Árvores de decisão como método de mineração de dados: análise de prontuários de uma clínica escola de nutrição

Revista da Associação Brasileira de Nutrição

Endereço:
Rua Cláudio Soares, 72 - conj. 1607 - Pinheiros
São Paulo / SP
05422-030
Site: https://www.rasbran.com.br/
Telefone: (11) 3257-0277
ISSN: 2357-7894
Editor Chefe: Cephora Maria Sabarense
Início Publicação: 26/05/2008
Periodicidade: Semestral
Área de Estudo: Ciências da Saúde, Área de Estudo: Nutrição

Árvores de decisão como método de mineração de dados: análise de prontuários de uma clínica escola de nutrição

Ano: 2019 | Volume: 10 | Número: 2
Autores: A. R. Freddo, M. F. Nishiyama, K. Zanuzo, E. Koehnlein
Autor Correspondente: A. R. Freddo | [email protected]

Palavras-chave: Análise de dados, Aprendizado de Máquina, Registros Médicos, Identificação de doenças

Resumos Cadastrados

Resumo Português:

Este artigo descreve a aplicação de árvores de decisão como método de mineração de dados nos prontuários da Clínica Escola de Nutrição da Universidade Federal da Fronteira Sul (UFSS), campus Realeza. Árvores de decisão é uma técnica de aprendizado de máquina, utilizada para reconhecimento de padrões em inteligência artificial na análise de dados. Para que se possa aplicar esta técnica, se faz necessária a existência de uma massa de dados com diversos atributos significativos. Portanto, a Clínica Escola de Nutrição da UFFS, campus Realeza, possui uma grande quantidade de prontuários que foram utilizados na mineração de dados. Utilizou-se 1339 prontuários. Destes, foram selecionados apenas atributos ou variáveis que estavam preenchidos em todos os prontuários a fim de não comprometer os resultados e criação dos modelos. Assim aplicou-se a técnica de árvores de decisão aos prontuários para identificar como classe final as respectivas doenças: dislipidemia, diabetes e hipertensão. Portanto, para cada doença, a partir dos prontuários selecionados, foi criada uma árvore de decisão ou modelo. Este possui um conjunto de atributos ou variáveis mais significativas para a identificação e caracterização da doença. Além disso, a confiabilidade ou eficiência da árvore na identificação da doença foi definida com base nos 30% dos 1339 prontuários. Portanto, 402 registros foram utilizados para testar os modelos, sendo para dislipidemia a eficiência foi de aproximadamente 89%. Na hipertensão e diabetes obteve-se uma eficiência de aproximadamente 94%. Isto significa, o quanto as regras criadas a partir das árvores de decisão são eficientes na identificação das doenças. Estas regras podem ser utilizadas para o desenvolvimento de alguma ferramenta computacional para auxílio no diagnóstico e também para prever e classificar doenças.



Resumo Inglês:

This article presents the application of decision trees as a method of data mining in the medical records of the Nutrition Clinical School Federal University of the South Frontier (UFFS) in Realeza city. Decision trees is a machine learning technique, used to recognize patterns in artificial intelligence in data analysis. In order to apply decision trees, it is necessary to have data with several importante attributes. Therefore, the Nutrition Clinical School, has a large number of medical records that were used in data mining. We used 1339 medical records. Of these, we selected only attributes or variables that were filled in all the medical records to creat e of the models. From these 1339 medical records, the decision tree technique was applied to identify the final diseases as dyslipidemia, diabetes and hypertension. Thus, for each disease, a tree or model was created  with a set of attributes or variables more significant for the identification  and characterization of the disease. In addition, the reliability or efficiency of the tree in the identification of the disease was defined based on 30% of 1339 medical records. Therefore, 402 records were used to test the models, and for dyslipidemia the efficiency was approximately 89%. In hypertension and diabetes an efficiency of approximately 94% was obtained. This means, how much the rules created from the decision trees are efficient in the identification of the diseases. These rules can be used to develop some computational tool to aid in diagnosis and also to predict and classify diseases.