Avaliação de algoritmos de aprendizado de máquina para predição de mortalidade neonatal utilizando dados do Datasus
dc.contributor.advisor | Silva, Everton Josué da | |
dc.contributor.author | Mota, Caio Augusto de Souza | |
dc.contributor.referee | Beluzo, Carlos | |
dc.contributor.referee | Sovat, Ricardo Barz | |
dc.date.accessioned | 2024-11-12T20:04:40Z | |
dc.date.available | 2024-11-12T20:04:40Z | |
dc.date.issued | 2021-06-09 | |
dc.description.abstract | A mortalidade infantil pode ser usada para analisar níveis de pobreza e socioeconômicos, assim como medir qualidade de saúde e tecnologia médica disponível em uma população. O aprendizado de máquina é uma área da inteligência artificial que propõe métodos de análise de dados que automatizam a construção de modelos analíticos com base em reconhecimento de padrões, baseado no conceito de que sistemas podem aprender com dados, identificando padrões e tomando decisões com o mínimo de intervenção humana. O objetivo deste trabalho é testar e analisar dois tipos diferentes de algoritmos de aprendizado de máquina, utilizando a base de dados do SIM e SINASC do Brasil, do período de 2016 até 2018, para gerar modelos para predição de mortalidade neonatal. Os métodos utilizados foram Árvore de Decisão e de Regressão Logística e como métricas para avaliar os modelos resultantes foram utilizadas a AUC, Curva ROC e a Matriz de Confusão. Como resultado, apesar de terem alcançado valores de AUC 0.93, ambos modelos de predições acertaram muitas predições de vivos cerca de 671.000 e erraram muitas predições de mortos cerca de 2.600, principalmente devido ao fato de a base estar desbalanceada. | |
dc.description.abstract2 | Infant mortality can be used to analyze poverty and socioeconomic levels, as well as measure the quality of health and medical technology available in a population. Machine learning is an area of artificial intelligence that proposes data analysis methods that automate the construction of analytical models based on pattern recognition, based on the concept that systems can learn from data, identifying patterns and making decisions with a minimum of human intervention. The objective of this work is to test and analyze two different types of machine learning algorithms, using the SIM and SINASC do Brasil database, from 2016 to 2018, to generate models for predicting neonatal mortality. The methods used were Decision Tree and Logistic Regression and as metrics to evaluate the resulting models, AUC, ROC Curve and Confusion Matrix were used. As a result, despite achieving values of AUC 0.93, both prediction models correct many live birth predictions around 671.000 and miss many stillbirth predictions around 2600, mainly due to the fact that the base is unbalanced. | |
dc.format.mimetype | application/pdf | |
dc.identifier.bibliographicCitation | MOTA, Caio Augusto de Souza. Avaliação de algoritmos de aprendizado de máquina para predição de mortalidade neonatal utilizando dados do Datasus. Campinas, SP, 2021. 131 f. Trabalho de conclusão de curso (Graduação) - Tecnologia em Análise e Desenvolvimento de Sistemas, Instituto Federal de Educação, Ciência e Tecnologia de São Paulo, Campus Campinas, 2021 | |
dc.identifier.uri | https://repositorio.ifsp.edu.br/handle/123456789/1740 | |
dc.publisher | Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP) | |
dc.publisher.campi | CAMPINAS | |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
dc.subject.keywords | Mortalidade neonatal | |
dc.subject.keywords | Controle preditivo | |
dc.subject.keywords | Aprendizado de máquina | |
dc.title | Avaliação de algoritmos de aprendizado de máquina para predição de mortalidade neonatal utilizando dados do Datasus | |
dc.title.alternative | Evaluation of machine learning algorithms for neonatal mortality prediction using data from Datasus | |
dc.type | Trabalhos de Conclusão de Curso de Graduação |