Avaliação de algoritmos de aprendizado de máquina para predição de mortalidade neonatal utilizando dados do Datasus

dc.contributor.advisorSilva, Everton Josué da
dc.contributor.authorMota, Caio Augusto de Souza
dc.contributor.refereeBeluzo, Carlos
dc.contributor.refereeSovat, Ricardo Barz
dc.date.accessioned2024-11-12T20:04:40Z
dc.date.available2024-11-12T20:04:40Z
dc.date.issued2021-06-09
dc.description.abstractA mortalidade infantil pode ser usada para analisar níveis de pobreza e socioeconômicos, assim como medir qualidade de saúde e tecnologia médica disponível em uma população. O aprendizado de máquina é uma área da inteligência artificial que propõe métodos de análise de dados que automatizam a construção de modelos analíticos com base em reconhecimento de padrões, baseado no conceito de que sistemas podem aprender com dados, identificando padrões e tomando decisões com o mínimo de intervenção humana. O objetivo deste trabalho é testar e analisar dois tipos diferentes de algoritmos de aprendizado de máquina, utilizando a base de dados do SIM e SINASC do Brasil, do período de 2016 até 2018, para gerar modelos para predição de mortalidade neonatal. Os métodos utilizados foram Árvore de Decisão e de Regressão Logística e como métricas para avaliar os modelos resultantes foram utilizadas a AUC, Curva ROC e a Matriz de Confusão. Como resultado, apesar de terem alcançado valores de AUC 0.93, ambos modelos de predições acertaram muitas predições de vivos cerca de 671.000 e erraram muitas predições de mortos cerca de 2.600, principalmente devido ao fato de a base estar desbalanceada.
dc.description.abstract2Infant mortality can be used to analyze poverty and socioeconomic levels, as well as measure the quality of health and medical technology available in a population. Machine learning is an area of artificial intelligence that proposes data analysis methods that automate the construction of analytical models based on pattern recognition, based on the concept that systems can learn from data, identifying patterns and making decisions with a minimum of human intervention. The objective of this work is to test and analyze two different types of machine learning algorithms, using the SIM and SINASC do Brasil database, from 2016 to 2018, to generate models for predicting neonatal mortality. The methods used were Decision Tree and Logistic Regression and as metrics to evaluate the resulting models, AUC, ROC Curve and Confusion Matrix were used. As a result, despite achieving values of AUC 0.93, both prediction models correct many live birth predictions around 671.000 and miss many stillbirth predictions around 2600, mainly due to the fact that the base is unbalanced.
dc.format.mimetypeapplication/pdf
dc.identifier.bibliographicCitationMOTA, Caio Augusto de Souza. Avaliação de algoritmos de aprendizado de máquina para predição de mortalidade neonatal utilizando dados do Datasus. Campinas, SP, 2021. 131 f. Trabalho de conclusão de curso (Graduação) - Tecnologia em Análise e Desenvolvimento de Sistemas, Instituto Federal de Educação, Ciência e Tecnologia de São Paulo, Campus Campinas, 2021
dc.identifier.urihttps://repositorio.ifsp.edu.br/handle/123456789/1740
dc.publisherInstituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP)
dc.publisher.campiCAMPINAS
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subject.keywordsMortalidade neonatal
dc.subject.keywordsControle preditivo
dc.subject.keywordsAprendizado de máquina
dc.titleAvaliação de algoritmos de aprendizado de máquina para predição de mortalidade neonatal utilizando dados do Datasus
dc.title.alternativeEvaluation of machine learning algorithms for neonatal mortality prediction using data from Datasus
dc.typeTrabalhos de Conclusão de Curso de Graduação
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
mota_cas_avaliação.pdf
Tamanho:
14.14 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.92 KB
Formato:
Item-specific license agreed upon to submission
Descrição: