Mortalidade neonatal da cidade de São Paulo: uma abordagem utilizando aprendizado de máquina supervisionado.

Data
2021-01-07
Título da Revista
ISSN da Revista
Título de Volume
Editor
Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP)

Resumo

Este projeto realizou uma análise exploratória de dados da mortalidade neonatal da cidade de São Paulo entre os anos 2012 e 2018, além da criação de modelos de aprendizado de máquina capazes de prever o risco de morte de recém-nascidos durante o período neonatal e estudar os fatores que mais influenciaram no resultado e as características mais importantes utilizadas pelos modelos na previsão. Foram utilizados três diferentes tipos de algoritmos de aprendizado de máquina, XGBoost, Random Foreste Logistic Regression, e dois métodos para treinamento, teste e validação dos modelos, oK-fold cross validation e Hold Out. Todos os modelos criados neste projeto obtiveram um bom desempenho preditivo, se considerarmos a acurácia e o valor AUC. Porém, uma vez que a base de dados utilizada é desbalanceada, não é viável analisar modelos criados utilizando apenas pela acurácia e o valor AUC, e sim realizar esta análise considerando métricas como a precisão e a cobertura. Os resultados das predições dos modelos criados utilizando a base de dados desbalanceada apresentaram uma precisão e cobertura da classe majoritária alta, entretanto, no caso da classe minoritária, o valor da precisão foi alto e o valor da cobertura foi baixo. Ao atribuir pesos à classe minoritária, a cobertura da classe minoritária aumentou.


Descrição
Palavras-chave
Citação