Mortalidade neonatal da cidade de São Paulo: uma abordagem utilizando aprendizado de máquina supervisionado.
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Este projeto realizou uma análise exploratória de dados da mortalidade neonatal da cidade de São Paulo entre os anos 2012 e 2018, além da criação de modelos de aprendizado de máquina capazes de prever o risco de morte de recém-nascidos durante o período neonatal e estudar os fatores que mais influenciaram no resultado e as características mais importantes utilizadas pelos modelos na previsão. Foram utilizados três diferentes tipos de algoritmos de aprendizado de máquina, XGBoost, Random Foreste Logistic Regression, e dois métodos para treinamento, teste e validação dos modelos, oK-fold cross validation e Hold Out. Todos os modelos criados neste projeto obtiveram um bom desempenho preditivo, se considerarmos a acurácia e o valor AUC. Porém, uma vez que a base de dados utilizada é desbalanceada, não é viável analisar modelos criados utilizando apenas pela acurácia e o valor AUC, e sim realizar esta análise considerando métricas como a precisão e a cobertura. Os resultados das predições dos modelos criados utilizando a base de dados desbalanceada apresentaram uma precisão e cobertura da classe majoritária alta, entretanto, no caso da classe minoritária, o valor da precisão foi alto e o valor da cobertura foi baixo. Ao atribuir pesos à classe minoritária, a cobertura da classe minoritária aumentou.