Mortalidade neonatal da cidade de São Paulo: uma abordagem utilizando aprendizado de máquina supervisionado.

Pelissari, Ana Carolina Chebel

Mortalidade neonatal da cidade de São Paulo: uma abordagem utilizando aprendizado de máquina supervisionado.

Arquivos

pelissari_acc_mortalidade.pdf(6.93 MB)

Data

2021-01-07

Autores

Pelissari, Ana Carolina Chebel

Editor

Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP)

Resumo

Este projeto realizou uma análise exploratória de dados da mortalidade neonatal da cidade de São Paulo entre os anos 2012 e 2018, além da criação de modelos de aprendizado de máquina capazes de prever o risco de morte de recém-nascidos durante o período neonatal e estudar os fatores que mais influenciaram no resultado e as características mais importantes utilizadas pelos modelos na previsão. Foram utilizados três diferentes tipos de algoritmos de aprendizado de máquina, XGBoost, Random Foreste Logistic Regression, e dois métodos para treinamento, teste e validação dos modelos, oK-fold cross validation e Hold Out. Todos os modelos criados neste projeto obtiveram um bom desempenho preditivo, se considerarmos a acurácia e o valor AUC. Porém, uma vez que a base de dados utilizada é desbalanceada, não é viável analisar modelos criados utilizando apenas pela acurácia e o valor AUC, e sim realizar esta análise considerando métricas como a precisão e a cobertura. Os resultados das predições dos modelos criados utilizando a base de dados desbalanceada apresentaram uma precisão e cobertura da classe majoritária alta, entretanto, no caso da classe minoritária, o valor da precisão foi alto e o valor da cobertura foi baixo. Ao atribuir pesos à classe minoritária, a cobertura da classe minoritária aumentou.

URI

https://repositorio.ifsp.edu.br/handle/123456789/678

Coleções

Tecnologia em Análise e Desenvolvimento de Sistemas

Página do item completo