Mortalidade neonatal da cidade de São Paulo: uma abordagem utilizando aprendizado de máquina supervisionado.

dc.contributor.advisorSilva, Everton Josué da
dc.contributor.authorPelissari, Ana Carolina Chebel
dc.date.accessioned2024-03-12T21:22:49Z
dc.date.available2024-03-12T21:22:49Z
dc.date.issued2021-01-07
dc.description.abstractEste projeto realizou uma análise exploratória de dados da mortalidade neonatal da cidade de São Paulo entre os anos 2012 e 2018, além da criação de modelos de aprendizado de máquina capazes de prever o risco de morte de recém-nascidos durante o período neonatal e estudar os fatores que mais influenciaram no resultado e as características mais importantes utilizadas pelos modelos na previsão. Foram utilizados três diferentes tipos de algoritmos de aprendizado de máquina, XGBoost, Random Foreste Logistic Regression, e dois métodos para treinamento, teste e validação dos modelos, oK-fold cross validation e Hold Out. Todos os modelos criados neste projeto obtiveram um bom desempenho preditivo, se considerarmos a acurácia e o valor AUC. Porém, uma vez que a base de dados utilizada é desbalanceada, não é viável analisar modelos criados utilizando apenas pela acurácia e o valor AUC, e sim realizar esta análise considerando métricas como a precisão e a cobertura. Os resultados das predições dos modelos criados utilizando a base de dados desbalanceada apresentaram uma precisão e cobertura da classe majoritária alta, entretanto, no caso da classe minoritária, o valor da precisão foi alto e o valor da cobertura foi baixo. Ao atribuir pesos à classe minoritária, a cobertura da classe minoritária aumentou.
dc.description.abstract2This project carried out an exploratory analysis of neonatal mortality data in the city of São Paulo between 2012 and 2018, in addition to creating machine learning models capable of predicting the risk of death of newborns during the neonatal period and studying the factors that most influenced the result and the most important characteristics used by the models in the prediction. Three different types of machine learning algorithms were used, XGBoost, Random Forest and Logistic Regression, and two methods for training, testing and validating the models, oK-fold cross validation and Hold Out. All models created in this project performed well predictive, if we consider the accuracy and the AUC value. However, since the database used is unbalanced, it is not feasible to analyze models created using only accuracy and AUC value, but rather carry out this analysis considering metrics such as precision and coverage. The prediction results of the models created using the unbalanced database showed high precision and coverage for the majority class, however, in the case of the minority class, the precision value was high and the coverage value was low. By assigning weights to the minority class, the coverage of the minority class increased.
dc.format.mimetypeapplication/pdf
dc.identifier.bibliographicCitationPELISSARI, Ana Carolina Chebel. Mortalidade neonatal da cidade de São Paulo: uma abordagem utilizando aprendizado de máquina supervisionado. 2020. 50 f. Trabalho de Conclusão de Curso (Graduação) - Tecnologia em Análise e Desenvolvimento de Sistemas, Instituto Federal de Educação, Ciência e Tecnologia de São Paulo, Campus Campinas, 2020.
dc.identifier.urihttps://repositorio.ifsp.edu.br/handle/123456789/678
dc.publisherInstituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP)
dc.publisher.campiCAMPINAS
dc.rightsAttribution-NonCommercial-ShareAlike 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/br/
dc.subject.keywordsMortalidade neonatal
dc.subject.keywordsSão Paulo (SP)
dc.subject.keywordsAprendizado de máquina
dc.subject.keywordsEstatística
dc.titleMortalidade neonatal da cidade de São Paulo: uma abordagem utilizando aprendizado de máquina supervisionado.
dc.title.alternativeNeonatal mortality in the city of São Paulo: an approach using supervised machine learning.
dc.typeTrabalhos de Conclusão de Curso de Graduação
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
pelissari_acc_mortalidade.pdf
Tamanho:
6.93 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.92 KB
Formato:
Item-specific license agreed upon to submission
Descrição: