Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Aleixo, Robson Pereira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-26012023-200820/
Resumo: Duas doenças que preocupam diversos países atualmente são sífilis congênita e dengue. A sífilis é uma infecção sexualmente transmissível (IST) causada pela bactéria Treponema Pallidum. Ao ser transmitida em crianças durante o período da gestação, é chamada de sífilis congênita. Já a dengue é uma doença viral transmitida pelas espécies de mosquitos Aedes Aegypti e Aedes Albopictus. No Brasil, há uma preocupação constante com o aumento do número de casos. Utilizando o município do Rio de Janeiro como escopo de trabalho, propomos dois modelos de aprendizado de máquina. O primeiro deles estima a probabilidade da criança nascer com sífilis a partir de dados públicos do Sistema Único de Saúde (SUS). O segundo prevê casos de dengue para cada bairro da cidade, aplicando modelo de regressão. Neste caso, para o treinamento e teste do modelo, foram considerados dados sociodemográficos, climáticos, série histórica de casos da doença, quantidade de estabelecimentos de saúde, índice de mensuração da quantidade de mosquitos na região e série histórica de casos de zika e chikungunya. No caso da sífilis congênita, avaliamos os modelos pela métrica AUC (Area Under Curve) da curva ROC e o melhor resultado foi 68% para a predição de casos positivos, obtidos pelos modelos LightGBM e XGBoost. No que se refere à dengue, mensuramos o desempenho do modelo em diferentes métricas e cenários. O modelo que obteve os melhores resultados foi o Catboost, identificando 75% dos surtos em até três meses de previsão. Além disso, dedicamos parte significativa deste trabalho na explicabilidade das previsões de dengue. Para isso, utilizamos a ferramenta SHAP que proporciona diferentes visões que contemplam tanto a visão geral como a local de impacto das variáveis na previsão.
id USP_fbfbe02ea0383fd26d50507d80ed08e6
oai_identifier_str oai:teses.usp.br:tde-26012023-200820
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquinaPredicting dengue outbreaks and syphilis congenital diagnosis using machine learningAprendizado de máquinaArtificial intelligenceDengueDengueInteligência artificialMachine learningOutbreakSífilisSyphilisDuas doenças que preocupam diversos países atualmente são sífilis congênita e dengue. A sífilis é uma infecção sexualmente transmissível (IST) causada pela bactéria Treponema Pallidum. Ao ser transmitida em crianças durante o período da gestação, é chamada de sífilis congênita. Já a dengue é uma doença viral transmitida pelas espécies de mosquitos Aedes Aegypti e Aedes Albopictus. No Brasil, há uma preocupação constante com o aumento do número de casos. Utilizando o município do Rio de Janeiro como escopo de trabalho, propomos dois modelos de aprendizado de máquina. O primeiro deles estima a probabilidade da criança nascer com sífilis a partir de dados públicos do Sistema Único de Saúde (SUS). O segundo prevê casos de dengue para cada bairro da cidade, aplicando modelo de regressão. Neste caso, para o treinamento e teste do modelo, foram considerados dados sociodemográficos, climáticos, série histórica de casos da doença, quantidade de estabelecimentos de saúde, índice de mensuração da quantidade de mosquitos na região e série histórica de casos de zika e chikungunya. No caso da sífilis congênita, avaliamos os modelos pela métrica AUC (Area Under Curve) da curva ROC e o melhor resultado foi 68% para a predição de casos positivos, obtidos pelos modelos LightGBM e XGBoost. No que se refere à dengue, mensuramos o desempenho do modelo em diferentes métricas e cenários. O modelo que obteve os melhores resultados foi o Catboost, identificando 75% dos surtos em até três meses de previsão. Além disso, dedicamos parte significativa deste trabalho na explicabilidade das previsões de dengue. Para isso, utilizamos a ferramenta SHAP que proporciona diferentes visões que contemplam tanto a visão geral como a local de impacto das variáveis na previsão.Two diseases that concern several countries today are congenital syphilis and dengue. Syphilis is a sexually transmitted infection (STI) caused by the bacterium Treponema Pallidum. When transmitted in children during pregnancy, it is called congenital syphilis. Dengue is a viral disease transmitted by the mosquito species Aedes Aegypti and Aedes Albopictus. In Brazil, there is a constant concern about the increase in the number of cases. Using the city of Rio de Janeiro as the scope of work, we propose two machine learning models. The first one estimates the probability of a child being born with syphilis based on public data from the Unified Health System (SUS). The second predicts dengue cases for each neighborhood in the city, applying a regression model. In this case, for the training and testing of the model, sociodemographic and climatic data, historical series of cases of the disease, number of health establishments, index of measurement of the number of mosquitoes in the region and historical series of cases of zika and chikungunya were considered. In the case of congenital syphilis, we evaluated the models by the AUC (Area Under Curve) metric of the ROC curve and the best result was 68% for the prediction of positive cases, obtained by the LightGBM and XGBoost models. With regard to dengue, we measured the performance of the model in different metrics and scenarios. The model that obtained the best results was Catboost, identifying 75% of outbreaks within three months of forecast. In addition, we dedicate a significant part of this work to the explainability of dengue predictions. For this, we use the SHAP tool that provides different views, including both the general and local, about the impact of the variables on the forecast.Biblioteca Digitais de Teses e Dissertações da USPCamargo, Raphael Yokoingawa deKon, FabioAleixo, Robson Pereira2022-10-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-26012023-200820/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-01-30T22:11:18Zoai:teses.usp.br:tde-26012023-200820Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-01-30T22:11:18Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina
Predicting dengue outbreaks and syphilis congenital diagnosis using machine learning
title Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina
spellingShingle Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina
Aleixo, Robson Pereira
Aprendizado de máquina
Artificial intelligence
Dengue
Dengue
Inteligência artificial
Machine learning
Outbreak
Sífilis
Syphilis
title_short Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina
title_full Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina
title_fullStr Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina
title_full_unstemmed Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina
title_sort Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina
author Aleixo, Robson Pereira
author_facet Aleixo, Robson Pereira
author_role author
dc.contributor.none.fl_str_mv Camargo, Raphael Yokoingawa de
Kon, Fabio
dc.contributor.author.fl_str_mv Aleixo, Robson Pereira
dc.subject.por.fl_str_mv Aprendizado de máquina
Artificial intelligence
Dengue
Dengue
Inteligência artificial
Machine learning
Outbreak
Sífilis
Syphilis
topic Aprendizado de máquina
Artificial intelligence
Dengue
Dengue
Inteligência artificial
Machine learning
Outbreak
Sífilis
Syphilis
description Duas doenças que preocupam diversos países atualmente são sífilis congênita e dengue. A sífilis é uma infecção sexualmente transmissível (IST) causada pela bactéria Treponema Pallidum. Ao ser transmitida em crianças durante o período da gestação, é chamada de sífilis congênita. Já a dengue é uma doença viral transmitida pelas espécies de mosquitos Aedes Aegypti e Aedes Albopictus. No Brasil, há uma preocupação constante com o aumento do número de casos. Utilizando o município do Rio de Janeiro como escopo de trabalho, propomos dois modelos de aprendizado de máquina. O primeiro deles estima a probabilidade da criança nascer com sífilis a partir de dados públicos do Sistema Único de Saúde (SUS). O segundo prevê casos de dengue para cada bairro da cidade, aplicando modelo de regressão. Neste caso, para o treinamento e teste do modelo, foram considerados dados sociodemográficos, climáticos, série histórica de casos da doença, quantidade de estabelecimentos de saúde, índice de mensuração da quantidade de mosquitos na região e série histórica de casos de zika e chikungunya. No caso da sífilis congênita, avaliamos os modelos pela métrica AUC (Area Under Curve) da curva ROC e o melhor resultado foi 68% para a predição de casos positivos, obtidos pelos modelos LightGBM e XGBoost. No que se refere à dengue, mensuramos o desempenho do modelo em diferentes métricas e cenários. O modelo que obteve os melhores resultados foi o Catboost, identificando 75% dos surtos em até três meses de previsão. Além disso, dedicamos parte significativa deste trabalho na explicabilidade das previsões de dengue. Para isso, utilizamos a ferramenta SHAP que proporciona diferentes visões que contemplam tanto a visão geral como a local de impacto das variáveis na previsão.
publishDate 2022
dc.date.none.fl_str_mv 2022-10-27
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45134/tde-26012023-200820/
url https://www.teses.usp.br/teses/disponiveis/45/45134/tde-26012023-200820/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865491332217176064