Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/45/45134/tde-26012023-200820/ |
Resumo: | Duas doenças que preocupam diversos países atualmente são sífilis congênita e dengue. A sífilis é uma infecção sexualmente transmissível (IST) causada pela bactéria Treponema Pallidum. Ao ser transmitida em crianças durante o período da gestação, é chamada de sífilis congênita. Já a dengue é uma doença viral transmitida pelas espécies de mosquitos Aedes Aegypti e Aedes Albopictus. No Brasil, há uma preocupação constante com o aumento do número de casos. Utilizando o município do Rio de Janeiro como escopo de trabalho, propomos dois modelos de aprendizado de máquina. O primeiro deles estima a probabilidade da criança nascer com sífilis a partir de dados públicos do Sistema Único de Saúde (SUS). O segundo prevê casos de dengue para cada bairro da cidade, aplicando modelo de regressão. Neste caso, para o treinamento e teste do modelo, foram considerados dados sociodemográficos, climáticos, série histórica de casos da doença, quantidade de estabelecimentos de saúde, índice de mensuração da quantidade de mosquitos na região e série histórica de casos de zika e chikungunya. No caso da sífilis congênita, avaliamos os modelos pela métrica AUC (Area Under Curve) da curva ROC e o melhor resultado foi 68% para a predição de casos positivos, obtidos pelos modelos LightGBM e XGBoost. No que se refere à dengue, mensuramos o desempenho do modelo em diferentes métricas e cenários. O modelo que obteve os melhores resultados foi o Catboost, identificando 75% dos surtos em até três meses de previsão. Além disso, dedicamos parte significativa deste trabalho na explicabilidade das previsões de dengue. Para isso, utilizamos a ferramenta SHAP que proporciona diferentes visões que contemplam tanto a visão geral como a local de impacto das variáveis na previsão. |
| id |
USP_fbfbe02ea0383fd26d50507d80ed08e6 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-26012023-200820 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquinaPredicting dengue outbreaks and syphilis congenital diagnosis using machine learningAprendizado de máquinaArtificial intelligenceDengueDengueInteligência artificialMachine learningOutbreakSífilisSyphilisDuas doenças que preocupam diversos países atualmente são sífilis congênita e dengue. A sífilis é uma infecção sexualmente transmissível (IST) causada pela bactéria Treponema Pallidum. Ao ser transmitida em crianças durante o período da gestação, é chamada de sífilis congênita. Já a dengue é uma doença viral transmitida pelas espécies de mosquitos Aedes Aegypti e Aedes Albopictus. No Brasil, há uma preocupação constante com o aumento do número de casos. Utilizando o município do Rio de Janeiro como escopo de trabalho, propomos dois modelos de aprendizado de máquina. O primeiro deles estima a probabilidade da criança nascer com sífilis a partir de dados públicos do Sistema Único de Saúde (SUS). O segundo prevê casos de dengue para cada bairro da cidade, aplicando modelo de regressão. Neste caso, para o treinamento e teste do modelo, foram considerados dados sociodemográficos, climáticos, série histórica de casos da doença, quantidade de estabelecimentos de saúde, índice de mensuração da quantidade de mosquitos na região e série histórica de casos de zika e chikungunya. No caso da sífilis congênita, avaliamos os modelos pela métrica AUC (Area Under Curve) da curva ROC e o melhor resultado foi 68% para a predição de casos positivos, obtidos pelos modelos LightGBM e XGBoost. No que se refere à dengue, mensuramos o desempenho do modelo em diferentes métricas e cenários. O modelo que obteve os melhores resultados foi o Catboost, identificando 75% dos surtos em até três meses de previsão. Além disso, dedicamos parte significativa deste trabalho na explicabilidade das previsões de dengue. Para isso, utilizamos a ferramenta SHAP que proporciona diferentes visões que contemplam tanto a visão geral como a local de impacto das variáveis na previsão.Two diseases that concern several countries today are congenital syphilis and dengue. Syphilis is a sexually transmitted infection (STI) caused by the bacterium Treponema Pallidum. When transmitted in children during pregnancy, it is called congenital syphilis. Dengue is a viral disease transmitted by the mosquito species Aedes Aegypti and Aedes Albopictus. In Brazil, there is a constant concern about the increase in the number of cases. Using the city of Rio de Janeiro as the scope of work, we propose two machine learning models. The first one estimates the probability of a child being born with syphilis based on public data from the Unified Health System (SUS). The second predicts dengue cases for each neighborhood in the city, applying a regression model. In this case, for the training and testing of the model, sociodemographic and climatic data, historical series of cases of the disease, number of health establishments, index of measurement of the number of mosquitoes in the region and historical series of cases of zika and chikungunya were considered. In the case of congenital syphilis, we evaluated the models by the AUC (Area Under Curve) metric of the ROC curve and the best result was 68% for the prediction of positive cases, obtained by the LightGBM and XGBoost models. With regard to dengue, we measured the performance of the model in different metrics and scenarios. The model that obtained the best results was Catboost, identifying 75% of outbreaks within three months of forecast. In addition, we dedicate a significant part of this work to the explainability of dengue predictions. For this, we use the SHAP tool that provides different views, including both the general and local, about the impact of the variables on the forecast.Biblioteca Digitais de Teses e Dissertações da USPCamargo, Raphael Yokoingawa deKon, FabioAleixo, Robson Pereira2022-10-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-26012023-200820/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-01-30T22:11:18Zoai:teses.usp.br:tde-26012023-200820Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-01-30T22:11:18Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina Predicting dengue outbreaks and syphilis congenital diagnosis using machine learning |
| title |
Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina |
| spellingShingle |
Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina Aleixo, Robson Pereira Aprendizado de máquina Artificial intelligence Dengue Dengue Inteligência artificial Machine learning Outbreak Sífilis Syphilis |
| title_short |
Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina |
| title_full |
Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina |
| title_fullStr |
Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina |
| title_full_unstemmed |
Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina |
| title_sort |
Predição de surtos de dengue e diagnóstico de sífilis congênita utilizando aprendizado de máquina |
| author |
Aleixo, Robson Pereira |
| author_facet |
Aleixo, Robson Pereira |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Camargo, Raphael Yokoingawa de Kon, Fabio |
| dc.contributor.author.fl_str_mv |
Aleixo, Robson Pereira |
| dc.subject.por.fl_str_mv |
Aprendizado de máquina Artificial intelligence Dengue Dengue Inteligência artificial Machine learning Outbreak Sífilis Syphilis |
| topic |
Aprendizado de máquina Artificial intelligence Dengue Dengue Inteligência artificial Machine learning Outbreak Sífilis Syphilis |
| description |
Duas doenças que preocupam diversos países atualmente são sífilis congênita e dengue. A sífilis é uma infecção sexualmente transmissível (IST) causada pela bactéria Treponema Pallidum. Ao ser transmitida em crianças durante o período da gestação, é chamada de sífilis congênita. Já a dengue é uma doença viral transmitida pelas espécies de mosquitos Aedes Aegypti e Aedes Albopictus. No Brasil, há uma preocupação constante com o aumento do número de casos. Utilizando o município do Rio de Janeiro como escopo de trabalho, propomos dois modelos de aprendizado de máquina. O primeiro deles estima a probabilidade da criança nascer com sífilis a partir de dados públicos do Sistema Único de Saúde (SUS). O segundo prevê casos de dengue para cada bairro da cidade, aplicando modelo de regressão. Neste caso, para o treinamento e teste do modelo, foram considerados dados sociodemográficos, climáticos, série histórica de casos da doença, quantidade de estabelecimentos de saúde, índice de mensuração da quantidade de mosquitos na região e série histórica de casos de zika e chikungunya. No caso da sífilis congênita, avaliamos os modelos pela métrica AUC (Area Under Curve) da curva ROC e o melhor resultado foi 68% para a predição de casos positivos, obtidos pelos modelos LightGBM e XGBoost. No que se refere à dengue, mensuramos o desempenho do modelo em diferentes métricas e cenários. O modelo que obteve os melhores resultados foi o Catboost, identificando 75% dos surtos em até três meses de previsão. Além disso, dedicamos parte significativa deste trabalho na explicabilidade das previsões de dengue. Para isso, utilizamos a ferramenta SHAP que proporciona diferentes visões que contemplam tanto a visão geral como a local de impacto das variáveis na previsão. |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-10-27 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-26012023-200820/ |
| url |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-26012023-200820/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865491332217176064 |