Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| dARK ID: | ark:/48912/0013000029gfq |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Paulo
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.unifesp.br/handle/11600/67419 |
Resumo: | Objetivo: Validar um modelo preditivo de diabetes do tipo 2 utilizando aprendizagem de máquina através de variáveis de fácil acesso e comparar os resultados dos bancos de dados VIGITEL e NHANES para validação da metodologia. Métodos: Após a seleção dos bancos de dados VIGITEL (2015) e NHANES (2014,15,16,17), foi aplicado critérios de inclusão e exclusão, aqueles que foram diagnosticados acima dos 30 anos e dados não faltantes, em cima dos indivíduos finais foi utilizado o método de balanceamento SMOTE para melhor aplicação dos algoritmos. Uma vez balanceado, foram aplicados os algoritmos “árvore de decisão”, “Floresta Aleatória” e “floresta de isolamento”. Resultados: O modelo de predição de diabetes tipo 2 apresentou melhor desempenho em todas as métricas em comparação com as outras duas doenças crônicas (dislipidemia e hipertensão arterial) no conjunto de dados do NHANES. No VIGITEL, o diabetes teve melhor desempenho em sensibilidade (73,25%) em comparação com as outras duas doenças, a hipertensão também teve alto desempenho em especificidade e acurácia (79,51% e 73,63%). Entre os dois conjuntos de dados, o NHANES teve melhor desempenho em todas as métricas em diabetes e hipertensão. Conclusões: O presente estudo apresentou evidências para a criação de um modelo preditivo através da utilização de aprendizagem de máquina para auxiliar no diagnóstico precoce de doenças crônicas através de variáveis de fácil acesso. |
| id |
UFSP_22f49122db331d50ef7da2fbbbc3745e |
|---|---|
| oai_identifier_str |
oai:repositorio.unifesp.br:11600/67419 |
| network_acronym_str |
UFSP |
| network_name_str |
Repositório Institucional da UNIFESP |
| repository_id_str |
|
| spelling |
Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acessoAprendizagem de máquinaDiabetes MellitusInteligência ArtificialDoenças CrônicasMachine learningDiabetes MellitusArtificial IntelligenceChronic DiseasesObjetivo: Validar um modelo preditivo de diabetes do tipo 2 utilizando aprendizagem de máquina através de variáveis de fácil acesso e comparar os resultados dos bancos de dados VIGITEL e NHANES para validação da metodologia. Métodos: Após a seleção dos bancos de dados VIGITEL (2015) e NHANES (2014,15,16,17), foi aplicado critérios de inclusão e exclusão, aqueles que foram diagnosticados acima dos 30 anos e dados não faltantes, em cima dos indivíduos finais foi utilizado o método de balanceamento SMOTE para melhor aplicação dos algoritmos. Uma vez balanceado, foram aplicados os algoritmos “árvore de decisão”, “Floresta Aleatória” e “floresta de isolamento”. Resultados: O modelo de predição de diabetes tipo 2 apresentou melhor desempenho em todas as métricas em comparação com as outras duas doenças crônicas (dislipidemia e hipertensão arterial) no conjunto de dados do NHANES. No VIGITEL, o diabetes teve melhor desempenho em sensibilidade (73,25%) em comparação com as outras duas doenças, a hipertensão também teve alto desempenho em especificidade e acurácia (79,51% e 73,63%). Entre os dois conjuntos de dados, o NHANES teve melhor desempenho em todas as métricas em diabetes e hipertensão. Conclusões: O presente estudo apresentou evidências para a criação de um modelo preditivo através da utilização de aprendizagem de máquina para auxiliar no diagnóstico precoce de doenças crônicas através de variáveis de fácil acesso.Objective: Validate a predictive model of type 2 diabetes using machine learning through easily accessible variables and compare the results of the VIGITEL and NHANES databases to validate the methodology. Methods: After selecting the VIGITEL (2015) and NHANES (2014,15,16,17) databases, inclusion and exclusion criteria were applied, those who were diagnosed over 30 years of age and no missing data, on top of individuals At the end, the SMOTE balancing method was used for better application of the algorithms. Once balanced, the “decision tree”, “Random Forest” and “isolation forest” algorithms were applied. Results: The type 2 diabetes prediction model performed better on all metrics compared to the other two chronic diseases (dyslipidemia and high blood pressure) in the NHANES dataset. In VIGITEL, diabetes performed better in sensitivity (73.25%) compared to the other two diseases, hypertension also had high performance in specificity and accuracy (79.51% and 73.63%). Between the two datasets, NHANES performed better on all metrics in diabetes and hypertension. Conclusions: The present study presented evidence for the creation of a predictive model through the use of machine learning to assist in the early diagnosis of chronic diseases through easily accessible variables.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Federal de São PauloCaranti, Danielle Arisa [UNIFESP]http://lattes.cnpq.br/4760019839583649http://lattes.cnpq.br/7376085574661825Universidade Federal de São Paulo (UNIFESP)Silva, Leonardo Fernandes [UNIFESP]2023-04-25T18:38:30Z2023-04-25T18:38:30Z2023-03-10info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersion56 f.application/pdfSILVA, Leonardo Fernandes. Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso. 2023. 56 f. Dissertação (Mestrado Interdisciplinar em Ciências da Saúde) - Instituto de Saúde e Sociedade, Universidade Federal de São Paulo, Santos, 2023.Processo SEI 23089.005778/2023-82https://repositorio.unifesp.br/handle/11600/67419ark:/48912/0013000029gfqporinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESP2024-08-12T16:02:19Zoai:repositorio.unifesp.br:11600/67419Repositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-08-12T16:02:19Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false |
| dc.title.none.fl_str_mv |
Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso |
| title |
Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso |
| spellingShingle |
Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso Silva, Leonardo Fernandes [UNIFESP] Aprendizagem de máquina Diabetes Mellitus Inteligência Artificial Doenças Crônicas Machine learning Diabetes Mellitus Artificial Intelligence Chronic Diseases |
| title_short |
Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso |
| title_full |
Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso |
| title_fullStr |
Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso |
| title_full_unstemmed |
Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso |
| title_sort |
Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso |
| author |
Silva, Leonardo Fernandes [UNIFESP] |
| author_facet |
Silva, Leonardo Fernandes [UNIFESP] |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Caranti, Danielle Arisa [UNIFESP] http://lattes.cnpq.br/4760019839583649 http://lattes.cnpq.br/7376085574661825 Universidade Federal de São Paulo (UNIFESP) |
| dc.contributor.author.fl_str_mv |
Silva, Leonardo Fernandes [UNIFESP] |
| dc.subject.por.fl_str_mv |
Aprendizagem de máquina Diabetes Mellitus Inteligência Artificial Doenças Crônicas Machine learning Diabetes Mellitus Artificial Intelligence Chronic Diseases |
| topic |
Aprendizagem de máquina Diabetes Mellitus Inteligência Artificial Doenças Crônicas Machine learning Diabetes Mellitus Artificial Intelligence Chronic Diseases |
| description |
Objetivo: Validar um modelo preditivo de diabetes do tipo 2 utilizando aprendizagem de máquina através de variáveis de fácil acesso e comparar os resultados dos bancos de dados VIGITEL e NHANES para validação da metodologia. Métodos: Após a seleção dos bancos de dados VIGITEL (2015) e NHANES (2014,15,16,17), foi aplicado critérios de inclusão e exclusão, aqueles que foram diagnosticados acima dos 30 anos e dados não faltantes, em cima dos indivíduos finais foi utilizado o método de balanceamento SMOTE para melhor aplicação dos algoritmos. Uma vez balanceado, foram aplicados os algoritmos “árvore de decisão”, “Floresta Aleatória” e “floresta de isolamento”. Resultados: O modelo de predição de diabetes tipo 2 apresentou melhor desempenho em todas as métricas em comparação com as outras duas doenças crônicas (dislipidemia e hipertensão arterial) no conjunto de dados do NHANES. No VIGITEL, o diabetes teve melhor desempenho em sensibilidade (73,25%) em comparação com as outras duas doenças, a hipertensão também teve alto desempenho em especificidade e acurácia (79,51% e 73,63%). Entre os dois conjuntos de dados, o NHANES teve melhor desempenho em todas as métricas em diabetes e hipertensão. Conclusões: O presente estudo apresentou evidências para a criação de um modelo preditivo através da utilização de aprendizagem de máquina para auxiliar no diagnóstico precoce de doenças crônicas através de variáveis de fácil acesso. |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-04-25T18:38:30Z 2023-04-25T18:38:30Z 2023-03-10 |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
SILVA, Leonardo Fernandes. Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso. 2023. 56 f. Dissertação (Mestrado Interdisciplinar em Ciências da Saúde) - Instituto de Saúde e Sociedade, Universidade Federal de São Paulo, Santos, 2023. Processo SEI 23089.005778/2023-82 https://repositorio.unifesp.br/handle/11600/67419 |
| dc.identifier.dark.fl_str_mv |
ark:/48912/0013000029gfq |
| identifier_str_mv |
SILVA, Leonardo Fernandes. Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso. 2023. 56 f. Dissertação (Mestrado Interdisciplinar em Ciências da Saúde) - Instituto de Saúde e Sociedade, Universidade Federal de São Paulo, Santos, 2023. Processo SEI 23089.005778/2023-82 ark:/48912/0013000029gfq |
| url |
https://repositorio.unifesp.br/handle/11600/67419 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
56 f. application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Paulo |
| publisher.none.fl_str_mv |
Universidade Federal de São Paulo |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNIFESP instname:Universidade Federal de São Paulo (UNIFESP) instacron:UNIFESP |
| instname_str |
Universidade Federal de São Paulo (UNIFESP) |
| instacron_str |
UNIFESP |
| institution |
UNIFESP |
| reponame_str |
Repositório Institucional da UNIFESP |
| collection |
Repositório Institucional da UNIFESP |
| repository.name.fl_str_mv |
Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP) |
| repository.mail.fl_str_mv |
biblioteca.csp@unifesp.br |
| _version_ |
1848497992503394304 |