Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Silva, Leonardo Fernandes [UNIFESP]
Orientador(a): Caranti, Danielle Arisa [UNIFESP]
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
dARK ID: ark:/48912/0013000029gfq
Idioma: por
Instituição de defesa: Universidade Federal de São Paulo
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: https://repositorio.unifesp.br/handle/11600/67419
Resumo: Objetivo: Validar um modelo preditivo de diabetes do tipo 2 utilizando aprendizagem de máquina através de variáveis de fácil acesso e comparar os resultados dos bancos de dados VIGITEL e NHANES para validação da metodologia. Métodos: Após a seleção dos bancos de dados VIGITEL (2015) e NHANES (2014,15,16,17), foi aplicado critérios de inclusão e exclusão, aqueles que foram diagnosticados acima dos 30 anos e dados não faltantes, em cima dos indivíduos finais foi utilizado o método de balanceamento SMOTE para melhor aplicação dos algoritmos. Uma vez balanceado, foram aplicados os algoritmos “árvore de decisão”, “Floresta Aleatória” e “floresta de isolamento”. Resultados: O modelo de predição de diabetes tipo 2 apresentou melhor desempenho em todas as métricas em comparação com as outras duas doenças crônicas (dislipidemia e hipertensão arterial) no conjunto de dados do NHANES. No VIGITEL, o diabetes teve melhor desempenho em sensibilidade (73,25%) em comparação com as outras duas doenças, a hipertensão também teve alto desempenho em especificidade e acurácia (79,51% e 73,63%). Entre os dois conjuntos de dados, o NHANES teve melhor desempenho em todas as métricas em diabetes e hipertensão. Conclusões: O presente estudo apresentou evidências para a criação de um modelo preditivo através da utilização de aprendizagem de máquina para auxiliar no diagnóstico precoce de doenças crônicas através de variáveis de fácil acesso.
id UFSP_22f49122db331d50ef7da2fbbbc3745e
oai_identifier_str oai:repositorio.unifesp.br:11600/67419
network_acronym_str UFSP
network_name_str Repositório Institucional da UNIFESP
repository_id_str
spelling http://lattes.cnpq.br/4760019839583649Silva, Leonardo Fernandes [UNIFESP]http://lattes.cnpq.br/7376085574661825Universidade Federal de São Paulo (UNIFESP)Caranti, Danielle Arisa [UNIFESP]2023-04-25T18:38:30Z2023-04-25T18:38:30Z2023-03-10Objetivo: Validar um modelo preditivo de diabetes do tipo 2 utilizando aprendizagem de máquina através de variáveis de fácil acesso e comparar os resultados dos bancos de dados VIGITEL e NHANES para validação da metodologia. Métodos: Após a seleção dos bancos de dados VIGITEL (2015) e NHANES (2014,15,16,17), foi aplicado critérios de inclusão e exclusão, aqueles que foram diagnosticados acima dos 30 anos e dados não faltantes, em cima dos indivíduos finais foi utilizado o método de balanceamento SMOTE para melhor aplicação dos algoritmos. Uma vez balanceado, foram aplicados os algoritmos “árvore de decisão”, “Floresta Aleatória” e “floresta de isolamento”. Resultados: O modelo de predição de diabetes tipo 2 apresentou melhor desempenho em todas as métricas em comparação com as outras duas doenças crônicas (dislipidemia e hipertensão arterial) no conjunto de dados do NHANES. No VIGITEL, o diabetes teve melhor desempenho em sensibilidade (73,25%) em comparação com as outras duas doenças, a hipertensão também teve alto desempenho em especificidade e acurácia (79,51% e 73,63%). Entre os dois conjuntos de dados, o NHANES teve melhor desempenho em todas as métricas em diabetes e hipertensão. Conclusões: O presente estudo apresentou evidências para a criação de um modelo preditivo através da utilização de aprendizagem de máquina para auxiliar no diagnóstico precoce de doenças crônicas através de variáveis de fácil acesso.Objective: Validate a predictive model of type 2 diabetes using machine learning through easily accessible variables and compare the results of the VIGITEL and NHANES databases to validate the methodology. Methods: After selecting the VIGITEL (2015) and NHANES (2014,15,16,17) databases, inclusion and exclusion criteria were applied, those who were diagnosed over 30 years of age and no missing data, on top of individuals At the end, the SMOTE balancing method was used for better application of the algorithms. Once balanced, the “decision tree”, “Random Forest” and “isolation forest” algorithms were applied. Results: The type 2 diabetes prediction model performed better on all metrics compared to the other two chronic diseases (dyslipidemia and high blood pressure) in the NHANES dataset. In VIGITEL, diabetes performed better in sensitivity (73.25%) compared to the other two diseases, hypertension also had high performance in specificity and accuracy (79.51% and 73.63%). Between the two datasets, NHANES performed better on all metrics in diabetes and hypertension. Conclusions: The present study presented evidence for the creation of a predictive model through the use of machine learning to assist in the early diagnosis of chronic diseases through easily accessible variables.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)danielle.caranti@unifesp.br56 f.SILVA, Leonardo Fernandes. Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso. 2023. 56 f. Dissertação (Mestrado Interdisciplinar em Ciências da Saúde) - Instituto de Saúde e Sociedade, Universidade Federal de São Paulo, Santos, 2023.Processo SEI 23089.005778/2023-82https://repositorio.unifesp.br/handle/11600/67419ark:/48912/0013000029gfqporUniversidade Federal de São Pauloinfo:eu-repo/semantics/openAccessDiabetes MellitusInteligência ArtificialDoenças CrônicasAprendizagem de máquinaMachine learningDiabetes MellitusArtificial IntelligenceChronic DiseasesModelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acessoinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESPInstituto de Saúde e Sociedade (ISS)Interdisciplinar em Ciências da SaúdeORIGINALDissertação_Leonardo Fernandes Silva_PDFA.pdfDissertação_Leonardo Fernandes Silva_PDFA.pdfDissertação de mestradoapplication/pdf725451https://repositorio.unifesp.br/bitstreams/28c92f7c-a021-4d49-a7bc-a8607bee8f29/download95c0b1ed3f18d9da4725ce8e7df8ee53MD55LICENSElicense.txtlicense.txttext/plain; charset=utf-85857https://repositorio.unifesp.br/bitstreams/5733d4dc-f455-4d8c-ae62-6e097e72830e/downloadbf40160ae1b20a0af34e242fba018aa1MD54TEXTDissertação_Leonardo Fernandes Silva_PDFA.pdf.txtDissertação_Leonardo Fernandes Silva_PDFA.pdf.txtExtracted texttext/plain113882https://repositorio.unifesp.br/bitstreams/1f88a0ab-5981-4c5c-88b2-6f955fc80f3e/download78434a1acc64472d471d2a13a6a09c90MD515THUMBNAILDissertação_Leonardo Fernandes Silva_PDFA.pdf.jpgDissertação_Leonardo Fernandes Silva_PDFA.pdf.jpgGenerated Thumbnailimage/jpeg2523https://repositorio.unifesp.br/bitstreams/2477c9a3-f113-4a23-8546-d8e370ff50c1/download2264f1ddeff138c519d6ab6c8354ed13MD51611600/674192024-08-12 16:02:19.592oai:repositorio.unifesp.br:11600/67419https://repositorio.unifesp.brRepositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-08-12T16:02:19Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)falseVEVSTU9TIEUgQ09OREnDh8OVRVMgUEFSQSBPIExJQ0VOQ0lBTUVOVE8gRE8gQVJRVUlWQU1FTlRPLCBSRVBST0RVw4fDg08gRSBESVZVTEdBw4fDg08gUMOaQkxJQ0EgREUgQ09OVEXDmkRPIE5PIFJFUE9TSVTDk1JJTyBJTlNUSVRVQ0lPTkFMIFVOSUZFU1AKCjEuIEV1LCBMZW9uYXJkbyBTaWx2YSAobGZzaWx2YTE2QHVuaWZlc3AuYnIpLCByZXNwb25zw6F2ZWwgcGVsbyB0cmFiYWxobyDigJxNT0RFTE8gREUgQVBSRU5ESVpBRE8gREUgTcOBUVVJTkEgUEFSQSBQUkVEScOHw4NPIERFIERJQUJFVEVTIFRJUE8gMiBQT1IgTUVJTyBERSBWQVJJw4FWRUlTIERFIEbDgUNJTCBBQ0VTU0/igJ0gZS9vdSB1c3XDoXJpby1kZXBvc2l0YW50ZSBubyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBVTklGRVNQLGFzc2VndXJvIG5vIHByZXNlbnRlIGF0byBxdWUgc291IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhdHJpbW9uaWFpcyBlL291IGRpcmVpdG9zIGNvbmV4b3MgcmVmZXJlbnRlcyDDoCB0b3RhbGlkYWRlIGRhIE9icmEgb3JhIGRlcG9zaXRhZGEgZW0gZm9ybWF0byBkaWdpdGFsLCBiZW0gY29tbyBkZSBzZXVzIGNvbXBvbmVudGVzIG1lbm9yZXMsIGVtIHNlIHRyYXRhbmRvIGRlIG9icmEgY29sZXRpdmEsIGNvbmZvcm1lIG8gcHJlY2VpdHVhZG8gcGVsYSBMZWkgOS42MTAvOTggZS9vdSBMZWkgOS42MDkvOTguIE7Do28gc2VuZG8gZXN0ZSBvIGNhc28sIGFzc2VndXJvIHRlciBvYnRpZG8gZGlyZXRhbWVudGUgZG9zIGRldmlkb3MgdGl0dWxhcmVzIGF1dG9yaXphw6fDo28gcHLDqXZpYSBlIGV4cHJlc3NhIHBhcmEgbyBkZXDDs3NpdG8gZSBwYXJhIGEgZGl2dWxnYcOnw6NvIGRhIE9icmEsIGFicmFuZ2VuZG8gdG9kb3Mgb3MgZGlyZWl0b3MgYXV0b3JhaXMgZSBjb25leG9zIGFmZXRhZG9zIHBlbGEgYXNzaW5hdHVyYSBkbyBwcmVzZW50ZSB0ZXJtbyBkZSBsaWNlbmNpYW1lbnRvLCBkZSBtb2RvIGEgZWZldGl2YW1lbnRlIGlzZW50YXIgYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTw6NvIFBhdWxvIChVTklGRVNQKSBlIHNldXMgZnVuY2lvbsOhcmlvcyBkZSBxdWFscXVlciByZXNwb25zYWJpbGlkYWRlIHBlbG8gdXNvIG7Do28tYXV0b3JpemFkbyBkbyBtYXRlcmlhbCBkZXBvc2l0YWRvLCBzZWphIGVtIHZpbmN1bGHDp8OjbyBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBVTklGRVNQLCBzZWphIGVtIHZpbmN1bGHDp8OjbyBhIHF1YWlzcXVlciBzZXJ2acOnb3MgZGUgYnVzY2EgZSBkZSBkaXN0cmlidWnDp8OjbyBkZSBjb250ZcO6ZG8gcXVlIGZhw6dhbSB1c28gZGFzIGludGVyZmFjZXMgZSBlc3Bhw6dvIGRlIGFybWF6ZW5hbWVudG8gcHJvdmlkZW5jaWFkb3MgcGVsYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTw6NvIFBhdWxvIChVTklGRVNQKSBwb3IgbWVpbyBkZSBzZXVzIHNpc3RlbWFzIGluZm9ybWF0aXphZG9zLgoKMi4gQSBjb25jb3Jkw6JuY2lhIGNvbSBlc3RhIGxpY2Vuw6dhIHRlbSBjb21vIGNvbnNlcXXDqm5jaWEgYSB0cmFuc2ZlcsOqbmNpYSwgYSB0w610dWxvIG7Do28tZXhjbHVzaXZvIGUgbsOjby1vbmVyb3NvLCBpc2VudGEgZG8gcGFnYW1lbnRvIGRlIHJveWFsdGllcyBvdSBxdWFscXVlciBvdXRyYSBjb250cmFwcmVzdGHDp8OjbywgcGVjdW5pw6FyaWEgb3UgbsOjbywgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU8OjbyBQYXVsbyAoVU5JRkVTUCkgZG9zIGRpcmVpdG9zIGRlIGFybWF6ZW5hciBkaWdpdGFsbWVudGUsIGRlIHJlcHJvZHV6aXIgZSBkZSBkaXN0cmlidWlyIG5hY2lvbmFsIGUgaW50ZXJuYWNpb25hbG1lbnRlIGEgT2JyYSwgaW5jbHVpbmRvLXNlIG8gc2V1IHJlc3Vtby9hYnN0cmFjdCwgcG9yIG1laW9zIGVsZXRyw7RuaWNvcyBhbyBww7pibGljbyBlbSBnZXJhbCwgZW0gcmVnaW1lIGRlIGFjZXNzbyBhYmVydG8uCgozLiBBIHByZXNlbnRlIGxpY2Vuw6dhIHRhbWLDqW0gYWJyYW5nZSwgbm9zIG1lc21vcyB0ZXJtb3MgZXN0YWJlbGVjaWRvcyBubyBpdGVtIDIsIHN1cHJhLCBxdWFscXVlciBkaXJlaXRvIGRlIGNvbXVuaWNhw6fDo28gYW8gcMO6YmxpY28gY2Fiw612ZWwgZW0gcmVsYcOnw6NvIMOgIE9icmEgb3JhIGRlcG9zaXRhZGEsIGluY2x1aW5kby1zZSBvcyB1c29zIHJlZmVyZW50ZXMgw6AgcmVwcmVzZW50YcOnw6NvIHDDumJsaWNhIGUvb3UgZXhlY3XDp8OjbyBww7pibGljYSwgYmVtIGNvbW8gcXVhbHF1ZXIgb3V0cmEgbW9kYWxpZGFkZSBkZSBjb211bmljYcOnw6NvIGFvIHDDumJsaWNvIHF1ZSBleGlzdGEgb3UgdmVuaGEgYSBleGlzdGlyLCBub3MgdGVybW9zIGRvIGFydGlnbyA2OCBlIHNlZ3VpbnRlcyBkYSBMZWkgOS42MTAvOTgsIG5hIGV4dGVuc8OjbyBxdWUgZm9yIGFwbGljw6F2ZWwgYW9zIHNlcnZpw6dvcyBwcmVzdGFkb3MgYW8gcMO6YmxpY28gcGVsYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTw6NvIFBhdWxvIChVTklGRVNQKS4KCjQuIEVzdGEgbGljZW7Dp2EgYWJyYW5nZSwgYWluZGEsIG5vcyBtZXNtb3MgdGVybW9zIGVzdGFiZWxlY2lkb3Mgbm8gaXRlbSAyLCBzdXByYSwgdG9kb3Mgb3MgZGlyZWl0b3MgY29uZXhvcyBkZSBhcnRpc3RhcyBpbnTDqXJwcmV0ZXMgb3UgZXhlY3V0YW50ZXMsIHByb2R1dG9yZXMgZm9ub2dyw6FmaWNvcyBvdSBlbXByZXNhcyBkZSByYWRpb2RpZnVzw6NvIHF1ZSBldmVudHVhbG1lbnRlIHNlamFtIGFwbGljw6F2ZWlzIGVtIHJlbGHDp8OjbyDDoCBvYnJhIGRlcG9zaXRhZGEsIGVtIGNvbmZvcm1pZGFkZSBjb20gbyByZWdpbWUgZml4YWRvIG5vIFTDrXR1bG8gViBkYSBMZWkgOS42MTAvOTguCgo1LiBTZSBhIE9icmEgZGVwb3NpdGFkYSBmb2kgb3Ugw6kgb2JqZXRvIGRlIGZpbmFuY2lhbWVudG8gcG9yIGluc3RpdHVpw6fDtWVzIGRlIGZvbWVudG8gw6AgcGVzcXVpc2Egb3UgcXVhbHF1ZXIgb3V0cmEgc2VtZWxoYW50ZSwgdm9jw6ogb3UgbyB0aXR1bGFyIGFzc2VndXJhIHF1ZSBjdW1wcml1IHRvZGFzIGFzIG9icmlnYcOnw7VlcyBxdWUgbGhlIGZvcmFtIGltcG9zdGFzIHBlbGEgaW5zdGl0dWnDp8OjbyBmaW5hbmNpYWRvcmEgZW0gcmF6w6NvIGRvIGZpbmFuY2lhbWVudG8sIGUgcXVlIG7Do28gZXN0w6EgY29udHJhcmlhbmRvIHF1YWxxdWVyIGRpc3Bvc2nDp8OjbyBjb250cmF0dWFsIHJlZmVyZW50ZSDDoCBwdWJsaWNhw6fDo28gZG8gY29udGXDumRvIG9yYSBzdWJtZXRpZG8gYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgVU5JRkVTUC4KIAo2LiBBdXRvcml6YSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFPDo28gUGF1bG8gYSBkaXNwb25pYmlsaXphciBhIG9icmEgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgVU5JRkVTUCBkZSBmb3JtYSBncmF0dWl0YSwgZGUgYWNvcmRvIGNvbSBhIGxpY2Vuw6dhIHDDumJsaWNhIENyZWF0aXZlIENvbW1vbnM6IEF0cmlidWnDp8Ojby1TZW0gRGVyaXZhw6fDtWVzLVNlbSBEZXJpdmFkb3MgNC4wIEludGVybmFjaW9uYWwgKENDIEJZLU5DLU5EKSwgcGVybWl0aW5kbyBzZXUgbGl2cmUgYWNlc3NvLCB1c28gZSBjb21wYXJ0aWxoYW1lbnRvLCBkZXNkZSBxdWUgY2l0YWRhIGEgZm9udGUuIEEgb2JyYSBjb250aW51YSBwcm90ZWdpZGEgcG9yIERpcmVpdG9zIEF1dG9yYWlzIGUvb3UgcG9yIG91dHJhcyBsZWlzIGFwbGljw6F2ZWlzLiBRdWFscXVlciB1c28gZGEgb2JyYSwgcXVlIG7Do28gbyBhdXRvcml6YWRvIHNvYiBlc3RhIGxpY2Vuw6dhIG91IHBlbGEgbGVnaXNsYcOnw6NvIGF1dG9yYWwsIMOpIHByb2liaWRvLiAgCgo3LiBBdGVzdGEgcXVlIGEgT2JyYSBzdWJtZXRpZGEgbsOjbyBjb250w6ltIHF1YWxxdWVyIGluZm9ybWHDp8OjbyBjb25maWRlbmNpYWwgc3VhIG91IGRlIHRlcmNlaXJvcy4KCjguIEF0ZXN0YSBxdWUgbyB0cmFiYWxobyBzdWJtZXRpZG8gw6kgb3JpZ2luYWwgZSBmb2kgZWxhYm9yYWRvIHJlc3BlaXRhbmRvIG9zIHByaW5jw61waW9zIGRhIG1vcmFsIGUgZGEgw6l0aWNhIGUgbsOjbyB2aW9sb3UgcXVhbHF1ZXIgZGlyZWl0byBkZSBwcm9wcmllZGFkZSBpbnRlbGVjdHVhbCwgc29iIHBlbmEgZGUgcmVzcG9uZGVyIGNpdmlsLCBjcmltaW5hbCwgw6l0aWNhIGUgcHJvZmlzc2lvbmFsbWVudGUgcG9yIG1ldXMgYXRvczsKCjkuIEF0ZXN0YSBxdWUgYSB2ZXJzw6NvIGRvIHRyYWJhbGhvIHByZXNlbnRlIG5vIGFycXVpdm8gc3VibWV0aWRvIMOpIGEgdmVyc8OjbyBkZWZpbml0aXZhIHF1ZSBpbmNsdWkgYXMgYWx0ZXJhw6fDtWVzIGRlY29ycmVudGVzIGRhIGRlZmVzYSwgc29saWNpdGFkYXMgcGVsYSBiYW5jYSwgc2UgaG91dmUgYWxndW1hLCBvdSBzb2xpY2l0YWRhcyBwb3IgcGFydGUgZGUgb3JpZW50YcOnw6NvIGRvY2VudGUgcmVzcG9uc8OhdmVsOwoKMTAuIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU8OjbyBQYXVsbyAoVU5JRkVTUCkgbyBkaXJlaXRvIG7Do28gZXhjbHVzaXZvIGRlIHJlYWxpemFyIHF1YWlzcXVlciBhbHRlcmHDp8O1ZXMgbmEgbcOtZGlhIG91IG5vIGZvcm1hdG8gZG8gYXJxdWl2byBwYXJhIHByb3DDs3NpdG9zIGRlIHByZXNlcnZhw6fDo28gZGlnaXRhbCwgZGUgYWNlc3NpYmlsaWRhZGUgZSBkZSBtZWxob3IgaWRlbnRpZmljYcOnw6NvIGRvIHRyYWJhbGhvIHN1Ym1ldGlkbywgZGVzZGUgcXVlIG7Do28gc2VqYSBhbHRlcmFkbyBzZXUgY29udGXDumRvIGludGVsZWN0dWFsLgoKQW8gY29uY2x1aXIgYXMgZXRhcGFzIGRvIHByb2Nlc3NvIGRlIHN1Ym1pc3PDo28gZGUgYXJxdWl2b3Mgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgVU5JRkVTUCwgYXRlc3RvIHF1ZSBsaSBlIGNvbmNvcmRlaSBpbnRlZ3JhbG1lbnRlIGNvbSBvcyB0ZXJtb3MgYWNpbWEgZGVsaW1pdGFkb3MsIHNlbSBmYXplciBxdWFscXVlciByZXNlcnZhIGUgbm92YW1lbnRlIGNvbmZpcm1hbmRvIHF1ZSBjdW1wcm8gb3MgcmVxdWlzaXRvcyBpbmRpY2Fkb3Mgbm9zIGl0ZW5zIG1lbmNpb25hZG9zIGFudGVyaW9ybWVudGUuCgpIYXZlbmRvIHF1YWxxdWVyIGRpc2NvcmTDom5jaWEgZW0gcmVsYcOnw6NvIGEgcHJlc2VudGUgbGljZW7Dp2Egb3UgbsOjbyBzZSB2ZXJpZmljYW5kbyBvIGV4aWdpZG8gbm9zIGl0ZW5zIGFudGVyaW9yZXMsIHZvY8OqIGRldmUgaW50ZXJyb21wZXIgaW1lZGlhdGFtZW50ZSBvIHByb2Nlc3NvIGRlIHN1Ym1pc3PDo28uIEEgY29udGludWlkYWRlIGRvIHByb2Nlc3NvIGVxdWl2YWxlIMOgIGNvbmNvcmTDom5jaWEgZSDDoCBhc3NpbmF0dXJhIGRlc3RlIGRvY3VtZW50bywgY29tIHRvZGFzIGFzIGNvbnNlcXXDqm5jaWFzIG5lbGUgcHJldmlzdGFzLCBzdWplaXRhbmRvLXNlIG8gc2lnbmF0w6FyaW8gYSBzYW7Dp8O1ZXMgY2l2aXMgZSBjcmltaW5haXMgY2FzbyBuw6NvIHNlamEgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGF0cmltb25pYWlzIGUvb3UgY29uZXhvcyBhcGxpY8OhdmVpcyDDoCBPYnJhIGRlcG9zaXRhZGEgZHVyYW50ZSBlc3RlIHByb2Nlc3NvLCBvdSBjYXNvIG7Do28gdGVuaGEgb2J0aWRvIHByw6l2aWEgZSBleHByZXNzYSBhdXRvcml6YcOnw6NvIGRvIHRpdHVsYXIgcGFyYSBvIGRlcMOzc2l0byBlIHRvZG9zIG9zIHVzb3MgZGEgT2JyYSBlbnZvbHZpZG9zLgoKU2UgdGl2ZXIgcXVhbHF1ZXIgZMO6dmlkYSBxdWFudG8gYW9zIHRlcm1vcyBkZSBsaWNlbmNpYW1lbnRvIGUgcXVhbnRvIGFvIHByb2Nlc3NvIGRlIHN1Ym1pc3PDo28sIGVudHJlIGVtIGNvbnRhdG8gY29tIGEgYmlibGlvdGVjYSBkbyBzZXUgY2FtcHVzIChjb25zdWx0ZSBlbTogaHR0cHM6Ly9iaWJsaW90ZWNhcy51bmlmZXNwLmJyL2JpYmxpb3RlY2FzLWRhLXJlZGUpLiAKClPDo28gUGF1bG8sIEZyaSBBcHIgMjEgMTI6NTY6NTMgQlJUIDIwMjMuCg==
dc.title.pt_BR.fl_str_mv Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso
title Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso
spellingShingle Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso
Silva, Leonardo Fernandes [UNIFESP]
Diabetes Mellitus
Inteligência Artificial
Doenças Crônicas
Aprendizagem de máquina
Machine learning
Diabetes Mellitus
Artificial Intelligence
Chronic Diseases
title_short Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso
title_full Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso
title_fullStr Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso
title_full_unstemmed Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso
title_sort Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso
author Silva, Leonardo Fernandes [UNIFESP]
author_facet Silva, Leonardo Fernandes [UNIFESP]
author_role author
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4760019839583649
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7376085574661825
dc.contributor.institution.none.fl_str_mv Universidade Federal de São Paulo (UNIFESP)
dc.contributor.author.fl_str_mv Silva, Leonardo Fernandes [UNIFESP]
dc.contributor.advisor1.fl_str_mv Caranti, Danielle Arisa [UNIFESP]
contributor_str_mv Caranti, Danielle Arisa [UNIFESP]
dc.subject.por.fl_str_mv Diabetes Mellitus
Inteligência Artificial
Doenças Crônicas
Aprendizagem de máquina
topic Diabetes Mellitus
Inteligência Artificial
Doenças Crônicas
Aprendizagem de máquina
Machine learning
Diabetes Mellitus
Artificial Intelligence
Chronic Diseases
dc.subject.eng.fl_str_mv Machine learning
Diabetes Mellitus
Artificial Intelligence
Chronic Diseases
description Objetivo: Validar um modelo preditivo de diabetes do tipo 2 utilizando aprendizagem de máquina através de variáveis de fácil acesso e comparar os resultados dos bancos de dados VIGITEL e NHANES para validação da metodologia. Métodos: Após a seleção dos bancos de dados VIGITEL (2015) e NHANES (2014,15,16,17), foi aplicado critérios de inclusão e exclusão, aqueles que foram diagnosticados acima dos 30 anos e dados não faltantes, em cima dos indivíduos finais foi utilizado o método de balanceamento SMOTE para melhor aplicação dos algoritmos. Uma vez balanceado, foram aplicados os algoritmos “árvore de decisão”, “Floresta Aleatória” e “floresta de isolamento”. Resultados: O modelo de predição de diabetes tipo 2 apresentou melhor desempenho em todas as métricas em comparação com as outras duas doenças crônicas (dislipidemia e hipertensão arterial) no conjunto de dados do NHANES. No VIGITEL, o diabetes teve melhor desempenho em sensibilidade (73,25%) em comparação com as outras duas doenças, a hipertensão também teve alto desempenho em especificidade e acurácia (79,51% e 73,63%). Entre os dois conjuntos de dados, o NHANES teve melhor desempenho em todas as métricas em diabetes e hipertensão. Conclusões: O presente estudo apresentou evidências para a criação de um modelo preditivo através da utilização de aprendizagem de máquina para auxiliar no diagnóstico precoce de doenças crônicas através de variáveis de fácil acesso.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-04-25T18:38:30Z
dc.date.available.fl_str_mv 2023-04-25T18:38:30Z
dc.date.issued.fl_str_mv 2023-03-10
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Leonardo Fernandes. Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso. 2023. 56 f. Dissertação (Mestrado Interdisciplinar em Ciências da Saúde) - Instituto de Saúde e Sociedade, Universidade Federal de São Paulo, Santos, 2023.
dc.identifier.uri.fl_str_mv https://repositorio.unifesp.br/handle/11600/67419
dc.identifier.dark.fl_str_mv ark:/48912/0013000029gfq
dc.identifier.other.pt.fl_str_mv Processo SEI 23089.005778/2023-82
identifier_str_mv SILVA, Leonardo Fernandes. Modelo de aprendizado de máquina para predição de Diabetes tipo 2 por meio de variáveis de fácil acesso. 2023. 56 f. Dissertação (Mestrado Interdisciplinar em Ciências da Saúde) - Instituto de Saúde e Sociedade, Universidade Federal de São Paulo, Santos, 2023.
Processo SEI 23089.005778/2023-82
ark:/48912/0013000029gfq
url https://repositorio.unifesp.br/handle/11600/67419
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 56 f.
dc.publisher.none.fl_str_mv Universidade Federal de São Paulo
publisher.none.fl_str_mv Universidade Federal de São Paulo
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFESP
instname:Universidade Federal de São Paulo (UNIFESP)
instacron:UNIFESP
instname_str Universidade Federal de São Paulo (UNIFESP)
instacron_str UNIFESP
institution UNIFESP
reponame_str Repositório Institucional da UNIFESP
collection Repositório Institucional da UNIFESP
bitstream.url.fl_str_mv https://repositorio.unifesp.br/bitstreams/28c92f7c-a021-4d49-a7bc-a8607bee8f29/download
https://repositorio.unifesp.br/bitstreams/5733d4dc-f455-4d8c-ae62-6e097e72830e/download
https://repositorio.unifesp.br/bitstreams/1f88a0ab-5981-4c5c-88b2-6f955fc80f3e/download
https://repositorio.unifesp.br/bitstreams/2477c9a3-f113-4a23-8546-d8e370ff50c1/download
bitstream.checksum.fl_str_mv 95c0b1ed3f18d9da4725ce8e7df8ee53
bf40160ae1b20a0af34e242fba018aa1
78434a1acc64472d471d2a13a6a09c90
2264f1ddeff138c519d6ab6c8354ed13
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)
repository.mail.fl_str_mv biblioteca.csp@unifesp.br
_version_ 1863846255618162688