Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.unb.br/handle/10482/51728 |
Resumo: | Introdução: A resistência à insulina é definida como uma diminuição da resposta dos tecidos às ações celulares mediadas pela insulina, sendo o inverso da sensibilidade à insulina. Atualmente existem métodos considerados padrão-ouro para medir a resistência à insulina, como o clamp euglicêmico hiperinsulinêmico e o clamp hiperglicêmico. Mas, estes métodos são caros, trabalhosos e raramente utilizados em grandes estudos epidemiológicos. Objetivo: Avaliar o melhor modelo preditivo de aprendizado de máquina para prever a resistência à insulina no Estudo de Riscos Cardiovasculares em Adolescentes (ERICA) 2013-2014. Métodos: Estudamos aproximadamente 38.000 adolescentes, utilizando as variáveis HDL colesterol, LDL colesterol, triglicerídeos, circunferência da cintura, estado nutricional, inatividade física, tabagismo, consumo de álcool, comportamento sedentário, nível socioeconômico, pressão arterial e idade para criação dos modelos de aprendizado de máquina. A amostra foi estratificada por sexo e desenvolvemos os modelos: Regressão Logística (RL), Poisson, Rede Neural Profunda (RNP), XGBoost, Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM). Avaliámos os modelos utilizando a área sob a curva (AUC), as curvas de calibração e a análise da curva de decisão (DCA) e o gráfico SHapley Additive exPlanations. Resultados: Os modelos RL, Poisson, XGBoost, RNP e RF apresentaram a AUC mais elevada, variando entre 0,72 e 0,8 para meninos e meninas. Três modelos (RL, XGBoost e RNP) apresentaram uma calibração mais elevada nas meninas do que nos meninos, 80% e 60%, respetivamente. A curva DCA mostrou valores de prevalência em torno de 18% para as meninas e 16% para os meninos e, para além deste limiar de probabilidade, todos os modelos, com exceção do modelo SVM, poderiam ser benéficos na intervenção clínica. Por fim, os preditores clínicos mais importantes encontrados para ambos os sexos foram a circunferência da cintura, triglicerídeos e idade. Conclusões: Nosso estudo sugere que a RL pode ser útil para prever a resistência à insulina em adolescentes do ERICA , pois destaca-se como a melhor escolha devido à sua interpretabilidade, ampla aplicabilidade em contextos clínicos, eficiência computacional e desempenho comparável aos outros modelos desenvolvidos. |
| id |
UNB_15a119b71da1b30a1f4398d142af70ec |
|---|---|
| oai_identifier_str |
oai:repositorio.unb.br:10482/51728 |
| network_acronym_str |
UNB |
| network_name_str |
Repositório Institucional da UnB |
| repository_id_str |
|
| spelling |
Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em AdolescentesAprendizagem de máquinaResistência à insulinaAdolescentesSaúde públicaIntrodução: A resistência à insulina é definida como uma diminuição da resposta dos tecidos às ações celulares mediadas pela insulina, sendo o inverso da sensibilidade à insulina. Atualmente existem métodos considerados padrão-ouro para medir a resistência à insulina, como o clamp euglicêmico hiperinsulinêmico e o clamp hiperglicêmico. Mas, estes métodos são caros, trabalhosos e raramente utilizados em grandes estudos epidemiológicos. Objetivo: Avaliar o melhor modelo preditivo de aprendizado de máquina para prever a resistência à insulina no Estudo de Riscos Cardiovasculares em Adolescentes (ERICA) 2013-2014. Métodos: Estudamos aproximadamente 38.000 adolescentes, utilizando as variáveis HDL colesterol, LDL colesterol, triglicerídeos, circunferência da cintura, estado nutricional, inatividade física, tabagismo, consumo de álcool, comportamento sedentário, nível socioeconômico, pressão arterial e idade para criação dos modelos de aprendizado de máquina. A amostra foi estratificada por sexo e desenvolvemos os modelos: Regressão Logística (RL), Poisson, Rede Neural Profunda (RNP), XGBoost, Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM). Avaliámos os modelos utilizando a área sob a curva (AUC), as curvas de calibração e a análise da curva de decisão (DCA) e o gráfico SHapley Additive exPlanations. Resultados: Os modelos RL, Poisson, XGBoost, RNP e RF apresentaram a AUC mais elevada, variando entre 0,72 e 0,8 para meninos e meninas. Três modelos (RL, XGBoost e RNP) apresentaram uma calibração mais elevada nas meninas do que nos meninos, 80% e 60%, respetivamente. A curva DCA mostrou valores de prevalência em torno de 18% para as meninas e 16% para os meninos e, para além deste limiar de probabilidade, todos os modelos, com exceção do modelo SVM, poderiam ser benéficos na intervenção clínica. Por fim, os preditores clínicos mais importantes encontrados para ambos os sexos foram a circunferência da cintura, triglicerídeos e idade. Conclusões: Nosso estudo sugere que a RL pode ser útil para prever a resistência à insulina em adolescentes do ERICA , pois destaca-se como a melhor escolha devido à sua interpretabilidade, ampla aplicabilidade em contextos clínicos, eficiência computacional e desempenho comparável aos outros modelos desenvolvidos.Introduction: Insulin resistance is defined as a decreased tissue response to insulinmediated cellular actions, and it is the inverse of insulin sensitivity. There are currently methods considered the gold standard for measuring insulin resistance, such as the hyperinsulinemic euglycemic clamp and the hyperglycemic clamp. However, these methods are expensive and are rarely used in large epidemiological studies. Aim: Asessment of machine learning models performance for clinical prediction of insulin resistance in The Study of Cardiovascular Risk in Adolescents (ERICA) 2013-2014. Methods: We studied approximately 38,000 adolescents and considered HDL cholesterol, LDL cholesterol, triglycerides, waist circumference, nutritional status, physical inactivity, smoking habits, alcohol consumption, sedentary behavior, socioeconomic status, blood pressure and age variables. We began stratifying the subset by sex and create the model building process for machine learning models logistic regression (LR), Poisson, Deep Neural Network (DNN), eXtreme Gradient Boosting (XGBoost), Random Forest (RF), Decision Tree (DT) and Support Vector Machine (SVM). We evaluate the models using area under the curve (AUC), calibration curves and decision curve analysis (DCA). Finally, we used SHapley Additive exPlanations. Results: LR, Poisson, XGBoost, DNN and RF models had the highest AUC ranging from 0.72 to 0.8 for boys and girls. Three models (LR, XGBoost and DNN) had higher calibration in girls than in boys, up to 80% vs up to 60%, respectively. The DCA curve showed prevalence values around 18% for girls and 16% for boys, and beyond this threshold of probability, all models could provide beneficial in clinical intervention, with exception of SVM model. Finally, the most important clinical predictors for both sexes were waist circumference, triglycerides and age. Conclusions: Our study suggests that the LR model could be useful to predict insulin resistance in ERICA adolescents and stands out as the most appropriate choice in this context due to its interpretability, broad applicability in clinical settings, computational efficiency, and comparable performance to other developed models.Faculdade de Medicina (FM)Programa de Pós-Graduação em Ciências MédicasRodrigues, Rodolfo Rego DeusdaraSilva, Jéssica Aparecida2025-02-25T17:34:57Z2025-02-25T17:34:57Z2025-02-252024-12-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Jéssica Aparecida. Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes.. 2024. 75 f. Dissertação (Mestrado em Ciências Médicas) — Universidade de Brasília, Brasília, 2024.http://repositorio.unb.br/handle/10482/51728porA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2025-02-25T17:34:58Zoai:repositorio.unb.br:10482/51728Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2025-02-25T17:34:58Repositório Institucional da UnB - Universidade de Brasília (UnB)false |
| dc.title.none.fl_str_mv |
Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes |
| title |
Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes |
| spellingShingle |
Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes Silva, Jéssica Aparecida Aprendizagem de máquina Resistência à insulina Adolescentes Saúde pública |
| title_short |
Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes |
| title_full |
Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes |
| title_fullStr |
Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes |
| title_full_unstemmed |
Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes |
| title_sort |
Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes |
| author |
Silva, Jéssica Aparecida |
| author_facet |
Silva, Jéssica Aparecida |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Rodrigues, Rodolfo Rego Deusdara |
| dc.contributor.author.fl_str_mv |
Silva, Jéssica Aparecida |
| dc.subject.por.fl_str_mv |
Aprendizagem de máquina Resistência à insulina Adolescentes Saúde pública |
| topic |
Aprendizagem de máquina Resistência à insulina Adolescentes Saúde pública |
| description |
Introdução: A resistência à insulina é definida como uma diminuição da resposta dos tecidos às ações celulares mediadas pela insulina, sendo o inverso da sensibilidade à insulina. Atualmente existem métodos considerados padrão-ouro para medir a resistência à insulina, como o clamp euglicêmico hiperinsulinêmico e o clamp hiperglicêmico. Mas, estes métodos são caros, trabalhosos e raramente utilizados em grandes estudos epidemiológicos. Objetivo: Avaliar o melhor modelo preditivo de aprendizado de máquina para prever a resistência à insulina no Estudo de Riscos Cardiovasculares em Adolescentes (ERICA) 2013-2014. Métodos: Estudamos aproximadamente 38.000 adolescentes, utilizando as variáveis HDL colesterol, LDL colesterol, triglicerídeos, circunferência da cintura, estado nutricional, inatividade física, tabagismo, consumo de álcool, comportamento sedentário, nível socioeconômico, pressão arterial e idade para criação dos modelos de aprendizado de máquina. A amostra foi estratificada por sexo e desenvolvemos os modelos: Regressão Logística (RL), Poisson, Rede Neural Profunda (RNP), XGBoost, Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM). Avaliámos os modelos utilizando a área sob a curva (AUC), as curvas de calibração e a análise da curva de decisão (DCA) e o gráfico SHapley Additive exPlanations. Resultados: Os modelos RL, Poisson, XGBoost, RNP e RF apresentaram a AUC mais elevada, variando entre 0,72 e 0,8 para meninos e meninas. Três modelos (RL, XGBoost e RNP) apresentaram uma calibração mais elevada nas meninas do que nos meninos, 80% e 60%, respetivamente. A curva DCA mostrou valores de prevalência em torno de 18% para as meninas e 16% para os meninos e, para além deste limiar de probabilidade, todos os modelos, com exceção do modelo SVM, poderiam ser benéficos na intervenção clínica. Por fim, os preditores clínicos mais importantes encontrados para ambos os sexos foram a circunferência da cintura, triglicerídeos e idade. Conclusões: Nosso estudo sugere que a RL pode ser útil para prever a resistência à insulina em adolescentes do ERICA , pois destaca-se como a melhor escolha devido à sua interpretabilidade, ampla aplicabilidade em contextos clínicos, eficiência computacional e desempenho comparável aos outros modelos desenvolvidos. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-12-09 2025-02-25T17:34:57Z 2025-02-25T17:34:57Z 2025-02-25 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
SILVA, Jéssica Aparecida. Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes.. 2024. 75 f. Dissertação (Mestrado em Ciências Médicas) — Universidade de Brasília, Brasília, 2024. http://repositorio.unb.br/handle/10482/51728 |
| identifier_str_mv |
SILVA, Jéssica Aparecida. Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes.. 2024. 75 f. Dissertação (Mestrado em Ciências Médicas) — Universidade de Brasília, Brasília, 2024. |
| url |
http://repositorio.unb.br/handle/10482/51728 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
| instname_str |
Universidade de Brasília (UnB) |
| instacron_str |
UNB |
| institution |
UNB |
| reponame_str |
Repositório Institucional da UnB |
| collection |
Repositório Institucional da UnB |
| repository.name.fl_str_mv |
Repositório Institucional da UnB - Universidade de Brasília (UnB) |
| repository.mail.fl_str_mv |
repositorio@unb.br |
| _version_ |
1839083775105957888 |