Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Silva, Jéssica Aparecida
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.unb.br/handle/10482/51728
Resumo: Introdução: A resistência à insulina é definida como uma diminuição da resposta dos tecidos às ações celulares mediadas pela insulina, sendo o inverso da sensibilidade à insulina. Atualmente existem métodos considerados padrão-ouro para medir a resistência à insulina, como o clamp euglicêmico hiperinsulinêmico e o clamp hiperglicêmico. Mas, estes métodos são caros, trabalhosos e raramente utilizados em grandes estudos epidemiológicos. Objetivo: Avaliar o melhor modelo preditivo de aprendizado de máquina para prever a resistência à insulina no Estudo de Riscos Cardiovasculares em Adolescentes (ERICA) 2013-2014. Métodos: Estudamos aproximadamente 38.000 adolescentes, utilizando as variáveis HDL colesterol, LDL colesterol, triglicerídeos, circunferência da cintura, estado nutricional, inatividade física, tabagismo, consumo de álcool, comportamento sedentário, nível socioeconômico, pressão arterial e idade para criação dos modelos de aprendizado de máquina. A amostra foi estratificada por sexo e desenvolvemos os modelos: Regressão Logística (RL), Poisson, Rede Neural Profunda (RNP), XGBoost, Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM). Avaliámos os modelos utilizando a área sob a curva (AUC), as curvas de calibração e a análise da curva de decisão (DCA) e o gráfico SHapley Additive exPlanations. Resultados: Os modelos RL, Poisson, XGBoost, RNP e RF apresentaram a AUC mais elevada, variando entre 0,72 e 0,8 para meninos e meninas. Três modelos (RL, XGBoost e RNP) apresentaram uma calibração mais elevada nas meninas do que nos meninos, 80% e 60%, respetivamente. A curva DCA mostrou valores de prevalência em torno de 18% para as meninas e 16% para os meninos e, para além deste limiar de probabilidade, todos os modelos, com exceção do modelo SVM, poderiam ser benéficos na intervenção clínica. Por fim, os preditores clínicos mais importantes encontrados para ambos os sexos foram a circunferência da cintura, triglicerídeos e idade. Conclusões: Nosso estudo sugere que a RL pode ser útil para prever a resistência à insulina em adolescentes do ERICA , pois destaca-se como a melhor escolha devido à sua interpretabilidade, ampla aplicabilidade em contextos clínicos, eficiência computacional e desempenho comparável aos outros modelos desenvolvidos.
id UNB_15a119b71da1b30a1f4398d142af70ec
oai_identifier_str oai:repositorio.unb.br:10482/51728
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em AdolescentesAprendizagem de máquinaResistência à insulinaAdolescentesSaúde públicaIntrodução: A resistência à insulina é definida como uma diminuição da resposta dos tecidos às ações celulares mediadas pela insulina, sendo o inverso da sensibilidade à insulina. Atualmente existem métodos considerados padrão-ouro para medir a resistência à insulina, como o clamp euglicêmico hiperinsulinêmico e o clamp hiperglicêmico. Mas, estes métodos são caros, trabalhosos e raramente utilizados em grandes estudos epidemiológicos. Objetivo: Avaliar o melhor modelo preditivo de aprendizado de máquina para prever a resistência à insulina no Estudo de Riscos Cardiovasculares em Adolescentes (ERICA) 2013-2014. Métodos: Estudamos aproximadamente 38.000 adolescentes, utilizando as variáveis HDL colesterol, LDL colesterol, triglicerídeos, circunferência da cintura, estado nutricional, inatividade física, tabagismo, consumo de álcool, comportamento sedentário, nível socioeconômico, pressão arterial e idade para criação dos modelos de aprendizado de máquina. A amostra foi estratificada por sexo e desenvolvemos os modelos: Regressão Logística (RL), Poisson, Rede Neural Profunda (RNP), XGBoost, Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM). Avaliámos os modelos utilizando a área sob a curva (AUC), as curvas de calibração e a análise da curva de decisão (DCA) e o gráfico SHapley Additive exPlanations. Resultados: Os modelos RL, Poisson, XGBoost, RNP e RF apresentaram a AUC mais elevada, variando entre 0,72 e 0,8 para meninos e meninas. Três modelos (RL, XGBoost e RNP) apresentaram uma calibração mais elevada nas meninas do que nos meninos, 80% e 60%, respetivamente. A curva DCA mostrou valores de prevalência em torno de 18% para as meninas e 16% para os meninos e, para além deste limiar de probabilidade, todos os modelos, com exceção do modelo SVM, poderiam ser benéficos na intervenção clínica. Por fim, os preditores clínicos mais importantes encontrados para ambos os sexos foram a circunferência da cintura, triglicerídeos e idade. Conclusões: Nosso estudo sugere que a RL pode ser útil para prever a resistência à insulina em adolescentes do ERICA , pois destaca-se como a melhor escolha devido à sua interpretabilidade, ampla aplicabilidade em contextos clínicos, eficiência computacional e desempenho comparável aos outros modelos desenvolvidos.Introduction: Insulin resistance is defined as a decreased tissue response to insulinmediated cellular actions, and it is the inverse of insulin sensitivity. There are currently methods considered the gold standard for measuring insulin resistance, such as the hyperinsulinemic euglycemic clamp and the hyperglycemic clamp. However, these methods are expensive and are rarely used in large epidemiological studies. Aim: Asessment of machine learning models performance for clinical prediction of insulin resistance in The Study of Cardiovascular Risk in Adolescents (ERICA) 2013-2014. Methods: We studied approximately 38,000 adolescents and considered HDL cholesterol, LDL cholesterol, triglycerides, waist circumference, nutritional status, physical inactivity, smoking habits, alcohol consumption, sedentary behavior, socioeconomic status, blood pressure and age variables. We began stratifying the subset by sex and create the model building process for machine learning models logistic regression (LR), Poisson, Deep Neural Network (DNN), eXtreme Gradient Boosting (XGBoost), Random Forest (RF), Decision Tree (DT) and Support Vector Machine (SVM). We evaluate the models using area under the curve (AUC), calibration curves and decision curve analysis (DCA). Finally, we used SHapley Additive exPlanations. Results: LR, Poisson, XGBoost, DNN and RF models had the highest AUC ranging from 0.72 to 0.8 for boys and girls. Three models (LR, XGBoost and DNN) had higher calibration in girls than in boys, up to 80% vs up to 60%, respectively. The DCA curve showed prevalence values around 18% for girls and 16% for boys, and beyond this threshold of probability, all models could provide beneficial in clinical intervention, with exception of SVM model. Finally, the most important clinical predictors for both sexes were waist circumference, triglycerides and age. Conclusions: Our study suggests that the LR model could be useful to predict insulin resistance in ERICA adolescents and stands out as the most appropriate choice in this context due to its interpretability, broad applicability in clinical settings, computational efficiency, and comparable performance to other developed models.Faculdade de Medicina (FM)Programa de Pós-Graduação em Ciências MédicasRodrigues, Rodolfo Rego DeusdaraSilva, Jéssica Aparecida2025-02-25T17:34:57Z2025-02-25T17:34:57Z2025-02-252024-12-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Jéssica Aparecida. Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes.. 2024. 75 f. Dissertação (Mestrado em Ciências Médicas) — Universidade de Brasília, Brasília, 2024.http://repositorio.unb.br/handle/10482/51728porA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2025-02-25T17:34:58Zoai:repositorio.unb.br:10482/51728Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2025-02-25T17:34:58Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes
title Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes
spellingShingle Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes
Silva, Jéssica Aparecida
Aprendizagem de máquina
Resistência à insulina
Adolescentes
Saúde pública
title_short Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes
title_full Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes
title_fullStr Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes
title_full_unstemmed Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes
title_sort Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes
author Silva, Jéssica Aparecida
author_facet Silva, Jéssica Aparecida
author_role author
dc.contributor.none.fl_str_mv Rodrigues, Rodolfo Rego Deusdara
dc.contributor.author.fl_str_mv Silva, Jéssica Aparecida
dc.subject.por.fl_str_mv Aprendizagem de máquina
Resistência à insulina
Adolescentes
Saúde pública
topic Aprendizagem de máquina
Resistência à insulina
Adolescentes
Saúde pública
description Introdução: A resistência à insulina é definida como uma diminuição da resposta dos tecidos às ações celulares mediadas pela insulina, sendo o inverso da sensibilidade à insulina. Atualmente existem métodos considerados padrão-ouro para medir a resistência à insulina, como o clamp euglicêmico hiperinsulinêmico e o clamp hiperglicêmico. Mas, estes métodos são caros, trabalhosos e raramente utilizados em grandes estudos epidemiológicos. Objetivo: Avaliar o melhor modelo preditivo de aprendizado de máquina para prever a resistência à insulina no Estudo de Riscos Cardiovasculares em Adolescentes (ERICA) 2013-2014. Métodos: Estudamos aproximadamente 38.000 adolescentes, utilizando as variáveis HDL colesterol, LDL colesterol, triglicerídeos, circunferência da cintura, estado nutricional, inatividade física, tabagismo, consumo de álcool, comportamento sedentário, nível socioeconômico, pressão arterial e idade para criação dos modelos de aprendizado de máquina. A amostra foi estratificada por sexo e desenvolvemos os modelos: Regressão Logística (RL), Poisson, Rede Neural Profunda (RNP), XGBoost, Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM). Avaliámos os modelos utilizando a área sob a curva (AUC), as curvas de calibração e a análise da curva de decisão (DCA) e o gráfico SHapley Additive exPlanations. Resultados: Os modelos RL, Poisson, XGBoost, RNP e RF apresentaram a AUC mais elevada, variando entre 0,72 e 0,8 para meninos e meninas. Três modelos (RL, XGBoost e RNP) apresentaram uma calibração mais elevada nas meninas do que nos meninos, 80% e 60%, respetivamente. A curva DCA mostrou valores de prevalência em torno de 18% para as meninas e 16% para os meninos e, para além deste limiar de probabilidade, todos os modelos, com exceção do modelo SVM, poderiam ser benéficos na intervenção clínica. Por fim, os preditores clínicos mais importantes encontrados para ambos os sexos foram a circunferência da cintura, triglicerídeos e idade. Conclusões: Nosso estudo sugere que a RL pode ser útil para prever a resistência à insulina em adolescentes do ERICA , pois destaca-se como a melhor escolha devido à sua interpretabilidade, ampla aplicabilidade em contextos clínicos, eficiência computacional e desempenho comparável aos outros modelos desenvolvidos.
publishDate 2024
dc.date.none.fl_str_mv 2024-12-09
2025-02-25T17:34:57Z
2025-02-25T17:34:57Z
2025-02-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Jéssica Aparecida. Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes.. 2024. 75 f. Dissertação (Mestrado em Ciências Médicas) — Universidade de Brasília, Brasília, 2024.
http://repositorio.unb.br/handle/10482/51728
identifier_str_mv SILVA, Jéssica Aparecida. Avaliação do modelo de aprendizado de máquina com a melhor performance para predizer a resistência insulínica em adolescentes do Estudo de Riscos Cardiovasculares em Adolescentes.. 2024. 75 f. Dissertação (Mestrado em Ciências Médicas) — Universidade de Brasília, Brasília, 2024.
url http://repositorio.unb.br/handle/10482/51728
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1839083775105957888