Exportação concluída — 

Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Schmidt, Fernanda Fortti Vianna
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/6/6143/tde-03092025-153742/
Resumo: Introdução: Entre as doenças crônicas não transmissíveis, o Acidente Vascular Cerebral (AVC) é a segunda causa mundial de morte e a terceira causa mundial de anos de vida saudável perdidos. AVC e Ataque Isquêmico Transitório (AIT) compartilham alguns dos mesmos fatores de risco e indivíduos que já vivenciaram um episódio de AIT possuem maior probabilidade de apresentar um evento de AVC. No âmbito da predição de eventos de AVC ou AIT, técnicas de modelagem preditiva de machine learning (ML) têm o potencial de superar limitações das metodologias estatísticas clássicas. Objetivo: Aplicar técnicas de ML e comparar seu desempenho na predição de eventos de AVC isquêmico, AVC hemorrágico ou AIT. Métodos: Utilizando dados do UK Biobank (UKB), uma coorte prospectiva do Reino Unido com cerca de 500 mil participantes, um pipeline de ML foi aplicado para 229.638 participantes e 3.918 eventos de AVC ou AIT (1,7%) em até aproximadamente 5 anos e 8 meses. Três algoritmos do tipo GBDT (XGBoost, LightGBM e CatBoost) foram testados em diferentes cenários comparativos. Resultados: Os algoritmos XGBoost e CatBoost apresentaram valores semelhantes de AUC ROC nos dados de teste, respectivamente 0,772 ± 0,009 (IC 95%: [0,755 - 0,789]) e 0,771 ± 0,008 (IC 95%: [0,755 - 0,789]). O conjunto reduzido de variáveis preditoras definidas com base no QStroke apresentou desempenho numericamente inferior - XGBoost: 0,729 ± 0,009 (IC 95%: [0,713 - 0,747]); CatBoost: 0,730 ± 0,009 (IC 95%: [0,713 - 0,747]). A variável idade foi a que apresentou maior importância preditora, com magnitude média de contribuição (valor SHAP médio absoluto) muito superior às demais variáveis. Conclusões: Técnicas de ML podem apresentar bom poder discriminativo para predição de eventos de AVC ou AIT na população geral, mesmo em contextos de baixa incidência.
id USP_bcce93a9fb9c9ac3a41e32e96da88815
oai_identifier_str oai:teses.usp.br:tde-03092025-153742
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learningPrediction of Stroke or Transient Ischemic Attack: application and comparison of machine learning techniquesAcidente Vascular CerebralAtaque Isquêmico TransitórioMachine learningMachine LearningPrediçãoPredictionStrokeTransient Ischemic AttackUK BiobankUK BiobankIntrodução: Entre as doenças crônicas não transmissíveis, o Acidente Vascular Cerebral (AVC) é a segunda causa mundial de morte e a terceira causa mundial de anos de vida saudável perdidos. AVC e Ataque Isquêmico Transitório (AIT) compartilham alguns dos mesmos fatores de risco e indivíduos que já vivenciaram um episódio de AIT possuem maior probabilidade de apresentar um evento de AVC. No âmbito da predição de eventos de AVC ou AIT, técnicas de modelagem preditiva de machine learning (ML) têm o potencial de superar limitações das metodologias estatísticas clássicas. Objetivo: Aplicar técnicas de ML e comparar seu desempenho na predição de eventos de AVC isquêmico, AVC hemorrágico ou AIT. Métodos: Utilizando dados do UK Biobank (UKB), uma coorte prospectiva do Reino Unido com cerca de 500 mil participantes, um pipeline de ML foi aplicado para 229.638 participantes e 3.918 eventos de AVC ou AIT (1,7%) em até aproximadamente 5 anos e 8 meses. Três algoritmos do tipo GBDT (XGBoost, LightGBM e CatBoost) foram testados em diferentes cenários comparativos. Resultados: Os algoritmos XGBoost e CatBoost apresentaram valores semelhantes de AUC ROC nos dados de teste, respectivamente 0,772 ± 0,009 (IC 95%: [0,755 - 0,789]) e 0,771 ± 0,008 (IC 95%: [0,755 - 0,789]). O conjunto reduzido de variáveis preditoras definidas com base no QStroke apresentou desempenho numericamente inferior - XGBoost: 0,729 ± 0,009 (IC 95%: [0,713 - 0,747]); CatBoost: 0,730 ± 0,009 (IC 95%: [0,713 - 0,747]). A variável idade foi a que apresentou maior importância preditora, com magnitude média de contribuição (valor SHAP médio absoluto) muito superior às demais variáveis. Conclusões: Técnicas de ML podem apresentar bom poder discriminativo para predição de eventos de AVC ou AIT na população geral, mesmo em contextos de baixa incidência.Introduction: Among non-communicable chronic diseases, stroke is the second leading cause of death worldwide and the third leading cause of Disability Adjusted Life Years (DALYs) worldwide. Stroke and Transient Ischemic Attack (TIA) share some of the same risk factors and individuals who have already experienced a TIA episode are more likely to have a stroke event. In the context of prediction of stroke or TIA events, machine learning (ML) predictive modeling techniques have the potential to overcome limitations of classical statistical techniques. Objective: Apply ML techniques and compare their performance in predicting ischemic stroke, hemorrhagic stroke or TIA events. Methods: Using data from UK Biobank (UKB), a prospective United Kingdom cohort of approximately 500,000 participants, an ML pipeline was applied to 229,638 participants and 3,918 stroke or TIA events (1.7%) up to approximately 5 years and 8 months. Three GBDT algorithms (XGBoost, LightGBM and CatBoost) were tested in different comparative scenarios. Results: XGBoost and CatBoost algorithms showed similar AUC ROC values on the test data, respectively 0.772 ± 0.009 (95% CI: [0.755 - 0.789]) and 0.771 ± 0.008 (95% CI: [0.755 - 0.789]). The reduced set of predictors that were defined based on QStroke showed numerically lower performance - XGBoost: 0.729 ± 0.009 (95% CI: [0.713 - 0.747]); CatBoost: 0.730 ± 0.009 (95% CI: [0.713 - 0.747]). Age was the predictor that presented the greatest predictive importance, with a mean contribution magnitude (mean absolute SHAP value) much higher than the other predictors. Conclusions: ML techniques may present good discriminative power for predicting stroke or TIA events in the general population, even in low incidence contexts.Biblioteca Digitais de Teses e Dissertações da USPChiavegatto Filho, Alexandre Dias PortoSchmidt, Fernanda Fortti Vianna2025-07-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/6/6143/tde-03092025-153742/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-09-03T18:44:03Zoai:teses.usp.br:tde-03092025-153742Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-09-03T18:44:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning
Prediction of Stroke or Transient Ischemic Attack: application and comparison of machine learning techniques
title Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning
spellingShingle Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning
Schmidt, Fernanda Fortti Vianna
Acidente Vascular Cerebral
Ataque Isquêmico Transitório
Machine learning
Machine Learning
Predição
Prediction
Stroke
Transient Ischemic Attack
UK Biobank
UK Biobank
title_short Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning
title_full Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning
title_fullStr Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning
title_full_unstemmed Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning
title_sort Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning
author Schmidt, Fernanda Fortti Vianna
author_facet Schmidt, Fernanda Fortti Vianna
author_role author
dc.contributor.none.fl_str_mv Chiavegatto Filho, Alexandre Dias Porto
dc.contributor.author.fl_str_mv Schmidt, Fernanda Fortti Vianna
dc.subject.por.fl_str_mv Acidente Vascular Cerebral
Ataque Isquêmico Transitório
Machine learning
Machine Learning
Predição
Prediction
Stroke
Transient Ischemic Attack
UK Biobank
UK Biobank
topic Acidente Vascular Cerebral
Ataque Isquêmico Transitório
Machine learning
Machine Learning
Predição
Prediction
Stroke
Transient Ischemic Attack
UK Biobank
UK Biobank
description Introdução: Entre as doenças crônicas não transmissíveis, o Acidente Vascular Cerebral (AVC) é a segunda causa mundial de morte e a terceira causa mundial de anos de vida saudável perdidos. AVC e Ataque Isquêmico Transitório (AIT) compartilham alguns dos mesmos fatores de risco e indivíduos que já vivenciaram um episódio de AIT possuem maior probabilidade de apresentar um evento de AVC. No âmbito da predição de eventos de AVC ou AIT, técnicas de modelagem preditiva de machine learning (ML) têm o potencial de superar limitações das metodologias estatísticas clássicas. Objetivo: Aplicar técnicas de ML e comparar seu desempenho na predição de eventos de AVC isquêmico, AVC hemorrágico ou AIT. Métodos: Utilizando dados do UK Biobank (UKB), uma coorte prospectiva do Reino Unido com cerca de 500 mil participantes, um pipeline de ML foi aplicado para 229.638 participantes e 3.918 eventos de AVC ou AIT (1,7%) em até aproximadamente 5 anos e 8 meses. Três algoritmos do tipo GBDT (XGBoost, LightGBM e CatBoost) foram testados em diferentes cenários comparativos. Resultados: Os algoritmos XGBoost e CatBoost apresentaram valores semelhantes de AUC ROC nos dados de teste, respectivamente 0,772 ± 0,009 (IC 95%: [0,755 - 0,789]) e 0,771 ± 0,008 (IC 95%: [0,755 - 0,789]). O conjunto reduzido de variáveis preditoras definidas com base no QStroke apresentou desempenho numericamente inferior - XGBoost: 0,729 ± 0,009 (IC 95%: [0,713 - 0,747]); CatBoost: 0,730 ± 0,009 (IC 95%: [0,713 - 0,747]). A variável idade foi a que apresentou maior importância preditora, com magnitude média de contribuição (valor SHAP médio absoluto) muito superior às demais variáveis. Conclusões: Técnicas de ML podem apresentar bom poder discriminativo para predição de eventos de AVC ou AIT na população geral, mesmo em contextos de baixa incidência.
publishDate 2025
dc.date.none.fl_str_mv 2025-07-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/6/6143/tde-03092025-153742/
url https://www.teses.usp.br/teses/disponiveis/6/6143/tde-03092025-153742/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1848370479732097024