Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/6/6143/tde-03092025-153742/ |
Resumo: | Introdução: Entre as doenças crônicas não transmissíveis, o Acidente Vascular Cerebral (AVC) é a segunda causa mundial de morte e a terceira causa mundial de anos de vida saudável perdidos. AVC e Ataque Isquêmico Transitório (AIT) compartilham alguns dos mesmos fatores de risco e indivíduos que já vivenciaram um episódio de AIT possuem maior probabilidade de apresentar um evento de AVC. No âmbito da predição de eventos de AVC ou AIT, técnicas de modelagem preditiva de machine learning (ML) têm o potencial de superar limitações das metodologias estatísticas clássicas. Objetivo: Aplicar técnicas de ML e comparar seu desempenho na predição de eventos de AVC isquêmico, AVC hemorrágico ou AIT. Métodos: Utilizando dados do UK Biobank (UKB), uma coorte prospectiva do Reino Unido com cerca de 500 mil participantes, um pipeline de ML foi aplicado para 229.638 participantes e 3.918 eventos de AVC ou AIT (1,7%) em até aproximadamente 5 anos e 8 meses. Três algoritmos do tipo GBDT (XGBoost, LightGBM e CatBoost) foram testados em diferentes cenários comparativos. Resultados: Os algoritmos XGBoost e CatBoost apresentaram valores semelhantes de AUC ROC nos dados de teste, respectivamente 0,772 ± 0,009 (IC 95%: [0,755 - 0,789]) e 0,771 ± 0,008 (IC 95%: [0,755 - 0,789]). O conjunto reduzido de variáveis preditoras definidas com base no QStroke apresentou desempenho numericamente inferior - XGBoost: 0,729 ± 0,009 (IC 95%: [0,713 - 0,747]); CatBoost: 0,730 ± 0,009 (IC 95%: [0,713 - 0,747]). A variável idade foi a que apresentou maior importância preditora, com magnitude média de contribuição (valor SHAP médio absoluto) muito superior às demais variáveis. Conclusões: Técnicas de ML podem apresentar bom poder discriminativo para predição de eventos de AVC ou AIT na população geral, mesmo em contextos de baixa incidência. |
| id |
USP_bcce93a9fb9c9ac3a41e32e96da88815 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-03092025-153742 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learningPrediction of Stroke or Transient Ischemic Attack: application and comparison of machine learning techniquesAcidente Vascular CerebralAtaque Isquêmico TransitórioMachine learningMachine LearningPrediçãoPredictionStrokeTransient Ischemic AttackUK BiobankUK BiobankIntrodução: Entre as doenças crônicas não transmissíveis, o Acidente Vascular Cerebral (AVC) é a segunda causa mundial de morte e a terceira causa mundial de anos de vida saudável perdidos. AVC e Ataque Isquêmico Transitório (AIT) compartilham alguns dos mesmos fatores de risco e indivíduos que já vivenciaram um episódio de AIT possuem maior probabilidade de apresentar um evento de AVC. No âmbito da predição de eventos de AVC ou AIT, técnicas de modelagem preditiva de machine learning (ML) têm o potencial de superar limitações das metodologias estatísticas clássicas. Objetivo: Aplicar técnicas de ML e comparar seu desempenho na predição de eventos de AVC isquêmico, AVC hemorrágico ou AIT. Métodos: Utilizando dados do UK Biobank (UKB), uma coorte prospectiva do Reino Unido com cerca de 500 mil participantes, um pipeline de ML foi aplicado para 229.638 participantes e 3.918 eventos de AVC ou AIT (1,7%) em até aproximadamente 5 anos e 8 meses. Três algoritmos do tipo GBDT (XGBoost, LightGBM e CatBoost) foram testados em diferentes cenários comparativos. Resultados: Os algoritmos XGBoost e CatBoost apresentaram valores semelhantes de AUC ROC nos dados de teste, respectivamente 0,772 ± 0,009 (IC 95%: [0,755 - 0,789]) e 0,771 ± 0,008 (IC 95%: [0,755 - 0,789]). O conjunto reduzido de variáveis preditoras definidas com base no QStroke apresentou desempenho numericamente inferior - XGBoost: 0,729 ± 0,009 (IC 95%: [0,713 - 0,747]); CatBoost: 0,730 ± 0,009 (IC 95%: [0,713 - 0,747]). A variável idade foi a que apresentou maior importância preditora, com magnitude média de contribuição (valor SHAP médio absoluto) muito superior às demais variáveis. Conclusões: Técnicas de ML podem apresentar bom poder discriminativo para predição de eventos de AVC ou AIT na população geral, mesmo em contextos de baixa incidência.Introduction: Among non-communicable chronic diseases, stroke is the second leading cause of death worldwide and the third leading cause of Disability Adjusted Life Years (DALYs) worldwide. Stroke and Transient Ischemic Attack (TIA) share some of the same risk factors and individuals who have already experienced a TIA episode are more likely to have a stroke event. In the context of prediction of stroke or TIA events, machine learning (ML) predictive modeling techniques have the potential to overcome limitations of classical statistical techniques. Objective: Apply ML techniques and compare their performance in predicting ischemic stroke, hemorrhagic stroke or TIA events. Methods: Using data from UK Biobank (UKB), a prospective United Kingdom cohort of approximately 500,000 participants, an ML pipeline was applied to 229,638 participants and 3,918 stroke or TIA events (1.7%) up to approximately 5 years and 8 months. Three GBDT algorithms (XGBoost, LightGBM and CatBoost) were tested in different comparative scenarios. Results: XGBoost and CatBoost algorithms showed similar AUC ROC values on the test data, respectively 0.772 ± 0.009 (95% CI: [0.755 - 0.789]) and 0.771 ± 0.008 (95% CI: [0.755 - 0.789]). The reduced set of predictors that were defined based on QStroke showed numerically lower performance - XGBoost: 0.729 ± 0.009 (95% CI: [0.713 - 0.747]); CatBoost: 0.730 ± 0.009 (95% CI: [0.713 - 0.747]). Age was the predictor that presented the greatest predictive importance, with a mean contribution magnitude (mean absolute SHAP value) much higher than the other predictors. Conclusions: ML techniques may present good discriminative power for predicting stroke or TIA events in the general population, even in low incidence contexts.Biblioteca Digitais de Teses e Dissertações da USPChiavegatto Filho, Alexandre Dias PortoSchmidt, Fernanda Fortti Vianna2025-07-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/6/6143/tde-03092025-153742/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-09-03T18:44:03Zoai:teses.usp.br:tde-03092025-153742Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-09-03T18:44:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning Prediction of Stroke or Transient Ischemic Attack: application and comparison of machine learning techniques |
| title |
Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning |
| spellingShingle |
Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning Schmidt, Fernanda Fortti Vianna Acidente Vascular Cerebral Ataque Isquêmico Transitório Machine learning Machine Learning Predição Prediction Stroke Transient Ischemic Attack UK Biobank UK Biobank |
| title_short |
Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning |
| title_full |
Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning |
| title_fullStr |
Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning |
| title_full_unstemmed |
Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning |
| title_sort |
Predição de Acidente Vascular Cerebral ou Ataque Isquêmico Transitório: aplicação e comparação de técnicas de machine learning |
| author |
Schmidt, Fernanda Fortti Vianna |
| author_facet |
Schmidt, Fernanda Fortti Vianna |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Chiavegatto Filho, Alexandre Dias Porto |
| dc.contributor.author.fl_str_mv |
Schmidt, Fernanda Fortti Vianna |
| dc.subject.por.fl_str_mv |
Acidente Vascular Cerebral Ataque Isquêmico Transitório Machine learning Machine Learning Predição Prediction Stroke Transient Ischemic Attack UK Biobank UK Biobank |
| topic |
Acidente Vascular Cerebral Ataque Isquêmico Transitório Machine learning Machine Learning Predição Prediction Stroke Transient Ischemic Attack UK Biobank UK Biobank |
| description |
Introdução: Entre as doenças crônicas não transmissíveis, o Acidente Vascular Cerebral (AVC) é a segunda causa mundial de morte e a terceira causa mundial de anos de vida saudável perdidos. AVC e Ataque Isquêmico Transitório (AIT) compartilham alguns dos mesmos fatores de risco e indivíduos que já vivenciaram um episódio de AIT possuem maior probabilidade de apresentar um evento de AVC. No âmbito da predição de eventos de AVC ou AIT, técnicas de modelagem preditiva de machine learning (ML) têm o potencial de superar limitações das metodologias estatísticas clássicas. Objetivo: Aplicar técnicas de ML e comparar seu desempenho na predição de eventos de AVC isquêmico, AVC hemorrágico ou AIT. Métodos: Utilizando dados do UK Biobank (UKB), uma coorte prospectiva do Reino Unido com cerca de 500 mil participantes, um pipeline de ML foi aplicado para 229.638 participantes e 3.918 eventos de AVC ou AIT (1,7%) em até aproximadamente 5 anos e 8 meses. Três algoritmos do tipo GBDT (XGBoost, LightGBM e CatBoost) foram testados em diferentes cenários comparativos. Resultados: Os algoritmos XGBoost e CatBoost apresentaram valores semelhantes de AUC ROC nos dados de teste, respectivamente 0,772 ± 0,009 (IC 95%: [0,755 - 0,789]) e 0,771 ± 0,008 (IC 95%: [0,755 - 0,789]). O conjunto reduzido de variáveis preditoras definidas com base no QStroke apresentou desempenho numericamente inferior - XGBoost: 0,729 ± 0,009 (IC 95%: [0,713 - 0,747]); CatBoost: 0,730 ± 0,009 (IC 95%: [0,713 - 0,747]). A variável idade foi a que apresentou maior importância preditora, com magnitude média de contribuição (valor SHAP médio absoluto) muito superior às demais variáveis. Conclusões: Técnicas de ML podem apresentar bom poder discriminativo para predição de eventos de AVC ou AIT na população geral, mesmo em contextos de baixa incidência. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-07-02 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/6/6143/tde-03092025-153742/ |
| url |
https://www.teses.usp.br/teses/disponiveis/6/6143/tde-03092025-153742/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1848370479732097024 |