Graph neural networks for clinical risk prediction based on patient similarity graphs

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Boll, Heloísa Oss
Orientador(a): Recamonde-Mendoza, Mariana
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/283321
Resumo: Prontuários eletrônicos de saúde (electronic health records, EHRs) são uma fonte abran gente de informações sobre o histórico de saúde de um paciente. Devido à natureza in terconectada dos eventos clínicos, esses registros contêm dados que podem ser expressos como grafos; por exemplo, pacientes podem ser representados como nós em uma rede de similaridade que conecta indivíduos com múltiplos eventos de saúde compartilhados, como diagnósticos e medicamentos. Modelos tradicionais de aprendizado de máquina (machine learning, ML) usados para a previsão de desfechos clínicos, que buscam prever diagnósticos, readmissões e mortalidade, geralmente não utilizam informações estrutura das em grafos. Como resultado, seus poderes preditivos são reduzidos. Por outro lado, as redes neurais de grafos (graph neural networks, GNN) são uma nova abordagem de aprendizagem profunda (deep learning, DL) que tem apresentado resultados superiores na previsão de riscos clínicos baseada em grafos, contribuindo para melhorar o atendi mento aos pacientes e a tomada de decisões médicas. Este trabalho tem como objetivo fornecer uma visão geral e abrangente das GNNs mais recentes utilizadas para previsão de desfechos clínicos usando EHRs e, em particular, investigar a relevância dos grafos de similaridade de pacientes para prever insuficiência cardíaca. Primeiramente, apresentamos uma extensa revisão de 50 artigos sobre o tema, que identificou a rede de atenção de grafos (GAT) como a GNN mais usada, a previsão de diagnóstico como a tarefa mais investigada e o MIMIC-III como o conjunto de dados de EHR mais empregado. Em se guida, introduzimos três soluções baseadas em GNNs, GraphSAGE, GAT e Transformer de grafos (Graph Transformer, GT), que abordam os desafios relacionados à três lacunas identificadas na literatura: multimodalidade, similaridade de pacientes e interpretabili dade. Nosso melhor modelo, o GT, obteve um F1 score de 0,5361, resultando em um aumento de 35,7% em relação ao score mais alto dos métodos de referência, bem como uma acurácia equilibrada de 0,7166 e uma AUROC de 0,7930. Além disso, avaliamos a importância de diferentes tipos de modalidades de dados para a previsão de insuficiência cardíaca e introduzimos novas estratégias para melhorar a explicabilidade do nosso mo delo GT, incluindo uma análise de estatística descritiva sobre a conectividade dos nós dos pacientes no grafo, seus perfis de atenção e padrões em seus atributos médicos e nos de seus vizinhos. Finalmente, nossos resultados reforçam o potencial dos GNNs para otimi zar a previsão de riscos clínicos e destacam a importância da utilização de informações estruturadas em grafos para melhorar os resultados dos desfechos médicos.
id URGS_4bc2cdf35c39f90c11f8b5ae947db427
oai_identifier_str oai:www.lume.ufrgs.br:10183/283321
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Boll, Heloísa OssRecamonde-Mendoza, MarianaByttner, Stefan2025-01-14T06:52:56Z2024http://hdl.handle.net/10183/283321001211078Prontuários eletrônicos de saúde (electronic health records, EHRs) são uma fonte abran gente de informações sobre o histórico de saúde de um paciente. Devido à natureza in terconectada dos eventos clínicos, esses registros contêm dados que podem ser expressos como grafos; por exemplo, pacientes podem ser representados como nós em uma rede de similaridade que conecta indivíduos com múltiplos eventos de saúde compartilhados, como diagnósticos e medicamentos. Modelos tradicionais de aprendizado de máquina (machine learning, ML) usados para a previsão de desfechos clínicos, que buscam prever diagnósticos, readmissões e mortalidade, geralmente não utilizam informações estrutura das em grafos. Como resultado, seus poderes preditivos são reduzidos. Por outro lado, as redes neurais de grafos (graph neural networks, GNN) são uma nova abordagem de aprendizagem profunda (deep learning, DL) que tem apresentado resultados superiores na previsão de riscos clínicos baseada em grafos, contribuindo para melhorar o atendi mento aos pacientes e a tomada de decisões médicas. Este trabalho tem como objetivo fornecer uma visão geral e abrangente das GNNs mais recentes utilizadas para previsão de desfechos clínicos usando EHRs e, em particular, investigar a relevância dos grafos de similaridade de pacientes para prever insuficiência cardíaca. Primeiramente, apresentamos uma extensa revisão de 50 artigos sobre o tema, que identificou a rede de atenção de grafos (GAT) como a GNN mais usada, a previsão de diagnóstico como a tarefa mais investigada e o MIMIC-III como o conjunto de dados de EHR mais empregado. Em se guida, introduzimos três soluções baseadas em GNNs, GraphSAGE, GAT e Transformer de grafos (Graph Transformer, GT), que abordam os desafios relacionados à três lacunas identificadas na literatura: multimodalidade, similaridade de pacientes e interpretabili dade. Nosso melhor modelo, o GT, obteve um F1 score de 0,5361, resultando em um aumento de 35,7% em relação ao score mais alto dos métodos de referência, bem como uma acurácia equilibrada de 0,7166 e uma AUROC de 0,7930. Além disso, avaliamos a importância de diferentes tipos de modalidades de dados para a previsão de insuficiência cardíaca e introduzimos novas estratégias para melhorar a explicabilidade do nosso mo delo GT, incluindo uma análise de estatística descritiva sobre a conectividade dos nós dos pacientes no grafo, seus perfis de atenção e padrões em seus atributos médicos e nos de seus vizinhos. Finalmente, nossos resultados reforçam o potencial dos GNNs para otimi zar a previsão de riscos clínicos e destacam a importância da utilização de informações estruturadas em grafos para melhorar os resultados dos desfechos médicos.Electronic health records (EHRs) are a comprehensive source of information about a pa tient’s health history. Due to the interconnected nature of clinical events, these records contain data that can be expressed as graphs; for example, patients can be represented as nodes in a similarity network that connects individuals with multiple shared health events, such as diagnoses and medications. Traditional machine learning (ML) models used for predicting clinical risks, which aim to forecast diagnoses, readmissions, and mortality, usually do not use this graph-structured information. As a result, their predictive power is hindered. In contrast, graph neural networks (GNNs) are a new deep learning (DL) approach that has shown superior results in predicting clinical risks based on graphs, helping to improve patient care and medical decision-making. This study aims to provide a comprehensive overview of the most recent GNNs used for predicting clinical risks us ing EHRs and, in particular, to investigate the relevance of patient similarity graphs for diagnosing heart failure. First, we present an extensive review of 50 papers on the topic, which identified the Graph Attention Network (GAT) as the most widely used GNN, diagnosis prediction as the most investigated task, and MIMIC-III as the most popular EHR dataset. Next, we introduce three new GNN solutions based on GraphSAGE, GAT, and Graph Transformer (GT) that address the challenges related to three identified literature gaps: multimodality, patient similarity, and interpretability. Our best model, the GT, ob tained an F1 score of 0.5361, resulting in a 35.7% increase over the highest score from baseline methods, as well as a balanced accuracy of 0.7166 and an AUROC of 0.7930. In addition, we evaluate the importance of four different types of data modalities for pre dicting heart failure and introduce new strategies to improve the explainability of our GT model, including a descriptive statistics analysis of the connectivity of patient nodes in the graph, their attention profiles, and patterns in their medical features and those of their neighbors. Finally, our results reinforce the potential of GNNs to optimize clinical risk prediction and highlight the importance of using graph-structured information to improve medical outcomes.application/pdfengRedes neurais de grafoGrafosHistórico de saúdeAprendizado de máquinaGraph neural networksElectronic health recordsClinical risk predictionPatient similarityGraph neural networks for clinical risk prediction based on patient similarity graphsRedes neurais de grafos para predição de riscos clínicos com base em grafos de similaridade de pacientes info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2024mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001211078.pdf.txt001211078.pdf.txtExtracted Texttext/plain279801http://www.lume.ufrgs.br/bitstream/10183/283321/2/001211078.pdf.txtbc373efac072b64d80496b2bbabf9c05MD52ORIGINAL001211078.pdfTexto completo (inglês)application/pdf7378386http://www.lume.ufrgs.br/bitstream/10183/283321/1/001211078.pdff79a0e26a4d6f922dc3e00532632625eMD5110183/2833212025-01-15 07:50:41.422599oai:www.lume.ufrgs.br:10183/283321Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532025-01-15T09:50:41Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Graph neural networks for clinical risk prediction based on patient similarity graphs
dc.title.alternative.pt.fl_str_mv Redes neurais de grafos para predição de riscos clínicos com base em grafos de similaridade de pacientes
title Graph neural networks for clinical risk prediction based on patient similarity graphs
spellingShingle Graph neural networks for clinical risk prediction based on patient similarity graphs
Boll, Heloísa Oss
Redes neurais de grafo
Grafos
Histórico de saúde
Aprendizado de máquina
Graph neural networks
Electronic health records
Clinical risk prediction
Patient similarity
title_short Graph neural networks for clinical risk prediction based on patient similarity graphs
title_full Graph neural networks for clinical risk prediction based on patient similarity graphs
title_fullStr Graph neural networks for clinical risk prediction based on patient similarity graphs
title_full_unstemmed Graph neural networks for clinical risk prediction based on patient similarity graphs
title_sort Graph neural networks for clinical risk prediction based on patient similarity graphs
author Boll, Heloísa Oss
author_facet Boll, Heloísa Oss
author_role author
dc.contributor.author.fl_str_mv Boll, Heloísa Oss
dc.contributor.advisor1.fl_str_mv Recamonde-Mendoza, Mariana
dc.contributor.advisor-co1.fl_str_mv Byttner, Stefan
contributor_str_mv Recamonde-Mendoza, Mariana
Byttner, Stefan
dc.subject.por.fl_str_mv Redes neurais de grafo
Grafos
Histórico de saúde
Aprendizado de máquina
topic Redes neurais de grafo
Grafos
Histórico de saúde
Aprendizado de máquina
Graph neural networks
Electronic health records
Clinical risk prediction
Patient similarity
dc.subject.eng.fl_str_mv Graph neural networks
Electronic health records
Clinical risk prediction
Patient similarity
description Prontuários eletrônicos de saúde (electronic health records, EHRs) são uma fonte abran gente de informações sobre o histórico de saúde de um paciente. Devido à natureza in terconectada dos eventos clínicos, esses registros contêm dados que podem ser expressos como grafos; por exemplo, pacientes podem ser representados como nós em uma rede de similaridade que conecta indivíduos com múltiplos eventos de saúde compartilhados, como diagnósticos e medicamentos. Modelos tradicionais de aprendizado de máquina (machine learning, ML) usados para a previsão de desfechos clínicos, que buscam prever diagnósticos, readmissões e mortalidade, geralmente não utilizam informações estrutura das em grafos. Como resultado, seus poderes preditivos são reduzidos. Por outro lado, as redes neurais de grafos (graph neural networks, GNN) são uma nova abordagem de aprendizagem profunda (deep learning, DL) que tem apresentado resultados superiores na previsão de riscos clínicos baseada em grafos, contribuindo para melhorar o atendi mento aos pacientes e a tomada de decisões médicas. Este trabalho tem como objetivo fornecer uma visão geral e abrangente das GNNs mais recentes utilizadas para previsão de desfechos clínicos usando EHRs e, em particular, investigar a relevância dos grafos de similaridade de pacientes para prever insuficiência cardíaca. Primeiramente, apresentamos uma extensa revisão de 50 artigos sobre o tema, que identificou a rede de atenção de grafos (GAT) como a GNN mais usada, a previsão de diagnóstico como a tarefa mais investigada e o MIMIC-III como o conjunto de dados de EHR mais empregado. Em se guida, introduzimos três soluções baseadas em GNNs, GraphSAGE, GAT e Transformer de grafos (Graph Transformer, GT), que abordam os desafios relacionados à três lacunas identificadas na literatura: multimodalidade, similaridade de pacientes e interpretabili dade. Nosso melhor modelo, o GT, obteve um F1 score de 0,5361, resultando em um aumento de 35,7% em relação ao score mais alto dos métodos de referência, bem como uma acurácia equilibrada de 0,7166 e uma AUROC de 0,7930. Além disso, avaliamos a importância de diferentes tipos de modalidades de dados para a previsão de insuficiência cardíaca e introduzimos novas estratégias para melhorar a explicabilidade do nosso mo delo GT, incluindo uma análise de estatística descritiva sobre a conectividade dos nós dos pacientes no grafo, seus perfis de atenção e padrões em seus atributos médicos e nos de seus vizinhos. Finalmente, nossos resultados reforçam o potencial dos GNNs para otimi zar a previsão de riscos clínicos e destacam a importância da utilização de informações estruturadas em grafos para melhorar os resultados dos desfechos médicos.
publishDate 2024
dc.date.issued.fl_str_mv 2024
dc.date.accessioned.fl_str_mv 2025-01-14T06:52:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/283321
dc.identifier.nrb.pt_BR.fl_str_mv 001211078
url http://hdl.handle.net/10183/283321
identifier_str_mv 001211078
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/283321/2/001211078.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/283321/1/001211078.pdf
bitstream.checksum.fl_str_mv bc373efac072b64d80496b2bbabf9c05
f79a0e26a4d6f922dc3e00532632625e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831316193075527680