Graph Reduction for Representation Learning

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Santos, Nícolas Roque dos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
GNN
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-15012026-144922/
Resumo: Graph Neural Networks (GNNs) are an important tool for representation learning in graph-structured data, such as social networks, citation networks, and molecules. They capture complex structural patterns through a message passing mechanism, where nodes iteratively aggregate information from their neighbors to update their representations. GNNs have achieved remarkable performance in applications such as fake news detection, drug discovery, text classification, content recommendation, and traffic forecasting. Despite their success, scaling them to large-scale graphs remains challenging due to high computational costs. Graph reduction techniques, such as coarsening and condensation, have emerged as a potential tool to address these challenges. Specifically, they simplify graphs while preserving essential structural information and maintaining model performance. In this context, this thesis concentrates on developing novel methods for scalable graph representation learning, focusing on text classification and graph reduction techniques. To this end, three research projects were carried out and their main contributions can be summarized as follows: i) a novel GNN-based method for text classification that leverages one-mode projections of bipartite graphs, ii) an extensive study on the impact of coarsening of bipartite graphs in the performance, memory usage, and training time of GNNs on text classification, iii) a novel model for text classification via GNNs that leverages the coarsening step of the multilevel optimization approach to reduce bipartite graphs hierarchically; iv) a semi-supervised coarsening algorithm to select documents nodes for merging into supernodes; and v) a novel framework for multi-view graph condensation via tensor decomposition that can reduce graphs into smaller ones at large reduction rates, such as 99.9%.
id USP_ecb7864f65bc199df4e797520760ade6
oai_identifier_str oai:teses.usp.br:tde-15012026-144922
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Graph Reduction for Representation LearningRedução de Grafos para Aprendizado de RepresentaçãoAprendizado de representaçãoClassificação de textosCoarsening de grafosCondensação de grafosDecomposição de tensoresGNNGNNGraph coarseningGraph condensationGraph neural networkGraph reductionRedes neurais para grafosRedução de grafosRepresentation learningTensor decompositionText classificationGraph Neural Networks (GNNs) are an important tool for representation learning in graph-structured data, such as social networks, citation networks, and molecules. They capture complex structural patterns through a message passing mechanism, where nodes iteratively aggregate information from their neighbors to update their representations. GNNs have achieved remarkable performance in applications such as fake news detection, drug discovery, text classification, content recommendation, and traffic forecasting. Despite their success, scaling them to large-scale graphs remains challenging due to high computational costs. Graph reduction techniques, such as coarsening and condensation, have emerged as a potential tool to address these challenges. Specifically, they simplify graphs while preserving essential structural information and maintaining model performance. In this context, this thesis concentrates on developing novel methods for scalable graph representation learning, focusing on text classification and graph reduction techniques. To this end, three research projects were carried out and their main contributions can be summarized as follows: i) a novel GNN-based method for text classification that leverages one-mode projections of bipartite graphs, ii) an extensive study on the impact of coarsening of bipartite graphs in the performance, memory usage, and training time of GNNs on text classification, iii) a novel model for text classification via GNNs that leverages the coarsening step of the multilevel optimization approach to reduce bipartite graphs hierarchically; iv) a semi-supervised coarsening algorithm to select documents nodes for merging into supernodes; and v) a novel framework for multi-view graph condensation via tensor decomposition that can reduce graphs into smaller ones at large reduction rates, such as 99.9%.Redes Neurais para Grafos (GNNs) são uma ferramenta importante para aprendizado de representações em grafos, como redes sociais, redes de citações e moléculas. Elas capturam padrões estruturais complexos por meio do mecanismo de message passing, no qual os nós agregam iterativamente informações de seus vizinhos para atualizar suas representações. As GNNs alcançaram desempenhos notáveis em aplicações como detecção de notícias falsas, descoberta de fármacos, classificação de textos, recomendação de conteúdo e previsão de tráfego. Apesar desse sucesso, escalá-las para grafos de grande escala continua sendo um desafio devido aos altos custos computacionais envolvidos. Técnicas de redução de grafos, como coarsening e condensação, têm se mostrado ferramentas promissoras para abordar esses desafios. Especificamente, elas simplificam grafos enquanto preservam informações estruturais essenciais e mantêm o desempenho dos modelos. Nesse contexto, esta tese concentra-se no desenvolvimento de novos métodos escaláveis para aprendizado de representações em grafos, com foco na classificação de textos e em técnicas de redução de grafos. Para isso, foram realizados três projetos de pesquisa, cujas principais contribuições podem ser resumidas da seguinte forma: i) um método baseado em GNNs para classificação de textos que utiliza projeções one-mode de grafos bipartidos; ii) um estudo aprofundado sobre o impacto do coarsening de grafos bipartidos no desempenho, uso de memória e tempo de treinamento de GNNs em classificação de textos; iii) um modelo para classificação de textos via GNNs que utiliza a etapa de coarsening da abordagem de otimização multinível para reduzir grafos bipartidos hierarquicamente; iv) um algoritmo semi-supervisionado de coarsening para selecionar nós de documentos para serem fundidos em supernós; e v) uma técnica para condensação de grafos multi-view usando decomposição de tensores, permitindo altas taxas de redução, como 99,9%.Biblioteca Digitais de Teses e Dissertações da USPLopes, Alneu de AndradeSantos, Nícolas Roque dos2025-01-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-15012026-144922/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2026-01-15T16:58:02Zoai:teses.usp.br:tde-15012026-144922Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-01-15T16:58:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Graph Reduction for Representation Learning
Redução de Grafos para Aprendizado de Representação
title Graph Reduction for Representation Learning
spellingShingle Graph Reduction for Representation Learning
Santos, Nícolas Roque dos
Aprendizado de representação
Classificação de textos
Coarsening de grafos
Condensação de grafos
Decomposição de tensores
GNN
GNN
Graph coarsening
Graph condensation
Graph neural network
Graph reduction
Redes neurais para grafos
Redução de grafos
Representation learning
Tensor decomposition
Text classification
title_short Graph Reduction for Representation Learning
title_full Graph Reduction for Representation Learning
title_fullStr Graph Reduction for Representation Learning
title_full_unstemmed Graph Reduction for Representation Learning
title_sort Graph Reduction for Representation Learning
author Santos, Nícolas Roque dos
author_facet Santos, Nícolas Roque dos
author_role author
dc.contributor.none.fl_str_mv Lopes, Alneu de Andrade
dc.contributor.author.fl_str_mv Santos, Nícolas Roque dos
dc.subject.por.fl_str_mv Aprendizado de representação
Classificação de textos
Coarsening de grafos
Condensação de grafos
Decomposição de tensores
GNN
GNN
Graph coarsening
Graph condensation
Graph neural network
Graph reduction
Redes neurais para grafos
Redução de grafos
Representation learning
Tensor decomposition
Text classification
topic Aprendizado de representação
Classificação de textos
Coarsening de grafos
Condensação de grafos
Decomposição de tensores
GNN
GNN
Graph coarsening
Graph condensation
Graph neural network
Graph reduction
Redes neurais para grafos
Redução de grafos
Representation learning
Tensor decomposition
Text classification
description Graph Neural Networks (GNNs) are an important tool for representation learning in graph-structured data, such as social networks, citation networks, and molecules. They capture complex structural patterns through a message passing mechanism, where nodes iteratively aggregate information from their neighbors to update their representations. GNNs have achieved remarkable performance in applications such as fake news detection, drug discovery, text classification, content recommendation, and traffic forecasting. Despite their success, scaling them to large-scale graphs remains challenging due to high computational costs. Graph reduction techniques, such as coarsening and condensation, have emerged as a potential tool to address these challenges. Specifically, they simplify graphs while preserving essential structural information and maintaining model performance. In this context, this thesis concentrates on developing novel methods for scalable graph representation learning, focusing on text classification and graph reduction techniques. To this end, three research projects were carried out and their main contributions can be summarized as follows: i) a novel GNN-based method for text classification that leverages one-mode projections of bipartite graphs, ii) an extensive study on the impact of coarsening of bipartite graphs in the performance, memory usage, and training time of GNNs on text classification, iii) a novel model for text classification via GNNs that leverages the coarsening step of the multilevel optimization approach to reduce bipartite graphs hierarchically; iv) a semi-supervised coarsening algorithm to select documents nodes for merging into supernodes; and v) a novel framework for multi-view graph condensation via tensor decomposition that can reduce graphs into smaller ones at large reduction rates, such as 99.9%.
publishDate 2025
dc.date.none.fl_str_mv 2025-01-13
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-15012026-144922/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-15012026-144922/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1857669978984022016