Graph Reduction for Representation Learning
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-15012026-144922/ |
Resumo: | Graph Neural Networks (GNNs) are an important tool for representation learning in graph-structured data, such as social networks, citation networks, and molecules. They capture complex structural patterns through a message passing mechanism, where nodes iteratively aggregate information from their neighbors to update their representations. GNNs have achieved remarkable performance in applications such as fake news detection, drug discovery, text classification, content recommendation, and traffic forecasting. Despite their success, scaling them to large-scale graphs remains challenging due to high computational costs. Graph reduction techniques, such as coarsening and condensation, have emerged as a potential tool to address these challenges. Specifically, they simplify graphs while preserving essential structural information and maintaining model performance. In this context, this thesis concentrates on developing novel methods for scalable graph representation learning, focusing on text classification and graph reduction techniques. To this end, three research projects were carried out and their main contributions can be summarized as follows: i) a novel GNN-based method for text classification that leverages one-mode projections of bipartite graphs, ii) an extensive study on the impact of coarsening of bipartite graphs in the performance, memory usage, and training time of GNNs on text classification, iii) a novel model for text classification via GNNs that leverages the coarsening step of the multilevel optimization approach to reduce bipartite graphs hierarchically; iv) a semi-supervised coarsening algorithm to select documents nodes for merging into supernodes; and v) a novel framework for multi-view graph condensation via tensor decomposition that can reduce graphs into smaller ones at large reduction rates, such as 99.9%. |
| id |
USP_ecb7864f65bc199df4e797520760ade6 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-15012026-144922 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Graph Reduction for Representation LearningRedução de Grafos para Aprendizado de RepresentaçãoAprendizado de representaçãoClassificação de textosCoarsening de grafosCondensação de grafosDecomposição de tensoresGNNGNNGraph coarseningGraph condensationGraph neural networkGraph reductionRedes neurais para grafosRedução de grafosRepresentation learningTensor decompositionText classificationGraph Neural Networks (GNNs) are an important tool for representation learning in graph-structured data, such as social networks, citation networks, and molecules. They capture complex structural patterns through a message passing mechanism, where nodes iteratively aggregate information from their neighbors to update their representations. GNNs have achieved remarkable performance in applications such as fake news detection, drug discovery, text classification, content recommendation, and traffic forecasting. Despite their success, scaling them to large-scale graphs remains challenging due to high computational costs. Graph reduction techniques, such as coarsening and condensation, have emerged as a potential tool to address these challenges. Specifically, they simplify graphs while preserving essential structural information and maintaining model performance. In this context, this thesis concentrates on developing novel methods for scalable graph representation learning, focusing on text classification and graph reduction techniques. To this end, three research projects were carried out and their main contributions can be summarized as follows: i) a novel GNN-based method for text classification that leverages one-mode projections of bipartite graphs, ii) an extensive study on the impact of coarsening of bipartite graphs in the performance, memory usage, and training time of GNNs on text classification, iii) a novel model for text classification via GNNs that leverages the coarsening step of the multilevel optimization approach to reduce bipartite graphs hierarchically; iv) a semi-supervised coarsening algorithm to select documents nodes for merging into supernodes; and v) a novel framework for multi-view graph condensation via tensor decomposition that can reduce graphs into smaller ones at large reduction rates, such as 99.9%.Redes Neurais para Grafos (GNNs) são uma ferramenta importante para aprendizado de representações em grafos, como redes sociais, redes de citações e moléculas. Elas capturam padrões estruturais complexos por meio do mecanismo de message passing, no qual os nós agregam iterativamente informações de seus vizinhos para atualizar suas representações. As GNNs alcançaram desempenhos notáveis em aplicações como detecção de notícias falsas, descoberta de fármacos, classificação de textos, recomendação de conteúdo e previsão de tráfego. Apesar desse sucesso, escalá-las para grafos de grande escala continua sendo um desafio devido aos altos custos computacionais envolvidos. Técnicas de redução de grafos, como coarsening e condensação, têm se mostrado ferramentas promissoras para abordar esses desafios. Especificamente, elas simplificam grafos enquanto preservam informações estruturais essenciais e mantêm o desempenho dos modelos. Nesse contexto, esta tese concentra-se no desenvolvimento de novos métodos escaláveis para aprendizado de representações em grafos, com foco na classificação de textos e em técnicas de redução de grafos. Para isso, foram realizados três projetos de pesquisa, cujas principais contribuições podem ser resumidas da seguinte forma: i) um método baseado em GNNs para classificação de textos que utiliza projeções one-mode de grafos bipartidos; ii) um estudo aprofundado sobre o impacto do coarsening de grafos bipartidos no desempenho, uso de memória e tempo de treinamento de GNNs em classificação de textos; iii) um modelo para classificação de textos via GNNs que utiliza a etapa de coarsening da abordagem de otimização multinível para reduzir grafos bipartidos hierarquicamente; iv) um algoritmo semi-supervisionado de coarsening para selecionar nós de documentos para serem fundidos em supernós; e v) uma técnica para condensação de grafos multi-view usando decomposição de tensores, permitindo altas taxas de redução, como 99,9%.Biblioteca Digitais de Teses e Dissertações da USPLopes, Alneu de AndradeSantos, Nícolas Roque dos2025-01-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-15012026-144922/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2026-01-15T16:58:02Zoai:teses.usp.br:tde-15012026-144922Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-01-15T16:58:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Graph Reduction for Representation Learning Redução de Grafos para Aprendizado de Representação |
| title |
Graph Reduction for Representation Learning |
| spellingShingle |
Graph Reduction for Representation Learning Santos, Nícolas Roque dos Aprendizado de representação Classificação de textos Coarsening de grafos Condensação de grafos Decomposição de tensores GNN GNN Graph coarsening Graph condensation Graph neural network Graph reduction Redes neurais para grafos Redução de grafos Representation learning Tensor decomposition Text classification |
| title_short |
Graph Reduction for Representation Learning |
| title_full |
Graph Reduction for Representation Learning |
| title_fullStr |
Graph Reduction for Representation Learning |
| title_full_unstemmed |
Graph Reduction for Representation Learning |
| title_sort |
Graph Reduction for Representation Learning |
| author |
Santos, Nícolas Roque dos |
| author_facet |
Santos, Nícolas Roque dos |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Lopes, Alneu de Andrade |
| dc.contributor.author.fl_str_mv |
Santos, Nícolas Roque dos |
| dc.subject.por.fl_str_mv |
Aprendizado de representação Classificação de textos Coarsening de grafos Condensação de grafos Decomposição de tensores GNN GNN Graph coarsening Graph condensation Graph neural network Graph reduction Redes neurais para grafos Redução de grafos Representation learning Tensor decomposition Text classification |
| topic |
Aprendizado de representação Classificação de textos Coarsening de grafos Condensação de grafos Decomposição de tensores GNN GNN Graph coarsening Graph condensation Graph neural network Graph reduction Redes neurais para grafos Redução de grafos Representation learning Tensor decomposition Text classification |
| description |
Graph Neural Networks (GNNs) are an important tool for representation learning in graph-structured data, such as social networks, citation networks, and molecules. They capture complex structural patterns through a message passing mechanism, where nodes iteratively aggregate information from their neighbors to update their representations. GNNs have achieved remarkable performance in applications such as fake news detection, drug discovery, text classification, content recommendation, and traffic forecasting. Despite their success, scaling them to large-scale graphs remains challenging due to high computational costs. Graph reduction techniques, such as coarsening and condensation, have emerged as a potential tool to address these challenges. Specifically, they simplify graphs while preserving essential structural information and maintaining model performance. In this context, this thesis concentrates on developing novel methods for scalable graph representation learning, focusing on text classification and graph reduction techniques. To this end, three research projects were carried out and their main contributions can be summarized as follows: i) a novel GNN-based method for text classification that leverages one-mode projections of bipartite graphs, ii) an extensive study on the impact of coarsening of bipartite graphs in the performance, memory usage, and training time of GNNs on text classification, iii) a novel model for text classification via GNNs that leverages the coarsening step of the multilevel optimization approach to reduce bipartite graphs hierarchically; iv) a semi-supervised coarsening algorithm to select documents nodes for merging into supernodes; and v) a novel framework for multi-view graph condensation via tensor decomposition that can reduce graphs into smaller ones at large reduction rates, such as 99.9%. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-01-13 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-15012026-144922/ |
| url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-15012026-144922/ |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1857669978984022016 |