Exportação concluída — 

Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Lopes Filho, Carlos Pereira
Orientador(a): Demétrius Baria Valejo, Alan lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação - PPGCC
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://hdl.handle.net/20.500.14289/22963
Resumo: Clustering plays a fundamental role in attributed graphs, which incorporate both topological structure and node attributes represented as feature vectors. Deep clustering methods based on Graph Neural Networks (GNNs) have proven effective in extracting patterns from such data. Most existing approaches use a traditional clustering algorithm to identify representative elements, which are later employed in the training of the GNN and the clustering task. However, when selecting representative elements, these clustering algorithms consider only the feature vector of each instance, neglecting topological information. This limitation negatively impacts the GNN learning process. To address this issue, we propose Deep Graph Clustering via Graph Neural Network and Seed Selection (DGCSS), a model consisting of three modules: (1) the seed selection module, which iden- tifies representative nodes; (2) the embedding module, which employs a graph attentional network to capture global topological information; and (3) the self-supervised module, which leverages the representative nodes to guide the clustering task. An advantage of our algorithm is that it integrates both the topological structure and node attributes across all modules to identify representative elements. This is the first GNN-based clustering algorithm that incorporates seed selection, establishing a significant reference for future research. The empirical analysis of real world graphs provides evidence that the use of seeds is competitive when compared to traditional algorithms, such as K-Means combined with GNNs.
id SCAR_7c44f998b9b3d7b51fb3d59bbcc13afc
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/22963
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Lopes Filho, Carlos PereiraDemétrius Baria Valejo, Alanhttp://lattes.cnpq.br/9546164790189830http://lattes.cnpq.br/4073822253624796https://orcid.org/0009-0005-6290-6558https://orcid.org/0000-0002-9046-9499https://orcid.org/0000-0002-3107-8236https://orcid.org/0000-0002-2309-3487Coelho Naldi, MuriloMarcondes Marcacini, Ricardohttp://lattes.cnpq.br/0573662728816861http://lattes.cnpq.br/32726112822602952025-10-28T14:38:26Z2025-06-04LOPES FILHO, Carlos Pereira. Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes. 2025. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22963.https://hdl.handle.net/20.500.14289/22963Clustering plays a fundamental role in attributed graphs, which incorporate both topological structure and node attributes represented as feature vectors. Deep clustering methods based on Graph Neural Networks (GNNs) have proven effective in extracting patterns from such data. Most existing approaches use a traditional clustering algorithm to identify representative elements, which are later employed in the training of the GNN and the clustering task. However, when selecting representative elements, these clustering algorithms consider only the feature vector of each instance, neglecting topological information. This limitation negatively impacts the GNN learning process. To address this issue, we propose Deep Graph Clustering via Graph Neural Network and Seed Selection (DGCSS), a model consisting of three modules: (1) the seed selection module, which iden- tifies representative nodes; (2) the embedding module, which employs a graph attentional network to capture global topological information; and (3) the self-supervised module, which leverages the representative nodes to guide the clustering task. An advantage of our algorithm is that it integrates both the topological structure and node attributes across all modules to identify representative elements. This is the first GNN-based clustering algorithm that incorporates seed selection, establishing a significant reference for future research. The empirical analysis of real world graphs provides evidence that the use of seeds is competitive when compared to traditional algorithms, such as K-Means combined with GNNs.Tarefas de detecção de comunidades (agrupamento, do inglês clustering) desempenham um papel fundamental em grafos com atributos, os quais incorporam tanto a estrutura topológica quanto os atributos dos nós, sendo representados por vetores de características. Métodos de detecção de comunidades baseados em Redes Neurais em Grafos (Graph Neural Networks - (GNNs)) têm se mostrado eficazes na extração de padrões a partir desses dados. A maioria das abordagens existentes utiliza um algoritmo de agrupamento tradicional para identificar elementos representativos, os quais são posteriormente empregados no treinamento da GNN e na tarefa de detecção de comunidades. Entretanto, ao selecionar esses elementos, tais algoritmos consideram apenas o vetor de características de cada nó, negligenciando a informação topológica do grafo, o que impacta negativamente o processo de aprendizado da GNN. Para solucionar essa questão, propomos o Deep Graph Clustering via Seed Selection (DGCSS), um modelo composto por três módulos: (1) o módulo de seleção de sementes, que identifica os nós representativos; (2) o módulo de embedding, que utiliza mecanismos de Atenção em Grafos (Graph Attention) para capturar informações topológicas globais; e (3) o módulo de auto-supervisão, que utiliza os nós representativos para orientar a tarefa de detecção de comunidades. Uma vantagem do nosso algoritmo é que ele integra, em todos os módulos, tanto a estrutura topológica quanto os atributos dos nós para identificar os elementos representativos. Este é o primeiro algoritmo de detecção de comunidades baseado em GNN que incorpora a seleção de sementes, estabelecendo uma referência significativa para pesquisas futuras. A análise empírica realizada em grafos do mundo real demonstra que o uso de sementes é competitivo quando comparado a algoritmos tradicionais, como o K-Means combinado com GNNs.porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAgrupamentoSeleção de sementesGrafosRedes neurais em grafosGraph clusteringGraph neural networksSeed selectionCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAgrupamento profundo de grafos usando redes neurais de grafos e seleção de sementesDeep graph clustering using graph neural networks and seed selectioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8906https://repositorio.ufscar.br/bitstreams/a2b4216a-1441-4bc1-860e-c3fa26b7866d/downloadfba754f0467e45ac3862bc2533fb2736MD52falseAnonymousREADORIGINAL2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdf2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdfapplication/pdf1546521https://repositorio.ufscar.br/bitstreams/96a89703-56e6-4ad8-b968-d3f9781ce5f1/download473251cb7495cf4c57c4bfc4665da702MD53trueAnonymousREADTEXT2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdf.txt2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdf.txtExtracted texttext/plain105880https://repositorio.ufscar.br/bitstreams/445ea565-572e-4d8e-9847-7d01738b07a7/download86f886f8f35f40a74870352e0be15f09MD54falseAnonymousREADTHUMBNAIL2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdf.jpg2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdf.jpgGenerated Thumbnailimage/jpeg4071https://repositorio.ufscar.br/bitstreams/85c37ae1-a355-406b-a4c6-4526146dc67d/downloadb8f78fafc27aaae3e7afb7248fd5a7a1MD55falseAnonymousREAD20.500.14289/229632025-10-29T03:25:22.720592Zhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/22963https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-10-29T03:25:22Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes
dc.title.alternative.eng.fl_str_mv Deep graph clustering using graph neural networks and seed selection
title Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes
spellingShingle Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes
Lopes Filho, Carlos Pereira
Agrupamento
Seleção de sementes
Grafos
Redes neurais em grafos
Graph clustering
Graph neural networks
Seed selection
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes
title_full Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes
title_fullStr Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes
title_full_unstemmed Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes
title_sort Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes
author Lopes Filho, Carlos Pereira
author_facet Lopes Filho, Carlos Pereira
author_role author
dc.contributor.authorlattes.none.fl_str_mv http://lattes.cnpq.br/4073822253624796
dc.contributor.authororcid.none.fl_str_mv https://orcid.org/0009-0005-6290-6558
dc.contributor.advisor1orcid.none.fl_str_mv https://orcid.org/0000-0002-9046-9499
dc.contributor.refereeorcid.none.fl_str_mv https://orcid.org/0000-0002-3107-8236
https://orcid.org/0000-0002-2309-3487
dc.contributor.referee.none.fl_str_mv Coelho Naldi, Murilo
Marcondes Marcacini, Ricardo
dc.contributor.refereeLattes.none.fl_str_mv http://lattes.cnpq.br/0573662728816861
http://lattes.cnpq.br/3272611282260295
dc.contributor.author.fl_str_mv Lopes Filho, Carlos Pereira
dc.contributor.advisor1.fl_str_mv Demétrius Baria Valejo, Alan
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/9546164790189830
contributor_str_mv Demétrius Baria Valejo, Alan
dc.subject.por.fl_str_mv Agrupamento
Seleção de sementes
Grafos
Redes neurais em grafos
topic Agrupamento
Seleção de sementes
Grafos
Redes neurais em grafos
Graph clustering
Graph neural networks
Seed selection
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.subject.eng.fl_str_mv Graph clustering
Graph neural networks
Seed selection
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description Clustering plays a fundamental role in attributed graphs, which incorporate both topological structure and node attributes represented as feature vectors. Deep clustering methods based on Graph Neural Networks (GNNs) have proven effective in extracting patterns from such data. Most existing approaches use a traditional clustering algorithm to identify representative elements, which are later employed in the training of the GNN and the clustering task. However, when selecting representative elements, these clustering algorithms consider only the feature vector of each instance, neglecting topological information. This limitation negatively impacts the GNN learning process. To address this issue, we propose Deep Graph Clustering via Graph Neural Network and Seed Selection (DGCSS), a model consisting of three modules: (1) the seed selection module, which iden- tifies representative nodes; (2) the embedding module, which employs a graph attentional network to capture global topological information; and (3) the self-supervised module, which leverages the representative nodes to guide the clustering task. An advantage of our algorithm is that it integrates both the topological structure and node attributes across all modules to identify representative elements. This is the first GNN-based clustering algorithm that incorporates seed selection, establishing a significant reference for future research. The empirical analysis of real world graphs provides evidence that the use of seeds is competitive when compared to traditional algorithms, such as K-Means combined with GNNs.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-10-28T14:38:26Z
dc.date.issued.fl_str_mv 2025-06-04
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv LOPES FILHO, Carlos Pereira. Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes. 2025. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22963.
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.14289/22963
identifier_str_mv LOPES FILHO, Carlos Pereira. Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes. 2025. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22963.
url https://hdl.handle.net/20.500.14289/22963
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/a2b4216a-1441-4bc1-860e-c3fa26b7866d/download
https://repositorio.ufscar.br/bitstreams/96a89703-56e6-4ad8-b968-d3f9781ce5f1/download
https://repositorio.ufscar.br/bitstreams/445ea565-572e-4d8e-9847-7d01738b07a7/download
https://repositorio.ufscar.br/bitstreams/85c37ae1-a355-406b-a4c6-4526146dc67d/download
bitstream.checksum.fl_str_mv fba754f0467e45ac3862bc2533fb2736
473251cb7495cf4c57c4bfc4665da702
86f886f8f35f40a74870352e0be15f09
b8f78fafc27aaae3e7afb7248fd5a7a1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688923923742720