Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação - PPGCC
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://hdl.handle.net/20.500.14289/22963 |
Resumo: | Clustering plays a fundamental role in attributed graphs, which incorporate both topological structure and node attributes represented as feature vectors. Deep clustering methods based on Graph Neural Networks (GNNs) have proven effective in extracting patterns from such data. Most existing approaches use a traditional clustering algorithm to identify representative elements, which are later employed in the training of the GNN and the clustering task. However, when selecting representative elements, these clustering algorithms consider only the feature vector of each instance, neglecting topological information. This limitation negatively impacts the GNN learning process. To address this issue, we propose Deep Graph Clustering via Graph Neural Network and Seed Selection (DGCSS), a model consisting of three modules: (1) the seed selection module, which iden- tifies representative nodes; (2) the embedding module, which employs a graph attentional network to capture global topological information; and (3) the self-supervised module, which leverages the representative nodes to guide the clustering task. An advantage of our algorithm is that it integrates both the topological structure and node attributes across all modules to identify representative elements. This is the first GNN-based clustering algorithm that incorporates seed selection, establishing a significant reference for future research. The empirical analysis of real world graphs provides evidence that the use of seeds is competitive when compared to traditional algorithms, such as K-Means combined with GNNs. |
| id |
SCAR_7c44f998b9b3d7b51fb3d59bbcc13afc |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/22963 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Lopes Filho, Carlos PereiraDemétrius Baria Valejo, Alanhttp://lattes.cnpq.br/9546164790189830http://lattes.cnpq.br/4073822253624796https://orcid.org/0009-0005-6290-6558https://orcid.org/0000-0002-9046-9499https://orcid.org/0000-0002-3107-8236https://orcid.org/0000-0002-2309-3487Coelho Naldi, MuriloMarcondes Marcacini, Ricardohttp://lattes.cnpq.br/0573662728816861http://lattes.cnpq.br/32726112822602952025-10-28T14:38:26Z2025-06-04LOPES FILHO, Carlos Pereira. Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes. 2025. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22963.https://hdl.handle.net/20.500.14289/22963Clustering plays a fundamental role in attributed graphs, which incorporate both topological structure and node attributes represented as feature vectors. Deep clustering methods based on Graph Neural Networks (GNNs) have proven effective in extracting patterns from such data. Most existing approaches use a traditional clustering algorithm to identify representative elements, which are later employed in the training of the GNN and the clustering task. However, when selecting representative elements, these clustering algorithms consider only the feature vector of each instance, neglecting topological information. This limitation negatively impacts the GNN learning process. To address this issue, we propose Deep Graph Clustering via Graph Neural Network and Seed Selection (DGCSS), a model consisting of three modules: (1) the seed selection module, which iden- tifies representative nodes; (2) the embedding module, which employs a graph attentional network to capture global topological information; and (3) the self-supervised module, which leverages the representative nodes to guide the clustering task. An advantage of our algorithm is that it integrates both the topological structure and node attributes across all modules to identify representative elements. This is the first GNN-based clustering algorithm that incorporates seed selection, establishing a significant reference for future research. The empirical analysis of real world graphs provides evidence that the use of seeds is competitive when compared to traditional algorithms, such as K-Means combined with GNNs.Tarefas de detecção de comunidades (agrupamento, do inglês clustering) desempenham um papel fundamental em grafos com atributos, os quais incorporam tanto a estrutura topológica quanto os atributos dos nós, sendo representados por vetores de características. Métodos de detecção de comunidades baseados em Redes Neurais em Grafos (Graph Neural Networks - (GNNs)) têm se mostrado eficazes na extração de padrões a partir desses dados. A maioria das abordagens existentes utiliza um algoritmo de agrupamento tradicional para identificar elementos representativos, os quais são posteriormente empregados no treinamento da GNN e na tarefa de detecção de comunidades. Entretanto, ao selecionar esses elementos, tais algoritmos consideram apenas o vetor de características de cada nó, negligenciando a informação topológica do grafo, o que impacta negativamente o processo de aprendizado da GNN. Para solucionar essa questão, propomos o Deep Graph Clustering via Seed Selection (DGCSS), um modelo composto por três módulos: (1) o módulo de seleção de sementes, que identifica os nós representativos; (2) o módulo de embedding, que utiliza mecanismos de Atenção em Grafos (Graph Attention) para capturar informações topológicas globais; e (3) o módulo de auto-supervisão, que utiliza os nós representativos para orientar a tarefa de detecção de comunidades. Uma vantagem do nosso algoritmo é que ele integra, em todos os módulos, tanto a estrutura topológica quanto os atributos dos nós para identificar os elementos representativos. Este é o primeiro algoritmo de detecção de comunidades baseado em GNN que incorpora a seleção de sementes, estabelecendo uma referência significativa para pesquisas futuras. A análise empírica realizada em grafos do mundo real demonstra que o uso de sementes é competitivo quando comparado a algoritmos tradicionais, como o K-Means combinado com GNNs.porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAgrupamentoSeleção de sementesGrafosRedes neurais em grafosGraph clusteringGraph neural networksSeed selectionCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAgrupamento profundo de grafos usando redes neurais de grafos e seleção de sementesDeep graph clustering using graph neural networks and seed selectioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8906https://repositorio.ufscar.br/bitstreams/a2b4216a-1441-4bc1-860e-c3fa26b7866d/downloadfba754f0467e45ac3862bc2533fb2736MD52falseAnonymousREADORIGINAL2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdf2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdfapplication/pdf1546521https://repositorio.ufscar.br/bitstreams/96a89703-56e6-4ad8-b968-d3f9781ce5f1/download473251cb7495cf4c57c4bfc4665da702MD53trueAnonymousREADTEXT2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdf.txt2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdf.txtExtracted texttext/plain105880https://repositorio.ufscar.br/bitstreams/445ea565-572e-4d8e-9847-7d01738b07a7/download86f886f8f35f40a74870352e0be15f09MD54falseAnonymousREADTHUMBNAIL2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdf.jpg2024_Mestrado_Defesa_Carlos_Pereira_Lopes_Filho.pdf.jpgGenerated Thumbnailimage/jpeg4071https://repositorio.ufscar.br/bitstreams/85c37ae1-a355-406b-a4c6-4526146dc67d/downloadb8f78fafc27aaae3e7afb7248fd5a7a1MD55falseAnonymousREAD20.500.14289/229632025-10-29T03:25:22.720592Zhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/22963https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-10-29T03:25:22Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.por.fl_str_mv |
Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes |
| dc.title.alternative.eng.fl_str_mv |
Deep graph clustering using graph neural networks and seed selection |
| title |
Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes |
| spellingShingle |
Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes Lopes Filho, Carlos Pereira Agrupamento Seleção de sementes Grafos Redes neurais em grafos Graph clustering Graph neural networks Seed selection CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
| title_short |
Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes |
| title_full |
Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes |
| title_fullStr |
Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes |
| title_full_unstemmed |
Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes |
| title_sort |
Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes |
| author |
Lopes Filho, Carlos Pereira |
| author_facet |
Lopes Filho, Carlos Pereira |
| author_role |
author |
| dc.contributor.authorlattes.none.fl_str_mv |
http://lattes.cnpq.br/4073822253624796 |
| dc.contributor.authororcid.none.fl_str_mv |
https://orcid.org/0009-0005-6290-6558 |
| dc.contributor.advisor1orcid.none.fl_str_mv |
https://orcid.org/0000-0002-9046-9499 |
| dc.contributor.refereeorcid.none.fl_str_mv |
https://orcid.org/0000-0002-3107-8236 https://orcid.org/0000-0002-2309-3487 |
| dc.contributor.referee.none.fl_str_mv |
Coelho Naldi, Murilo Marcondes Marcacini, Ricardo |
| dc.contributor.refereeLattes.none.fl_str_mv |
http://lattes.cnpq.br/0573662728816861 http://lattes.cnpq.br/3272611282260295 |
| dc.contributor.author.fl_str_mv |
Lopes Filho, Carlos Pereira |
| dc.contributor.advisor1.fl_str_mv |
Demétrius Baria Valejo, Alan |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/9546164790189830 |
| contributor_str_mv |
Demétrius Baria Valejo, Alan |
| dc.subject.por.fl_str_mv |
Agrupamento Seleção de sementes Grafos Redes neurais em grafos |
| topic |
Agrupamento Seleção de sementes Grafos Redes neurais em grafos Graph clustering Graph neural networks Seed selection CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Graph clustering Graph neural networks Seed selection |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
| description |
Clustering plays a fundamental role in attributed graphs, which incorporate both topological structure and node attributes represented as feature vectors. Deep clustering methods based on Graph Neural Networks (GNNs) have proven effective in extracting patterns from such data. Most existing approaches use a traditional clustering algorithm to identify representative elements, which are later employed in the training of the GNN and the clustering task. However, when selecting representative elements, these clustering algorithms consider only the feature vector of each instance, neglecting topological information. This limitation negatively impacts the GNN learning process. To address this issue, we propose Deep Graph Clustering via Graph Neural Network and Seed Selection (DGCSS), a model consisting of three modules: (1) the seed selection module, which iden- tifies representative nodes; (2) the embedding module, which employs a graph attentional network to capture global topological information; and (3) the self-supervised module, which leverages the representative nodes to guide the clustering task. An advantage of our algorithm is that it integrates both the topological structure and node attributes across all modules to identify representative elements. This is the first GNN-based clustering algorithm that incorporates seed selection, establishing a significant reference for future research. The empirical analysis of real world graphs provides evidence that the use of seeds is competitive when compared to traditional algorithms, such as K-Means combined with GNNs. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-10-28T14:38:26Z |
| dc.date.issued.fl_str_mv |
2025-06-04 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
LOPES FILHO, Carlos Pereira. Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes. 2025. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22963. |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.14289/22963 |
| identifier_str_mv |
LOPES FILHO, Carlos Pereira. Agrupamento profundo de grafos usando redes neurais de grafos e seleção de sementes. 2025. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22963. |
| url |
https://hdl.handle.net/20.500.14289/22963 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/a2b4216a-1441-4bc1-860e-c3fa26b7866d/download https://repositorio.ufscar.br/bitstreams/96a89703-56e6-4ad8-b968-d3f9781ce5f1/download https://repositorio.ufscar.br/bitstreams/445ea565-572e-4d8e-9847-7d01738b07a7/download https://repositorio.ufscar.br/bitstreams/85c37ae1-a355-406b-a4c6-4526146dc67d/download |
| bitstream.checksum.fl_str_mv |
fba754f0467e45ac3862bc2533fb2736 473251cb7495cf4c57c4bfc4665da702 86f886f8f35f40a74870352e0be15f09 b8f78fafc27aaae3e7afb7248fd5a7a1 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688923923742720 |