Solving the decision version of the Graph Coloring Problem : a neural-symbolic approach using graph neural networks

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Santos, Henrique Lemos dos
Orientador(a): Lamb, Luis da Cunha
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/211255
Resumo: Técnicas baseadas em aprendizado profundo têm recorrentemente atingido desempenho de estado-da-arte em diversas áreas ao longo dos últimos anos. Ainda há, no entanto, uma certa falta de compreensão em como problemas simbólicos e relacionais podem se beneficiar de modelos cuja arquitetura é baseada em aprendizado profundo. O caminho mais promissor para essa tão desejada integração consiste em arquiteturas neurais cuja propriedade de compartilhamento de parâmetros baseia-se em grafos e, dessa forma, podem ser treinadas para aprender características complexas de dados relacionais. Diversos problemas NP-Completos, tais como satisfatibilidade booleana e problema do caixeiro viajante, apresentam esse tipo de característica. Em ambos casos, um metamodelo chamado Graph Neural Network (GNN) pode trabalhar diretamente com entradas em formato de grafos, que representam uma instância do problema, e aprender a produzir uma resposta binária para o problema em questão. Nessa dissertação, estamos particularmente focados em aplicar um modelo de GNN ao problema da coloração de grafos: o modelo que propomos se aproveita de propriedades específicas desse problema ao contemplar tanto vértices quanto cores com representações internas na sua arquitetura e ao fazer com que tais representações passem por diversas etapas de troca de mensagens. Nesse sentido, a arquitetura que propomos é capaz de refletir a estrutura relacional do problema original, sem necessidade de uma redução em tempos polinomial para outro problema, enquanto ainda emprega uma estratégia de compartilhamento de parâmetros em função de vértices e cores. Nós também demonstramos como treinar tal modelo com instâncias muito difíceis, geradas de uma maneira adversarial: nós geramos pares de instâncias que são grafos no limite da satisfatibilidade – uma instância positiva e outra negativa que diferem apenas por uma única aresta, tal aresta faz com que a segunda instância não seja colorável por um dado número de cores C, enquanto a primeira permanece sendo minimamente colorável com C. Obtivemos uma acurácia de 83% durante treinamento e verificamos que nosso modelo é capaz de generalizar, até certo ponto, esse desempenho para instâncias de teste – não-vistas durante treinamento e que foram amostradas de diferentes distribuições. Nós mostramos que esse desempenho superou o desempenho de duas heurísticas e o desempenho de uma suposta abordagem neuro-simbólica generalista. Por fim, nós exploramos a memória interna do nosso modelos e encontramos evidências de como o seu raciocínio é construído em volta dos valores de representação de vértices e cores. Em suma, nossos resultados sugerem fortemente que GNNs são, de fato, ferramentas poderosas para resolver problemas combinatoriais mas que seu aprendizado pode ser amplamente melhorado quando as propriedades de um problema são totalmente agregadas à arquitetura neural e nenhuma conversão de problema é feita.
id URGS_2c8839d76e0ddbad7cee255e540fdc71
oai_identifier_str oai:www.lume.ufrgs.br:10183/211255
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Santos, Henrique Lemos dosLamb, Luis da Cunha2020-07-02T03:36:16Z2020http://hdl.handle.net/10183/211255001114939Técnicas baseadas em aprendizado profundo têm recorrentemente atingido desempenho de estado-da-arte em diversas áreas ao longo dos últimos anos. Ainda há, no entanto, uma certa falta de compreensão em como problemas simbólicos e relacionais podem se beneficiar de modelos cuja arquitetura é baseada em aprendizado profundo. O caminho mais promissor para essa tão desejada integração consiste em arquiteturas neurais cuja propriedade de compartilhamento de parâmetros baseia-se em grafos e, dessa forma, podem ser treinadas para aprender características complexas de dados relacionais. Diversos problemas NP-Completos, tais como satisfatibilidade booleana e problema do caixeiro viajante, apresentam esse tipo de característica. Em ambos casos, um metamodelo chamado Graph Neural Network (GNN) pode trabalhar diretamente com entradas em formato de grafos, que representam uma instância do problema, e aprender a produzir uma resposta binária para o problema em questão. Nessa dissertação, estamos particularmente focados em aplicar um modelo de GNN ao problema da coloração de grafos: o modelo que propomos se aproveita de propriedades específicas desse problema ao contemplar tanto vértices quanto cores com representações internas na sua arquitetura e ao fazer com que tais representações passem por diversas etapas de troca de mensagens. Nesse sentido, a arquitetura que propomos é capaz de refletir a estrutura relacional do problema original, sem necessidade de uma redução em tempos polinomial para outro problema, enquanto ainda emprega uma estratégia de compartilhamento de parâmetros em função de vértices e cores. Nós também demonstramos como treinar tal modelo com instâncias muito difíceis, geradas de uma maneira adversarial: nós geramos pares de instâncias que são grafos no limite da satisfatibilidade – uma instância positiva e outra negativa que diferem apenas por uma única aresta, tal aresta faz com que a segunda instância não seja colorável por um dado número de cores C, enquanto a primeira permanece sendo minimamente colorável com C. Obtivemos uma acurácia de 83% durante treinamento e verificamos que nosso modelo é capaz de generalizar, até certo ponto, esse desempenho para instâncias de teste – não-vistas durante treinamento e que foram amostradas de diferentes distribuições. Nós mostramos que esse desempenho superou o desempenho de duas heurísticas e o desempenho de uma suposta abordagem neuro-simbólica generalista. Por fim, nós exploramos a memória interna do nosso modelos e encontramos evidências de como o seu raciocínio é construído em volta dos valores de representação de vértices e cores. Em suma, nossos resultados sugerem fortemente que GNNs são, de fato, ferramentas poderosas para resolver problemas combinatoriais mas que seu aprendizado pode ser amplamente melhorado quando as propriedades de um problema são totalmente agregadas à arquitetura neural e nenhuma conversão de problema é feita.Deep learning (DL) has consistently pushed the state-of-the-art in many fields over the last years. Still there is, however, a lack of understanding on how symbolic and relational problems can benefit from DL architectures. The most promising path towards this longdesired integration comprises deep learning architectures whose parameter sharing strategy is based over graphs and thus can be trained to learn complex properties of relational data. Several NP-Complete problems, such as the boolean satisfiability problem and the traveling salesperson problem, present such properties. In both cases, a meta-model called Graph Neural Network (GNN) can be directly fed with the graph representation of the problem and learn to produce a binary answer at hand. In this dissertation, we are specifically concerned with the application of a GNN model to tackle the graph coloring problem: our proposed model leverages the specific features of such problem by adding internal representations of vertices and colors to the GNN kernel and by performing messagepassing iterations over such representations. In this sense, our model’s architecture is able to reflect the relational structure of the original problem, with no need of polynomial time reductions, while it still employs parameter sharing over the graph vertices and colors. We also show how to train such model upon very hard instances, which were generated in an adversarial fashion: we generate pairs of instances comprising graphs that are on the verge of satisfiability – a positive and a negative-labeled instance that only differ by a single edge, such edge makes the second instance unsatisfiable given a fixed number of colors C. We were able to obtain 83% accuracy during training and to show that such model is able to generalize, to some extent, its performance to unseen instances coming from different distributions and sizes. We show that such performance defeats two heuristics and an allegedly generalist neural-symbolic approach. Finally, we explore the internal memory of our model and find evidence of how its reasoning is built upon its internal states (vertex and color representations). In summary, our results strongly suggests that GNNs are, indeed, powerful to tackle combinatorial problems but their performance can be largely enhanced when all problem’s features are integrated within the GNN neural architecture and no problem translation is required.application/pdfengRede neural profundaGrafosAprendizado de máquinaInteligência artificialAprendizado profundoRede neural de grafoRecurrent neural networksGraph neural networksGraph coloringNeural-symbolic computationSolving the decision version of the Graph Coloring Problem : a neural-symbolic approach using graph neural networksResolvendo a versão de decisão do problema de coloração de grafos : uma abordagem neuro-simbólica usando redes grafo-neurais info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2020mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001114939.pdf.txt001114939.pdf.txtExtracted Texttext/plain191155http://www.lume.ufrgs.br/bitstream/10183/211255/2/001114939.pdf.txt8dd0bd554524609ec1e124364e8a218eMD52ORIGINAL001114939.pdfTexto completo (inglês)application/pdf1842981http://www.lume.ufrgs.br/bitstream/10183/211255/1/001114939.pdf09b1582746dac56dffd4d26db6662cbfMD5110183/2112552024-06-12 05:33:48.223801oai:www.lume.ufrgs.br:10183/211255Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532024-06-12T08:33:48Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Solving the decision version of the Graph Coloring Problem : a neural-symbolic approach using graph neural networks
dc.title.alternative.pt.fl_str_mv Resolvendo a versão de decisão do problema de coloração de grafos : uma abordagem neuro-simbólica usando redes grafo-neurais
title Solving the decision version of the Graph Coloring Problem : a neural-symbolic approach using graph neural networks
spellingShingle Solving the decision version of the Graph Coloring Problem : a neural-symbolic approach using graph neural networks
Santos, Henrique Lemos dos
Rede neural profunda
Grafos
Aprendizado de máquina
Inteligência artificial
Aprendizado profundo
Rede neural de grafo
Recurrent neural networks
Graph neural networks
Graph coloring
Neural-symbolic computation
title_short Solving the decision version of the Graph Coloring Problem : a neural-symbolic approach using graph neural networks
title_full Solving the decision version of the Graph Coloring Problem : a neural-symbolic approach using graph neural networks
title_fullStr Solving the decision version of the Graph Coloring Problem : a neural-symbolic approach using graph neural networks
title_full_unstemmed Solving the decision version of the Graph Coloring Problem : a neural-symbolic approach using graph neural networks
title_sort Solving the decision version of the Graph Coloring Problem : a neural-symbolic approach using graph neural networks
author Santos, Henrique Lemos dos
author_facet Santos, Henrique Lemos dos
author_role author
dc.contributor.author.fl_str_mv Santos, Henrique Lemos dos
dc.contributor.advisor1.fl_str_mv Lamb, Luis da Cunha
contributor_str_mv Lamb, Luis da Cunha
dc.subject.por.fl_str_mv Rede neural profunda
Grafos
Aprendizado de máquina
Inteligência artificial
Aprendizado profundo
Rede neural de grafo
topic Rede neural profunda
Grafos
Aprendizado de máquina
Inteligência artificial
Aprendizado profundo
Rede neural de grafo
Recurrent neural networks
Graph neural networks
Graph coloring
Neural-symbolic computation
dc.subject.eng.fl_str_mv Recurrent neural networks
Graph neural networks
Graph coloring
Neural-symbolic computation
description Técnicas baseadas em aprendizado profundo têm recorrentemente atingido desempenho de estado-da-arte em diversas áreas ao longo dos últimos anos. Ainda há, no entanto, uma certa falta de compreensão em como problemas simbólicos e relacionais podem se beneficiar de modelos cuja arquitetura é baseada em aprendizado profundo. O caminho mais promissor para essa tão desejada integração consiste em arquiteturas neurais cuja propriedade de compartilhamento de parâmetros baseia-se em grafos e, dessa forma, podem ser treinadas para aprender características complexas de dados relacionais. Diversos problemas NP-Completos, tais como satisfatibilidade booleana e problema do caixeiro viajante, apresentam esse tipo de característica. Em ambos casos, um metamodelo chamado Graph Neural Network (GNN) pode trabalhar diretamente com entradas em formato de grafos, que representam uma instância do problema, e aprender a produzir uma resposta binária para o problema em questão. Nessa dissertação, estamos particularmente focados em aplicar um modelo de GNN ao problema da coloração de grafos: o modelo que propomos se aproveita de propriedades específicas desse problema ao contemplar tanto vértices quanto cores com representações internas na sua arquitetura e ao fazer com que tais representações passem por diversas etapas de troca de mensagens. Nesse sentido, a arquitetura que propomos é capaz de refletir a estrutura relacional do problema original, sem necessidade de uma redução em tempos polinomial para outro problema, enquanto ainda emprega uma estratégia de compartilhamento de parâmetros em função de vértices e cores. Nós também demonstramos como treinar tal modelo com instâncias muito difíceis, geradas de uma maneira adversarial: nós geramos pares de instâncias que são grafos no limite da satisfatibilidade – uma instância positiva e outra negativa que diferem apenas por uma única aresta, tal aresta faz com que a segunda instância não seja colorável por um dado número de cores C, enquanto a primeira permanece sendo minimamente colorável com C. Obtivemos uma acurácia de 83% durante treinamento e verificamos que nosso modelo é capaz de generalizar, até certo ponto, esse desempenho para instâncias de teste – não-vistas durante treinamento e que foram amostradas de diferentes distribuições. Nós mostramos que esse desempenho superou o desempenho de duas heurísticas e o desempenho de uma suposta abordagem neuro-simbólica generalista. Por fim, nós exploramos a memória interna do nosso modelos e encontramos evidências de como o seu raciocínio é construído em volta dos valores de representação de vértices e cores. Em suma, nossos resultados sugerem fortemente que GNNs são, de fato, ferramentas poderosas para resolver problemas combinatoriais mas que seu aprendizado pode ser amplamente melhorado quando as propriedades de um problema são totalmente agregadas à arquitetura neural e nenhuma conversão de problema é feita.
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-07-02T03:36:16Z
dc.date.issued.fl_str_mv 2020
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/211255
dc.identifier.nrb.pt_BR.fl_str_mv 001114939
url http://hdl.handle.net/10183/211255
identifier_str_mv 001114939
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/211255/2/001114939.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/211255/1/001114939.pdf
bitstream.checksum.fl_str_mv 8dd0bd554524609ec1e124364e8a218e
09b1582746dac56dffd4d26db6662cbf
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831316095052546048