Modelos de programação inteira para o problema de busca de motivos em redes biológicas

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Prazeres, Ricardo Molinari dos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/100/100131/tde-24082022-162352/
Resumo: Existem diversas variantes do problema de busca de motivos na literatura, com muitas aplicações em bioinformática. Na variante denominada busca de motivos em grafos, proposta em 2006, dado grafo colorido G, um multiconjunto de cores M (chamado motivo), buscamos um subgrafo conexo induzido de G que contém as cores de M. Quando o motivo não pode ser encontrado em G, buscamos uma ocorrência aproximada dele, considerando alguns critérios de aproximação. No trabalho mencionado, provou-se que o problema é NP-difícil mesmo que G esteja restrito a árvores e foi proposto um algoritmo exato de enumeração, que enumera apenas motivos pequenos (contendo no máximo 4 vértices). Em 2018, foi proposta uma abordagem baseada em programação inteira para o caso especial em que G está restrito a árvores. No presente trabalho, apresentamos modelos de programação inteira para o referido problema e propomos uma abordagem branch-and-cut para o caso geral do problema (quando G é um grafo arbitrário). As restrições de conexidade da solução são adicionadas ao modelo como planos de corte. Com uma pequena adaptação dessa abordagem, obtemos um algoritmo de enumeração. A abordagem apresentada conseguiu resolver instâncias provenientes de redes de interação proteína-proteína contendo, após pré-processamento, aproximadamente 3.000 proteínas (vértices) e 4.100 interações entre elas (arestas).
id USP_d52724f54c33780bb149a5a58c07cab1
oai_identifier_str oai:teses.usp.br:tde-24082022-162352
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Modelos de programação inteira para o problema de busca de motivos em redes biológicasInteger programming models for the motif search problem in biological networks.Branch-and-cutBranch-and-cutBusca de motivosGraph motifInteger programmingMotif searchMotivo em grafosProgramação inteiraProtein-protein interaction networksRedes de interação proteína-proteínaExistem diversas variantes do problema de busca de motivos na literatura, com muitas aplicações em bioinformática. Na variante denominada busca de motivos em grafos, proposta em 2006, dado grafo colorido G, um multiconjunto de cores M (chamado motivo), buscamos um subgrafo conexo induzido de G que contém as cores de M. Quando o motivo não pode ser encontrado em G, buscamos uma ocorrência aproximada dele, considerando alguns critérios de aproximação. No trabalho mencionado, provou-se que o problema é NP-difícil mesmo que G esteja restrito a árvores e foi proposto um algoritmo exato de enumeração, que enumera apenas motivos pequenos (contendo no máximo 4 vértices). Em 2018, foi proposta uma abordagem baseada em programação inteira para o caso especial em que G está restrito a árvores. No presente trabalho, apresentamos modelos de programação inteira para o referido problema e propomos uma abordagem branch-and-cut para o caso geral do problema (quando G é um grafo arbitrário). As restrições de conexidade da solução são adicionadas ao modelo como planos de corte. Com uma pequena adaptação dessa abordagem, obtemos um algoritmo de enumeração. A abordagem apresentada conseguiu resolver instâncias provenientes de redes de interação proteína-proteína contendo, após pré-processamento, aproximadamente 3.000 proteínas (vértices) e 4.100 interações entre elas (arestas).There are several variants of the motif search problem in the literature, with many applications in bioinformatics. In the variant called motif search in graphs, proposed in 2006, we are given a colored graph G, a multiset of colors M (called motif ) and we seek for a connected induced subgraph of G which contains the colors of M. When the given motif cannot be found in G, we seek for an approximate match of it, considering some approximation criteria. In the mentioned work, it was proved that the problem is NP-hard even though G is restricted to trees and an exact enumeration algorithm was proposed, which enumerates only small-size motifs (containing at most 4 vertices). In 2018, an integer programming approach was proposed for the special case where G is restricted to trees. In the present work, we present integer programming models for this problem and propose a branch-and-cut approach for the general case of it (when G is an arbitrary graph). The solution connectivity constraints are added to the model as cutting planes. With a small adaptation of this approach, we get an enumeration algorithm. The presented approach was able to solve instances from protein-protein interaction networks containing, after pre-processing, approximately 3,000 proteins (vertices) and 4,100 interactions between them (edges)Biblioteca Digitais de Teses e Dissertações da USPFreire, Alexandre da SilvaPrazeres, Ricardo Molinari dos2022-06-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-24082022-162352/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-09T13:16:04Zoai:teses.usp.br:tde-24082022-162352Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T13:16:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Modelos de programação inteira para o problema de busca de motivos em redes biológicas
Integer programming models for the motif search problem in biological networks.
title Modelos de programação inteira para o problema de busca de motivos em redes biológicas
spellingShingle Modelos de programação inteira para o problema de busca de motivos em redes biológicas
Prazeres, Ricardo Molinari dos
Branch-and-cut
Branch-and-cut
Busca de motivos
Graph motif
Integer programming
Motif search
Motivo em grafos
Programação inteira
Protein-protein interaction networks
Redes de interação proteína-proteína
title_short Modelos de programação inteira para o problema de busca de motivos em redes biológicas
title_full Modelos de programação inteira para o problema de busca de motivos em redes biológicas
title_fullStr Modelos de programação inteira para o problema de busca de motivos em redes biológicas
title_full_unstemmed Modelos de programação inteira para o problema de busca de motivos em redes biológicas
title_sort Modelos de programação inteira para o problema de busca de motivos em redes biológicas
author Prazeres, Ricardo Molinari dos
author_facet Prazeres, Ricardo Molinari dos
author_role author
dc.contributor.none.fl_str_mv Freire, Alexandre da Silva
dc.contributor.author.fl_str_mv Prazeres, Ricardo Molinari dos
dc.subject.por.fl_str_mv Branch-and-cut
Branch-and-cut
Busca de motivos
Graph motif
Integer programming
Motif search
Motivo em grafos
Programação inteira
Protein-protein interaction networks
Redes de interação proteína-proteína
topic Branch-and-cut
Branch-and-cut
Busca de motivos
Graph motif
Integer programming
Motif search
Motivo em grafos
Programação inteira
Protein-protein interaction networks
Redes de interação proteína-proteína
description Existem diversas variantes do problema de busca de motivos na literatura, com muitas aplicações em bioinformática. Na variante denominada busca de motivos em grafos, proposta em 2006, dado grafo colorido G, um multiconjunto de cores M (chamado motivo), buscamos um subgrafo conexo induzido de G que contém as cores de M. Quando o motivo não pode ser encontrado em G, buscamos uma ocorrência aproximada dele, considerando alguns critérios de aproximação. No trabalho mencionado, provou-se que o problema é NP-difícil mesmo que G esteja restrito a árvores e foi proposto um algoritmo exato de enumeração, que enumera apenas motivos pequenos (contendo no máximo 4 vértices). Em 2018, foi proposta uma abordagem baseada em programação inteira para o caso especial em que G está restrito a árvores. No presente trabalho, apresentamos modelos de programação inteira para o referido problema e propomos uma abordagem branch-and-cut para o caso geral do problema (quando G é um grafo arbitrário). As restrições de conexidade da solução são adicionadas ao modelo como planos de corte. Com uma pequena adaptação dessa abordagem, obtemos um algoritmo de enumeração. A abordagem apresentada conseguiu resolver instâncias provenientes de redes de interação proteína-proteína contendo, após pré-processamento, aproximadamente 3.000 proteínas (vértices) e 4.100 interações entre elas (arestas).
publishDate 2022
dc.date.none.fl_str_mv 2022-06-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/100/100131/tde-24082022-162352/
url https://www.teses.usp.br/teses/disponiveis/100/100131/tde-24082022-162352/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1818279230716248064