Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Ribeiro, Vagner Soares
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Viçosa
Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://locus.ufv.br/handle/123456789/32506
Resumo: O volume de dados disponíveis sobre sequências e estruturas de proteínas vem cres- cendo rapidamente ao longo dos últimos anos. Por exemplo, o banco de dados de sequências Uniprot possui hoje mais de 500.000 sequências revisadas manualmente e outras 107 milhões automaticamente anotadas. A quantidade de estruturas dis- poníveis é menor, mas ainda assim bem extensa, onde temos no PDB (Protein Data Bank), principal repositório de estruturas proteicas, mais de 137 mil estru- turas depositadas. Neste contexto, a Bioinformática desempenha um importante papel, no sentido de armazenar, organizar e extrair informação da grande quan- tidade de dados provenientes de organismos vivos. Neste trabalho, são propostas duas abordagens visuais para dados em larga escala que auxiliem os pesquisadores a responder diferentes questões relacionadas à proteínas. No primeiro trabalho, VERMONT (ViewER MutatiON Tool) 2.0, é apresentada uma plataforma intera- tiva que utiliza dados de sequência e estruturas de proteínas, com o objetivo de fornecer informações sobre pontos de mutação potencialmente danosos à estrutura e função proteica. Uma mutação é uma alteração na sequência de DNA, podendo afetar um único par de bases ou múltiplos genes. Elas podem ser hereditárias, quando herdadas dos pais ou somáticas, quando ocorrem durante a vida. O VER- MONT tem o objetivo de permitir o estudo do efeito de pontos de mutação em proteínas, que ocorrem quando um único nucleotídeo é alterado na sequência de DNA, podendo modificar determinados resíduos na proteína . Para isto, é utili- zada uma abordagem mista, que envolve interações intramoleculares, cálculo de acessibilidade a solvente, métricas de redes complexas e cálculo da energia livre de Gibbs. O cálculo destas informações acoplado a uma amigável interface, per- mite aos especialistas analisar e compreender o impacto de pontos de mutações. O segundo trabalho, visGReMLIN (visual Graph Mining strategy to infer protein- Ligand INteraction patterns), utiliza uma abordagem de mineração de grafos para encontrar padrões de interação recorrentes entre proteínas e ligantes. São con- siderados ligantes pequenas moléculas não proteicas que formam um complexo com a proteína. Nele, as interações entre proteína e ligante são modelados como um grafo bipartido, onde os vértices são rotulados com as características físico- químicos do átomo e as arestas com o tipo de interação estabelecido pelos átomos. Para encontrar os padrões de interação, foi realizado um agrupamento dos gra- fos, utilizando, por padrão, o método k-medoids com coeficiente de silhueta como métrica de avaliação, seguido por uma mineração de subgrafos frequentes. Esta estratégia foi capaz de identificar átomos e resíduos importantes, já determinados experimentalmente ou computacionalmente, em estudos anteriores. Em ambos os trabalhos, foram propostas ferramentas robustas e fáceis de usar que lidam com dados de proteínas em larga escala e tem o objetivo de auxiliar na compreensão de diferentes problemas biológicos.
id UFV_9b30c5192cd3a291d6b9ecfb9775bf89
oai_identifier_str oai:locus.ufv.br:123456789/32506
network_acronym_str UFV
network_name_str LOCUS Repositório Institucional da UFV
repository_id_str
spelling Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentesGraph mining based detection and visualization of conserved motifs in 3D protein-ligand interface at atomic levelMineração de dados (Computação)Banco de dadosProteínasBioinformáticaCiência da ComputaçãoO volume de dados disponíveis sobre sequências e estruturas de proteínas vem cres- cendo rapidamente ao longo dos últimos anos. Por exemplo, o banco de dados de sequências Uniprot possui hoje mais de 500.000 sequências revisadas manualmente e outras 107 milhões automaticamente anotadas. A quantidade de estruturas dis- poníveis é menor, mas ainda assim bem extensa, onde temos no PDB (Protein Data Bank), principal repositório de estruturas proteicas, mais de 137 mil estru- turas depositadas. Neste contexto, a Bioinformática desempenha um importante papel, no sentido de armazenar, organizar e extrair informação da grande quan- tidade de dados provenientes de organismos vivos. Neste trabalho, são propostas duas abordagens visuais para dados em larga escala que auxiliem os pesquisadores a responder diferentes questões relacionadas à proteínas. No primeiro trabalho, VERMONT (ViewER MutatiON Tool) 2.0, é apresentada uma plataforma intera- tiva que utiliza dados de sequência e estruturas de proteínas, com o objetivo de fornecer informações sobre pontos de mutação potencialmente danosos à estrutura e função proteica. Uma mutação é uma alteração na sequência de DNA, podendo afetar um único par de bases ou múltiplos genes. Elas podem ser hereditárias, quando herdadas dos pais ou somáticas, quando ocorrem durante a vida. O VER- MONT tem o objetivo de permitir o estudo do efeito de pontos de mutação em proteínas, que ocorrem quando um único nucleotídeo é alterado na sequência de DNA, podendo modificar determinados resíduos na proteína . Para isto, é utili- zada uma abordagem mista, que envolve interações intramoleculares, cálculo de acessibilidade a solvente, métricas de redes complexas e cálculo da energia livre de Gibbs. O cálculo destas informações acoplado a uma amigável interface, per- mite aos especialistas analisar e compreender o impacto de pontos de mutações. O segundo trabalho, visGReMLIN (visual Graph Mining strategy to infer protein- Ligand INteraction patterns), utiliza uma abordagem de mineração de grafos para encontrar padrões de interação recorrentes entre proteínas e ligantes. São con- siderados ligantes pequenas moléculas não proteicas que formam um complexo com a proteína. Nele, as interações entre proteína e ligante são modelados como um grafo bipartido, onde os vértices são rotulados com as características físico- químicos do átomo e as arestas com o tipo de interação estabelecido pelos átomos. Para encontrar os padrões de interação, foi realizado um agrupamento dos gra- fos, utilizando, por padrão, o método k-medoids com coeficiente de silhueta como métrica de avaliação, seguido por uma mineração de subgrafos frequentes. Esta estratégia foi capaz de identificar átomos e resíduos importantes, já determinados experimentalmente ou computacionalmente, em estudos anteriores. Em ambos os trabalhos, foram propostas ferramentas robustas e fáceis de usar que lidam com dados de proteínas em larga escala e tem o objetivo de auxiliar na compreensão de diferentes problemas biológicos.Protein sequences and structures is growing fast in the last years. For example, the database of protein sequences Uniprot has more than 500.000 sequences manually annotated and others 107.000.000 automatically annotated. The number of pro- tein structures available is smaller, but still very extensive, with 137000 structures deposited in the PDB (Protein Data Bank), major protein structure repository. In this context, bioinformatics plays an important role, when allows to store, orga- nize and deal with the huge amount of data arising from living organisms. In this work, two visual approaches are proposed to handle large scale data to help resear- chers to answer different questions about proteins. In the first work, VERMONT (ViewER MutatiON Tool) 2.0, it’s presented an interactive plataform that uses protein sequence and structure data to provide information about point mutations potentially harmful to the protein structure or function. To do so, different ap- proaches are used as intramolecular interactions, solvent accessibility calculation, complex network metrics, e Gibbs free energy. The computation of this informa- tion coupled with a friendly interface enables specialists to analyse and make sense of the impact of point mutations. Mutation is the alteration in the DNA sequence that may affect a single base pair or multiple genes. They may be hereditary, when inherited from parents or somatic, when occur during the life. The VERMONT aim is to allow the study of the impact of point mutations in proteins, that hap- pens when a single nucleotide is modified in the DNA sequence, what can alter protein residues. The second work, visGReMLIN (visual Graph Mining strategy to infer protein-Ligand INteraction patterns), uses a graph mining approach to detect motifs in the protein-ligand interaction. Are considered as ligands, small non protein molecules that forms a complex with the protein. The interactions between protein and ligand are modeled as a bipartite graph, where nodes are la- beled with the physicochemical properties of atoms and the edges are labeled with the interaction type established between atoms. To detect the motifs, the graphs are clustered, using, by default, the k-medoids method and the silhouette coeffici- ent as evaluation metric, followed by a frequent subgraph mining. This strategy was able to find relevant atoms and residues experimentally or computationally determined in previous studies. In both works, are provided robust and easy to use tools that deal with large scale protein data and aim to help in the understanding of different biological problems. viiiUniversidade Federal de ViçosaCiência da ComputaçãoSilveira, Sabrina de Azevedohttp://lattes.cnpq.br/8094348015333788Ribeiro, Vagner Soares2024-08-07T14:07:01Z2018-02-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfRIBEIRO, Vagner Soares. Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes. 2018. 59 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2018.https://locus.ufv.br/handle/123456789/32506porinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFV2024-08-08T06:03:13Zoai:locus.ufv.br:123456789/32506Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452024-08-08T06:03:13LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.none.fl_str_mv Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes
Graph mining based detection and visualization of conserved motifs in 3D protein-ligand interface at atomic level
title Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes
spellingShingle Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes
Ribeiro, Vagner Soares
Mineração de dados (Computação)
Banco de dados
Proteínas
Bioinformática
Ciência da Computação
title_short Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes
title_full Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes
title_fullStr Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes
title_full_unstemmed Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes
title_sort Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes
author Ribeiro, Vagner Soares
author_facet Ribeiro, Vagner Soares
author_role author
dc.contributor.none.fl_str_mv Silveira, Sabrina de Azevedo
http://lattes.cnpq.br/8094348015333788
dc.contributor.author.fl_str_mv Ribeiro, Vagner Soares
dc.subject.por.fl_str_mv Mineração de dados (Computação)
Banco de dados
Proteínas
Bioinformática
Ciência da Computação
topic Mineração de dados (Computação)
Banco de dados
Proteínas
Bioinformática
Ciência da Computação
description O volume de dados disponíveis sobre sequências e estruturas de proteínas vem cres- cendo rapidamente ao longo dos últimos anos. Por exemplo, o banco de dados de sequências Uniprot possui hoje mais de 500.000 sequências revisadas manualmente e outras 107 milhões automaticamente anotadas. A quantidade de estruturas dis- poníveis é menor, mas ainda assim bem extensa, onde temos no PDB (Protein Data Bank), principal repositório de estruturas proteicas, mais de 137 mil estru- turas depositadas. Neste contexto, a Bioinformática desempenha um importante papel, no sentido de armazenar, organizar e extrair informação da grande quan- tidade de dados provenientes de organismos vivos. Neste trabalho, são propostas duas abordagens visuais para dados em larga escala que auxiliem os pesquisadores a responder diferentes questões relacionadas à proteínas. No primeiro trabalho, VERMONT (ViewER MutatiON Tool) 2.0, é apresentada uma plataforma intera- tiva que utiliza dados de sequência e estruturas de proteínas, com o objetivo de fornecer informações sobre pontos de mutação potencialmente danosos à estrutura e função proteica. Uma mutação é uma alteração na sequência de DNA, podendo afetar um único par de bases ou múltiplos genes. Elas podem ser hereditárias, quando herdadas dos pais ou somáticas, quando ocorrem durante a vida. O VER- MONT tem o objetivo de permitir o estudo do efeito de pontos de mutação em proteínas, que ocorrem quando um único nucleotídeo é alterado na sequência de DNA, podendo modificar determinados resíduos na proteína . Para isto, é utili- zada uma abordagem mista, que envolve interações intramoleculares, cálculo de acessibilidade a solvente, métricas de redes complexas e cálculo da energia livre de Gibbs. O cálculo destas informações acoplado a uma amigável interface, per- mite aos especialistas analisar e compreender o impacto de pontos de mutações. O segundo trabalho, visGReMLIN (visual Graph Mining strategy to infer protein- Ligand INteraction patterns), utiliza uma abordagem de mineração de grafos para encontrar padrões de interação recorrentes entre proteínas e ligantes. São con- siderados ligantes pequenas moléculas não proteicas que formam um complexo com a proteína. Nele, as interações entre proteína e ligante são modelados como um grafo bipartido, onde os vértices são rotulados com as características físico- químicos do átomo e as arestas com o tipo de interação estabelecido pelos átomos. Para encontrar os padrões de interação, foi realizado um agrupamento dos gra- fos, utilizando, por padrão, o método k-medoids com coeficiente de silhueta como métrica de avaliação, seguido por uma mineração de subgrafos frequentes. Esta estratégia foi capaz de identificar átomos e resíduos importantes, já determinados experimentalmente ou computacionalmente, em estudos anteriores. Em ambos os trabalhos, foram propostas ferramentas robustas e fáceis de usar que lidam com dados de proteínas em larga escala e tem o objetivo de auxiliar na compreensão de diferentes problemas biológicos.
publishDate 2018
dc.date.none.fl_str_mv 2018-02-21
2024-08-07T14:07:01Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv RIBEIRO, Vagner Soares. Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes. 2018. 59 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2018.
https://locus.ufv.br/handle/123456789/32506
identifier_str_mv RIBEIRO, Vagner Soares. Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes. 2018. 59 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2018.
url https://locus.ufv.br/handle/123456789/32506
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Viçosa
Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Viçosa
Ciência da Computação
dc.source.none.fl_str_mv reponame:LOCUS Repositório Institucional da UFV
instname:Universidade Federal de Viçosa (UFV)
instacron:UFV
instname_str Universidade Federal de Viçosa (UFV)
instacron_str UFV
institution UFV
reponame_str LOCUS Repositório Institucional da UFV
collection LOCUS Repositório Institucional da UFV
repository.name.fl_str_mv LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv fabiojreis@ufv.br
_version_ 1855045725784637440