Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes
| Ano de defesa: | 2018 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Viçosa
Ciência da Computação |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://locus.ufv.br/handle/123456789/32506 |
Resumo: | O volume de dados disponíveis sobre sequências e estruturas de proteínas vem cres- cendo rapidamente ao longo dos últimos anos. Por exemplo, o banco de dados de sequências Uniprot possui hoje mais de 500.000 sequências revisadas manualmente e outras 107 milhões automaticamente anotadas. A quantidade de estruturas dis- poníveis é menor, mas ainda assim bem extensa, onde temos no PDB (Protein Data Bank), principal repositório de estruturas proteicas, mais de 137 mil estru- turas depositadas. Neste contexto, a Bioinformática desempenha um importante papel, no sentido de armazenar, organizar e extrair informação da grande quan- tidade de dados provenientes de organismos vivos. Neste trabalho, são propostas duas abordagens visuais para dados em larga escala que auxiliem os pesquisadores a responder diferentes questões relacionadas à proteínas. No primeiro trabalho, VERMONT (ViewER MutatiON Tool) 2.0, é apresentada uma plataforma intera- tiva que utiliza dados de sequência e estruturas de proteínas, com o objetivo de fornecer informações sobre pontos de mutação potencialmente danosos à estrutura e função proteica. Uma mutação é uma alteração na sequência de DNA, podendo afetar um único par de bases ou múltiplos genes. Elas podem ser hereditárias, quando herdadas dos pais ou somáticas, quando ocorrem durante a vida. O VER- MONT tem o objetivo de permitir o estudo do efeito de pontos de mutação em proteínas, que ocorrem quando um único nucleotídeo é alterado na sequência de DNA, podendo modificar determinados resíduos na proteína . Para isto, é utili- zada uma abordagem mista, que envolve interações intramoleculares, cálculo de acessibilidade a solvente, métricas de redes complexas e cálculo da energia livre de Gibbs. O cálculo destas informações acoplado a uma amigável interface, per- mite aos especialistas analisar e compreender o impacto de pontos de mutações. O segundo trabalho, visGReMLIN (visual Graph Mining strategy to infer protein- Ligand INteraction patterns), utiliza uma abordagem de mineração de grafos para encontrar padrões de interação recorrentes entre proteínas e ligantes. São con- siderados ligantes pequenas moléculas não proteicas que formam um complexo com a proteína. Nele, as interações entre proteína e ligante são modelados como um grafo bipartido, onde os vértices são rotulados com as características físico- químicos do átomo e as arestas com o tipo de interação estabelecido pelos átomos. Para encontrar os padrões de interação, foi realizado um agrupamento dos gra- fos, utilizando, por padrão, o método k-medoids com coeficiente de silhueta como métrica de avaliação, seguido por uma mineração de subgrafos frequentes. Esta estratégia foi capaz de identificar átomos e resíduos importantes, já determinados experimentalmente ou computacionalmente, em estudos anteriores. Em ambos os trabalhos, foram propostas ferramentas robustas e fáceis de usar que lidam com dados de proteínas em larga escala e tem o objetivo de auxiliar na compreensão de diferentes problemas biológicos. |
| id |
UFV_9b30c5192cd3a291d6b9ecfb9775bf89 |
|---|---|
| oai_identifier_str |
oai:locus.ufv.br:123456789/32506 |
| network_acronym_str |
UFV |
| network_name_str |
LOCUS Repositório Institucional da UFV |
| repository_id_str |
|
| spelling |
Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentesGraph mining based detection and visualization of conserved motifs in 3D protein-ligand interface at atomic levelMineração de dados (Computação)Banco de dadosProteínasBioinformáticaCiência da ComputaçãoO volume de dados disponíveis sobre sequências e estruturas de proteínas vem cres- cendo rapidamente ao longo dos últimos anos. Por exemplo, o banco de dados de sequências Uniprot possui hoje mais de 500.000 sequências revisadas manualmente e outras 107 milhões automaticamente anotadas. A quantidade de estruturas dis- poníveis é menor, mas ainda assim bem extensa, onde temos no PDB (Protein Data Bank), principal repositório de estruturas proteicas, mais de 137 mil estru- turas depositadas. Neste contexto, a Bioinformática desempenha um importante papel, no sentido de armazenar, organizar e extrair informação da grande quan- tidade de dados provenientes de organismos vivos. Neste trabalho, são propostas duas abordagens visuais para dados em larga escala que auxiliem os pesquisadores a responder diferentes questões relacionadas à proteínas. No primeiro trabalho, VERMONT (ViewER MutatiON Tool) 2.0, é apresentada uma plataforma intera- tiva que utiliza dados de sequência e estruturas de proteínas, com o objetivo de fornecer informações sobre pontos de mutação potencialmente danosos à estrutura e função proteica. Uma mutação é uma alteração na sequência de DNA, podendo afetar um único par de bases ou múltiplos genes. Elas podem ser hereditárias, quando herdadas dos pais ou somáticas, quando ocorrem durante a vida. O VER- MONT tem o objetivo de permitir o estudo do efeito de pontos de mutação em proteínas, que ocorrem quando um único nucleotídeo é alterado na sequência de DNA, podendo modificar determinados resíduos na proteína . Para isto, é utili- zada uma abordagem mista, que envolve interações intramoleculares, cálculo de acessibilidade a solvente, métricas de redes complexas e cálculo da energia livre de Gibbs. O cálculo destas informações acoplado a uma amigável interface, per- mite aos especialistas analisar e compreender o impacto de pontos de mutações. O segundo trabalho, visGReMLIN (visual Graph Mining strategy to infer protein- Ligand INteraction patterns), utiliza uma abordagem de mineração de grafos para encontrar padrões de interação recorrentes entre proteínas e ligantes. São con- siderados ligantes pequenas moléculas não proteicas que formam um complexo com a proteína. Nele, as interações entre proteína e ligante são modelados como um grafo bipartido, onde os vértices são rotulados com as características físico- químicos do átomo e as arestas com o tipo de interação estabelecido pelos átomos. Para encontrar os padrões de interação, foi realizado um agrupamento dos gra- fos, utilizando, por padrão, o método k-medoids com coeficiente de silhueta como métrica de avaliação, seguido por uma mineração de subgrafos frequentes. Esta estratégia foi capaz de identificar átomos e resíduos importantes, já determinados experimentalmente ou computacionalmente, em estudos anteriores. Em ambos os trabalhos, foram propostas ferramentas robustas e fáceis de usar que lidam com dados de proteínas em larga escala e tem o objetivo de auxiliar na compreensão de diferentes problemas biológicos.Protein sequences and structures is growing fast in the last years. For example, the database of protein sequences Uniprot has more than 500.000 sequences manually annotated and others 107.000.000 automatically annotated. The number of pro- tein structures available is smaller, but still very extensive, with 137000 structures deposited in the PDB (Protein Data Bank), major protein structure repository. In this context, bioinformatics plays an important role, when allows to store, orga- nize and deal with the huge amount of data arising from living organisms. In this work, two visual approaches are proposed to handle large scale data to help resear- chers to answer different questions about proteins. In the first work, VERMONT (ViewER MutatiON Tool) 2.0, it’s presented an interactive plataform that uses protein sequence and structure data to provide information about point mutations potentially harmful to the protein structure or function. To do so, different ap- proaches are used as intramolecular interactions, solvent accessibility calculation, complex network metrics, e Gibbs free energy. The computation of this informa- tion coupled with a friendly interface enables specialists to analyse and make sense of the impact of point mutations. Mutation is the alteration in the DNA sequence that may affect a single base pair or multiple genes. They may be hereditary, when inherited from parents or somatic, when occur during the life. The VERMONT aim is to allow the study of the impact of point mutations in proteins, that hap- pens when a single nucleotide is modified in the DNA sequence, what can alter protein residues. The second work, visGReMLIN (visual Graph Mining strategy to infer protein-Ligand INteraction patterns), uses a graph mining approach to detect motifs in the protein-ligand interaction. Are considered as ligands, small non protein molecules that forms a complex with the protein. The interactions between protein and ligand are modeled as a bipartite graph, where nodes are la- beled with the physicochemical properties of atoms and the edges are labeled with the interaction type established between atoms. To detect the motifs, the graphs are clustered, using, by default, the k-medoids method and the silhouette coeffici- ent as evaluation metric, followed by a frequent subgraph mining. This strategy was able to find relevant atoms and residues experimentally or computationally determined in previous studies. In both works, are provided robust and easy to use tools that deal with large scale protein data and aim to help in the understanding of different biological problems. viiiUniversidade Federal de ViçosaCiência da ComputaçãoSilveira, Sabrina de Azevedohttp://lattes.cnpq.br/8094348015333788Ribeiro, Vagner Soares2024-08-07T14:07:01Z2018-02-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfRIBEIRO, Vagner Soares. Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes. 2018. 59 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2018.https://locus.ufv.br/handle/123456789/32506porinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFV2024-08-08T06:03:13Zoai:locus.ufv.br:123456789/32506Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452024-08-08T06:03:13LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
| dc.title.none.fl_str_mv |
Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes Graph mining based detection and visualization of conserved motifs in 3D protein-ligand interface at atomic level |
| title |
Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes |
| spellingShingle |
Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes Ribeiro, Vagner Soares Mineração de dados (Computação) Banco de dados Proteínas Bioinformática Ciência da Computação |
| title_short |
Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes |
| title_full |
Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes |
| title_fullStr |
Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes |
| title_full_unstemmed |
Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes |
| title_sort |
Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes |
| author |
Ribeiro, Vagner Soares |
| author_facet |
Ribeiro, Vagner Soares |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Silveira, Sabrina de Azevedo http://lattes.cnpq.br/8094348015333788 |
| dc.contributor.author.fl_str_mv |
Ribeiro, Vagner Soares |
| dc.subject.por.fl_str_mv |
Mineração de dados (Computação) Banco de dados Proteínas Bioinformática Ciência da Computação |
| topic |
Mineração de dados (Computação) Banco de dados Proteínas Bioinformática Ciência da Computação |
| description |
O volume de dados disponíveis sobre sequências e estruturas de proteínas vem cres- cendo rapidamente ao longo dos últimos anos. Por exemplo, o banco de dados de sequências Uniprot possui hoje mais de 500.000 sequências revisadas manualmente e outras 107 milhões automaticamente anotadas. A quantidade de estruturas dis- poníveis é menor, mas ainda assim bem extensa, onde temos no PDB (Protein Data Bank), principal repositório de estruturas proteicas, mais de 137 mil estru- turas depositadas. Neste contexto, a Bioinformática desempenha um importante papel, no sentido de armazenar, organizar e extrair informação da grande quan- tidade de dados provenientes de organismos vivos. Neste trabalho, são propostas duas abordagens visuais para dados em larga escala que auxiliem os pesquisadores a responder diferentes questões relacionadas à proteínas. No primeiro trabalho, VERMONT (ViewER MutatiON Tool) 2.0, é apresentada uma plataforma intera- tiva que utiliza dados de sequência e estruturas de proteínas, com o objetivo de fornecer informações sobre pontos de mutação potencialmente danosos à estrutura e função proteica. Uma mutação é uma alteração na sequência de DNA, podendo afetar um único par de bases ou múltiplos genes. Elas podem ser hereditárias, quando herdadas dos pais ou somáticas, quando ocorrem durante a vida. O VER- MONT tem o objetivo de permitir o estudo do efeito de pontos de mutação em proteínas, que ocorrem quando um único nucleotídeo é alterado na sequência de DNA, podendo modificar determinados resíduos na proteína . Para isto, é utili- zada uma abordagem mista, que envolve interações intramoleculares, cálculo de acessibilidade a solvente, métricas de redes complexas e cálculo da energia livre de Gibbs. O cálculo destas informações acoplado a uma amigável interface, per- mite aos especialistas analisar e compreender o impacto de pontos de mutações. O segundo trabalho, visGReMLIN (visual Graph Mining strategy to infer protein- Ligand INteraction patterns), utiliza uma abordagem de mineração de grafos para encontrar padrões de interação recorrentes entre proteínas e ligantes. São con- siderados ligantes pequenas moléculas não proteicas que formam um complexo com a proteína. Nele, as interações entre proteína e ligante são modelados como um grafo bipartido, onde os vértices são rotulados com as características físico- químicos do átomo e as arestas com o tipo de interação estabelecido pelos átomos. Para encontrar os padrões de interação, foi realizado um agrupamento dos gra- fos, utilizando, por padrão, o método k-medoids com coeficiente de silhueta como métrica de avaliação, seguido por uma mineração de subgrafos frequentes. Esta estratégia foi capaz de identificar átomos e resíduos importantes, já determinados experimentalmente ou computacionalmente, em estudos anteriores. Em ambos os trabalhos, foram propostas ferramentas robustas e fáceis de usar que lidam com dados de proteínas em larga escala e tem o objetivo de auxiliar na compreensão de diferentes problemas biológicos. |
| publishDate |
2018 |
| dc.date.none.fl_str_mv |
2018-02-21 2024-08-07T14:07:01Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
RIBEIRO, Vagner Soares. Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes. 2018. 59 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2018. https://locus.ufv.br/handle/123456789/32506 |
| identifier_str_mv |
RIBEIRO, Vagner Soares. Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes. 2018. 59 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2018. |
| url |
https://locus.ufv.br/handle/123456789/32506 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa Ciência da Computação |
| publisher.none.fl_str_mv |
Universidade Federal de Viçosa Ciência da Computação |
| dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
| instname_str |
Universidade Federal de Viçosa (UFV) |
| instacron_str |
UFV |
| institution |
UFV |
| reponame_str |
LOCUS Repositório Institucional da UFV |
| collection |
LOCUS Repositório Institucional da UFV |
| repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
| repository.mail.fl_str_mv |
fabiojreis@ufv.br |
| _version_ |
1855045725784637440 |