pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction
Ano de defesa: | 2022 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | eng |
Instituição de defesa: |
Universidade Federal de Viçosa
|
Programa de Pós-Graduação: |
Ciência da Computação
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Área do conhecimento CNPq: | |
Link de acesso: | https://locus.ufv.br//handle/123456789/30520 https://doi.org/10.47328/ufvbbt.2023.006 |
Resumo: | Uma das fontes de dados para o conjunto de dados de proteínas que está sendo explorado em bioinformática é o Protein Data Bank (PDB). A busca por estruturas conservadas semelhantes em problemas biológicos foi uma tentativa inicial e ainda é um método popular amplamente utilizado por pesquisadores. Neste trabalho, uma abordagem baseada em gráficos chamada pGReMLIN é proposta, que prediz estruturas similares em complexos proteína-proteína ou proteína-peptídeo usando os arranjos estruturais conservados estabelecidos de Serina protease e BCL-2. Os complexos proteína-proteína ou proteína-peptídeo são baixados do PDB, e a interface entre as proteínas no nível atômico é modelada como um gráfico, com os átomos como nós e as interações não covalentes entre os átomos como arestas. O cálculo de um padrão semelhante de arranjo estrutural no gráfico de dados foi obtido usando um conjunto de pares candidatos de gráfico de dados D(G) e gráfico de consulta Q(G) com base na representação do espaço de estado e regras de viabilidade que incorporam a igualdade de estrutura e atributos . pGReMLIN foi capaz de calcular, no gráfico de dados, um arranjo estrutural conservado que representa interações altamente conservadas na interface de ligação de especificidade de tripsina e proteínas semelhantes a tripsina. Além disso, nosso método foi capaz de identificar padrões semelhantes com tamanho de padrão grande no gráfico de dados comum à serina protease e BCL-2 e também exclusivo para serina protease e BCL-2. Além disso, pGReMLIN foi capaz de apresentar vários grandes padrões de padrões conservados semelhantes que podem ser mais explorados para determinar sua potência. Portanto, a presença de padrões semelhantes em nosso conjunto de dados proteína-proteína indica a possibilidade de que os padrões encontrados em nosso conjunto de dados tenham funções semelhantes às estruturas conservadas. Palavras-chave: Interação proteína-proteína. Isomorfismo grafo-subgrafo. previsão de ligantes. |
id |
UFV_64087dacf1f18bd73103cfd5d05ee47b |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/30520 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
|
spelling |
Adeagbo, Moruf Adedejihttp://lattes.cnpq.br/8607282294601900Silveira, Sabrina de Azevedo2023-03-17T13:55:19Z2023-03-17T13:55:19Z2022-12-21ADEAGBO, Moruf Adedeji. pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction. 2022. 58 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2022.https://locus.ufv.br//handle/123456789/30520https://doi.org/10.47328/ufvbbt.2023.006Uma das fontes de dados para o conjunto de dados de proteínas que está sendo explorado em bioinformática é o Protein Data Bank (PDB). A busca por estruturas conservadas semelhantes em problemas biológicos foi uma tentativa inicial e ainda é um método popular amplamente utilizado por pesquisadores. Neste trabalho, uma abordagem baseada em gráficos chamada pGReMLIN é proposta, que prediz estruturas similares em complexos proteína-proteína ou proteína-peptídeo usando os arranjos estruturais conservados estabelecidos de Serina protease e BCL-2. Os complexos proteína-proteína ou proteína-peptídeo são baixados do PDB, e a interface entre as proteínas no nível atômico é modelada como um gráfico, com os átomos como nós e as interações não covalentes entre os átomos como arestas. O cálculo de um padrão semelhante de arranjo estrutural no gráfico de dados foi obtido usando um conjunto de pares candidatos de gráfico de dados D(G) e gráfico de consulta Q(G) com base na representação do espaço de estado e regras de viabilidade que incorporam a igualdade de estrutura e atributos . pGReMLIN foi capaz de calcular, no gráfico de dados, um arranjo estrutural conservado que representa interações altamente conservadas na interface de ligação de especificidade de tripsina e proteínas semelhantes a tripsina. Além disso, nosso método foi capaz de identificar padrões semelhantes com tamanho de padrão grande no gráfico de dados comum à serina protease e BCL-2 e também exclusivo para serina protease e BCL-2. Além disso, pGReMLIN foi capaz de apresentar vários grandes padrões de padrões conservados semelhantes que podem ser mais explorados para determinar sua potência. Portanto, a presença de padrões semelhantes em nosso conjunto de dados proteína-proteína indica a possibilidade de que os padrões encontrados em nosso conjunto de dados tenham funções semelhantes às estruturas conservadas. Palavras-chave: Interação proteína-proteína. Isomorfismo grafo-subgrafo. previsão de ligantes.One of the sources of data for the protein dataset being explored in bioinformatics is the Protein Data Bank (PDB). Searching for similar conserved structures in biological problems was an early attempt and is still a popular method widely used by researchers. In this work, a graph-based approach named pGReMLIN is proposed, which predicts similar structures in protein-protein or protein-peptide complexes using the established conserved structural arrangements of Serine protease and BCL-2. The protein-protein or protein-peptide complexes are downloaded from the PDB, and the interface between proteins at the atomic level is modeled as a graph, with atoms as nodes and the non-covalent interactions between atoms as edges. The computation of a similar pattern of structural arrangement in the data graph was achieved using a set of candidate pairs of data graph D(G) and query graph Q(G) based on state space representation and feasibility rules that embed equality of structure and attributes. pGReMLIN was able to compute, in the data graph, a conserved structural arrangement that represents highly conserved interactions at the specificity binding interface of trypsin and trypsin-like proteins. Also, our method was able to identify similar patterns with large pattern size in the data graph common to Serine protease and BCL-2 and as well as unique to Serine protease and BCL-2. Furthermore, pGReMLIN was able to present various large patterns of similar conserved patterns that can be further explored to determine their potency. Hence, the presence of similar patterns in our protein-protein dataset indicates the possibility that patterns found in our dataset have similar functions to the conserved structures. Keywords: Protein-protein interaction. Graph-subgraph isomorphism. Ligands prediction.FARAengUniversidade Federal de ViçosaCiência da ComputaçãoAprendizado do computadorProteínas - EstruturaLigações químicasCiência da ComputaçãopGReMLIN: prediction of ligands using conserved substructures in protein-protein interactionpGReMLIN: previsão de ligantes usando subestruturas conservadas na interação proteína-proteínainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de InformáticaMestre em Ciência da ComputaçãoViçosa - MG2022-12-21Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf1386959https://locus.ufv.br//bitstream/123456789/30520/1/texto%20completo.pdf00ddb93aad1812453d5e9bd9bb2bf554MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/30520/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/305202023-03-17 11:03:49.078oai:locus.ufv.br:123456789/30520Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452023-03-17T14:03:49LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.en.fl_str_mv |
pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction |
dc.title.pt-BR.fl_str_mv |
pGReMLIN: previsão de ligantes usando subestruturas conservadas na interação proteína-proteína |
title |
pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction |
spellingShingle |
pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction Adeagbo, Moruf Adedeji Aprendizado do computador Proteínas - Estrutura Ligações químicas Ciência da Computação |
title_short |
pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction |
title_full |
pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction |
title_fullStr |
pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction |
title_full_unstemmed |
pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction |
title_sort |
pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction |
author |
Adeagbo, Moruf Adedeji |
author_facet |
Adeagbo, Moruf Adedeji |
author_role |
author |
dc.contributor.authorLattes.pt-BR.fl_str_mv |
http://lattes.cnpq.br/8607282294601900 |
dc.contributor.author.fl_str_mv |
Adeagbo, Moruf Adedeji |
dc.contributor.advisor1.fl_str_mv |
Silveira, Sabrina de Azevedo |
contributor_str_mv |
Silveira, Sabrina de Azevedo |
dc.subject.pt-BR.fl_str_mv |
Aprendizado do computador Proteínas - Estrutura Ligações químicas |
topic |
Aprendizado do computador Proteínas - Estrutura Ligações químicas Ciência da Computação |
dc.subject.cnpq.fl_str_mv |
Ciência da Computação |
description |
Uma das fontes de dados para o conjunto de dados de proteínas que está sendo explorado em bioinformática é o Protein Data Bank (PDB). A busca por estruturas conservadas semelhantes em problemas biológicos foi uma tentativa inicial e ainda é um método popular amplamente utilizado por pesquisadores. Neste trabalho, uma abordagem baseada em gráficos chamada pGReMLIN é proposta, que prediz estruturas similares em complexos proteína-proteína ou proteína-peptídeo usando os arranjos estruturais conservados estabelecidos de Serina protease e BCL-2. Os complexos proteína-proteína ou proteína-peptídeo são baixados do PDB, e a interface entre as proteínas no nível atômico é modelada como um gráfico, com os átomos como nós e as interações não covalentes entre os átomos como arestas. O cálculo de um padrão semelhante de arranjo estrutural no gráfico de dados foi obtido usando um conjunto de pares candidatos de gráfico de dados D(G) e gráfico de consulta Q(G) com base na representação do espaço de estado e regras de viabilidade que incorporam a igualdade de estrutura e atributos . pGReMLIN foi capaz de calcular, no gráfico de dados, um arranjo estrutural conservado que representa interações altamente conservadas na interface de ligação de especificidade de tripsina e proteínas semelhantes a tripsina. Além disso, nosso método foi capaz de identificar padrões semelhantes com tamanho de padrão grande no gráfico de dados comum à serina protease e BCL-2 e também exclusivo para serina protease e BCL-2. Além disso, pGReMLIN foi capaz de apresentar vários grandes padrões de padrões conservados semelhantes que podem ser mais explorados para determinar sua potência. Portanto, a presença de padrões semelhantes em nosso conjunto de dados proteína-proteína indica a possibilidade de que os padrões encontrados em nosso conjunto de dados tenham funções semelhantes às estruturas conservadas. Palavras-chave: Interação proteína-proteína. Isomorfismo grafo-subgrafo. previsão de ligantes. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022-12-21 |
dc.date.accessioned.fl_str_mv |
2023-03-17T13:55:19Z |
dc.date.available.fl_str_mv |
2023-03-17T13:55:19Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ADEAGBO, Moruf Adedeji. pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction. 2022. 58 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2022. |
dc.identifier.uri.fl_str_mv |
https://locus.ufv.br//handle/123456789/30520 |
dc.identifier.doi.pt-BR.fl_str_mv |
https://doi.org/10.47328/ufvbbt.2023.006 |
identifier_str_mv |
ADEAGBO, Moruf Adedeji. pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction. 2022. 58 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2022. |
url |
https://locus.ufv.br//handle/123456789/30520 https://doi.org/10.47328/ufvbbt.2023.006 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.publisher.program.fl_str_mv |
Ciência da Computação |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/30520/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/30520/2/license.txt |
bitstream.checksum.fl_str_mv |
00ddb93aad1812453d5e9bd9bb2bf554 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1794528706348187648 |