pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Adeagbo, Moruf Adedeji
Orientador(a): Silveira, Sabrina de Azevedo
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal de Viçosa
Programa de Pós-Graduação: Ciência da Computação
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Área do conhecimento CNPq:
Link de acesso: https://locus.ufv.br//handle/123456789/30520
https://doi.org/10.47328/ufvbbt.2023.006
Resumo: Uma das fontes de dados para o conjunto de dados de proteínas que está sendo explorado em bioinformática é o Protein Data Bank (PDB). A busca por estruturas conservadas semelhantes em problemas biológicos foi uma tentativa inicial e ainda é um método popular amplamente utilizado por pesquisadores. Neste trabalho, uma abordagem baseada em gráficos chamada pGReMLIN é proposta, que prediz estruturas similares em complexos proteína-proteína ou proteína-peptídeo usando os arranjos estruturais conservados estabelecidos de Serina protease e BCL-2. Os complexos proteína-proteína ou proteína-peptídeo são baixados do PDB, e a interface entre as proteínas no nível atômico é modelada como um gráfico, com os átomos como nós e as interações não covalentes entre os átomos como arestas. O cálculo de um padrão semelhante de arranjo estrutural no gráfico de dados foi obtido usando um conjunto de pares candidatos de gráfico de dados D(G) e gráfico de consulta Q(G) com base na representação do espaço de estado e regras de viabilidade que incorporam a igualdade de estrutura e atributos . pGReMLIN foi capaz de calcular, no gráfico de dados, um arranjo estrutural conservado que representa interações altamente conservadas na interface de ligação de especificidade de tripsina e proteínas semelhantes a tripsina. Além disso, nosso método foi capaz de identificar padrões semelhantes com tamanho de padrão grande no gráfico de dados comum à serina protease e BCL-2 e também exclusivo para serina protease e BCL-2. Além disso, pGReMLIN foi capaz de apresentar vários grandes padrões de padrões conservados semelhantes que podem ser mais explorados para determinar sua potência. Portanto, a presença de padrões semelhantes em nosso conjunto de dados proteína-proteína indica a possibilidade de que os padrões encontrados em nosso conjunto de dados tenham funções semelhantes às estruturas conservadas. Palavras-chave: Interação proteína-proteína. Isomorfismo grafo-subgrafo. previsão de ligantes.
id UFV_64087dacf1f18bd73103cfd5d05ee47b
oai_identifier_str oai:locus.ufv.br:123456789/30520
network_acronym_str UFV
network_name_str LOCUS Repositório Institucional da UFV
repository_id_str
spelling Adeagbo, Moruf Adedejihttp://lattes.cnpq.br/8607282294601900Silveira, Sabrina de Azevedo2023-03-17T13:55:19Z2023-03-17T13:55:19Z2022-12-21ADEAGBO, Moruf Adedeji. pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction. 2022. 58 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2022.https://locus.ufv.br//handle/123456789/30520https://doi.org/10.47328/ufvbbt.2023.006Uma das fontes de dados para o conjunto de dados de proteínas que está sendo explorado em bioinformática é o Protein Data Bank (PDB). A busca por estruturas conservadas semelhantes em problemas biológicos foi uma tentativa inicial e ainda é um método popular amplamente utilizado por pesquisadores. Neste trabalho, uma abordagem baseada em gráficos chamada pGReMLIN é proposta, que prediz estruturas similares em complexos proteína-proteína ou proteína-peptídeo usando os arranjos estruturais conservados estabelecidos de Serina protease e BCL-2. Os complexos proteína-proteína ou proteína-peptídeo são baixados do PDB, e a interface entre as proteínas no nível atômico é modelada como um gráfico, com os átomos como nós e as interações não covalentes entre os átomos como arestas. O cálculo de um padrão semelhante de arranjo estrutural no gráfico de dados foi obtido usando um conjunto de pares candidatos de gráfico de dados D(G) e gráfico de consulta Q(G) com base na representação do espaço de estado e regras de viabilidade que incorporam a igualdade de estrutura e atributos . pGReMLIN foi capaz de calcular, no gráfico de dados, um arranjo estrutural conservado que representa interações altamente conservadas na interface de ligação de especificidade de tripsina e proteínas semelhantes a tripsina. Além disso, nosso método foi capaz de identificar padrões semelhantes com tamanho de padrão grande no gráfico de dados comum à serina protease e BCL-2 e também exclusivo para serina protease e BCL-2. Além disso, pGReMLIN foi capaz de apresentar vários grandes padrões de padrões conservados semelhantes que podem ser mais explorados para determinar sua potência. Portanto, a presença de padrões semelhantes em nosso conjunto de dados proteína-proteína indica a possibilidade de que os padrões encontrados em nosso conjunto de dados tenham funções semelhantes às estruturas conservadas. Palavras-chave: Interação proteína-proteína. Isomorfismo grafo-subgrafo. previsão de ligantes.One of the sources of data for the protein dataset being explored in bioinformatics is the Protein Data Bank (PDB). Searching for similar conserved structures in biological problems was an early attempt and is still a popular method widely used by researchers. In this work, a graph-based approach named pGReMLIN is proposed, which predicts similar structures in protein-protein or protein-peptide complexes using the established conserved structural arrangements of Serine protease and BCL-2. The protein-protein or protein-peptide complexes are downloaded from the PDB, and the interface between proteins at the atomic level is modeled as a graph, with atoms as nodes and the non-covalent interactions between atoms as edges. The computation of a similar pattern of structural arrangement in the data graph was achieved using a set of candidate pairs of data graph D(G) and query graph Q(G) based on state space representation and feasibility rules that embed equality of structure and attributes. pGReMLIN was able to compute, in the data graph, a conserved structural arrangement that represents highly conserved interactions at the specificity binding interface of trypsin and trypsin-like proteins. Also, our method was able to identify similar patterns with large pattern size in the data graph common to Serine protease and BCL-2 and as well as unique to Serine protease and BCL-2. Furthermore, pGReMLIN was able to present various large patterns of similar conserved patterns that can be further explored to determine their potency. Hence, the presence of similar patterns in our protein-protein dataset indicates the possibility that patterns found in our dataset have similar functions to the conserved structures. Keywords: Protein-protein interaction. Graph-subgraph isomorphism. Ligands prediction.FARAengUniversidade Federal de ViçosaCiência da ComputaçãoAprendizado do computadorProteínas - EstruturaLigações químicasCiência da ComputaçãopGReMLIN: prediction of ligands using conserved substructures in protein-protein interactionpGReMLIN: previsão de ligantes usando subestruturas conservadas na interação proteína-proteínainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de InformáticaMestre em Ciência da ComputaçãoViçosa - MG2022-12-21Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf1386959https://locus.ufv.br//bitstream/123456789/30520/1/texto%20completo.pdf00ddb93aad1812453d5e9bd9bb2bf554MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/30520/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/305202023-03-17 11:03:49.078oai:locus.ufv.br:123456789/30520Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452023-03-17T14:03:49LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.en.fl_str_mv pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction
dc.title.pt-BR.fl_str_mv pGReMLIN: previsão de ligantes usando subestruturas conservadas na interação proteína-proteína
title pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction
spellingShingle pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction
Adeagbo, Moruf Adedeji
Aprendizado do computador
Proteínas - Estrutura
Ligações químicas
Ciência da Computação
title_short pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction
title_full pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction
title_fullStr pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction
title_full_unstemmed pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction
title_sort pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction
author Adeagbo, Moruf Adedeji
author_facet Adeagbo, Moruf Adedeji
author_role author
dc.contributor.authorLattes.pt-BR.fl_str_mv http://lattes.cnpq.br/8607282294601900
dc.contributor.author.fl_str_mv Adeagbo, Moruf Adedeji
dc.contributor.advisor1.fl_str_mv Silveira, Sabrina de Azevedo
contributor_str_mv Silveira, Sabrina de Azevedo
dc.subject.pt-BR.fl_str_mv Aprendizado do computador
Proteínas - Estrutura
Ligações químicas
topic Aprendizado do computador
Proteínas - Estrutura
Ligações químicas
Ciência da Computação
dc.subject.cnpq.fl_str_mv Ciência da Computação
description Uma das fontes de dados para o conjunto de dados de proteínas que está sendo explorado em bioinformática é o Protein Data Bank (PDB). A busca por estruturas conservadas semelhantes em problemas biológicos foi uma tentativa inicial e ainda é um método popular amplamente utilizado por pesquisadores. Neste trabalho, uma abordagem baseada em gráficos chamada pGReMLIN é proposta, que prediz estruturas similares em complexos proteína-proteína ou proteína-peptídeo usando os arranjos estruturais conservados estabelecidos de Serina protease e BCL-2. Os complexos proteína-proteína ou proteína-peptídeo são baixados do PDB, e a interface entre as proteínas no nível atômico é modelada como um gráfico, com os átomos como nós e as interações não covalentes entre os átomos como arestas. O cálculo de um padrão semelhante de arranjo estrutural no gráfico de dados foi obtido usando um conjunto de pares candidatos de gráfico de dados D(G) e gráfico de consulta Q(G) com base na representação do espaço de estado e regras de viabilidade que incorporam a igualdade de estrutura e atributos . pGReMLIN foi capaz de calcular, no gráfico de dados, um arranjo estrutural conservado que representa interações altamente conservadas na interface de ligação de especificidade de tripsina e proteínas semelhantes a tripsina. Além disso, nosso método foi capaz de identificar padrões semelhantes com tamanho de padrão grande no gráfico de dados comum à serina protease e BCL-2 e também exclusivo para serina protease e BCL-2. Além disso, pGReMLIN foi capaz de apresentar vários grandes padrões de padrões conservados semelhantes que podem ser mais explorados para determinar sua potência. Portanto, a presença de padrões semelhantes em nosso conjunto de dados proteína-proteína indica a possibilidade de que os padrões encontrados em nosso conjunto de dados tenham funções semelhantes às estruturas conservadas. Palavras-chave: Interação proteína-proteína. Isomorfismo grafo-subgrafo. previsão de ligantes.
publishDate 2022
dc.date.issued.fl_str_mv 2022-12-21
dc.date.accessioned.fl_str_mv 2023-03-17T13:55:19Z
dc.date.available.fl_str_mv 2023-03-17T13:55:19Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ADEAGBO, Moruf Adedeji. pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction. 2022. 58 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2022.
dc.identifier.uri.fl_str_mv https://locus.ufv.br//handle/123456789/30520
dc.identifier.doi.pt-BR.fl_str_mv https://doi.org/10.47328/ufvbbt.2023.006
identifier_str_mv ADEAGBO, Moruf Adedeji. pGReMLIN: prediction of ligands using conserved substructures in protein-protein interaction. 2022. 58 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2022.
url https://locus.ufv.br//handle/123456789/30520
https://doi.org/10.47328/ufvbbt.2023.006
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.publisher.program.fl_str_mv Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.source.none.fl_str_mv reponame:LOCUS Repositório Institucional da UFV
instname:Universidade Federal de Viçosa (UFV)
instacron:UFV
instname_str Universidade Federal de Viçosa (UFV)
instacron_str UFV
institution UFV
reponame_str LOCUS Repositório Institucional da UFV
collection LOCUS Repositório Institucional da UFV
bitstream.url.fl_str_mv https://locus.ufv.br//bitstream/123456789/30520/1/texto%20completo.pdf
https://locus.ufv.br//bitstream/123456789/30520/2/license.txt
bitstream.checksum.fl_str_mv 00ddb93aad1812453d5e9bd9bb2bf554
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv fabiojreis@ufv.br
_version_ 1794528706348187648