Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Gomes, Isabela de Souza
Orientador(a): Silveira, Sabrina de Azevedo
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal de Viçosa
Programa de Pós-Graduação: Ciência da Computação
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Área do conhecimento CNPq:
Link de acesso: https://locus.ufv.br//handle/123456789/30488
https://doi.org/10.47328/ufvbbt.2022.550
Resumo: Proteínas são biomoléculas fundamentais para o metabolismo dos seres vivos e possuem di- versas aplicações biotecnológicas. O estudo computacional dessas macromoléculas permite expandir o conhecimento e dar velocidade em pesquisas em diversas áreas, como processos catalíticos, conformações tridimensionais, inibição enzimática, engenharia molecular, entre out- ras. Nesta dissertação, apresentamos um conjunto de artigos que fazem a proposta de estratégias computacionais para o estudo de estruturas tridimensionais de proteínas. No primeiro trabalho, combinamos uma estratégia de aprendizagem de máquinas, desenvolvida pelo nosso grupo de pesquisa, com simulações de docking, MM-PBSA, e metadinâmica para detectar potenciais in- ibidores da main protease de SARS-COV-2. Estratégias computacionais podem acelerar o pro- cesso de descoberta de fármacos, reduzindo o tempo e o custo dos experimentos em bancada, visto que estes se concentrarão em menos moléculas. Nós evidenciamos seis ligantes que têm uma boa interação com a proteína alvo no seu sítio ativo, indicando um comportamento inibidor promissor. A interação mais forte detectada, o complexo M pro -mirabegron, foi utilizado como insumo para ensaios in vitro subsequentes a fim de validar o potencial de inibição sugerido pelos ensaios in silico. No segundo trabalho, apresentamos o trabalho de revisão de literatura sobre diversas ferramentas de bioinformática para o estudo de proteínas. O artigo é um mate- rial bastante abrangente para embasar a escolha de estudantes e profissionais pela ferramenta mais adequada para determinada aplicação. No terceiro trabalho, apresentamos a base de da- dos Propedia para consulta de interações de peptídeo-proteína, que compreende mais de 19.000 estruturas de alta resolução do Protein Data Bank. As interações proteína-peptídeo podem ser úteis para prever, classificar e pontuar complexos ou para a concepção de novas moléculas. A principal vantagem do Propedia sobre outras bases de dados de peptídeos é que permite uma análise mais abrangente da similaridade e redundância. Os artigos aqui apresentados trazem uma visão geral da diversidade do estudo de bioinformática de proteínas e algumas de suas aplicações em problemas biológicos. Palavras-chave: Bioinformática. Interação proteína-proteína. Interação peptídeo-proteína. Apren- dizado de máquina. Ancoragem molecular. Dinâmica molecular.Proteínas.
id UFV_f7fe7288a938d5b33b17649a62f5601b
oai_identifier_str oai:locus.ufv.br:123456789/30488
network_acronym_str UFV
network_name_str LOCUS Repositório Institucional da UFV
repository_id_str
spelling Gomes, Isabela de Souzahttp://lattes.cnpq.br/9820348618837540Silveira, Sabrina de Azevedo2023-03-06T18:00:47Z2023-03-06T18:00:47Z2022-09-01GOMES, Isabela de Souza. Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control. 2022. 156 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2022.https://locus.ufv.br//handle/123456789/30488https://doi.org/10.47328/ufvbbt.2022.550Proteínas são biomoléculas fundamentais para o metabolismo dos seres vivos e possuem di- versas aplicações biotecnológicas. O estudo computacional dessas macromoléculas permite expandir o conhecimento e dar velocidade em pesquisas em diversas áreas, como processos catalíticos, conformações tridimensionais, inibição enzimática, engenharia molecular, entre out- ras. Nesta dissertação, apresentamos um conjunto de artigos que fazem a proposta de estratégias computacionais para o estudo de estruturas tridimensionais de proteínas. No primeiro trabalho, combinamos uma estratégia de aprendizagem de máquinas, desenvolvida pelo nosso grupo de pesquisa, com simulações de docking, MM-PBSA, e metadinâmica para detectar potenciais in- ibidores da main protease de SARS-COV-2. Estratégias computacionais podem acelerar o pro- cesso de descoberta de fármacos, reduzindo o tempo e o custo dos experimentos em bancada, visto que estes se concentrarão em menos moléculas. Nós evidenciamos seis ligantes que têm uma boa interação com a proteína alvo no seu sítio ativo, indicando um comportamento inibidor promissor. A interação mais forte detectada, o complexo M pro -mirabegron, foi utilizado como insumo para ensaios in vitro subsequentes a fim de validar o potencial de inibição sugerido pelos ensaios in silico. No segundo trabalho, apresentamos o trabalho de revisão de literatura sobre diversas ferramentas de bioinformática para o estudo de proteínas. O artigo é um mate- rial bastante abrangente para embasar a escolha de estudantes e profissionais pela ferramenta mais adequada para determinada aplicação. No terceiro trabalho, apresentamos a base de da- dos Propedia para consulta de interações de peptídeo-proteína, que compreende mais de 19.000 estruturas de alta resolução do Protein Data Bank. As interações proteína-peptídeo podem ser úteis para prever, classificar e pontuar complexos ou para a concepção de novas moléculas. A principal vantagem do Propedia sobre outras bases de dados de peptídeos é que permite uma análise mais abrangente da similaridade e redundância. Os artigos aqui apresentados trazem uma visão geral da diversidade do estudo de bioinformática de proteínas e algumas de suas aplicações em problemas biológicos. Palavras-chave: Bioinformática. Interação proteína-proteína. Interação peptídeo-proteína. Apren- dizado de máquina. Ancoragem molecular. Dinâmica molecular.Proteínas.Proteins are fundamental biomolecules for the metabolism of living beings and have several biotechnological uses. The computational study of this class of macromolecules allows the ex- pansion of knowledge and speed in research applications, such as catalytic processes, three- dimensional conformations, enzyme inhibition, molecular engineering, among others. In this dissertation, we present a set of papers that purposes computational strategies to study three- dimensional structures of proteins. In the first work, we combine an in-house developed machine learning strategy with docking, MM-PBSA, and metadynamics simulations to detect potential inhibitors for SARS-COV-2 main protease. Computational strategies can help to speed up the process of drug discovery, reducing the time and cost of wet-lab experiments because they will be focused on fewer molecules. Our work points out six ligands that have a good interaction with our target in its active pocket, indicating an inhibitor behavior. We highlighted the strongest interaction of our experiments, M pro -mirabegron complex, which was used as input for subse- quent in vitro assays to validate the inhibition potential suggested by in silico experiments. In the second paper, we present a literature review of several bioinformatics tools for the study of proteins. The article is a very detailed material to support the choice of students and profession- als for the most appropriate tool for a particular application. In the third work, we introduced the Propedia database for protein-peptide identification, which comprises over 19,000 high- resolution structures from the Protein Data Bank. Protein-peptide interactions can be useful for predicting, classifying, and scoring complexes or for designing new molecules. The main ad- vantage of Propedia over other peptide databases is that it allows a more comprehensive analysis of similarity and redundancy. The papers presented here provide an overview of the diversity of protein bioinformatics study and some of its applications in biological problems. Keywords: Bioinformatics. Protein-protein interaction. Peptide-protein interaction. Machine learning. Docking. Molecular dynamics. Proteins.Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorengUniversidade Federal de ViçosaCiência da ComputaçãoBioinformáticaInteração proteína-proteína - Processamento de dadosPeptídeosAprendizado do computadorDinâmica molecularProteínasCiência da ComputaçãoProtein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease controlBioinformática de proteínas: panorama e estratégias computacionais para determinação de padrões de interações entre proteínas para auxiliar no controle de doençasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de InformáticaMestre em Ciência da ComputaçãoViçosa - MG2022-09-01Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf6291093https://locus.ufv.br//bitstream/123456789/30488/1/texto%20completo.pdf1d07cabd499feb611d47af9299dfd326MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/30488/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/304882023-03-06 15:00:48.167oai:locus.ufv.br:123456789/30488Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452023-03-06T18:00:48LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.en.fl_str_mv Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control
dc.title.pt-BR.fl_str_mv Bioinformática de proteínas: panorama e estratégias computacionais para determinação de padrões de interações entre proteínas para auxiliar no controle de doenças
title Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control
spellingShingle Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control
Gomes, Isabela de Souza
Bioinformática
Interação proteína-proteína - Processamento de dados
Peptídeos
Aprendizado do computador
Dinâmica molecular
Proteínas
Ciência da Computação
title_short Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control
title_full Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control
title_fullStr Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control
title_full_unstemmed Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control
title_sort Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control
author Gomes, Isabela de Souza
author_facet Gomes, Isabela de Souza
author_role author
dc.contributor.authorLattes.pt-BR.fl_str_mv http://lattes.cnpq.br/9820348618837540
dc.contributor.author.fl_str_mv Gomes, Isabela de Souza
dc.contributor.advisor1.fl_str_mv Silveira, Sabrina de Azevedo
contributor_str_mv Silveira, Sabrina de Azevedo
dc.subject.pt-BR.fl_str_mv Bioinformática
Interação proteína-proteína - Processamento de dados
Peptídeos
Aprendizado do computador
Dinâmica molecular
Proteínas
topic Bioinformática
Interação proteína-proteína - Processamento de dados
Peptídeos
Aprendizado do computador
Dinâmica molecular
Proteínas
Ciência da Computação
dc.subject.cnpq.fl_str_mv Ciência da Computação
description Proteínas são biomoléculas fundamentais para o metabolismo dos seres vivos e possuem di- versas aplicações biotecnológicas. O estudo computacional dessas macromoléculas permite expandir o conhecimento e dar velocidade em pesquisas em diversas áreas, como processos catalíticos, conformações tridimensionais, inibição enzimática, engenharia molecular, entre out- ras. Nesta dissertação, apresentamos um conjunto de artigos que fazem a proposta de estratégias computacionais para o estudo de estruturas tridimensionais de proteínas. No primeiro trabalho, combinamos uma estratégia de aprendizagem de máquinas, desenvolvida pelo nosso grupo de pesquisa, com simulações de docking, MM-PBSA, e metadinâmica para detectar potenciais in- ibidores da main protease de SARS-COV-2. Estratégias computacionais podem acelerar o pro- cesso de descoberta de fármacos, reduzindo o tempo e o custo dos experimentos em bancada, visto que estes se concentrarão em menos moléculas. Nós evidenciamos seis ligantes que têm uma boa interação com a proteína alvo no seu sítio ativo, indicando um comportamento inibidor promissor. A interação mais forte detectada, o complexo M pro -mirabegron, foi utilizado como insumo para ensaios in vitro subsequentes a fim de validar o potencial de inibição sugerido pelos ensaios in silico. No segundo trabalho, apresentamos o trabalho de revisão de literatura sobre diversas ferramentas de bioinformática para o estudo de proteínas. O artigo é um mate- rial bastante abrangente para embasar a escolha de estudantes e profissionais pela ferramenta mais adequada para determinada aplicação. No terceiro trabalho, apresentamos a base de da- dos Propedia para consulta de interações de peptídeo-proteína, que compreende mais de 19.000 estruturas de alta resolução do Protein Data Bank. As interações proteína-peptídeo podem ser úteis para prever, classificar e pontuar complexos ou para a concepção de novas moléculas. A principal vantagem do Propedia sobre outras bases de dados de peptídeos é que permite uma análise mais abrangente da similaridade e redundância. Os artigos aqui apresentados trazem uma visão geral da diversidade do estudo de bioinformática de proteínas e algumas de suas aplicações em problemas biológicos. Palavras-chave: Bioinformática. Interação proteína-proteína. Interação peptídeo-proteína. Apren- dizado de máquina. Ancoragem molecular. Dinâmica molecular.Proteínas.
publishDate 2022
dc.date.issued.fl_str_mv 2022-09-01
dc.date.accessioned.fl_str_mv 2023-03-06T18:00:47Z
dc.date.available.fl_str_mv 2023-03-06T18:00:47Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GOMES, Isabela de Souza. Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control. 2022. 156 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2022.
dc.identifier.uri.fl_str_mv https://locus.ufv.br//handle/123456789/30488
dc.identifier.doi.pt-BR.fl_str_mv https://doi.org/10.47328/ufvbbt.2022.550
identifier_str_mv GOMES, Isabela de Souza. Protein bioinformatics: overview and computational strategies to determine protein interaction patterns to assist in disease control. 2022. 156 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2022.
url https://locus.ufv.br//handle/123456789/30488
https://doi.org/10.47328/ufvbbt.2022.550
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.publisher.program.fl_str_mv Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.source.none.fl_str_mv reponame:LOCUS Repositório Institucional da UFV
instname:Universidade Federal de Viçosa (UFV)
instacron:UFV
instname_str Universidade Federal de Viçosa (UFV)
instacron_str UFV
institution UFV
reponame_str LOCUS Repositório Institucional da UFV
collection LOCUS Repositório Institucional da UFV
bitstream.url.fl_str_mv https://locus.ufv.br//bitstream/123456789/30488/1/texto%20completo.pdf
https://locus.ufv.br//bitstream/123456789/30488/2/license.txt
bitstream.checksum.fl_str_mv 1d07cabd499feb611d47af9299dfd326
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv fabiojreis@ufv.br
_version_ 1794528709254840320