Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas

Detalhes bibliográficos
Ano de defesa: 2011
Autor(a) principal: Goliatt, Priscila Vanessa Zabala Capriles
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
BR
LNCC
Programa de Pós-Graduação em Modelagem Computacional
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.lncc.br/handle/tede/157
Resumo: O conhecimento da conformação tridimensional (3D) da estrutura nativa de uma proteína tem auxiliado pesquisas biotecnológicas como as voltadas à engenharia de proteínas e ao desenho racional de fármacos. Como alternativa às técnicas de predição experimental e à técnica de predição teórica via modelagem comparativa, a técnica de predição teórica via ab initio tem sido cada vez mais explorada. Na técnica ab initio, a predição da estrutura 3D de uma proteína (PSP) é feita baseando-se apenas na sua sequência de resíduos de aminoácidos e nas propriedades físico-químicas dos mesmos. Entretanto, os métodos de PSP ab initio, para chegarem à soluções que representem estruturas nativas, requerem um grande número de avaliações de função o que limita suas aplicações em estudos de proteínas mais complexas. Uma possível solução para este problema é o uso de uma representação simplificada do sistema (modelo coarse-grained - CG). No modelo CG, a representação de cada aminoácido é reduzida a um conjunto de poucos sítios de interação, diminuindo significativamente o número de graus de liberdade a serem tratados e, portanto, reduzindo o custo computacional necessário na avaliação de cada estrutura durante o processo de otimização. Neste trabalho, foi desenvolvido e implementado um modelo CG aplicado ao problema de predição de estruturas 3D de proteínas, incluindo-se a possibilidade de simular a presença de ligações dissulfídicas. Este modelo foi adaptado ao programa GAPF (Genetic Algorithm for Protein Folding), previamente desenvolvido no Grupo de Modelagem Molecular de Sistemas Biológicos (GMMSB/ LNCC) e originalmente implementado para a PSP via técnica ab initio usando um modelo de representação de todos os átomos do sistema. O modelo CG desenvolvido foi testado em um conjunto de 36 estruturas, de tamanhos variando entre 18 e 106 resíduos de aminoácidos, e abrangendo as distintas classes de proteínas (i.e. preferencialmente alfa, alfa+beta e preferencialmente beta). Os resultados obtidos mostraram que o modelo CG proposto resultou em melhorias na capacidade preditiva do programa GAPF, sendo agora capaz de predizer conformações em folha-β, e na redução de aproximadamente 80% do tempo computacional.
id LNCC_59b731d78821bdc7d7fcf09a3c5b7387
oai_identifier_str oai:tede-server.lncc.br:tede/157
network_acronym_str LNCC
network_name_str Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínasDevelopment and implementation of a coarse-grained model for protein structure predictionEstrutura molecularAlgorítmos genéticosGenetic algorithmsMolecular structureCNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULARO conhecimento da conformação tridimensional (3D) da estrutura nativa de uma proteína tem auxiliado pesquisas biotecnológicas como as voltadas à engenharia de proteínas e ao desenho racional de fármacos. Como alternativa às técnicas de predição experimental e à técnica de predição teórica via modelagem comparativa, a técnica de predição teórica via ab initio tem sido cada vez mais explorada. Na técnica ab initio, a predição da estrutura 3D de uma proteína (PSP) é feita baseando-se apenas na sua sequência de resíduos de aminoácidos e nas propriedades físico-químicas dos mesmos. Entretanto, os métodos de PSP ab initio, para chegarem à soluções que representem estruturas nativas, requerem um grande número de avaliações de função o que limita suas aplicações em estudos de proteínas mais complexas. Uma possível solução para este problema é o uso de uma representação simplificada do sistema (modelo coarse-grained - CG). No modelo CG, a representação de cada aminoácido é reduzida a um conjunto de poucos sítios de interação, diminuindo significativamente o número de graus de liberdade a serem tratados e, portanto, reduzindo o custo computacional necessário na avaliação de cada estrutura durante o processo de otimização. Neste trabalho, foi desenvolvido e implementado um modelo CG aplicado ao problema de predição de estruturas 3D de proteínas, incluindo-se a possibilidade de simular a presença de ligações dissulfídicas. Este modelo foi adaptado ao programa GAPF (Genetic Algorithm for Protein Folding), previamente desenvolvido no Grupo de Modelagem Molecular de Sistemas Biológicos (GMMSB/ LNCC) e originalmente implementado para a PSP via técnica ab initio usando um modelo de representação de todos os átomos do sistema. O modelo CG desenvolvido foi testado em um conjunto de 36 estruturas, de tamanhos variando entre 18 e 106 resíduos de aminoácidos, e abrangendo as distintas classes de proteínas (i.e. preferencialmente alfa, alfa+beta e preferencialmente beta). Os resultados obtidos mostraram que o modelo CG proposto resultou em melhorias na capacidade preditiva do programa GAPF, sendo agora capaz de predizer conformações em folha-β, e na redução de aproximadamente 80% do tempo computacional.The knowledge of the three-dimensional (3D) conformation of the native structure of proteins has assisted biotechnological researches as those focused on protein design and structure based drug design. As an alternative to the techniques of experimental prediction and theoretical prediction via comparative modeling, the theoretical prediction via ab initio technique has been increasingly exploited. In the ab initio technique, the 3D protein structure prediction (PSP) is performed based only on its amino acid sequence and in their physicochemical properties. However, to obtain solutions that represent native structures, methods of ab initio PSP require a large number of function evaluations which limits their use in studies of more complex proteins. In the CG model, the representation of each amino acid is reduced to a set of few interaction sites, significantly reducing the number of degrees of freedom to be treated, and thus reducing the computational cost needed to evaluate each structure during the optimization process. In this work, we developed and implemented a CG model applied to the PSP problem, including the ability to simulate the presence of disulfide bonds. This model was adapted to the GAPF program (Genetic Algorithm for Protein Folding), previously developed by the "Grupo de Modelagem Molecular de Sistemas Biológicos" (GMMSB/ LNCC) and originally implemented for the PSP via ab initio technique using an all-atom model representation. The CG model has been tested on a set of 36 structures with sizes ranging from 18 to 106 amino acid residues, and covering the different classes of proteins (i.e. mainly alpha, alpha+beta and mainly beta). The results showed that the CG model proposed promoted improvements in predictive ability of GAPF program, now being able to predict β-sheet structures, and a decrease of approximately 80% of computational time.Laboratório Nacional de Computação CientíficaCoordenação de Pós-Graduação e Aperfeiçoamento (COPGA)BRLNCCPrograma de Pós-Graduação em Modelagem ComputacionalDardenne, Laurent EmmanuelCPF:49809431104http://lattes.cnpq.br/8344194525615133Garratt, Richard CharlesCPF:00000000004http://lattes.cnpq.br/1405100203133067Barbosa, Helio José CorrêaCPF:194 306 716 34http://lattes.cnpq.br/0375745110240885Silva, Fernando Luís Barroso daCPF:19142394821http://lattes.cnpq.br/0740745836565262Goliatt, Priscila Vanessa Zabala Capriles2015-03-04T18:57:49Z2013-07-092011-06-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://tede.lncc.br/handle/tede/157porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCC2023-06-02T14:49:29Zoai:tede-server.lncc.br:tede/157Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-06-02T14:49:29Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.none.fl_str_mv Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
Development and implementation of a coarse-grained model for protein structure prediction
title Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
spellingShingle Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
Goliatt, Priscila Vanessa Zabala Capriles
Estrutura molecular
Algorítmos genéticos
Genetic algorithms
Molecular structure
CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
title_short Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
title_full Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
title_fullStr Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
title_full_unstemmed Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
title_sort Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
author Goliatt, Priscila Vanessa Zabala Capriles
author_facet Goliatt, Priscila Vanessa Zabala Capriles
author_role author
dc.contributor.none.fl_str_mv Dardenne, Laurent Emmanuel
CPF:49809431104
http://lattes.cnpq.br/8344194525615133
Garratt, Richard Charles
CPF:00000000004
http://lattes.cnpq.br/1405100203133067
Barbosa, Helio José Corrêa
CPF:194 306 716 34
http://lattes.cnpq.br/0375745110240885
Silva, Fernando Luís Barroso da
CPF:19142394821
http://lattes.cnpq.br/0740745836565262
dc.contributor.author.fl_str_mv Goliatt, Priscila Vanessa Zabala Capriles
dc.subject.por.fl_str_mv Estrutura molecular
Algorítmos genéticos
Genetic algorithms
Molecular structure
CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
topic Estrutura molecular
Algorítmos genéticos
Genetic algorithms
Molecular structure
CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
description O conhecimento da conformação tridimensional (3D) da estrutura nativa de uma proteína tem auxiliado pesquisas biotecnológicas como as voltadas à engenharia de proteínas e ao desenho racional de fármacos. Como alternativa às técnicas de predição experimental e à técnica de predição teórica via modelagem comparativa, a técnica de predição teórica via ab initio tem sido cada vez mais explorada. Na técnica ab initio, a predição da estrutura 3D de uma proteína (PSP) é feita baseando-se apenas na sua sequência de resíduos de aminoácidos e nas propriedades físico-químicas dos mesmos. Entretanto, os métodos de PSP ab initio, para chegarem à soluções que representem estruturas nativas, requerem um grande número de avaliações de função o que limita suas aplicações em estudos de proteínas mais complexas. Uma possível solução para este problema é o uso de uma representação simplificada do sistema (modelo coarse-grained - CG). No modelo CG, a representação de cada aminoácido é reduzida a um conjunto de poucos sítios de interação, diminuindo significativamente o número de graus de liberdade a serem tratados e, portanto, reduzindo o custo computacional necessário na avaliação de cada estrutura durante o processo de otimização. Neste trabalho, foi desenvolvido e implementado um modelo CG aplicado ao problema de predição de estruturas 3D de proteínas, incluindo-se a possibilidade de simular a presença de ligações dissulfídicas. Este modelo foi adaptado ao programa GAPF (Genetic Algorithm for Protein Folding), previamente desenvolvido no Grupo de Modelagem Molecular de Sistemas Biológicos (GMMSB/ LNCC) e originalmente implementado para a PSP via técnica ab initio usando um modelo de representação de todos os átomos do sistema. O modelo CG desenvolvido foi testado em um conjunto de 36 estruturas, de tamanhos variando entre 18 e 106 resíduos de aminoácidos, e abrangendo as distintas classes de proteínas (i.e. preferencialmente alfa, alfa+beta e preferencialmente beta). Os resultados obtidos mostraram que o modelo CG proposto resultou em melhorias na capacidade preditiva do programa GAPF, sendo agora capaz de predizer conformações em folha-β, e na redução de aproximadamente 80% do tempo computacional.
publishDate 2011
dc.date.none.fl_str_mv 2011-06-27
2013-07-09
2015-03-04T18:57:49Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://tede.lncc.br/handle/tede/157
url https://tede.lncc.br/handle/tede/157
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
BR
LNCC
Programa de Pós-Graduação em Modelagem Computacional
publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
BR
LNCC
Programa de Pós-Graduação em Modelagem Computacional
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do LNCC
instname:Laboratório Nacional de Computação Científica (LNCC)
instacron:LNCC
instname_str Laboratório Nacional de Computação Científica (LNCC)
instacron_str LNCC
institution LNCC
reponame_str Biblioteca Digital de Teses e Dissertações do LNCC
collection Biblioteca Digital de Teses e Dissertações do LNCC
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv library@lncc.br||library@lncc.br
_version_ 1832738027022057472