Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
| Ano de defesa: | 2014 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Laboratório Nacional de Computação Cientifica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA) BR LNCC Programa de Pós-Graduação em Modelagem Computacional |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://tede.lncc.br/handle/tede/185 |
Resumo: | A predição da estrutura tridimensional de proteínas (PSP) tem se mostrado um dos campos mais desafiadores da biologia computacional, tanto pela sua aplicabilidade no campo da medicina e no desenho de fármacos, quanto pela sua alta complexidade e custo computacionais. O objetivo principal deste trabalho foi implementar e investigar o potencial preditivo, no contexto do programa GAPF (Genetic Algorithm for Protein Folding), do uso de um modelo Coarse Grained (CG) acoplado com um algoritmo genético de múltiplos mínimos desenvolvido especificamente para predizer estruturas de proteínas, utilizando restrições de distância e de ângulos advindas de experimentos de Ressonância Magnética Nuclear (RMN). Um segundo objetivo foi, utilizando estruturas determinadas por RMN depositadas no Protein Data Bank (PDB), identificar, classificar e gerar estatísticas sobre as restrições de RMN que possam ser mais relevantes em um processo de predição de estruturas de proteínas. Neste sentido, foram desenvolvidos programas, na linguagem C++, para ler, interpretar, analisar e acoplar as informações de RMN contidas nos arquivos do PDB, tornando possível a utilização das restrições, contidas nestes arquivos, pelo programa GAPF. Também foi desenvolvido um programa de visualização que, utilizando a biblioteca OpenGL, permite a observação das estruturas de proteínas com as suas respectivas restrições de RMN. Foram realizadas simulações em um grupo teste de dez proteínas, de estrutura já conhecida, e os resultados foram comparados com aqueles obtidos com o uso do modelo all-atom. Os resultados obtidos com o uso do modelo CG conseguiram ser equivalentes ou, na maioria dos casos, superar os resultados obtidos com o modelo all-atom. Além de permitir uma redução significativa no custo computacional, o uso do modelo CG possibilitou uma redução significativa do número de restrições de RMN necessárias para a predição de uma estrutura com um enovelamento considerado correto ou satisfatório. |
| id |
LNCC_366f6370c0cdb658174fe7bbbf9fdef7 |
|---|---|
| oai_identifier_str |
oai:tede-server.lncc.br:tede/185 |
| network_acronym_str |
LNCC |
| network_name_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
| repository_id_str |
|
| spelling |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grainedPrediction of protein structures using NMR restraints and a coarse grained modelBiologia molecularProcessamento eletrônico de dadosAlgorítmos genéticosMolecular biologyCNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULARA predição da estrutura tridimensional de proteínas (PSP) tem se mostrado um dos campos mais desafiadores da biologia computacional, tanto pela sua aplicabilidade no campo da medicina e no desenho de fármacos, quanto pela sua alta complexidade e custo computacionais. O objetivo principal deste trabalho foi implementar e investigar o potencial preditivo, no contexto do programa GAPF (Genetic Algorithm for Protein Folding), do uso de um modelo Coarse Grained (CG) acoplado com um algoritmo genético de múltiplos mínimos desenvolvido especificamente para predizer estruturas de proteínas, utilizando restrições de distância e de ângulos advindas de experimentos de Ressonância Magnética Nuclear (RMN). Um segundo objetivo foi, utilizando estruturas determinadas por RMN depositadas no Protein Data Bank (PDB), identificar, classificar e gerar estatísticas sobre as restrições de RMN que possam ser mais relevantes em um processo de predição de estruturas de proteínas. Neste sentido, foram desenvolvidos programas, na linguagem C++, para ler, interpretar, analisar e acoplar as informações de RMN contidas nos arquivos do PDB, tornando possível a utilização das restrições, contidas nestes arquivos, pelo programa GAPF. Também foi desenvolvido um programa de visualização que, utilizando a biblioteca OpenGL, permite a observação das estruturas de proteínas com as suas respectivas restrições de RMN. Foram realizadas simulações em um grupo teste de dez proteínas, de estrutura já conhecida, e os resultados foram comparados com aqueles obtidos com o uso do modelo all-atom. Os resultados obtidos com o uso do modelo CG conseguiram ser equivalentes ou, na maioria dos casos, superar os resultados obtidos com o modelo all-atom. Além de permitir uma redução significativa no custo computacional, o uso do modelo CG possibilitou uma redução significativa do número de restrições de RMN necessárias para a predição de uma estrutura com um enovelamento considerado correto ou satisfatório.The prediction of the three-dimensional structure of proteins (PSP) has been one of the most challenging fields of computational biology, both for its applicability in the field of medicine and drug design, as for its high complexity and computational cost. The main objective of this work was to implement and investigate the predictive potential in the context of the program GAPF (Genetic Algorithm for Protein Folding), the use of a Coarse Grained (CG) model, coupled with a genetic algorithm of multiple minimum, designed specifically to predict protein structures, using restraints of distance and angles obtained from experiments of Nuclear Magnetic Resonance (NMR). A second objective was, using structures determined by NMR and deposited in the Protein Data Bank (PDB), to identify, classify and generate statistics of those NMR restraints that might be more relevant in a process of predicting protein structures. In this sense, programs were developed, in C++ language, to read, interpret, analyze and engage the NMR information contained in the PDB files, making it possible to use the restraints contained in these files, by the program GAPF. A visualization program was also developed, using the OpenGL library, which allows the observation of protein structures with their respective NMR restraints. Simulations were performed on a test group of ten proteins with known structure, and the results were compared with those obtained using an all atom model. The results obtained with the use of the CG model were equivalent or, in most cases, exceeded the results achieved with the all atom force field. Besides allowing a significant reduction in computational cost, the use of the CG model enabled a significant reduction of the number of NMR restraints necessary for the prediction of a structure with a folding considered correct or satisfactory.Laboratório Nacional de Computação CientificaCoordenação de Pós-Graduação e Aperfeiçoamento (COPGA)BRLNCCPrograma de Pós-Graduação em Modelagem ComputacionalDardenne, Laurent EmmanuelCPF:49809431104http://lattes.cnpq.br/8344194525615133Custódio, Fábio LimaCPF:08159264720http://lattes.cnpq.br/9126339190151859Barbosa, Helio José CorrêaCPF:194 306 716 34http://lattes.cnpq.br/0375745110240885Pascutti, Pedro Geraldohttp://lattes.cnpq.br/61425584109227273Werdt, Paulo Roberto Teixeira2015-03-04T18:58:04Z2014-10-062014-04-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://tede.lncc.br/handle/tede/185porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCC2023-06-02T15:00:59Zoai:tede-server.lncc.br:tede/185Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-06-02T15:00:59Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false |
| dc.title.none.fl_str_mv |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained Prediction of protein structures using NMR restraints and a coarse grained model |
| title |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
| spellingShingle |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained Werdt, Paulo Roberto Teixeira Biologia molecular Processamento eletrônico de dados Algorítmos genéticos Molecular biology CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR |
| title_short |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
| title_full |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
| title_fullStr |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
| title_full_unstemmed |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
| title_sort |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
| author |
Werdt, Paulo Roberto Teixeira |
| author_facet |
Werdt, Paulo Roberto Teixeira |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Dardenne, Laurent Emmanuel CPF:49809431104 http://lattes.cnpq.br/8344194525615133 Custódio, Fábio Lima CPF:08159264720 http://lattes.cnpq.br/9126339190151859 Barbosa, Helio José Corrêa CPF:194 306 716 34 http://lattes.cnpq.br/0375745110240885 Pascutti, Pedro Geraldo http://lattes.cnpq.br/61425584109227273 |
| dc.contributor.author.fl_str_mv |
Werdt, Paulo Roberto Teixeira |
| dc.subject.por.fl_str_mv |
Biologia molecular Processamento eletrônico de dados Algorítmos genéticos Molecular biology CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR |
| topic |
Biologia molecular Processamento eletrônico de dados Algorítmos genéticos Molecular biology CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR |
| description |
A predição da estrutura tridimensional de proteínas (PSP) tem se mostrado um dos campos mais desafiadores da biologia computacional, tanto pela sua aplicabilidade no campo da medicina e no desenho de fármacos, quanto pela sua alta complexidade e custo computacionais. O objetivo principal deste trabalho foi implementar e investigar o potencial preditivo, no contexto do programa GAPF (Genetic Algorithm for Protein Folding), do uso de um modelo Coarse Grained (CG) acoplado com um algoritmo genético de múltiplos mínimos desenvolvido especificamente para predizer estruturas de proteínas, utilizando restrições de distância e de ângulos advindas de experimentos de Ressonância Magnética Nuclear (RMN). Um segundo objetivo foi, utilizando estruturas determinadas por RMN depositadas no Protein Data Bank (PDB), identificar, classificar e gerar estatísticas sobre as restrições de RMN que possam ser mais relevantes em um processo de predição de estruturas de proteínas. Neste sentido, foram desenvolvidos programas, na linguagem C++, para ler, interpretar, analisar e acoplar as informações de RMN contidas nos arquivos do PDB, tornando possível a utilização das restrições, contidas nestes arquivos, pelo programa GAPF. Também foi desenvolvido um programa de visualização que, utilizando a biblioteca OpenGL, permite a observação das estruturas de proteínas com as suas respectivas restrições de RMN. Foram realizadas simulações em um grupo teste de dez proteínas, de estrutura já conhecida, e os resultados foram comparados com aqueles obtidos com o uso do modelo all-atom. Os resultados obtidos com o uso do modelo CG conseguiram ser equivalentes ou, na maioria dos casos, superar os resultados obtidos com o modelo all-atom. Além de permitir uma redução significativa no custo computacional, o uso do modelo CG possibilitou uma redução significativa do número de restrições de RMN necessárias para a predição de uma estrutura com um enovelamento considerado correto ou satisfatório. |
| publishDate |
2014 |
| dc.date.none.fl_str_mv |
2014-10-06 2014-04-28 2015-03-04T18:58:04Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://tede.lncc.br/handle/tede/185 |
| url |
https://tede.lncc.br/handle/tede/185 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Laboratório Nacional de Computação Cientifica Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA) BR LNCC Programa de Pós-Graduação em Modelagem Computacional |
| publisher.none.fl_str_mv |
Laboratório Nacional de Computação Cientifica Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA) BR LNCC Programa de Pós-Graduação em Modelagem Computacional |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do LNCC instname:Laboratório Nacional de Computação Científica (LNCC) instacron:LNCC |
| instname_str |
Laboratório Nacional de Computação Científica (LNCC) |
| instacron_str |
LNCC |
| institution |
LNCC |
| reponame_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
| collection |
Biblioteca Digital de Teses e Dissertações do LNCC |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC) |
| repository.mail.fl_str_mv |
library@lncc.br||library@lncc.br |
| _version_ |
1832738027091263488 |