Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Werdt, Paulo Roberto Teixeira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Laboratório Nacional de Computação Cientifica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
BR
LNCC
Programa de Pós-Graduação em Modelagem Computacional
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.lncc.br/handle/tede/185
Resumo: A predição da estrutura tridimensional de proteínas (PSP) tem se mostrado um dos campos mais desafiadores da biologia computacional, tanto pela sua aplicabilidade no campo da medicina e no desenho de fármacos, quanto pela sua alta complexidade e custo computacionais. O objetivo principal deste trabalho foi implementar e investigar o potencial preditivo, no contexto do programa GAPF (Genetic Algorithm for Protein Folding), do uso de um modelo Coarse Grained (CG) acoplado com um algoritmo genético de múltiplos mínimos desenvolvido especificamente para predizer estruturas de proteínas, utilizando restrições de distância e de ângulos advindas de experimentos de Ressonância Magnética Nuclear (RMN). Um segundo objetivo foi, utilizando estruturas determinadas por RMN depositadas no Protein Data Bank (PDB), identificar, classificar e gerar estatísticas sobre as restrições de RMN que possam ser mais relevantes em um processo de predição de estruturas de proteínas. Neste sentido, foram desenvolvidos programas, na linguagem C++, para ler, interpretar, analisar e acoplar as informações de RMN contidas nos arquivos do PDB, tornando possível a utilização das restrições, contidas nestes arquivos, pelo programa GAPF. Também foi desenvolvido um programa de visualização que, utilizando a biblioteca OpenGL, permite a observação das estruturas de proteínas com as suas respectivas restrições de RMN. Foram realizadas simulações em um grupo teste de dez proteínas, de estrutura já conhecida, e os resultados foram comparados com aqueles obtidos com o uso do modelo all-atom. Os resultados obtidos com o uso do modelo CG conseguiram ser equivalentes ou, na maioria dos casos, superar os resultados obtidos com o modelo all-atom. Além de permitir uma redução significativa no custo computacional, o uso do modelo CG possibilitou uma redução significativa do número de restrições de RMN necessárias para a predição de uma estrutura com um enovelamento considerado correto ou satisfatório.
id LNCC_366f6370c0cdb658174fe7bbbf9fdef7
oai_identifier_str oai:tede-server.lncc.br:tede/185
network_acronym_str LNCC
network_name_str Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grainedPrediction of protein structures using NMR restraints and a coarse grained modelBiologia molecularProcessamento eletrônico de dadosAlgorítmos genéticosMolecular biologyCNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULARA predição da estrutura tridimensional de proteínas (PSP) tem se mostrado um dos campos mais desafiadores da biologia computacional, tanto pela sua aplicabilidade no campo da medicina e no desenho de fármacos, quanto pela sua alta complexidade e custo computacionais. O objetivo principal deste trabalho foi implementar e investigar o potencial preditivo, no contexto do programa GAPF (Genetic Algorithm for Protein Folding), do uso de um modelo Coarse Grained (CG) acoplado com um algoritmo genético de múltiplos mínimos desenvolvido especificamente para predizer estruturas de proteínas, utilizando restrições de distância e de ângulos advindas de experimentos de Ressonância Magnética Nuclear (RMN). Um segundo objetivo foi, utilizando estruturas determinadas por RMN depositadas no Protein Data Bank (PDB), identificar, classificar e gerar estatísticas sobre as restrições de RMN que possam ser mais relevantes em um processo de predição de estruturas de proteínas. Neste sentido, foram desenvolvidos programas, na linguagem C++, para ler, interpretar, analisar e acoplar as informações de RMN contidas nos arquivos do PDB, tornando possível a utilização das restrições, contidas nestes arquivos, pelo programa GAPF. Também foi desenvolvido um programa de visualização que, utilizando a biblioteca OpenGL, permite a observação das estruturas de proteínas com as suas respectivas restrições de RMN. Foram realizadas simulações em um grupo teste de dez proteínas, de estrutura já conhecida, e os resultados foram comparados com aqueles obtidos com o uso do modelo all-atom. Os resultados obtidos com o uso do modelo CG conseguiram ser equivalentes ou, na maioria dos casos, superar os resultados obtidos com o modelo all-atom. Além de permitir uma redução significativa no custo computacional, o uso do modelo CG possibilitou uma redução significativa do número de restrições de RMN necessárias para a predição de uma estrutura com um enovelamento considerado correto ou satisfatório.The prediction of the three-dimensional structure of proteins (PSP) has been one of the most challenging fields of computational biology, both for its applicability in the field of medicine and drug design, as for its high complexity and computational cost. The main objective of this work was to implement and investigate the predictive potential in the context of the program GAPF (Genetic Algorithm for Protein Folding), the use of a Coarse Grained (CG) model, coupled with a genetic algorithm of multiple minimum, designed specifically to predict protein structures, using restraints of distance and angles obtained from experiments of Nuclear Magnetic Resonance (NMR). A second objective was, using structures determined by NMR and deposited in the Protein Data Bank (PDB), to identify, classify and generate statistics of those NMR restraints that might be more relevant in a process of predicting protein structures. In this sense, programs were developed, in C++ language, to read, interpret, analyze and engage the NMR information contained in the PDB files, making it possible to use the restraints contained in these files, by the program GAPF. A visualization program was also developed, using the OpenGL library, which allows the observation of protein structures with their respective NMR restraints. Simulations were performed on a test group of ten proteins with known structure, and the results were compared with those obtained using an all atom model. The results obtained with the use of the CG model were equivalent or, in most cases, exceeded the results achieved with the all atom force field. Besides allowing a significant reduction in computational cost, the use of the CG model enabled a significant reduction of the number of NMR restraints necessary for the prediction of a structure with a folding considered correct or satisfactory.Laboratório Nacional de Computação CientificaCoordenação de Pós-Graduação e Aperfeiçoamento (COPGA)BRLNCCPrograma de Pós-Graduação em Modelagem ComputacionalDardenne, Laurent EmmanuelCPF:49809431104http://lattes.cnpq.br/8344194525615133Custódio, Fábio LimaCPF:08159264720http://lattes.cnpq.br/9126339190151859Barbosa, Helio José CorrêaCPF:194 306 716 34http://lattes.cnpq.br/0375745110240885Pascutti, Pedro Geraldohttp://lattes.cnpq.br/61425584109227273Werdt, Paulo Roberto Teixeira2015-03-04T18:58:04Z2014-10-062014-04-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://tede.lncc.br/handle/tede/185porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCC2023-06-02T15:00:59Zoai:tede-server.lncc.br:tede/185Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-06-02T15:00:59Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.none.fl_str_mv Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
Prediction of protein structures using NMR restraints and a coarse grained model
title Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
spellingShingle Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
Werdt, Paulo Roberto Teixeira
Biologia molecular
Processamento eletrônico de dados
Algorítmos genéticos
Molecular biology
CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
title_short Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
title_full Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
title_fullStr Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
title_full_unstemmed Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
title_sort Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
author Werdt, Paulo Roberto Teixeira
author_facet Werdt, Paulo Roberto Teixeira
author_role author
dc.contributor.none.fl_str_mv Dardenne, Laurent Emmanuel
CPF:49809431104
http://lattes.cnpq.br/8344194525615133
Custódio, Fábio Lima
CPF:08159264720
http://lattes.cnpq.br/9126339190151859
Barbosa, Helio José Corrêa
CPF:194 306 716 34
http://lattes.cnpq.br/0375745110240885
Pascutti, Pedro Geraldo
http://lattes.cnpq.br/61425584109227273
dc.contributor.author.fl_str_mv Werdt, Paulo Roberto Teixeira
dc.subject.por.fl_str_mv Biologia molecular
Processamento eletrônico de dados
Algorítmos genéticos
Molecular biology
CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
topic Biologia molecular
Processamento eletrônico de dados
Algorítmos genéticos
Molecular biology
CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
description A predição da estrutura tridimensional de proteínas (PSP) tem se mostrado um dos campos mais desafiadores da biologia computacional, tanto pela sua aplicabilidade no campo da medicina e no desenho de fármacos, quanto pela sua alta complexidade e custo computacionais. O objetivo principal deste trabalho foi implementar e investigar o potencial preditivo, no contexto do programa GAPF (Genetic Algorithm for Protein Folding), do uso de um modelo Coarse Grained (CG) acoplado com um algoritmo genético de múltiplos mínimos desenvolvido especificamente para predizer estruturas de proteínas, utilizando restrições de distância e de ângulos advindas de experimentos de Ressonância Magnética Nuclear (RMN). Um segundo objetivo foi, utilizando estruturas determinadas por RMN depositadas no Protein Data Bank (PDB), identificar, classificar e gerar estatísticas sobre as restrições de RMN que possam ser mais relevantes em um processo de predição de estruturas de proteínas. Neste sentido, foram desenvolvidos programas, na linguagem C++, para ler, interpretar, analisar e acoplar as informações de RMN contidas nos arquivos do PDB, tornando possível a utilização das restrições, contidas nestes arquivos, pelo programa GAPF. Também foi desenvolvido um programa de visualização que, utilizando a biblioteca OpenGL, permite a observação das estruturas de proteínas com as suas respectivas restrições de RMN. Foram realizadas simulações em um grupo teste de dez proteínas, de estrutura já conhecida, e os resultados foram comparados com aqueles obtidos com o uso do modelo all-atom. Os resultados obtidos com o uso do modelo CG conseguiram ser equivalentes ou, na maioria dos casos, superar os resultados obtidos com o modelo all-atom. Além de permitir uma redução significativa no custo computacional, o uso do modelo CG possibilitou uma redução significativa do número de restrições de RMN necessárias para a predição de uma estrutura com um enovelamento considerado correto ou satisfatório.
publishDate 2014
dc.date.none.fl_str_mv 2014-10-06
2014-04-28
2015-03-04T18:58:04Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://tede.lncc.br/handle/tede/185
url https://tede.lncc.br/handle/tede/185
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Laboratório Nacional de Computação Cientifica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
BR
LNCC
Programa de Pós-Graduação em Modelagem Computacional
publisher.none.fl_str_mv Laboratório Nacional de Computação Cientifica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
BR
LNCC
Programa de Pós-Graduação em Modelagem Computacional
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do LNCC
instname:Laboratório Nacional de Computação Científica (LNCC)
instacron:LNCC
instname_str Laboratório Nacional de Computação Científica (LNCC)
instacron_str LNCC
institution LNCC
reponame_str Biblioteca Digital de Teses e Dissertações do LNCC
collection Biblioteca Digital de Teses e Dissertações do LNCC
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv library@lncc.br||library@lncc.br
_version_ 1832738027091263488