Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Werdt, Paulo Roberto Teixeira lattes
Orientador(a): Dardenne, Laurent Emmanuel lattes
Banca de defesa: Barbosa, Helio José Corrêa lattes, Pascutti, Pedro Geraldo lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Laboratório Nacional de Computação Cientifica
Programa de Pós-Graduação: Programa de Pós-Graduação em Modelagem Computacional
Departamento: Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
País: BR
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://tede.lncc.br/handle/tede/185
Resumo: The prediction of the three-dimensional structure of proteins (PSP) has been one of the most challenging fields of computational biology, both for its applicability in the field of medicine and drug design, as for its high complexity and computational cost. The main objective of this work was to implement and investigate the predictive potential in the context of the program GAPF (Genetic Algorithm for Protein Folding), the use of a Coarse Grained (CG) model, coupled with a genetic algorithm of multiple minimum, designed specifically to predict protein structures, using restraints of distance and angles obtained from experiments of Nuclear Magnetic Resonance (NMR). A second objective was, using structures determined by NMR and deposited in the Protein Data Bank (PDB), to identify, classify and generate statistics of those NMR restraints that might be more relevant in a process of predicting protein structures. In this sense, programs were developed, in C++ language, to read, interpret, analyze and engage the NMR information contained in the PDB files, making it possible to use the restraints contained in these files, by the program GAPF. A visualization program was also developed, using the OpenGL library, which allows the observation of protein structures with their respective NMR restraints. Simulations were performed on a test group of ten proteins with known structure, and the results were compared with those obtained using an all atom model. The results obtained with the use of the CG model were equivalent or, in most cases, exceeded the results achieved with the all atom force field. Besides allowing a significant reduction in computational cost, the use of the CG model enabled a significant reduction of the number of NMR restraints necessary for the prediction of a structure with a folding considered correct or satisfactory.
id LNCC_366f6370c0cdb658174fe7bbbf9fdef7
oai_identifier_str oai:tede-server.lncc.br:tede/185
network_acronym_str LNCC
network_name_str Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling Dardenne, Laurent EmmanuelCPF:49809431104http://lattes.cnpq.br/8344194525615133Custódio, Fábio LimaCPF:08159264720http://lattes.cnpq.br/9126339190151859Barbosa, Helio José CorrêaCPF:194 306 716 34http://lattes.cnpq.br/0375745110240885Pascutti, Pedro Geraldohttp://lattes.cnpq.br/61425584109227273CPF:05694045769http://lattes.cnpq.br/5138848008740842Werdt, Paulo Roberto Teixeira2015-03-04T18:58:04Z2014-10-062014-04-28https://tede.lncc.br/handle/tede/185The prediction of the three-dimensional structure of proteins (PSP) has been one of the most challenging fields of computational biology, both for its applicability in the field of medicine and drug design, as for its high complexity and computational cost. The main objective of this work was to implement and investigate the predictive potential in the context of the program GAPF (Genetic Algorithm for Protein Folding), the use of a Coarse Grained (CG) model, coupled with a genetic algorithm of multiple minimum, designed specifically to predict protein structures, using restraints of distance and angles obtained from experiments of Nuclear Magnetic Resonance (NMR). A second objective was, using structures determined by NMR and deposited in the Protein Data Bank (PDB), to identify, classify and generate statistics of those NMR restraints that might be more relevant in a process of predicting protein structures. In this sense, programs were developed, in C++ language, to read, interpret, analyze and engage the NMR information contained in the PDB files, making it possible to use the restraints contained in these files, by the program GAPF. A visualization program was also developed, using the OpenGL library, which allows the observation of protein structures with their respective NMR restraints. Simulations were performed on a test group of ten proteins with known structure, and the results were compared with those obtained using an all atom model. The results obtained with the use of the CG model were equivalent or, in most cases, exceeded the results achieved with the all atom force field. Besides allowing a significant reduction in computational cost, the use of the CG model enabled a significant reduction of the number of NMR restraints necessary for the prediction of a structure with a folding considered correct or satisfactory.A predição da estrutura tridimensional de proteínas (PSP) tem se mostrado um dos campos mais desafiadores da biologia computacional, tanto pela sua aplicabilidade no campo da medicina e no desenho de fármacos, quanto pela sua alta complexidade e custo computacionais. O objetivo principal deste trabalho foi implementar e investigar o potencial preditivo, no contexto do programa GAPF (Genetic Algorithm for Protein Folding), do uso de um modelo Coarse Grained (CG) acoplado com um algoritmo genético de múltiplos mínimos desenvolvido especificamente para predizer estruturas de proteínas, utilizando restrições de distância e de ângulos advindas de experimentos de Ressonância Magnética Nuclear (RMN). Um segundo objetivo foi, utilizando estruturas determinadas por RMN depositadas no Protein Data Bank (PDB), identificar, classificar e gerar estatísticas sobre as restrições de RMN que possam ser mais relevantes em um processo de predição de estruturas de proteínas. Neste sentido, foram desenvolvidos programas, na linguagem C++, para ler, interpretar, analisar e acoplar as informações de RMN contidas nos arquivos do PDB, tornando possível a utilização das restrições, contidas nestes arquivos, pelo programa GAPF. Também foi desenvolvido um programa de visualização que, utilizando a biblioteca OpenGL, permite a observação das estruturas de proteínas com as suas respectivas restrições de RMN. Foram realizadas simulações em um grupo teste de dez proteínas, de estrutura já conhecida, e os resultados foram comparados com aqueles obtidos com o uso do modelo all-atom. Os resultados obtidos com o uso do modelo CG conseguiram ser equivalentes ou, na maioria dos casos, superar os resultados obtidos com o modelo all-atom. Além de permitir uma redução significativa no custo computacional, o uso do modelo CG possibilitou uma redução significativa do número de restrições de RMN necessárias para a predição de uma estrutura com um enovelamento considerado correto ou satisfatório.Made available in DSpace on 2015-03-04T18:58:04Z (GMT). No. of bitstreams: 1 DISSERTACAO_PAULO_WERDT.pdf: 21786566 bytes, checksum: 03a53ac9704356741edfa085dc1c0f81 (MD5) Previous issue date: 2014-04-28application/pdfhttp://tede-server.lncc.br:8080/retrieve/451/DISSERTACAO_PAULO_WERDT.pdf.jpghttp://tede-server.lncc.br:8080/retrieve/665/DISSERTACAO_PAULO_WERDT.pdf.jpgporLaboratório Nacional de Computação CientificaPrograma de Pós-Graduação em Modelagem ComputacionalLNCCBRCoordenação de Pós-Graduação e Aperfeiçoamento (COPGA)Biologia molecularProcessamento eletrônico de dadosAlgorítmos genéticosMolecular biologyCNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULARPredição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grainedPrediction of protein structures using NMR restraints and a coarse grained modelinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCCORIGINALDISSERTACAO_PAULO_WERDT.pdfapplication/pdf21786566http://tede-server.lncc.br:8080/tede/bitstream/tede/185/1/DISSERTACAO_PAULO_WERDT.pdf03a53ac9704356741edfa085dc1c0f81MD51THUMBNAILDISSERTACAO_PAULO_WERDT.pdf.jpgDISSERTACAO_PAULO_WERDT.pdf.jpgimage/jpeg3274http://tede-server.lncc.br:8080/tede/bitstream/tede/185/2/DISSERTACAO_PAULO_WERDT.pdf.jpg0a2a1ded0cf7d9435a5c3e22d9d9c2cbMD52tede/1852023-06-02 12:00:59.515oai:tede-server.lncc.br:tede/185Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-06-02T15:00:59Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.por.fl_str_mv Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
dc.title.alternative.eng.fl_str_mv Prediction of protein structures using NMR restraints and a coarse grained model
title Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
spellingShingle Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
Werdt, Paulo Roberto Teixeira
Biologia molecular
Processamento eletrônico de dados
Algorítmos genéticos
Molecular biology
CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
title_short Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
title_full Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
title_fullStr Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
title_full_unstemmed Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
title_sort Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
author Werdt, Paulo Roberto Teixeira
author_facet Werdt, Paulo Roberto Teixeira
author_role author
dc.contributor.advisor1.fl_str_mv Dardenne, Laurent Emmanuel
dc.contributor.advisor1ID.fl_str_mv CPF:49809431104
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8344194525615133
dc.contributor.advisor-co1.fl_str_mv Custódio, Fábio Lima
dc.contributor.advisor-co1ID.fl_str_mv CPF:08159264720
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/9126339190151859
dc.contributor.referee1.fl_str_mv Barbosa, Helio José Corrêa
dc.contributor.referee1ID.fl_str_mv CPF:194 306 716 34
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/0375745110240885
dc.contributor.referee2.fl_str_mv Pascutti, Pedro Geraldo
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/61425584109227273
dc.contributor.authorID.fl_str_mv CPF:05694045769
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/5138848008740842
dc.contributor.author.fl_str_mv Werdt, Paulo Roberto Teixeira
contributor_str_mv Dardenne, Laurent Emmanuel
Custódio, Fábio Lima
Barbosa, Helio José Corrêa
Pascutti, Pedro Geraldo
dc.subject.por.fl_str_mv Biologia molecular
Processamento eletrônico de dados
Algorítmos genéticos
topic Biologia molecular
Processamento eletrônico de dados
Algorítmos genéticos
Molecular biology
CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
dc.subject.eng.fl_str_mv Molecular biology
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
description The prediction of the three-dimensional structure of proteins (PSP) has been one of the most challenging fields of computational biology, both for its applicability in the field of medicine and drug design, as for its high complexity and computational cost. The main objective of this work was to implement and investigate the predictive potential in the context of the program GAPF (Genetic Algorithm for Protein Folding), the use of a Coarse Grained (CG) model, coupled with a genetic algorithm of multiple minimum, designed specifically to predict protein structures, using restraints of distance and angles obtained from experiments of Nuclear Magnetic Resonance (NMR). A second objective was, using structures determined by NMR and deposited in the Protein Data Bank (PDB), to identify, classify and generate statistics of those NMR restraints that might be more relevant in a process of predicting protein structures. In this sense, programs were developed, in C++ language, to read, interpret, analyze and engage the NMR information contained in the PDB files, making it possible to use the restraints contained in these files, by the program GAPF. A visualization program was also developed, using the OpenGL library, which allows the observation of protein structures with their respective NMR restraints. Simulations were performed on a test group of ten proteins with known structure, and the results were compared with those obtained using an all atom model. The results obtained with the use of the CG model were equivalent or, in most cases, exceeded the results achieved with the all atom force field. Besides allowing a significant reduction in computational cost, the use of the CG model enabled a significant reduction of the number of NMR restraints necessary for the prediction of a structure with a folding considered correct or satisfactory.
publishDate 2014
dc.date.available.fl_str_mv 2014-10-06
dc.date.issued.fl_str_mv 2014-04-28
dc.date.accessioned.fl_str_mv 2015-03-04T18:58:04Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://tede.lncc.br/handle/tede/185
url https://tede.lncc.br/handle/tede/185
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Laboratório Nacional de Computação Cientifica
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Modelagem Computacional
dc.publisher.initials.fl_str_mv LNCC
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
publisher.none.fl_str_mv Laboratório Nacional de Computação Cientifica
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do LNCC
instname:Laboratório Nacional de Computação Científica (LNCC)
instacron:LNCC
instname_str Laboratório Nacional de Computação Científica (LNCC)
instacron_str LNCC
institution LNCC
reponame_str Biblioteca Digital de Teses e Dissertações do LNCC
collection Biblioteca Digital de Teses e Dissertações do LNCC
bitstream.url.fl_str_mv http://tede-server.lncc.br:8080/tede/bitstream/tede/185/1/DISSERTACAO_PAULO_WERDT.pdf
http://tede-server.lncc.br:8080/tede/bitstream/tede/185/2/DISSERTACAO_PAULO_WERDT.pdf.jpg
bitstream.checksum.fl_str_mv 03a53ac9704356741edfa085dc1c0f81
0a2a1ded0cf7d9435a5c3e22d9d9c2cb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv library@lncc.br||library@lncc.br
_version_ 1797689459647447040