Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained
Ano de defesa: | 2014 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Laboratório Nacional de Computação Cientifica
|
Programa de Pós-Graduação: |
Programa de Pós-Graduação em Modelagem Computacional
|
Departamento: |
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
|
País: |
BR
|
Palavras-chave em Português: | |
Palavras-chave em Inglês: | |
Área do conhecimento CNPq: | |
Link de acesso: | https://tede.lncc.br/handle/tede/185 |
Resumo: | The prediction of the three-dimensional structure of proteins (PSP) has been one of the most challenging fields of computational biology, both for its applicability in the field of medicine and drug design, as for its high complexity and computational cost. The main objective of this work was to implement and investigate the predictive potential in the context of the program GAPF (Genetic Algorithm for Protein Folding), the use of a Coarse Grained (CG) model, coupled with a genetic algorithm of multiple minimum, designed specifically to predict protein structures, using restraints of distance and angles obtained from experiments of Nuclear Magnetic Resonance (NMR). A second objective was, using structures determined by NMR and deposited in the Protein Data Bank (PDB), to identify, classify and generate statistics of those NMR restraints that might be more relevant in a process of predicting protein structures. In this sense, programs were developed, in C++ language, to read, interpret, analyze and engage the NMR information contained in the PDB files, making it possible to use the restraints contained in these files, by the program GAPF. A visualization program was also developed, using the OpenGL library, which allows the observation of protein structures with their respective NMR restraints. Simulations were performed on a test group of ten proteins with known structure, and the results were compared with those obtained using an all atom model. The results obtained with the use of the CG model were equivalent or, in most cases, exceeded the results achieved with the all atom force field. Besides allowing a significant reduction in computational cost, the use of the CG model enabled a significant reduction of the number of NMR restraints necessary for the prediction of a structure with a folding considered correct or satisfactory. |
id |
LNCC_366f6370c0cdb658174fe7bbbf9fdef7 |
---|---|
oai_identifier_str |
oai:tede-server.lncc.br:tede/185 |
network_acronym_str |
LNCC |
network_name_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
repository_id_str |
|
spelling |
Dardenne, Laurent EmmanuelCPF:49809431104http://lattes.cnpq.br/8344194525615133Custódio, Fábio LimaCPF:08159264720http://lattes.cnpq.br/9126339190151859Barbosa, Helio José CorrêaCPF:194 306 716 34http://lattes.cnpq.br/0375745110240885Pascutti, Pedro Geraldohttp://lattes.cnpq.br/61425584109227273CPF:05694045769http://lattes.cnpq.br/5138848008740842Werdt, Paulo Roberto Teixeira2015-03-04T18:58:04Z2014-10-062014-04-28https://tede.lncc.br/handle/tede/185The prediction of the three-dimensional structure of proteins (PSP) has been one of the most challenging fields of computational biology, both for its applicability in the field of medicine and drug design, as for its high complexity and computational cost. The main objective of this work was to implement and investigate the predictive potential in the context of the program GAPF (Genetic Algorithm for Protein Folding), the use of a Coarse Grained (CG) model, coupled with a genetic algorithm of multiple minimum, designed specifically to predict protein structures, using restraints of distance and angles obtained from experiments of Nuclear Magnetic Resonance (NMR). A second objective was, using structures determined by NMR and deposited in the Protein Data Bank (PDB), to identify, classify and generate statistics of those NMR restraints that might be more relevant in a process of predicting protein structures. In this sense, programs were developed, in C++ language, to read, interpret, analyze and engage the NMR information contained in the PDB files, making it possible to use the restraints contained in these files, by the program GAPF. A visualization program was also developed, using the OpenGL library, which allows the observation of protein structures with their respective NMR restraints. Simulations were performed on a test group of ten proteins with known structure, and the results were compared with those obtained using an all atom model. The results obtained with the use of the CG model were equivalent or, in most cases, exceeded the results achieved with the all atom force field. Besides allowing a significant reduction in computational cost, the use of the CG model enabled a significant reduction of the number of NMR restraints necessary for the prediction of a structure with a folding considered correct or satisfactory.A predição da estrutura tridimensional de proteínas (PSP) tem se mostrado um dos campos mais desafiadores da biologia computacional, tanto pela sua aplicabilidade no campo da medicina e no desenho de fármacos, quanto pela sua alta complexidade e custo computacionais. O objetivo principal deste trabalho foi implementar e investigar o potencial preditivo, no contexto do programa GAPF (Genetic Algorithm for Protein Folding), do uso de um modelo Coarse Grained (CG) acoplado com um algoritmo genético de múltiplos mínimos desenvolvido especificamente para predizer estruturas de proteínas, utilizando restrições de distância e de ângulos advindas de experimentos de Ressonância Magnética Nuclear (RMN). Um segundo objetivo foi, utilizando estruturas determinadas por RMN depositadas no Protein Data Bank (PDB), identificar, classificar e gerar estatísticas sobre as restrições de RMN que possam ser mais relevantes em um processo de predição de estruturas de proteínas. Neste sentido, foram desenvolvidos programas, na linguagem C++, para ler, interpretar, analisar e acoplar as informações de RMN contidas nos arquivos do PDB, tornando possível a utilização das restrições, contidas nestes arquivos, pelo programa GAPF. Também foi desenvolvido um programa de visualização que, utilizando a biblioteca OpenGL, permite a observação das estruturas de proteínas com as suas respectivas restrições de RMN. Foram realizadas simulações em um grupo teste de dez proteínas, de estrutura já conhecida, e os resultados foram comparados com aqueles obtidos com o uso do modelo all-atom. Os resultados obtidos com o uso do modelo CG conseguiram ser equivalentes ou, na maioria dos casos, superar os resultados obtidos com o modelo all-atom. Além de permitir uma redução significativa no custo computacional, o uso do modelo CG possibilitou uma redução significativa do número de restrições de RMN necessárias para a predição de uma estrutura com um enovelamento considerado correto ou satisfatório.Made available in DSpace on 2015-03-04T18:58:04Z (GMT). No. of bitstreams: 1 DISSERTACAO_PAULO_WERDT.pdf: 21786566 bytes, checksum: 03a53ac9704356741edfa085dc1c0f81 (MD5) Previous issue date: 2014-04-28application/pdfhttp://tede-server.lncc.br:8080/retrieve/451/DISSERTACAO_PAULO_WERDT.pdf.jpghttp://tede-server.lncc.br:8080/retrieve/665/DISSERTACAO_PAULO_WERDT.pdf.jpgporLaboratório Nacional de Computação CientificaPrograma de Pós-Graduação em Modelagem ComputacionalLNCCBRCoordenação de Pós-Graduação e Aperfeiçoamento (COPGA)Biologia molecularProcessamento eletrônico de dadosAlgorítmos genéticosMolecular biologyCNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULARPredição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grainedPrediction of protein structures using NMR restraints and a coarse grained modelinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCCORIGINALDISSERTACAO_PAULO_WERDT.pdfapplication/pdf21786566http://tede-server.lncc.br:8080/tede/bitstream/tede/185/1/DISSERTACAO_PAULO_WERDT.pdf03a53ac9704356741edfa085dc1c0f81MD51THUMBNAILDISSERTACAO_PAULO_WERDT.pdf.jpgDISSERTACAO_PAULO_WERDT.pdf.jpgimage/jpeg3274http://tede-server.lncc.br:8080/tede/bitstream/tede/185/2/DISSERTACAO_PAULO_WERDT.pdf.jpg0a2a1ded0cf7d9435a5c3e22d9d9c2cbMD52tede/1852023-06-02 12:00:59.515oai:tede-server.lncc.br:tede/185Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-06-02T15:00:59Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false |
dc.title.por.fl_str_mv |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
dc.title.alternative.eng.fl_str_mv |
Prediction of protein structures using NMR restraints and a coarse grained model |
title |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
spellingShingle |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained Werdt, Paulo Roberto Teixeira Biologia molecular Processamento eletrônico de dados Algorítmos genéticos Molecular biology CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR |
title_short |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
title_full |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
title_fullStr |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
title_full_unstemmed |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
title_sort |
Predição de estruturas de proteínas utilizando restrições de RMN e um modelo coarse grained |
author |
Werdt, Paulo Roberto Teixeira |
author_facet |
Werdt, Paulo Roberto Teixeira |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Dardenne, Laurent Emmanuel |
dc.contributor.advisor1ID.fl_str_mv |
CPF:49809431104 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/8344194525615133 |
dc.contributor.advisor-co1.fl_str_mv |
Custódio, Fábio Lima |
dc.contributor.advisor-co1ID.fl_str_mv |
CPF:08159264720 |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/9126339190151859 |
dc.contributor.referee1.fl_str_mv |
Barbosa, Helio José Corrêa |
dc.contributor.referee1ID.fl_str_mv |
CPF:194 306 716 34 |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/0375745110240885 |
dc.contributor.referee2.fl_str_mv |
Pascutti, Pedro Geraldo |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/61425584109227273 |
dc.contributor.authorID.fl_str_mv |
CPF:05694045769 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/5138848008740842 |
dc.contributor.author.fl_str_mv |
Werdt, Paulo Roberto Teixeira |
contributor_str_mv |
Dardenne, Laurent Emmanuel Custódio, Fábio Lima Barbosa, Helio José Corrêa Pascutti, Pedro Geraldo |
dc.subject.por.fl_str_mv |
Biologia molecular Processamento eletrônico de dados Algorítmos genéticos |
topic |
Biologia molecular Processamento eletrônico de dados Algorítmos genéticos Molecular biology CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR |
dc.subject.eng.fl_str_mv |
Molecular biology |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR |
description |
The prediction of the three-dimensional structure of proteins (PSP) has been one of the most challenging fields of computational biology, both for its applicability in the field of medicine and drug design, as for its high complexity and computational cost. The main objective of this work was to implement and investigate the predictive potential in the context of the program GAPF (Genetic Algorithm for Protein Folding), the use of a Coarse Grained (CG) model, coupled with a genetic algorithm of multiple minimum, designed specifically to predict protein structures, using restraints of distance and angles obtained from experiments of Nuclear Magnetic Resonance (NMR). A second objective was, using structures determined by NMR and deposited in the Protein Data Bank (PDB), to identify, classify and generate statistics of those NMR restraints that might be more relevant in a process of predicting protein structures. In this sense, programs were developed, in C++ language, to read, interpret, analyze and engage the NMR information contained in the PDB files, making it possible to use the restraints contained in these files, by the program GAPF. A visualization program was also developed, using the OpenGL library, which allows the observation of protein structures with their respective NMR restraints. Simulations were performed on a test group of ten proteins with known structure, and the results were compared with those obtained using an all atom model. The results obtained with the use of the CG model were equivalent or, in most cases, exceeded the results achieved with the all atom force field. Besides allowing a significant reduction in computational cost, the use of the CG model enabled a significant reduction of the number of NMR restraints necessary for the prediction of a structure with a folding considered correct or satisfactory. |
publishDate |
2014 |
dc.date.available.fl_str_mv |
2014-10-06 |
dc.date.issued.fl_str_mv |
2014-04-28 |
dc.date.accessioned.fl_str_mv |
2015-03-04T18:58:04Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://tede.lncc.br/handle/tede/185 |
url |
https://tede.lncc.br/handle/tede/185 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Laboratório Nacional de Computação Cientifica |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Modelagem Computacional |
dc.publisher.initials.fl_str_mv |
LNCC |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA) |
publisher.none.fl_str_mv |
Laboratório Nacional de Computação Cientifica |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do LNCC instname:Laboratório Nacional de Computação Científica (LNCC) instacron:LNCC |
instname_str |
Laboratório Nacional de Computação Científica (LNCC) |
instacron_str |
LNCC |
institution |
LNCC |
reponame_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
collection |
Biblioteca Digital de Teses e Dissertações do LNCC |
bitstream.url.fl_str_mv |
http://tede-server.lncc.br:8080/tede/bitstream/tede/185/1/DISSERTACAO_PAULO_WERDT.pdf http://tede-server.lncc.br:8080/tede/bitstream/tede/185/2/DISSERTACAO_PAULO_WERDT.pdf.jpg |
bitstream.checksum.fl_str_mv |
03a53ac9704356741edfa085dc1c0f81 0a2a1ded0cf7d9435a5c3e22d9d9c2cb |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC) |
repository.mail.fl_str_mv |
library@lncc.br||library@lncc.br |
_version_ |
1797689459647447040 |