Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos
Ano de defesa: | 2009 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Laboratório Nacional de Computação Científica
|
Programa de Pós-Graduação: |
Programa de Pós-Graduação em Modelagem Computacional
|
Departamento: |
Serviço de Análise e Apoio a Formação de Recursos Humanos
|
País: |
BR
|
Palavras-chave em Português: | |
Palavras-chave em Inglês: | |
Área do conhecimento CNPq: | |
Link de acesso: | https://tede.lncc.br/handle/tede/106 |
Resumo: | Proteins are biological macromolecules comprised of amino acid polymers that play a wide range of biological roles involved in every process of living organisms. Together with X-ray diffraction, Nuclear Resonance Spectroscopy (NMR) is one of the two main experimental techniques that are capable of delivering atomic-level resolution of protein structures. Prediction of proteic structures using experimental information from NMR experiments is a global optimization problem with restraints. GAPF is a computer program that uses a Genetic Algorithm (GA) developed for ab initio prediction -- the determination of the structure of a protein from its amino acid sequence only -- using a multiple minima approach and a fitness function derived from a classic molecular force field. The work presented here describes GAPF-NMR, an alternate version of GAPF that uses experimental restraints from NMR to support the search for the best protein structures that correspond to a given sequence. Five different versions of the algorithm have been developed, each with a variation on how the energy function is calculated during the course of the program run. GAPF was tested on a test set comprised of 7 proteins with known structure and it was capable of achieving a correct or approximate fold for every one of these proteins. It was noted that the versions of the algorithm that progressively increase the area of the protein used in the energy function have performed better than the other versions, and that the multiple minima approach was important to the achievement of good results. Results were compared to those obtained by GENFOLD -- to the moment, the only known alternate implementation of a GA to the problem of protein structure prediction using NMR data -- and the current version of GAPF was shown to be superior to GENFOLD for two of the three proteins that compose its test set. |
id |
LNCC_0a42cf17d7e63b908404b9671b807cf2 |
---|---|
oai_identifier_str |
oai:tede-server.lncc.br:tede/106 |
network_acronym_str |
LNCC |
network_name_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
repository_id_str |
|
spelling |
Dardenne, Laurent EmmanuelCPF:49809431104http://lattes.cnpq.br/8344194525615133Barbosa, Helio José CorrêaCPF:194 306 716 34http://lattes.cnpq.br/0375745110240885Almeida, Fábio Ceneviva LacerdaCPF:08729261894http://lattes.cnpq.br/5916017746341882Bish, Paulo MascarelloCPF:34485309720http://lattes.cnpq.br/5928043800446342CPF:04694122401http://8005995150161965Linden, Marx Gomes Van Der2015-03-04T18:51:09Z2009-09-252009-04-15LINDEN, Marx Gomes Van Der. Resolution of Protein Structures Using NMR Data by Means of a Genetic Algorithm of Multiple Minima. 2009. 145 f. Dissertação (Mestrado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2009.https://tede.lncc.br/handle/tede/106Proteins are biological macromolecules comprised of amino acid polymers that play a wide range of biological roles involved in every process of living organisms. Together with X-ray diffraction, Nuclear Resonance Spectroscopy (NMR) is one of the two main experimental techniques that are capable of delivering atomic-level resolution of protein structures. Prediction of proteic structures using experimental information from NMR experiments is a global optimization problem with restraints. GAPF is a computer program that uses a Genetic Algorithm (GA) developed for ab initio prediction -- the determination of the structure of a protein from its amino acid sequence only -- using a multiple minima approach and a fitness function derived from a classic molecular force field. The work presented here describes GAPF-NMR, an alternate version of GAPF that uses experimental restraints from NMR to support the search for the best protein structures that correspond to a given sequence. Five different versions of the algorithm have been developed, each with a variation on how the energy function is calculated during the course of the program run. GAPF was tested on a test set comprised of 7 proteins with known structure and it was capable of achieving a correct or approximate fold for every one of these proteins. It was noted that the versions of the algorithm that progressively increase the area of the protein used in the energy function have performed better than the other versions, and that the multiple minima approach was important to the achievement of good results. Results were compared to those obtained by GENFOLD -- to the moment, the only known alternate implementation of a GA to the problem of protein structure prediction using NMR data -- and the current version of GAPF was shown to be superior to GENFOLD for two of the three proteins that compose its test set.Proteínas são macromoléculas biológicas formadas por polímeros de aminoácidos, as quais estão envolvidas em todos os processos vitais dos organismos, compreendendo um amplo leque de funções. A espectropia por Ressonância Magnética Nuclear (RMN) é, ao lado da difração de raios-X em cristais, uma das duas principais técnicas experimentais capazes de permitir a elucidação da estrutura de proteínas em resolução atômica. A predição de estruturas protéicas utilizando informações experimentais de RMN é um problema de otimização global com restrições. O GAPF é um programa que utiliza um Algoritmo Genético (AG) desenvolvido para predição ab initio -- isto é, para determinação da estrutura de uma proteína apenas a partir do conhecimento de sua seqüência de aminoácidos -- utilizando uma abordagem de múltiplos mínimos, baseada em uma função aptidão derivada de um campo de força molecular clássico. Neste trabalho, é descrito o GAPF-NMR, uma versão derivada do GAPF, que utiliza restrições experimentais de RMN para auxiliar na busca pelas melhores estruturas protéicas correspondentes a uma seqüência dada. Cinco versões diferentes do algoritmo foram desenvolvidas, com diferentes variações na maneira como a função de energia é calculada ao longo da execução. O programa desenvolvido foi aplicado a um conjunto-teste de 7 proteínas de estrutura já conhecida e, para todas elas, foi capaz de chegar a uma estrutura com o enovelamento correto ou aproximado. Foi observado que as versões do algoritmo que aumentam progressivamente a região da proteína usada no cálculo de energia tiveram desempenho superior às demais, e que a abordagem de múltiplos mínimos foi importante para a obtenção de bons resultados. Os resultados foram comparados aos descritos para o GENFOLD -- que é, até o momento, a única implementação alternativa conhecida de um AG para o problema de predição de estruturas a partir de dados de RMN -- e a versão atual do GAPF-NMR se mostrou superior ao GENFOLD na determinação de duas das três proteínas do conjunto-teste deste.Made available in DSpace on 2015-03-04T18:51:09Z (GMT). No. of bitstreams: 1 tese Marx.pdf: 13309696 bytes, checksum: c9f52e4492b104fdb02b2a485e043412 (MD5) Previous issue date: 2009-04-15Coordenacao de Aperfeicoamento de Pessoal de Nivel Superiorapplication/pdfhttp://tede-server.lncc.br:8080/retrieve/362/tese%20Marx.pdf.jpghttp://tede-server.lncc.br:8080/retrieve/588/tese%20Marx.pdf.jpgporLaboratório Nacional de Computação CientíficaPrograma de Pós-Graduação em Modelagem ComputacionalLNCCBRServiço de Análise e Apoio a Formação de Recursos HumanosProteínas-EstruturaAlgorítmos genéticosRessonância Magnética NuclearProtein StructuresGenetic AlgorithmNuclear Resonance SpectroscopyCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOResolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimosResolution of Protein Structures Using NMR Data by Means of a Genetic Algorithm of Multiple Minimainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCCORIGINALtese Marx.pdfapplication/pdf13309696http://tede-server.lncc.br:8080/tede/bitstream/tede/106/1/tese+Marx.pdfc9f52e4492b104fdb02b2a485e043412MD51THUMBNAILtese Marx.pdf.jpgtese Marx.pdf.jpgimage/jpeg3259http://tede-server.lncc.br:8080/tede/bitstream/tede/106/2/tese+Marx.pdf.jpg774bd98f961a9070ff80cb294265aed7MD52tede/1062018-07-04 09:59:38.198oai:tede-server.lncc.br:tede/106Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2018-07-04T12:59:38Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false |
dc.title.por.fl_str_mv |
Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos |
dc.title.alternative.eng.fl_str_mv |
Resolution of Protein Structures Using NMR Data by Means of a Genetic Algorithm of Multiple Minima |
title |
Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos |
spellingShingle |
Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos Linden, Marx Gomes Van Der Proteínas-Estrutura Algorítmos genéticos Ressonância Magnética Nuclear Protein Structures Genetic Algorithm Nuclear Resonance Spectroscopy CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos |
title_full |
Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos |
title_fullStr |
Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos |
title_full_unstemmed |
Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos |
title_sort |
Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos |
author |
Linden, Marx Gomes Van Der |
author_facet |
Linden, Marx Gomes Van Der |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Dardenne, Laurent Emmanuel |
dc.contributor.advisor1ID.fl_str_mv |
CPF:49809431104 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/8344194525615133 |
dc.contributor.advisor-co1.fl_str_mv |
Barbosa, Helio José Corrêa |
dc.contributor.advisor-co1ID.fl_str_mv |
CPF:194 306 716 34 |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/0375745110240885 |
dc.contributor.referee1.fl_str_mv |
Almeida, Fábio Ceneviva Lacerda |
dc.contributor.referee1ID.fl_str_mv |
CPF:08729261894 |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/5916017746341882 |
dc.contributor.referee2.fl_str_mv |
Bish, Paulo Mascarello |
dc.contributor.referee2ID.fl_str_mv |
CPF:34485309720 |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/5928043800446342 |
dc.contributor.authorID.fl_str_mv |
CPF:04694122401 |
dc.contributor.authorLattes.fl_str_mv |
http://8005995150161965 |
dc.contributor.author.fl_str_mv |
Linden, Marx Gomes Van Der |
contributor_str_mv |
Dardenne, Laurent Emmanuel Barbosa, Helio José Corrêa Almeida, Fábio Ceneviva Lacerda Bish, Paulo Mascarello |
dc.subject.por.fl_str_mv |
Proteínas-Estrutura Algorítmos genéticos Ressonância Magnética Nuclear |
topic |
Proteínas-Estrutura Algorítmos genéticos Ressonância Magnética Nuclear Protein Structures Genetic Algorithm Nuclear Resonance Spectroscopy CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Protein Structures Genetic Algorithm Nuclear Resonance Spectroscopy |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Proteins are biological macromolecules comprised of amino acid polymers that play a wide range of biological roles involved in every process of living organisms. Together with X-ray diffraction, Nuclear Resonance Spectroscopy (NMR) is one of the two main experimental techniques that are capable of delivering atomic-level resolution of protein structures. Prediction of proteic structures using experimental information from NMR experiments is a global optimization problem with restraints. GAPF is a computer program that uses a Genetic Algorithm (GA) developed for ab initio prediction -- the determination of the structure of a protein from its amino acid sequence only -- using a multiple minima approach and a fitness function derived from a classic molecular force field. The work presented here describes GAPF-NMR, an alternate version of GAPF that uses experimental restraints from NMR to support the search for the best protein structures that correspond to a given sequence. Five different versions of the algorithm have been developed, each with a variation on how the energy function is calculated during the course of the program run. GAPF was tested on a test set comprised of 7 proteins with known structure and it was capable of achieving a correct or approximate fold for every one of these proteins. It was noted that the versions of the algorithm that progressively increase the area of the protein used in the energy function have performed better than the other versions, and that the multiple minima approach was important to the achievement of good results. Results were compared to those obtained by GENFOLD -- to the moment, the only known alternate implementation of a GA to the problem of protein structure prediction using NMR data -- and the current version of GAPF was shown to be superior to GENFOLD for two of the three proteins that compose its test set. |
publishDate |
2009 |
dc.date.available.fl_str_mv |
2009-09-25 |
dc.date.issued.fl_str_mv |
2009-04-15 |
dc.date.accessioned.fl_str_mv |
2015-03-04T18:51:09Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
LINDEN, Marx Gomes Van Der. Resolution of Protein Structures Using NMR Data by Means of a Genetic Algorithm of Multiple Minima. 2009. 145 f. Dissertação (Mestrado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2009. |
dc.identifier.uri.fl_str_mv |
https://tede.lncc.br/handle/tede/106 |
identifier_str_mv |
LINDEN, Marx Gomes Van Der. Resolution of Protein Structures Using NMR Data by Means of a Genetic Algorithm of Multiple Minima. 2009. 145 f. Dissertação (Mestrado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2009. |
url |
https://tede.lncc.br/handle/tede/106 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Laboratório Nacional de Computação Científica |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Modelagem Computacional |
dc.publisher.initials.fl_str_mv |
LNCC |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Serviço de Análise e Apoio a Formação de Recursos Humanos |
publisher.none.fl_str_mv |
Laboratório Nacional de Computação Científica |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do LNCC instname:Laboratório Nacional de Computação Científica (LNCC) instacron:LNCC |
instname_str |
Laboratório Nacional de Computação Científica (LNCC) |
instacron_str |
LNCC |
institution |
LNCC |
reponame_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
collection |
Biblioteca Digital de Teses e Dissertações do LNCC |
bitstream.url.fl_str_mv |
http://tede-server.lncc.br:8080/tede/bitstream/tede/106/1/tese+Marx.pdf http://tede-server.lncc.br:8080/tede/bitstream/tede/106/2/tese+Marx.pdf.jpg |
bitstream.checksum.fl_str_mv |
c9f52e4492b104fdb02b2a485e043412 774bd98f961a9070ff80cb294265aed7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC) |
repository.mail.fl_str_mv |
library@lncc.br||library@lncc.br |
_version_ |
1797689458931269632 |