Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos

Detalhes bibliográficos
Ano de defesa: 2009
Autor(a) principal: Linden, Marx Gomes Van Der lattes
Orientador(a): Dardenne, Laurent Emmanuel lattes
Banca de defesa: Almeida, Fábio Ceneviva Lacerda lattes, Bish, Paulo Mascarello lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Laboratório Nacional de Computação Científica
Programa de Pós-Graduação: Programa de Pós-Graduação em Modelagem Computacional
Departamento: Serviço de Análise e Apoio a Formação de Recursos Humanos
País: BR
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://tede.lncc.br/handle/tede/106
Resumo: Proteins are biological macromolecules comprised of amino acid polymers that play a wide range of biological roles involved in every process of living organisms. Together with X-ray diffraction, Nuclear Resonance Spectroscopy (NMR) is one of the two main experimental techniques that are capable of delivering atomic-level resolution of protein structures. Prediction of proteic structures using experimental information from NMR experiments is a global optimization problem with restraints. GAPF is a computer program that uses a Genetic Algorithm (GA) developed for ab initio prediction -- the determination of the structure of a protein from its amino acid sequence only -- using a multiple minima approach and a fitness function derived from a classic molecular force field. The work presented here describes GAPF-NMR, an alternate version of GAPF that uses experimental restraints from NMR to support the search for the best protein structures that correspond to a given sequence. Five different versions of the algorithm have been developed, each with a variation on how the energy function is calculated during the course of the program run. GAPF was tested on a test set comprised of 7 proteins with known structure and it was capable of achieving a correct or approximate fold for every one of these proteins. It was noted that the versions of the algorithm that progressively increase the area of the protein used in the energy function have performed better than the other versions, and that the multiple minima approach was important to the achievement of good results. Results were compared to those obtained by GENFOLD -- to the moment, the only known alternate implementation of a GA to the problem of protein structure prediction using NMR data -- and the current version of GAPF was shown to be superior to GENFOLD for two of the three proteins that compose its test set.
id LNCC_0a42cf17d7e63b908404b9671b807cf2
oai_identifier_str oai:tede-server.lncc.br:tede/106
network_acronym_str LNCC
network_name_str Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling Dardenne, Laurent EmmanuelCPF:49809431104http://lattes.cnpq.br/8344194525615133Barbosa, Helio José CorrêaCPF:194 306 716 34http://lattes.cnpq.br/0375745110240885Almeida, Fábio Ceneviva LacerdaCPF:08729261894http://lattes.cnpq.br/5916017746341882Bish, Paulo MascarelloCPF:34485309720http://lattes.cnpq.br/5928043800446342CPF:04694122401http://8005995150161965Linden, Marx Gomes Van Der2015-03-04T18:51:09Z2009-09-252009-04-15LINDEN, Marx Gomes Van Der. Resolution of Protein Structures Using NMR Data by Means of a Genetic Algorithm of Multiple Minima. 2009. 145 f. Dissertação (Mestrado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2009.https://tede.lncc.br/handle/tede/106Proteins are biological macromolecules comprised of amino acid polymers that play a wide range of biological roles involved in every process of living organisms. Together with X-ray diffraction, Nuclear Resonance Spectroscopy (NMR) is one of the two main experimental techniques that are capable of delivering atomic-level resolution of protein structures. Prediction of proteic structures using experimental information from NMR experiments is a global optimization problem with restraints. GAPF is a computer program that uses a Genetic Algorithm (GA) developed for ab initio prediction -- the determination of the structure of a protein from its amino acid sequence only -- using a multiple minima approach and a fitness function derived from a classic molecular force field. The work presented here describes GAPF-NMR, an alternate version of GAPF that uses experimental restraints from NMR to support the search for the best protein structures that correspond to a given sequence. Five different versions of the algorithm have been developed, each with a variation on how the energy function is calculated during the course of the program run. GAPF was tested on a test set comprised of 7 proteins with known structure and it was capable of achieving a correct or approximate fold for every one of these proteins. It was noted that the versions of the algorithm that progressively increase the area of the protein used in the energy function have performed better than the other versions, and that the multiple minima approach was important to the achievement of good results. Results were compared to those obtained by GENFOLD -- to the moment, the only known alternate implementation of a GA to the problem of protein structure prediction using NMR data -- and the current version of GAPF was shown to be superior to GENFOLD for two of the three proteins that compose its test set.Proteínas são macromoléculas biológicas formadas por polímeros de aminoácidos, as quais estão envolvidas em todos os processos vitais dos organismos, compreendendo um amplo leque de funções. A espectropia por Ressonância Magnética Nuclear (RMN) é, ao lado da difração de raios-X em cristais, uma das duas principais técnicas experimentais capazes de permitir a elucidação da estrutura de proteínas em resolução atômica. A predição de estruturas protéicas utilizando informações experimentais de RMN é um problema de otimização global com restrições. O GAPF é um programa que utiliza um Algoritmo Genético (AG) desenvolvido para predição ab initio -- isto é, para determinação da estrutura de uma proteína apenas a partir do conhecimento de sua seqüência de aminoácidos -- utilizando uma abordagem de múltiplos mínimos, baseada em uma função aptidão derivada de um campo de força molecular clássico. Neste trabalho, é descrito o GAPF-NMR, uma versão derivada do GAPF, que utiliza restrições experimentais de RMN para auxiliar na busca pelas melhores estruturas protéicas correspondentes a uma seqüência dada. Cinco versões diferentes do algoritmo foram desenvolvidas, com diferentes variações na maneira como a função de energia é calculada ao longo da execução. O programa desenvolvido foi aplicado a um conjunto-teste de 7 proteínas de estrutura já conhecida e, para todas elas, foi capaz de chegar a uma estrutura com o enovelamento correto ou aproximado. Foi observado que as versões do algoritmo que aumentam progressivamente a região da proteína usada no cálculo de energia tiveram desempenho superior às demais, e que a abordagem de múltiplos mínimos foi importante para a obtenção de bons resultados. Os resultados foram comparados aos descritos para o GENFOLD -- que é, até o momento, a única implementação alternativa conhecida de um AG para o problema de predição de estruturas a partir de dados de RMN -- e a versão atual do GAPF-NMR se mostrou superior ao GENFOLD na determinação de duas das três proteínas do conjunto-teste deste.Made available in DSpace on 2015-03-04T18:51:09Z (GMT). No. of bitstreams: 1 tese Marx.pdf: 13309696 bytes, checksum: c9f52e4492b104fdb02b2a485e043412 (MD5) Previous issue date: 2009-04-15Coordenacao de Aperfeicoamento de Pessoal de Nivel Superiorapplication/pdfhttp://tede-server.lncc.br:8080/retrieve/362/tese%20Marx.pdf.jpghttp://tede-server.lncc.br:8080/retrieve/588/tese%20Marx.pdf.jpgporLaboratório Nacional de Computação CientíficaPrograma de Pós-Graduação em Modelagem ComputacionalLNCCBRServiço de Análise e Apoio a Formação de Recursos HumanosProteínas-EstruturaAlgorítmos genéticosRessonância Magnética NuclearProtein StructuresGenetic AlgorithmNuclear Resonance SpectroscopyCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOResolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimosResolution of Protein Structures Using NMR Data by Means of a Genetic Algorithm of Multiple Minimainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCCORIGINALtese Marx.pdfapplication/pdf13309696http://tede-server.lncc.br:8080/tede/bitstream/tede/106/1/tese+Marx.pdfc9f52e4492b104fdb02b2a485e043412MD51THUMBNAILtese Marx.pdf.jpgtese Marx.pdf.jpgimage/jpeg3259http://tede-server.lncc.br:8080/tede/bitstream/tede/106/2/tese+Marx.pdf.jpg774bd98f961a9070ff80cb294265aed7MD52tede/1062018-07-04 09:59:38.198oai:tede-server.lncc.br:tede/106Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2018-07-04T12:59:38Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.por.fl_str_mv Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos
dc.title.alternative.eng.fl_str_mv Resolution of Protein Structures Using NMR Data by Means of a Genetic Algorithm of Multiple Minima
title Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos
spellingShingle Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos
Linden, Marx Gomes Van Der
Proteínas-Estrutura
Algorítmos genéticos
Ressonância Magnética Nuclear
Protein Structures
Genetic Algorithm
Nuclear Resonance Spectroscopy
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos
title_full Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos
title_fullStr Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos
title_full_unstemmed Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos
title_sort Resolução de estruturas de proteínas utilizando-se dados de RMN a partir de um algorítmo genético de múltiplos mínimos
author Linden, Marx Gomes Van Der
author_facet Linden, Marx Gomes Van Der
author_role author
dc.contributor.advisor1.fl_str_mv Dardenne, Laurent Emmanuel
dc.contributor.advisor1ID.fl_str_mv CPF:49809431104
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8344194525615133
dc.contributor.advisor-co1.fl_str_mv Barbosa, Helio José Corrêa
dc.contributor.advisor-co1ID.fl_str_mv CPF:194 306 716 34
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/0375745110240885
dc.contributor.referee1.fl_str_mv Almeida, Fábio Ceneviva Lacerda
dc.contributor.referee1ID.fl_str_mv CPF:08729261894
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/5916017746341882
dc.contributor.referee2.fl_str_mv Bish, Paulo Mascarello
dc.contributor.referee2ID.fl_str_mv CPF:34485309720
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/5928043800446342
dc.contributor.authorID.fl_str_mv CPF:04694122401
dc.contributor.authorLattes.fl_str_mv http://8005995150161965
dc.contributor.author.fl_str_mv Linden, Marx Gomes Van Der
contributor_str_mv Dardenne, Laurent Emmanuel
Barbosa, Helio José Corrêa
Almeida, Fábio Ceneviva Lacerda
Bish, Paulo Mascarello
dc.subject.por.fl_str_mv Proteínas-Estrutura
Algorítmos genéticos
Ressonância Magnética Nuclear
topic Proteínas-Estrutura
Algorítmos genéticos
Ressonância Magnética Nuclear
Protein Structures
Genetic Algorithm
Nuclear Resonance Spectroscopy
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Protein Structures
Genetic Algorithm
Nuclear Resonance Spectroscopy
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Proteins are biological macromolecules comprised of amino acid polymers that play a wide range of biological roles involved in every process of living organisms. Together with X-ray diffraction, Nuclear Resonance Spectroscopy (NMR) is one of the two main experimental techniques that are capable of delivering atomic-level resolution of protein structures. Prediction of proteic structures using experimental information from NMR experiments is a global optimization problem with restraints. GAPF is a computer program that uses a Genetic Algorithm (GA) developed for ab initio prediction -- the determination of the structure of a protein from its amino acid sequence only -- using a multiple minima approach and a fitness function derived from a classic molecular force field. The work presented here describes GAPF-NMR, an alternate version of GAPF that uses experimental restraints from NMR to support the search for the best protein structures that correspond to a given sequence. Five different versions of the algorithm have been developed, each with a variation on how the energy function is calculated during the course of the program run. GAPF was tested on a test set comprised of 7 proteins with known structure and it was capable of achieving a correct or approximate fold for every one of these proteins. It was noted that the versions of the algorithm that progressively increase the area of the protein used in the energy function have performed better than the other versions, and that the multiple minima approach was important to the achievement of good results. Results were compared to those obtained by GENFOLD -- to the moment, the only known alternate implementation of a GA to the problem of protein structure prediction using NMR data -- and the current version of GAPF was shown to be superior to GENFOLD for two of the three proteins that compose its test set.
publishDate 2009
dc.date.available.fl_str_mv 2009-09-25
dc.date.issued.fl_str_mv 2009-04-15
dc.date.accessioned.fl_str_mv 2015-03-04T18:51:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv LINDEN, Marx Gomes Van Der. Resolution of Protein Structures Using NMR Data by Means of a Genetic Algorithm of Multiple Minima. 2009. 145 f. Dissertação (Mestrado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2009.
dc.identifier.uri.fl_str_mv https://tede.lncc.br/handle/tede/106
identifier_str_mv LINDEN, Marx Gomes Van Der. Resolution of Protein Structures Using NMR Data by Means of a Genetic Algorithm of Multiple Minima. 2009. 145 f. Dissertação (Mestrado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2009.
url https://tede.lncc.br/handle/tede/106
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Modelagem Computacional
dc.publisher.initials.fl_str_mv LNCC
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Serviço de Análise e Apoio a Formação de Recursos Humanos
publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do LNCC
instname:Laboratório Nacional de Computação Científica (LNCC)
instacron:LNCC
instname_str Laboratório Nacional de Computação Científica (LNCC)
instacron_str LNCC
institution LNCC
reponame_str Biblioteca Digital de Teses e Dissertações do LNCC
collection Biblioteca Digital de Teses e Dissertações do LNCC
bitstream.url.fl_str_mv http://tede-server.lncc.br:8080/tede/bitstream/tede/106/1/tese+Marx.pdf
http://tede-server.lncc.br:8080/tede/bitstream/tede/106/2/tese+Marx.pdf.jpg
bitstream.checksum.fl_str_mv c9f52e4492b104fdb02b2a485e043412
774bd98f961a9070ff80cb294265aed7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv library@lncc.br||library@lncc.br
_version_ 1797689458931269632