Uma busca probabilística para o problema de geometria de distâncias moleculares

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Batista, Fernando do Carmo
Orientador(a): Souza, Michael Ferreira de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: http://repositorio.ufc.br/handle/riufc/78336
Resumo: The prediction of three-dimensional protein structures has been an area of intense research, addressed by several disciplines represented by bioinformatics. The present work proposes an innovative method for predicting protein structures based on a binary tree, called Frequency-Based Search (FBS). We carried out a statistical comparison of the efficiency of this method in relation to the Depth Search (DFS) method, using protein structures obtained by Nuclear Magnetic Resonance (NMR) available in the Protein Data Bank (PDB). The main objective is to evaluate the efficiency of these methods on subsequences of protein backbone atoms of sizes 5, 10, 15, 20 and 25, while investigating whether nature exhibits geometric preferences when folding. The computational results indicate that the FBS method outperforms the DFS method in at least 70% of the atom subsequences analyzed and suggest the existence of geometric preferences in proteins, as evidenced by the selected sample.
id UFC-7_9641eb43cfcb43743a34321bdff089a0
oai_identifier_str oai:repositorio.ufc.br:riufc/78336
network_acronym_str UFC-7
network_name_str Repositório Institucional da Universidade Federal do Ceará (UFC)
repository_id_str
spelling Batista, Fernando do CarmoSouza, Michael Ferreira de2024-10-01T12:00:30Z2024-10-01T12:00:30Z2024-02-27BATISTA, Fernando do Carmo. Uma busca probabilística para o problema de geometria de distâncias moleculares. 2024. 48 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2024.http://repositorio.ufc.br/handle/riufc/78336The prediction of three-dimensional protein structures has been an area of intense research, addressed by several disciplines represented by bioinformatics. The present work proposes an innovative method for predicting protein structures based on a binary tree, called Frequency-Based Search (FBS). We carried out a statistical comparison of the efficiency of this method in relation to the Depth Search (DFS) method, using protein structures obtained by Nuclear Magnetic Resonance (NMR) available in the Protein Data Bank (PDB). The main objective is to evaluate the efficiency of these methods on subsequences of protein backbone atoms of sizes 5, 10, 15, 20 and 25, while investigating whether nature exhibits geometric preferences when folding. The computational results indicate that the FBS method outperforms the DFS method in at least 70% of the atom subsequences analyzed and suggest the existence of geometric preferences in proteins, as evidenced by the selected sample.A predição de estruturas tridimensionais de proteínas tem sido uma área de intensa pesquisa, abordada por diversas disciplinas representadas pela bioinformática. O presente trabalho propõe um método inovador de predição de estruturas de proteínas baseado em árvore binária, denominado Pesquisa Baseada em Frequência (FBS). Realizamos um comparativo estatístico da eficiência deste método em relação ao método Pesquisa em Profundidade (DFS), utilizando estruturas de proteínas obtidas por Ressonância Magnética Nuclear (NMR) disponíveis no Banco de Dados de Proteínas (PDB). O objetivo principal é avaliar a eficiência desses métodos em subsequências de átomos do backbone proteico de tamanhos 5, 10, 15, 20 e 25, enquanto investigamos se a natureza exibe preferências geométricas ao enovelar-se. Os resultados computacionais indicam que o método FBS supera o método DFS em pelo menos 70% das subsequências de átomos analisadas e sugerem a existência de preferências geométricas nas proteínas, conforme evidenciado pela amostra selecionada.Uma busca probabilística para o problema de geometria de distâncias molecularesA probabilistic search for the geometry problem of molecular distancesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisÁrvore bináriaEstrutura tridimensional de proteínaProblema de Geometria de Distância MolecularBinary treeProtein three-dimensional structureGeometric Molecular Distance Probleminfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFChttp://lattes.cnpq.br/5022342588509702https://orcid.org/0000-0001-6751-2877http://lattes.cnpq.br/12467767189216742024-02-27ORIGINAL2024_dis_fcbatista.pdf2024_dis_fcbatista.pdfDissertaçãoapplication/pdf8362998http://repositorio.ufc.br/bitstream/riufc/78336/7/2024_dis_fcbatista.pdfc74a2f132a0efb151e12386ebdfbe41bMD57LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.ufc.br/bitstream/riufc/78336/6/license.txt8a4605be74aa9ea9d79846c1fba20a33MD56riufc/783362024-10-01 09:02:55.546oai:repositorio.ufc.br:riufc/78336Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2024-10-01T12:02:55Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false
dc.title.pt_BR.fl_str_mv Uma busca probabilística para o problema de geometria de distâncias moleculares
dc.title.en.pt_BR.fl_str_mv A probabilistic search for the geometry problem of molecular distances
title Uma busca probabilística para o problema de geometria de distâncias moleculares
spellingShingle Uma busca probabilística para o problema de geometria de distâncias moleculares
Batista, Fernando do Carmo
Árvore binária
Estrutura tridimensional de proteína
Problema de Geometria de Distância Molecular
Binary tree
Protein three-dimensional structure
Geometric Molecular Distance Problem
title_short Uma busca probabilística para o problema de geometria de distâncias moleculares
title_full Uma busca probabilística para o problema de geometria de distâncias moleculares
title_fullStr Uma busca probabilística para o problema de geometria de distâncias moleculares
title_full_unstemmed Uma busca probabilística para o problema de geometria de distâncias moleculares
title_sort Uma busca probabilística para o problema de geometria de distâncias moleculares
author Batista, Fernando do Carmo
author_facet Batista, Fernando do Carmo
author_role author
dc.contributor.author.fl_str_mv Batista, Fernando do Carmo
dc.contributor.advisor1.fl_str_mv Souza, Michael Ferreira de
contributor_str_mv Souza, Michael Ferreira de
dc.subject.ptbr.pt_BR.fl_str_mv Árvore binária
Estrutura tridimensional de proteína
Problema de Geometria de Distância Molecular
topic Árvore binária
Estrutura tridimensional de proteína
Problema de Geometria de Distância Molecular
Binary tree
Protein three-dimensional structure
Geometric Molecular Distance Problem
dc.subject.en.pt_BR.fl_str_mv Binary tree
Protein three-dimensional structure
Geometric Molecular Distance Problem
description The prediction of three-dimensional protein structures has been an area of intense research, addressed by several disciplines represented by bioinformatics. The present work proposes an innovative method for predicting protein structures based on a binary tree, called Frequency-Based Search (FBS). We carried out a statistical comparison of the efficiency of this method in relation to the Depth Search (DFS) method, using protein structures obtained by Nuclear Magnetic Resonance (NMR) available in the Protein Data Bank (PDB). The main objective is to evaluate the efficiency of these methods on subsequences of protein backbone atoms of sizes 5, 10, 15, 20 and 25, while investigating whether nature exhibits geometric preferences when folding. The computational results indicate that the FBS method outperforms the DFS method in at least 70% of the atom subsequences analyzed and suggest the existence of geometric preferences in proteins, as evidenced by the selected sample.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-10-01T12:00:30Z
dc.date.available.fl_str_mv 2024-10-01T12:00:30Z
dc.date.issued.fl_str_mv 2024-02-27
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BATISTA, Fernando do Carmo. Uma busca probabilística para o problema de geometria de distâncias moleculares. 2024. 48 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2024.
dc.identifier.uri.fl_str_mv http://repositorio.ufc.br/handle/riufc/78336
identifier_str_mv BATISTA, Fernando do Carmo. Uma busca probabilística para o problema de geometria de distâncias moleculares. 2024. 48 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2024.
url http://repositorio.ufc.br/handle/riufc/78336
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Ceará (UFC)
instname:Universidade Federal do Ceará (UFC)
instacron:UFC
instname_str Universidade Federal do Ceará (UFC)
instacron_str UFC
institution UFC
reponame_str Repositório Institucional da Universidade Federal do Ceará (UFC)
collection Repositório Institucional da Universidade Federal do Ceará (UFC)
bitstream.url.fl_str_mv http://repositorio.ufc.br/bitstream/riufc/78336/7/2024_dis_fcbatista.pdf
http://repositorio.ufc.br/bitstream/riufc/78336/6/license.txt
bitstream.checksum.fl_str_mv c74a2f132a0efb151e12386ebdfbe41b
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)
repository.mail.fl_str_mv bu@ufc.br || repositorio@ufc.br
_version_ 1847793179233878016