Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: PAIVA, Vinícius de Almeida lattes
Orientador(a): IZIDORO, Sandro Carvalho lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Itajubá
Programa de Pós-Graduação: Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação
Departamento: IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.unifei.edu.br/jspui/handle/123456789/2318
Resumo: Metais estão presentes em mais de 30% das proteínas encontradas na natureza e desempenham funções biológicas importantes, além de atuarem na manutenção da estrutura de proteínas. Íons metálicos em proteínas estão ligados a grupos de átomos e a esse conjunto é dado o nome de sítio metálico. Um sítio metálico pode exercer funções catalíticas, estruturais, transporte e transferência de elétrons em uma proteína. Métodos tradicionais e experimentais para a predição de sítios metálicos geralmente encontram empecilhos relacionados a tempo e custo de execução, e por isso cresce a necessidade de ferramentas computacionais que possam auxiliar em predições. Diversos métodos na literatura têm empenhado esforços na predição de sítios metálicos e tem mostrado grandes resultados, porém ainda encontram barreiras por questões relacionadas ao tamanho da proteína, tipo de íons e ligantes, capacidade de encontrar resíduos interdomínio e até mesmo ao obter taxas de acerto não satisfatórias. O objetivo desta dissertação é adaptar o algoritmo GASS (Genetic Active Site Search), inicialmente proposto para a predição de sítios catalíticos, para a busca de sítios metálicos. O método criado, GASS-Metal, divide os resíduos de uma proteína no espaço tridimensional e utiliza paralelismo de algoritmos genéticos para encontrar sítios metálicos candidatos que sejam próximos em relação à distância de templates curados provenientes dos M-CSA e MetalPDB. Os resultados dos testes de sanidade e com proteínas homólogas mostraram que o GASS-Metal é um método robusto, capaz de encontrar sítios metálicos em diversos tipos de íons diferentes e não restringe sua busca a uma única cadeia. Além disso, ao usar mutações conservativas, a taxa de acerto na predição melhora ainda mais, ajudando a encontrar sítios em situações onde antes era inviável, pela falta de resíduos em determinadas proteínas. Em comparação a preditores estado da arte, o GASS-Metal conseguiu desempenho satisfatório na predição de sítios metálicos de diferentes íons. Os resultados mostraram que o método foi superior na predição em 5 dos 12 íons metálicos avaliados e ainda obteve performance equivalente em outros 6 sítios metálicos diferentes.
id UFEI_c3dcd9efb98d993a8c64bff5036d1dea
oai_identifier_str oai:repositorio.unifei.edu.br:123456789/2318
network_acronym_str UFEI
network_name_str Repositório Institucional da UNIFEI (RIUNIFEI)
repository_id_str
spelling 2021-03-052021-03-082021-03-08T17:35:10Z2021-03-08T17:35:10Zhttps://repositorio.unifei.edu.br/jspui/handle/123456789/2318Metais estão presentes em mais de 30% das proteínas encontradas na natureza e desempenham funções biológicas importantes, além de atuarem na manutenção da estrutura de proteínas. Íons metálicos em proteínas estão ligados a grupos de átomos e a esse conjunto é dado o nome de sítio metálico. Um sítio metálico pode exercer funções catalíticas, estruturais, transporte e transferência de elétrons em uma proteína. Métodos tradicionais e experimentais para a predição de sítios metálicos geralmente encontram empecilhos relacionados a tempo e custo de execução, e por isso cresce a necessidade de ferramentas computacionais que possam auxiliar em predições. Diversos métodos na literatura têm empenhado esforços na predição de sítios metálicos e tem mostrado grandes resultados, porém ainda encontram barreiras por questões relacionadas ao tamanho da proteína, tipo de íons e ligantes, capacidade de encontrar resíduos interdomínio e até mesmo ao obter taxas de acerto não satisfatórias. O objetivo desta dissertação é adaptar o algoritmo GASS (Genetic Active Site Search), inicialmente proposto para a predição de sítios catalíticos, para a busca de sítios metálicos. O método criado, GASS-Metal, divide os resíduos de uma proteína no espaço tridimensional e utiliza paralelismo de algoritmos genéticos para encontrar sítios metálicos candidatos que sejam próximos em relação à distância de templates curados provenientes dos M-CSA e MetalPDB. Os resultados dos testes de sanidade e com proteínas homólogas mostraram que o GASS-Metal é um método robusto, capaz de encontrar sítios metálicos em diversos tipos de íons diferentes e não restringe sua busca a uma única cadeia. Além disso, ao usar mutações conservativas, a taxa de acerto na predição melhora ainda mais, ajudando a encontrar sítios em situações onde antes era inviável, pela falta de resíduos em determinadas proteínas. Em comparação a preditores estado da arte, o GASS-Metal conseguiu desempenho satisfatório na predição de sítios metálicos de diferentes íons. Os resultados mostraram que o método foi superior na predição em 5 dos 12 íons metálicos avaliados e ainda obteve performance equivalente em outros 6 sítios metálicos diferentes.Metals are present in more than 30% of proteins found in nature and perform important biological functions, in addition they act in the maintenance of protein structure. Metal ions in proteins are bounded to groups of atoms and this set is called a metal-binding site. Metal-binding sites can perform catalytic, structural, transport and electron transfer functions in a protein. Traditional and experimental techniques for metal-binding site prediction usually find obstacles related to time and cost of execution, making computational tools that can assist in predictions become even more important. Several methods in the literature have made efforts to predict metal-binding sites and have shown great results, but they still encounter barriers due to issues related to protein size, type of ions and ligands, ability to find inter-domain residues and even when obtaining not good accuracy rates. The main goal of this master thesis is to adapt GASS algorithm (Genetic Active Site Search), initially proposed for the prediction of catalytic sites, to search for metalbinding sites. The method developed, GASS-Metal, divides residues of a protein in threedimensional space and uses parallelism of genetic algorithms to find candidate sites that are close in relation to the distance of cured templates from M-CSA and MetalPDB. The results of the sanity and homologous protein tests showed that GASS-Metal is a robust method, capable of finding metal-binding sites in different types of ions and does not restrict its search to a single chain. In addition, when using conservative mutations, the prediction accuracy rate improves even more, helping to find sites in situations where it was previously impossible, due to the lack of residues in certain proteins. In comparison to state-of-the-art predictors, GASS-Metal achieved satisfactory performance in predicting metal-binding sites of different ions. The results showed that the method was superior in the prediction in 5 of the 12 metal ions evaluated and still obtained equivalent performance in other 6 different metal-binding sites.Agência 1porUniversidade Federal de ItajubáPrograma de Pós-Graduação: Mestrado - Ciência e Tecnologia da ComputaçãoUNIFEIBrasilIESTI - Instituto de Engenharia de Sistemas e Tecnologia da InformaçãoCNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃOSítios metálicosBase de dadosAlgoritmos genéticosGass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisIZIDORO, Sandro Carvalhohttp://lattes.cnpq.br/8024579151966887SILVEIRA, Sabrina de Azevedohttp://lattes.cnpq.br/0899817111748167http://lattes.cnpq.br/2889736880174687PAIVA, Vinícius de AlmeidaPAIVA, Vinícius de Almeida. Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos. 2021. 94 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itajubá, 2021.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFEI (RIUNIFEI)instname:Universidade Federal de Itajubá (UNIFEI)instacron:UNIFEILICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unifei.edu.br/jspui/bitstream/123456789/2318/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALDissertação_2021044.pdfDissertação_2021044.pdfapplication/pdf7060697https://repositorio.unifei.edu.br/jspui/bitstream/123456789/2318/1/Disserta%c3%a7%c3%a3o_2021044.pdf35e6dfa123993c02f9c2dc060b26c432MD51123456789/23182022-09-21 12:53:42.482oai:repositorio.unifei.edu.br:123456789/2318Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.unifei.edu.br/oai/requestrepositorio@unifei.edu.br || geraldocarlos@unifei.edu.bropendoar:70442025-08-26T21:12:09.118142Repositório Institucional da UNIFEI (RIUNIFEI) - Universidade Federal de Itajubá (UNIFEI)false
dc.title.pt_BR.fl_str_mv Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos
title Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos
spellingShingle Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos
PAIVA, Vinícius de Almeida
CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO
Sítios metálicos
Base de dados
Algoritmos genéticos
title_short Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos
title_full Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos
title_fullStr Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos
title_full_unstemmed Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos
title_sort Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos
author PAIVA, Vinícius de Almeida
author_facet PAIVA, Vinícius de Almeida
author_role author
dc.contributor.advisor1.fl_str_mv IZIDORO, Sandro Carvalho
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8024579151966887
dc.contributor.advisor-co1.fl_str_mv SILVEIRA, Sabrina de Azevedo
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/0899817111748167
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2889736880174687
dc.contributor.author.fl_str_mv PAIVA, Vinícius de Almeida
contributor_str_mv IZIDORO, Sandro Carvalho
SILVEIRA, Sabrina de Azevedo
dc.subject.cnpq.fl_str_mv CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO
topic CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO
Sítios metálicos
Base de dados
Algoritmos genéticos
dc.subject.por.fl_str_mv Sítios metálicos
Base de dados
Algoritmos genéticos
description Metais estão presentes em mais de 30% das proteínas encontradas na natureza e desempenham funções biológicas importantes, além de atuarem na manutenção da estrutura de proteínas. Íons metálicos em proteínas estão ligados a grupos de átomos e a esse conjunto é dado o nome de sítio metálico. Um sítio metálico pode exercer funções catalíticas, estruturais, transporte e transferência de elétrons em uma proteína. Métodos tradicionais e experimentais para a predição de sítios metálicos geralmente encontram empecilhos relacionados a tempo e custo de execução, e por isso cresce a necessidade de ferramentas computacionais que possam auxiliar em predições. Diversos métodos na literatura têm empenhado esforços na predição de sítios metálicos e tem mostrado grandes resultados, porém ainda encontram barreiras por questões relacionadas ao tamanho da proteína, tipo de íons e ligantes, capacidade de encontrar resíduos interdomínio e até mesmo ao obter taxas de acerto não satisfatórias. O objetivo desta dissertação é adaptar o algoritmo GASS (Genetic Active Site Search), inicialmente proposto para a predição de sítios catalíticos, para a busca de sítios metálicos. O método criado, GASS-Metal, divide os resíduos de uma proteína no espaço tridimensional e utiliza paralelismo de algoritmos genéticos para encontrar sítios metálicos candidatos que sejam próximos em relação à distância de templates curados provenientes dos M-CSA e MetalPDB. Os resultados dos testes de sanidade e com proteínas homólogas mostraram que o GASS-Metal é um método robusto, capaz de encontrar sítios metálicos em diversos tipos de íons diferentes e não restringe sua busca a uma única cadeia. Além disso, ao usar mutações conservativas, a taxa de acerto na predição melhora ainda mais, ajudando a encontrar sítios em situações onde antes era inviável, pela falta de resíduos em determinadas proteínas. Em comparação a preditores estado da arte, o GASS-Metal conseguiu desempenho satisfatório na predição de sítios metálicos de diferentes íons. Os resultados mostraram que o método foi superior na predição em 5 dos 12 íons metálicos avaliados e ainda obteve performance equivalente em outros 6 sítios metálicos diferentes.
publishDate 2021
dc.date.issued.fl_str_mv 2021-03-05
dc.date.available.fl_str_mv 2021-03-08
2021-03-08T17:35:10Z
dc.date.accessioned.fl_str_mv 2021-03-08T17:35:10Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.unifei.edu.br/jspui/handle/123456789/2318
url https://repositorio.unifei.edu.br/jspui/handle/123456789/2318
dc.language.iso.fl_str_mv por
language por
dc.relation.references.pt_BR.fl_str_mv PAIVA, Vinícius de Almeida. Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos. 2021. 94 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itajubá, 2021.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Itajubá
dc.publisher.program.fl_str_mv Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação
dc.publisher.initials.fl_str_mv UNIFEI
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
publisher.none.fl_str_mv Universidade Federal de Itajubá
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFEI (RIUNIFEI)
instname:Universidade Federal de Itajubá (UNIFEI)
instacron:UNIFEI
instname_str Universidade Federal de Itajubá (UNIFEI)
instacron_str UNIFEI
institution UNIFEI
reponame_str Repositório Institucional da UNIFEI (RIUNIFEI)
collection Repositório Institucional da UNIFEI (RIUNIFEI)
bitstream.url.fl_str_mv https://repositorio.unifei.edu.br/jspui/bitstream/123456789/2318/2/license.txt
https://repositorio.unifei.edu.br/jspui/bitstream/123456789/2318/1/Disserta%c3%a7%c3%a3o_2021044.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
35e6dfa123993c02f9c2dc060b26c432
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UNIFEI (RIUNIFEI) - Universidade Federal de Itajubá (UNIFEI)
repository.mail.fl_str_mv repositorio@unifei.edu.br || geraldocarlos@unifei.edu.br
_version_ 1854751268957847552