Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Itajubá
|
| Programa de Pós-Graduação: |
Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação
|
| Departamento: |
IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.unifei.edu.br/jspui/handle/123456789/2318 |
Resumo: | Metais estão presentes em mais de 30% das proteínas encontradas na natureza e desempenham funções biológicas importantes, além de atuarem na manutenção da estrutura de proteínas. Íons metálicos em proteínas estão ligados a grupos de átomos e a esse conjunto é dado o nome de sítio metálico. Um sítio metálico pode exercer funções catalíticas, estruturais, transporte e transferência de elétrons em uma proteína. Métodos tradicionais e experimentais para a predição de sítios metálicos geralmente encontram empecilhos relacionados a tempo e custo de execução, e por isso cresce a necessidade de ferramentas computacionais que possam auxiliar em predições. Diversos métodos na literatura têm empenhado esforços na predição de sítios metálicos e tem mostrado grandes resultados, porém ainda encontram barreiras por questões relacionadas ao tamanho da proteína, tipo de íons e ligantes, capacidade de encontrar resíduos interdomínio e até mesmo ao obter taxas de acerto não satisfatórias. O objetivo desta dissertação é adaptar o algoritmo GASS (Genetic Active Site Search), inicialmente proposto para a predição de sítios catalíticos, para a busca de sítios metálicos. O método criado, GASS-Metal, divide os resíduos de uma proteína no espaço tridimensional e utiliza paralelismo de algoritmos genéticos para encontrar sítios metálicos candidatos que sejam próximos em relação à distância de templates curados provenientes dos M-CSA e MetalPDB. Os resultados dos testes de sanidade e com proteínas homólogas mostraram que o GASS-Metal é um método robusto, capaz de encontrar sítios metálicos em diversos tipos de íons diferentes e não restringe sua busca a uma única cadeia. Além disso, ao usar mutações conservativas, a taxa de acerto na predição melhora ainda mais, ajudando a encontrar sítios em situações onde antes era inviável, pela falta de resíduos em determinadas proteínas. Em comparação a preditores estado da arte, o GASS-Metal conseguiu desempenho satisfatório na predição de sítios metálicos de diferentes íons. Os resultados mostraram que o método foi superior na predição em 5 dos 12 íons metálicos avaliados e ainda obteve performance equivalente em outros 6 sítios metálicos diferentes. |
| id |
UFEI_c3dcd9efb98d993a8c64bff5036d1dea |
|---|---|
| oai_identifier_str |
oai:repositorio.unifei.edu.br:123456789/2318 |
| network_acronym_str |
UFEI |
| network_name_str |
Repositório Institucional da UNIFEI (RIUNIFEI) |
| repository_id_str |
|
| spelling |
2021-03-052021-03-082021-03-08T17:35:10Z2021-03-08T17:35:10Zhttps://repositorio.unifei.edu.br/jspui/handle/123456789/2318Metais estão presentes em mais de 30% das proteínas encontradas na natureza e desempenham funções biológicas importantes, além de atuarem na manutenção da estrutura de proteínas. Íons metálicos em proteínas estão ligados a grupos de átomos e a esse conjunto é dado o nome de sítio metálico. Um sítio metálico pode exercer funções catalíticas, estruturais, transporte e transferência de elétrons em uma proteína. Métodos tradicionais e experimentais para a predição de sítios metálicos geralmente encontram empecilhos relacionados a tempo e custo de execução, e por isso cresce a necessidade de ferramentas computacionais que possam auxiliar em predições. Diversos métodos na literatura têm empenhado esforços na predição de sítios metálicos e tem mostrado grandes resultados, porém ainda encontram barreiras por questões relacionadas ao tamanho da proteína, tipo de íons e ligantes, capacidade de encontrar resíduos interdomínio e até mesmo ao obter taxas de acerto não satisfatórias. O objetivo desta dissertação é adaptar o algoritmo GASS (Genetic Active Site Search), inicialmente proposto para a predição de sítios catalíticos, para a busca de sítios metálicos. O método criado, GASS-Metal, divide os resíduos de uma proteína no espaço tridimensional e utiliza paralelismo de algoritmos genéticos para encontrar sítios metálicos candidatos que sejam próximos em relação à distância de templates curados provenientes dos M-CSA e MetalPDB. Os resultados dos testes de sanidade e com proteínas homólogas mostraram que o GASS-Metal é um método robusto, capaz de encontrar sítios metálicos em diversos tipos de íons diferentes e não restringe sua busca a uma única cadeia. Além disso, ao usar mutações conservativas, a taxa de acerto na predição melhora ainda mais, ajudando a encontrar sítios em situações onde antes era inviável, pela falta de resíduos em determinadas proteínas. Em comparação a preditores estado da arte, o GASS-Metal conseguiu desempenho satisfatório na predição de sítios metálicos de diferentes íons. Os resultados mostraram que o método foi superior na predição em 5 dos 12 íons metálicos avaliados e ainda obteve performance equivalente em outros 6 sítios metálicos diferentes.Metals are present in more than 30% of proteins found in nature and perform important biological functions, in addition they act in the maintenance of protein structure. Metal ions in proteins are bounded to groups of atoms and this set is called a metal-binding site. Metal-binding sites can perform catalytic, structural, transport and electron transfer functions in a protein. Traditional and experimental techniques for metal-binding site prediction usually find obstacles related to time and cost of execution, making computational tools that can assist in predictions become even more important. Several methods in the literature have made efforts to predict metal-binding sites and have shown great results, but they still encounter barriers due to issues related to protein size, type of ions and ligands, ability to find inter-domain residues and even when obtaining not good accuracy rates. The main goal of this master thesis is to adapt GASS algorithm (Genetic Active Site Search), initially proposed for the prediction of catalytic sites, to search for metalbinding sites. The method developed, GASS-Metal, divides residues of a protein in threedimensional space and uses parallelism of genetic algorithms to find candidate sites that are close in relation to the distance of cured templates from M-CSA and MetalPDB. The results of the sanity and homologous protein tests showed that GASS-Metal is a robust method, capable of finding metal-binding sites in different types of ions and does not restrict its search to a single chain. In addition, when using conservative mutations, the prediction accuracy rate improves even more, helping to find sites in situations where it was previously impossible, due to the lack of residues in certain proteins. In comparison to state-of-the-art predictors, GASS-Metal achieved satisfactory performance in predicting metal-binding sites of different ions. The results showed that the method was superior in the prediction in 5 of the 12 metal ions evaluated and still obtained equivalent performance in other 6 different metal-binding sites.Agência 1porUniversidade Federal de ItajubáPrograma de Pós-Graduação: Mestrado - Ciência e Tecnologia da ComputaçãoUNIFEIBrasilIESTI - Instituto de Engenharia de Sistemas e Tecnologia da InformaçãoCNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃOSítios metálicosBase de dadosAlgoritmos genéticosGass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisIZIDORO, Sandro Carvalhohttp://lattes.cnpq.br/8024579151966887SILVEIRA, Sabrina de Azevedohttp://lattes.cnpq.br/0899817111748167http://lattes.cnpq.br/2889736880174687PAIVA, Vinícius de AlmeidaPAIVA, Vinícius de Almeida. Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos. 2021. 94 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itajubá, 2021.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFEI (RIUNIFEI)instname:Universidade Federal de Itajubá (UNIFEI)instacron:UNIFEILICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unifei.edu.br/jspui/bitstream/123456789/2318/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALDissertação_2021044.pdfDissertação_2021044.pdfapplication/pdf7060697https://repositorio.unifei.edu.br/jspui/bitstream/123456789/2318/1/Disserta%c3%a7%c3%a3o_2021044.pdf35e6dfa123993c02f9c2dc060b26c432MD51123456789/23182022-09-21 12:53:42.482oai:repositorio.unifei.edu.br:123456789/2318Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.unifei.edu.br/oai/requestrepositorio@unifei.edu.br || geraldocarlos@unifei.edu.bropendoar:70442025-08-26T21:12:09.118142Repositório Institucional da UNIFEI (RIUNIFEI) - Universidade Federal de Itajubá (UNIFEI)false |
| dc.title.pt_BR.fl_str_mv |
Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos |
| title |
Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos |
| spellingShingle |
Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos PAIVA, Vinícius de Almeida CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO Sítios metálicos Base de dados Algoritmos genéticos |
| title_short |
Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos |
| title_full |
Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos |
| title_fullStr |
Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos |
| title_full_unstemmed |
Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos |
| title_sort |
Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos |
| author |
PAIVA, Vinícius de Almeida |
| author_facet |
PAIVA, Vinícius de Almeida |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
IZIDORO, Sandro Carvalho |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/8024579151966887 |
| dc.contributor.advisor-co1.fl_str_mv |
SILVEIRA, Sabrina de Azevedo |
| dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/0899817111748167 |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/2889736880174687 |
| dc.contributor.author.fl_str_mv |
PAIVA, Vinícius de Almeida |
| contributor_str_mv |
IZIDORO, Sandro Carvalho SILVEIRA, Sabrina de Azevedo |
| dc.subject.cnpq.fl_str_mv |
CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO |
| topic |
CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO Sítios metálicos Base de dados Algoritmos genéticos |
| dc.subject.por.fl_str_mv |
Sítios metálicos Base de dados Algoritmos genéticos |
| description |
Metais estão presentes em mais de 30% das proteínas encontradas na natureza e desempenham funções biológicas importantes, além de atuarem na manutenção da estrutura de proteínas. Íons metálicos em proteínas estão ligados a grupos de átomos e a esse conjunto é dado o nome de sítio metálico. Um sítio metálico pode exercer funções catalíticas, estruturais, transporte e transferência de elétrons em uma proteína. Métodos tradicionais e experimentais para a predição de sítios metálicos geralmente encontram empecilhos relacionados a tempo e custo de execução, e por isso cresce a necessidade de ferramentas computacionais que possam auxiliar em predições. Diversos métodos na literatura têm empenhado esforços na predição de sítios metálicos e tem mostrado grandes resultados, porém ainda encontram barreiras por questões relacionadas ao tamanho da proteína, tipo de íons e ligantes, capacidade de encontrar resíduos interdomínio e até mesmo ao obter taxas de acerto não satisfatórias. O objetivo desta dissertação é adaptar o algoritmo GASS (Genetic Active Site Search), inicialmente proposto para a predição de sítios catalíticos, para a busca de sítios metálicos. O método criado, GASS-Metal, divide os resíduos de uma proteína no espaço tridimensional e utiliza paralelismo de algoritmos genéticos para encontrar sítios metálicos candidatos que sejam próximos em relação à distância de templates curados provenientes dos M-CSA e MetalPDB. Os resultados dos testes de sanidade e com proteínas homólogas mostraram que o GASS-Metal é um método robusto, capaz de encontrar sítios metálicos em diversos tipos de íons diferentes e não restringe sua busca a uma única cadeia. Além disso, ao usar mutações conservativas, a taxa de acerto na predição melhora ainda mais, ajudando a encontrar sítios em situações onde antes era inviável, pela falta de resíduos em determinadas proteínas. Em comparação a preditores estado da arte, o GASS-Metal conseguiu desempenho satisfatório na predição de sítios metálicos de diferentes íons. Os resultados mostraram que o método foi superior na predição em 5 dos 12 íons metálicos avaliados e ainda obteve performance equivalente em outros 6 sítios metálicos diferentes. |
| publishDate |
2021 |
| dc.date.issued.fl_str_mv |
2021-03-05 |
| dc.date.available.fl_str_mv |
2021-03-08 2021-03-08T17:35:10Z |
| dc.date.accessioned.fl_str_mv |
2021-03-08T17:35:10Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://repositorio.unifei.edu.br/jspui/handle/123456789/2318 |
| url |
https://repositorio.unifei.edu.br/jspui/handle/123456789/2318 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.references.pt_BR.fl_str_mv |
PAIVA, Vinícius de Almeida. Gass-metal: um servidor web para identificação de sítios metálicos similares em proteínas baseado em algoritmos genéticos paralelos. 2021. 94 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itajubá, 2021. |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Itajubá |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação |
| dc.publisher.initials.fl_str_mv |
UNIFEI |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação |
| publisher.none.fl_str_mv |
Universidade Federal de Itajubá |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNIFEI (RIUNIFEI) instname:Universidade Federal de Itajubá (UNIFEI) instacron:UNIFEI |
| instname_str |
Universidade Federal de Itajubá (UNIFEI) |
| instacron_str |
UNIFEI |
| institution |
UNIFEI |
| reponame_str |
Repositório Institucional da UNIFEI (RIUNIFEI) |
| collection |
Repositório Institucional da UNIFEI (RIUNIFEI) |
| bitstream.url.fl_str_mv |
https://repositorio.unifei.edu.br/jspui/bitstream/123456789/2318/2/license.txt https://repositorio.unifei.edu.br/jspui/bitstream/123456789/2318/1/Disserta%c3%a7%c3%a3o_2021044.pdf |
| bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 35e6dfa123993c02f9c2dc060b26c432 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UNIFEI (RIUNIFEI) - Universidade Federal de Itajubá (UNIFEI) |
| repository.mail.fl_str_mv |
repositorio@unifei.edu.br || geraldocarlos@unifei.edu.br |
| _version_ |
1854751268957847552 |