Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Freitas, Eduardo Kenji Hasegawa de
Orientador(a): Machado, Karina dos Santos, Werhli, Adriano Velasque
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.furg.br/handle/1/9971
Resumo: O refinar de propriedades das proteínas, através de mutações pontuais sobre seus aminoácidos é uma prática muito comum utilizada em processos da indústria bioquímica. Métodos computacionais acurados são necessários para realizar a predição sobre esses experimentos de mutações, tornando o design de proteínas mais eficiente. Por meio de bases de dados provenientes do Protherm, onde cada instância inclui dados numéricos,como variação da energia livre de Gibbs, mudança de entalpia, mudança de capacidade térmica, temperatura de transição, entre outros, são informações importantes para a compreensão da estabilidade da proteína. As predições do efeito da mutação na estrutura da proteína medido pela variação da variação da energia de Gibbs (ddG) são divididas entre duas classes, estabilizante e desestabilizante, onde algoritmos de classificação e ensemble de classificadores, disponibilizados pelo software Weka, terão a função de determinar a acurácia dos modelos de predição. Através de três experimentos, que são diferenciados pelo pré-processamento dos dados de entrada para os modelos de predição, é avaliado o comportamento dos das predições cada ferramenta, proporcionando uma discussão de como a bioinformática pode se beneficiar desses resultados e como os modelos de predição criados podem predizer o impacto de mutações pontuais na estrutura de proteínas.
id FURG_e789541379d14feb0c2b9da39ebfe300
oai_identifier_str oai:repositorio.furg.br:1/9971
network_acronym_str FURG
network_name_str Repositório Institucional da FURG (RI FURG)
repository_id_str
spelling Freitas, Eduardo Kenji Hasegawa deMachado, Karina dos SantosWerhli, Adriano Velasque2021-12-17T13:55:11Z2021-12-17T13:55:11Z2020FREITAS, Eduardo Kenji Hasegawa de. Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas. 2020. 56 f. Dissertação (Mestrado em Engenharia da Computação) – Centro de Ciências Computacionais, Universidade Federal do Rio Grande, Rio Grande, 2020.http://repositorio.furg.br/handle/1/9971O refinar de propriedades das proteínas, através de mutações pontuais sobre seus aminoácidos é uma prática muito comum utilizada em processos da indústria bioquímica. Métodos computacionais acurados são necessários para realizar a predição sobre esses experimentos de mutações, tornando o design de proteínas mais eficiente. Por meio de bases de dados provenientes do Protherm, onde cada instância inclui dados numéricos,como variação da energia livre de Gibbs, mudança de entalpia, mudança de capacidade térmica, temperatura de transição, entre outros, são informações importantes para a compreensão da estabilidade da proteína. As predições do efeito da mutação na estrutura da proteína medido pela variação da variação da energia de Gibbs (ddG) são divididas entre duas classes, estabilizante e desestabilizante, onde algoritmos de classificação e ensemble de classificadores, disponibilizados pelo software Weka, terão a função de determinar a acurácia dos modelos de predição. Através de três experimentos, que são diferenciados pelo pré-processamento dos dados de entrada para os modelos de predição, é avaliado o comportamento dos das predições cada ferramenta, proporcionando uma discussão de como a bioinformática pode se beneficiar desses resultados e como os modelos de predição criados podem predizer o impacto de mutações pontuais na estrutura de proteínas.The refining of protein properties, through point mutations on their amino acids, is avery common practice used in biochemical industry processes. Accurate computational methods are required to carry out the prediction on these mutation experiments, making protein design more efficient. Through databases from Protherm, where each instance in-cludes numerical data, such as Gibbs free energy variation, enthalpy change, thermal ca-pacity change, transition temperature, among others, are important for the understanding of protein stabilization. The predictions will be divided between two classes, stabilizing and destabilizing, where algorithms for classification and ensemble classifiers, available on the Weka software, have the objective to determine the accuracy of the prediction models. By making use of three experiments, that are unique in the way of data inputpre-processing for the prediction models, it is evaluated the prediction behavior of each tool, providing a discussion on how bioinformatics can benefit from these results and how the created predicting models can predict the impact of point mutations on the structure of proteins.porWekaMachine learningEsemble learningClassificaçãoRegressãoClassificationRegressionAplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínasEnsemble Learning Applications for Study- ing the Effect of Single Point Mutations on Three Dimensional Protein Structures.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FURG (RI FURG)instname:Universidade Federal do Rio Grande (FURG)instacron:FURGORIGINAL37161f01df48ea7e700bb3fb2388771c.pdf37161f01df48ea7e700bb3fb2388771c.pdfapplication/pdf2065139https://repositorio.furg.br/bitstreams/e082d54b-faf7-43f9-bc1f-36b135024dc1/download73cfb33a3c9f208ca4d69f9823c4f2f9MD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.furg.br/bitstreams/ba629bf6-1d21-469c-81e6-154aea964167/download8a4605be74aa9ea9d79846c1fba20a33MD52falseAnonymousREADTEXT37161f01df48ea7e700bb3fb2388771c.pdf.txt37161f01df48ea7e700bb3fb2388771c.pdf.txtExtracted texttext/plain103042https://repositorio.furg.br/bitstreams/782f8584-b4ce-4067-bcae-d45f2d384dff/downloadde87f047c8d809f6e59c447127cec07aMD53falseAnonymousREADTHUMBNAIL37161f01df48ea7e700bb3fb2388771c.pdf.jpg37161f01df48ea7e700bb3fb2388771c.pdf.jpgGenerated Thumbnailimage/jpeg3302https://repositorio.furg.br/bitstreams/c303a6d5-eded-40ff-9640-384978ffc16c/downloadd2e09277becc03ce0a631bfda30d0978MD54falseAnonymousREAD1/99712025-12-10 00:13:58.988open.accessoai:repositorio.furg.br:1/9971https://repositorio.furg.brRepositório InstitucionalPUBhttps://repositorio.furg.br/oai/request || http://200.19.254.174/oai/requestrepositorio@furg.br||sib.bdtd@furg.bropendoar:2025-12-10T03:13:58Repositório Institucional da FURG (RI FURG) - Universidade Federal do Rio Grande (FURG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
dc.title.pt_BR.fl_str_mv Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas
dc.title.alternative.pt_BR.fl_str_mv Ensemble Learning Applications for Study- ing the Effect of Single Point Mutations on Three Dimensional Protein Structures.
title Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas
spellingShingle Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas
Freitas, Eduardo Kenji Hasegawa de
Weka
Machine learning
Esemble learning
Classificação
Regressão
Classification
Regression
title_short Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas
title_full Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas
title_fullStr Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas
title_full_unstemmed Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas
title_sort Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas
author Freitas, Eduardo Kenji Hasegawa de
author_facet Freitas, Eduardo Kenji Hasegawa de
author_role author
dc.contributor.author.fl_str_mv Freitas, Eduardo Kenji Hasegawa de
dc.contributor.advisor1.fl_str_mv Machado, Karina dos Santos
Werhli, Adriano Velasque
contributor_str_mv Machado, Karina dos Santos
Werhli, Adriano Velasque
dc.subject.por.fl_str_mv Weka
Machine learning
Esemble learning
Classificação
Regressão
Classification
Regression
topic Weka
Machine learning
Esemble learning
Classificação
Regressão
Classification
Regression
description O refinar de propriedades das proteínas, através de mutações pontuais sobre seus aminoácidos é uma prática muito comum utilizada em processos da indústria bioquímica. Métodos computacionais acurados são necessários para realizar a predição sobre esses experimentos de mutações, tornando o design de proteínas mais eficiente. Por meio de bases de dados provenientes do Protherm, onde cada instância inclui dados numéricos,como variação da energia livre de Gibbs, mudança de entalpia, mudança de capacidade térmica, temperatura de transição, entre outros, são informações importantes para a compreensão da estabilidade da proteína. As predições do efeito da mutação na estrutura da proteína medido pela variação da variação da energia de Gibbs (ddG) são divididas entre duas classes, estabilizante e desestabilizante, onde algoritmos de classificação e ensemble de classificadores, disponibilizados pelo software Weka, terão a função de determinar a acurácia dos modelos de predição. Através de três experimentos, que são diferenciados pelo pré-processamento dos dados de entrada para os modelos de predição, é avaliado o comportamento dos das predições cada ferramenta, proporcionando uma discussão de como a bioinformática pode se beneficiar desses resultados e como os modelos de predição criados podem predizer o impacto de mutações pontuais na estrutura de proteínas.
publishDate 2020
dc.date.issued.fl_str_mv 2020
dc.date.accessioned.fl_str_mv 2021-12-17T13:55:11Z
dc.date.available.fl_str_mv 2021-12-17T13:55:11Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FREITAS, Eduardo Kenji Hasegawa de. Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas. 2020. 56 f. Dissertação (Mestrado em Engenharia da Computação) – Centro de Ciências Computacionais, Universidade Federal do Rio Grande, Rio Grande, 2020.
dc.identifier.uri.fl_str_mv http://repositorio.furg.br/handle/1/9971
identifier_str_mv FREITAS, Eduardo Kenji Hasegawa de. Aplicações de ensemble learning para o estudo do efeito de mutações pontuais em estruturas tridimensionais de proteínas. 2020. 56 f. Dissertação (Mestrado em Engenharia da Computação) – Centro de Ciências Computacionais, Universidade Federal do Rio Grande, Rio Grande, 2020.
url http://repositorio.furg.br/handle/1/9971
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da FURG (RI FURG)
instname:Universidade Federal do Rio Grande (FURG)
instacron:FURG
instname_str Universidade Federal do Rio Grande (FURG)
instacron_str FURG
institution FURG
reponame_str Repositório Institucional da FURG (RI FURG)
collection Repositório Institucional da FURG (RI FURG)
bitstream.url.fl_str_mv https://repositorio.furg.br/bitstreams/e082d54b-faf7-43f9-bc1f-36b135024dc1/download
https://repositorio.furg.br/bitstreams/ba629bf6-1d21-469c-81e6-154aea964167/download
https://repositorio.furg.br/bitstreams/782f8584-b4ce-4067-bcae-d45f2d384dff/download
https://repositorio.furg.br/bitstreams/c303a6d5-eded-40ff-9640-384978ffc16c/download
bitstream.checksum.fl_str_mv 73cfb33a3c9f208ca4d69f9823c4f2f9
8a4605be74aa9ea9d79846c1fba20a33
de87f047c8d809f6e59c447127cec07a
d2e09277becc03ce0a631bfda30d0978
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da FURG (RI FURG) - Universidade Federal do Rio Grande (FURG)
repository.mail.fl_str_mv repositorio@furg.br||sib.bdtd@furg.br
_version_ 1856849666134507520