Multi objective and diversity guided success history based adaptive differential Evolution approaches for the Tertiary Protein Structure Prediction Problem

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Narloch, Pedro Henrique
Orientador(a): Dorn, Márcio
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/233767
Resumo: A predição de estrutura terciária das proteínas é um dos problemas mais desafiadores na Bioinformática Estrutural, e é considerado um problema NP-Hard na teoria da com plexidade computacional. A complexidade do problema está relacionada com o número significativo de conformações possíveis que uma única proteína pode assumir. Como a determinação experimental das estruturas proteicas é cara e demorada, os métodos com putacionais tornaram-se uma forma interessante de predizer a forma das proteínas com base em sua sequência de aminoácidos. Como o problema é considerado NP-Hard, ne nhum algoritmo conhecido pode encontrar a solução ótima global. A este respeito, as meta heurísticas tornaram-se uma opção para o problema de predição da estrutura da proteína nos últimos anos. Apesar da popularidade de tais métodos, cada um deles tem características e fontes de conhecimento diferentes. Como as meta heurísticas dependem muito do ajuste dos parâmetros, um ajuste errôneo dos parâmetros pode impactar direta mente no desempenho dos métodos. Além disso, os campos de força usados para avaliar a energia da proteína podem ter termos conflitantes em sua composição, levando a uma possível versão multiobjetivo do problema Com isto em mente, esta tese apresenta uma formulação multi-objetiva da Evolução Diferencial Adaptativa baseada na História de Su cesso para o problema de predição da estrutura da proteína, mantendo as características do notável vencedor do CEC’2014 (SHADE). Uma segunda abordagem também é proposta, utilizando o algoritmo SHADE mono-objetivo com mecanismos de adaptação guiados por diversidade para a manutenção da diversidade. Na abordagem orientada pela diver sidade, são utilizados conhecimentos estruturais de duas fontes, a Lista de Probabilidade Angular durante a inicialização da população e fragmentos de Rosetta durante a fase de geração da diversidade. Com os resultados obtidos nesta tese de diferentes aplicações da Evolução Diferencial no Problema de Predição da Estrutura da Proteína, verificamos que nossa proposta melhora a capacidade da meta heurística de alcançar resultados relevantes para um dos problemas mais desafiadores da bioinformática estrutural. Além disso, o novo mecanismo de adaptação baseado na diversidade populacional melhorou significati vamente em comparação com os DEs que não utilizam o mecanismo de adaptação guiado pela diversidade. Assim, nosso trabalho contém contribuições relevantes para o algoritmo de Evolução Diferencial e suas aplicações. Embora nossas abordagens sejam aplicadas ao problema de PSP, elas podem ser generalizadas para outros problemas NP-Hard com características similares, como o problema de Atracamento Molecular.
id URGS_96227c3fe3f1c4632518a6a96cd9737f
oai_identifier_str oai:www.lume.ufrgs.br:10183/233767
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Narloch, Pedro HenriqueDorn, Márcio2022-01-05T04:30:11Z2021http://hdl.handle.net/10183/233767001135600A predição de estrutura terciária das proteínas é um dos problemas mais desafiadores na Bioinformática Estrutural, e é considerado um problema NP-Hard na teoria da com plexidade computacional. A complexidade do problema está relacionada com o número significativo de conformações possíveis que uma única proteína pode assumir. Como a determinação experimental das estruturas proteicas é cara e demorada, os métodos com putacionais tornaram-se uma forma interessante de predizer a forma das proteínas com base em sua sequência de aminoácidos. Como o problema é considerado NP-Hard, ne nhum algoritmo conhecido pode encontrar a solução ótima global. A este respeito, as meta heurísticas tornaram-se uma opção para o problema de predição da estrutura da proteína nos últimos anos. Apesar da popularidade de tais métodos, cada um deles tem características e fontes de conhecimento diferentes. Como as meta heurísticas dependem muito do ajuste dos parâmetros, um ajuste errôneo dos parâmetros pode impactar direta mente no desempenho dos métodos. Além disso, os campos de força usados para avaliar a energia da proteína podem ter termos conflitantes em sua composição, levando a uma possível versão multiobjetivo do problema Com isto em mente, esta tese apresenta uma formulação multi-objetiva da Evolução Diferencial Adaptativa baseada na História de Su cesso para o problema de predição da estrutura da proteína, mantendo as características do notável vencedor do CEC’2014 (SHADE). Uma segunda abordagem também é proposta, utilizando o algoritmo SHADE mono-objetivo com mecanismos de adaptação guiados por diversidade para a manutenção da diversidade. Na abordagem orientada pela diver sidade, são utilizados conhecimentos estruturais de duas fontes, a Lista de Probabilidade Angular durante a inicialização da população e fragmentos de Rosetta durante a fase de geração da diversidade. Com os resultados obtidos nesta tese de diferentes aplicações da Evolução Diferencial no Problema de Predição da Estrutura da Proteína, verificamos que nossa proposta melhora a capacidade da meta heurística de alcançar resultados relevantes para um dos problemas mais desafiadores da bioinformática estrutural. Além disso, o novo mecanismo de adaptação baseado na diversidade populacional melhorou significati vamente em comparação com os DEs que não utilizam o mecanismo de adaptação guiado pela diversidade. Assim, nosso trabalho contém contribuições relevantes para o algoritmo de Evolução Diferencial e suas aplicações. Embora nossas abordagens sejam aplicadas ao problema de PSP, elas podem ser generalizadas para outros problemas NP-Hard com características similares, como o problema de Atracamento Molecular.Tertiary protein structure prediction is one of the most challenging problems in Struc tural Bioinformatics, and it is an NP-Hard problem in computational complexity theory. The complexity is related to the significant number of possible conformations a single protein can assume. As the experimental determination of protein structures is costly and time-consuming, computational methods became an interesting way to predict pro teins’ shape based on their amino acid sequence. As the problem is considered NP-Hard, no known algorithm can find the global optimum solution. In this regard, Metaheuris tics became an option for the protein structure prediction problem in recent years. Al though the popularity of such methods, each one of them has different characteristics and knowledge sources. As metaheuristics are heavily dependent on parameter tuning, wrong parameters might cause poor performance. Moreover, the force fields used for evaluating the protein’s energy might have conflicting terms in their composition, lead ing to a possible multi-objective version of the problem. With this in mind, this thesis presents a multi-objective formulation of the Success-History based Adaptive Differen tial Evolution for the protein structure prediction problem, maintaining the characteristics of the remarkable CEC’2014 winner (SHADE). A second approach is also proposed, us ing the SHADE single-objective algorithm with diversity-guided adaptation mechanisms for diversity maintenance. In the diversity-guided approach, structural knowledge from two sources are used, the Angle Probability List during the population’s initialization and Rosetta fragments during the diversity generation phase. With the results obtained in this thesis from different Differential Evolution applications in the Protein Structure Prediction Problem, we verified that our proposal improves the metaheuristics’ capabili ties of predicting relevant results for one of the most challenging problems in structural bioinformatics. Besides, the novel adaptation mechanism based on populational diversity improved significantly compared to DEs that do not use the diversity-guided adaptation mechanism. Thus, our work contains relevant contributions to the Differential Evolution algorithm and its applications. Although our approaches are applied to the PSP problem, they can be generalized for other NP-hard problems with similar characteristics, such as the Molecular Docking problem.application/pdfengPredição de estrutura de proteínasBioinformáticaOtimização multiobjetivoProtein Structure PredictionDifferential EvolutionStructural BioinformaticsDiversity-guided AdaptationMulti-Objective OptimizationMulti-ObjectiveDifferential EvolutionMulti objective and diversity guided success history based adaptive differential Evolution approaches for the Tertiary Protein Structure Prediction Probleminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2021doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001135600.pdf.txt001135600.pdf.txtExtracted Texttext/plain394631http://www.lume.ufrgs.br/bitstream/10183/233767/2/001135600.pdf.txtcea0ccbcb30b8b52f77a81c3f51fe23bMD52ORIGINAL001135600.pdfTexto completo (inglês)application/pdf138619229http://www.lume.ufrgs.br/bitstream/10183/233767/1/001135600.pdf65a80b34d757b68b24416050346f8f98MD5110183/2337672022-02-22 05:10:34.376168oai:www.lume.ufrgs.br:10183/233767Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-02-22T08:10:34Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Multi objective and diversity guided success history based adaptive differential Evolution approaches for the Tertiary Protein Structure Prediction Problem
title Multi objective and diversity guided success history based adaptive differential Evolution approaches for the Tertiary Protein Structure Prediction Problem
spellingShingle Multi objective and diversity guided success history based adaptive differential Evolution approaches for the Tertiary Protein Structure Prediction Problem
Narloch, Pedro Henrique
Predição de estrutura de proteínas
Bioinformática
Otimização multiobjetivo
Protein Structure Prediction
Differential Evolution
Structural Bioinformatics
Diversity-guided Adaptation
Multi-Objective Optimization
Multi-Objective
Differential Evolution
title_short Multi objective and diversity guided success history based adaptive differential Evolution approaches for the Tertiary Protein Structure Prediction Problem
title_full Multi objective and diversity guided success history based adaptive differential Evolution approaches for the Tertiary Protein Structure Prediction Problem
title_fullStr Multi objective and diversity guided success history based adaptive differential Evolution approaches for the Tertiary Protein Structure Prediction Problem
title_full_unstemmed Multi objective and diversity guided success history based adaptive differential Evolution approaches for the Tertiary Protein Structure Prediction Problem
title_sort Multi objective and diversity guided success history based adaptive differential Evolution approaches for the Tertiary Protein Structure Prediction Problem
author Narloch, Pedro Henrique
author_facet Narloch, Pedro Henrique
author_role author
dc.contributor.author.fl_str_mv Narloch, Pedro Henrique
dc.contributor.advisor1.fl_str_mv Dorn, Márcio
contributor_str_mv Dorn, Márcio
dc.subject.por.fl_str_mv Predição de estrutura de proteínas
Bioinformática
Otimização multiobjetivo
topic Predição de estrutura de proteínas
Bioinformática
Otimização multiobjetivo
Protein Structure Prediction
Differential Evolution
Structural Bioinformatics
Diversity-guided Adaptation
Multi-Objective Optimization
Multi-Objective
Differential Evolution
dc.subject.eng.fl_str_mv Protein Structure Prediction
Differential Evolution
Structural Bioinformatics
Diversity-guided Adaptation
Multi-Objective Optimization
Multi-Objective
Differential Evolution
description A predição de estrutura terciária das proteínas é um dos problemas mais desafiadores na Bioinformática Estrutural, e é considerado um problema NP-Hard na teoria da com plexidade computacional. A complexidade do problema está relacionada com o número significativo de conformações possíveis que uma única proteína pode assumir. Como a determinação experimental das estruturas proteicas é cara e demorada, os métodos com putacionais tornaram-se uma forma interessante de predizer a forma das proteínas com base em sua sequência de aminoácidos. Como o problema é considerado NP-Hard, ne nhum algoritmo conhecido pode encontrar a solução ótima global. A este respeito, as meta heurísticas tornaram-se uma opção para o problema de predição da estrutura da proteína nos últimos anos. Apesar da popularidade de tais métodos, cada um deles tem características e fontes de conhecimento diferentes. Como as meta heurísticas dependem muito do ajuste dos parâmetros, um ajuste errôneo dos parâmetros pode impactar direta mente no desempenho dos métodos. Além disso, os campos de força usados para avaliar a energia da proteína podem ter termos conflitantes em sua composição, levando a uma possível versão multiobjetivo do problema Com isto em mente, esta tese apresenta uma formulação multi-objetiva da Evolução Diferencial Adaptativa baseada na História de Su cesso para o problema de predição da estrutura da proteína, mantendo as características do notável vencedor do CEC’2014 (SHADE). Uma segunda abordagem também é proposta, utilizando o algoritmo SHADE mono-objetivo com mecanismos de adaptação guiados por diversidade para a manutenção da diversidade. Na abordagem orientada pela diver sidade, são utilizados conhecimentos estruturais de duas fontes, a Lista de Probabilidade Angular durante a inicialização da população e fragmentos de Rosetta durante a fase de geração da diversidade. Com os resultados obtidos nesta tese de diferentes aplicações da Evolução Diferencial no Problema de Predição da Estrutura da Proteína, verificamos que nossa proposta melhora a capacidade da meta heurística de alcançar resultados relevantes para um dos problemas mais desafiadores da bioinformática estrutural. Além disso, o novo mecanismo de adaptação baseado na diversidade populacional melhorou significati vamente em comparação com os DEs que não utilizam o mecanismo de adaptação guiado pela diversidade. Assim, nosso trabalho contém contribuições relevantes para o algoritmo de Evolução Diferencial e suas aplicações. Embora nossas abordagens sejam aplicadas ao problema de PSP, elas podem ser generalizadas para outros problemas NP-Hard com características similares, como o problema de Atracamento Molecular.
publishDate 2021
dc.date.issued.fl_str_mv 2021
dc.date.accessioned.fl_str_mv 2022-01-05T04:30:11Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/233767
dc.identifier.nrb.pt_BR.fl_str_mv 001135600
url http://hdl.handle.net/10183/233767
identifier_str_mv 001135600
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/233767/2/001135600.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/233767/1/001135600.pdf
bitstream.checksum.fl_str_mv cea0ccbcb30b8b52f77a81c3f51fe23b
65a80b34d757b68b24416050346f8f98
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831316125832445952