Explorando a diversidade em algoritmos genéticos distribuídos para o problema de predição de estrutura tridimensional de proteínas

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Alixandre, Bruno Ferreira de Faria
Orientador(a): Dorn, Márcio
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/240676
Resumo: Conhecer a estrutura tridimensional de uma proteína é um passo fundamental para se determinar seu papel biológico. Ainda que o problema de predição da estrutura de proteínas permaneça sem solução definitiva, diversos métodos foram propostos nos últimos anos no intuito de solucioná-lo. Como principal alternativa, meta-heurísticas como o Algoritmo Genético e versões similares vem sendo aplicadas ao problema. Apesar de eficientes em diversas tarefas, estes algoritmos encontram alguns obstáculos ao tratarem o problema, principalmente devido à convergência prematura. Isso ocorre quando a população do algoritmo perde diversidade, convergindo então em valores não satisfatórios. Muitas maneiras de lidar com este problema foram desenvolvidas. O Algoritmo Genético Distribuído se divide em múltiplas populações, de modo a desacelerar a convergência global. Nesta dissertação, um Algoritmo Genético Distribuído com controle de diversidade é apresentado. Para tal, uma nova política de migração foi proposta, a qual busca manter e explorar de maneira eficiente a diversidade populacional. Antes de aplicá-la ao problema de predição da estrutura de proteínas, uma série de testes foram realizados, com o objetivo de se obter a versão mais adequada ao problema. Em uma primeira etapa, esta nova política foi testada em conjunto com outras cinco políticas distintas, todas aplicadas no Algoritmo Genético canônico e no Biased Random-Key Genetic Algorithm (BRKGA), uma versão também baseada em diversidade. Os resultados apontam para um melhor desempenho da política proposta em relação às demais, principalmente combinada ao BRKGA. Na etapa seguinte, uma série de operadores genéticos foram propostos, no intuito de agregar informações específicas do problema à tomada de decisão. Além disso, utilizou-se também uma base de conhecimento experimental visando reduzir o espaço de busca conformacional. Como resultado, um novo método foi gerado (política proposta + BRKGA), incorporando novos operadores de inicialização baseado em conhecimento experimental, além de operadores de recombinação e mutação que utilizam informação da estrutura secundária. Por fim, este método foi comparado a outros dois que também fazem uso de informação da estrutura secundária e de bases de conhecimento. Os resultados apontam para um desempenho competitivo, se mostrando superior em diversos casos.
id URGS_78dbdf42e6dd269951217c06866e61ee
oai_identifier_str oai:www.lume.ufrgs.br:10183/240676
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Alixandre, Bruno Ferreira de FariaDorn, Márcio2022-06-22T05:04:07Z2018http://hdl.handle.net/10183/240676001065466Conhecer a estrutura tridimensional de uma proteína é um passo fundamental para se determinar seu papel biológico. Ainda que o problema de predição da estrutura de proteínas permaneça sem solução definitiva, diversos métodos foram propostos nos últimos anos no intuito de solucioná-lo. Como principal alternativa, meta-heurísticas como o Algoritmo Genético e versões similares vem sendo aplicadas ao problema. Apesar de eficientes em diversas tarefas, estes algoritmos encontram alguns obstáculos ao tratarem o problema, principalmente devido à convergência prematura. Isso ocorre quando a população do algoritmo perde diversidade, convergindo então em valores não satisfatórios. Muitas maneiras de lidar com este problema foram desenvolvidas. O Algoritmo Genético Distribuído se divide em múltiplas populações, de modo a desacelerar a convergência global. Nesta dissertação, um Algoritmo Genético Distribuído com controle de diversidade é apresentado. Para tal, uma nova política de migração foi proposta, a qual busca manter e explorar de maneira eficiente a diversidade populacional. Antes de aplicá-la ao problema de predição da estrutura de proteínas, uma série de testes foram realizados, com o objetivo de se obter a versão mais adequada ao problema. Em uma primeira etapa, esta nova política foi testada em conjunto com outras cinco políticas distintas, todas aplicadas no Algoritmo Genético canônico e no Biased Random-Key Genetic Algorithm (BRKGA), uma versão também baseada em diversidade. Os resultados apontam para um melhor desempenho da política proposta em relação às demais, principalmente combinada ao BRKGA. Na etapa seguinte, uma série de operadores genéticos foram propostos, no intuito de agregar informações específicas do problema à tomada de decisão. Além disso, utilizou-se também uma base de conhecimento experimental visando reduzir o espaço de busca conformacional. Como resultado, um novo método foi gerado (política proposta + BRKGA), incorporando novos operadores de inicialização baseado em conhecimento experimental, além de operadores de recombinação e mutação que utilizam informação da estrutura secundária. Por fim, este método foi comparado a outros dois que também fazem uso de informação da estrutura secundária e de bases de conhecimento. Os resultados apontam para um desempenho competitivo, se mostrando superior em diversos casos.The knowledge of the three-dimensional structure of a protein is a key step in determining its biological role. Although the protein structure prediction problem remains without a definitive solution, several methods have been proposed in the last years aiming to solve it. As the main alternative, meta-heuristics such as the Genetic Algorithm and similar versions have been applied to the problem. Despite efficient in several tasks, these algorithms face some obstacles when dealing with this problem, mainly due to the premature convergence. This happens when the population of the algorithm loses diversity, converging to unsatisfactory values. Many ways of dealing with this problem have been developed. The Distributed Genetic Algorithm seeks to divide the population into multiple groups to slow global convergence. In this dissertation, a Distributed Genetic Algorithm with diversity control is presented. To this end, a new migration policy has been developed, in which it seeks not only to maintain but also to efficiently explore population diversity. Before applying it to the protein strucure prediction problem, several tests were performed, in order to obtain the most appropriate version of the method to the problem. In a first stage, this new policy was tested along with five other distinct policies, all applied in the Canonical Genetic Algorithm and the Biased Random-Key Genetic Algorithm (BRKGA), a version also based on diversity. The results point to a better performance of the proposed policy in relation to the others, mainly combined with BRKGA. In the next stage, a series of genetic operators were proposed, to aggregate specific information of the problem to the decision making. Also, an experimental knowledge base was used to reduce the conformational search space. As a result, a novel method (proposed policy + BRKGA) was generated, incorporating new initialization operators based on experimental knowledge, as well as recombination and mutation operators that use information from the secondary structure of proteins. Finally, this method was compared to other two methods that also make use of secondary structure information and knowledge bases. The results point to a competitive performance, proving superior in several cases.application/pdfengBioinformáticaAlgoritmos genéticosStructural BioinformaticsDiversity ControlDistributed Genetic AlgorithmMetaheuristicsOptimizationThree-dimensional Protein Strucute PredictionExplorando a diversidade em algoritmos genéticos distribuídos para o problema de predição de estrutura tridimensional de proteínasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2018mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001065466.pdf.txt001065466.pdf.txtExtracted Texttext/plain228576http://www.lume.ufrgs.br/bitstream/10183/240676/2/001065466.pdf.txt2bf3b43a6ca4d10ad0f4c099f2298f20MD52ORIGINAL001065466.pdfTexto completoapplication/pdf8706502http://www.lume.ufrgs.br/bitstream/10183/240676/1/001065466.pdfb8cb4afa1e57eacaa6b9044c8c279a86MD5110183/2406762022-06-23 04:50:12.137oai:www.lume.ufrgs.br:10183/240676Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-06-23T07:50:12Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Explorando a diversidade em algoritmos genéticos distribuídos para o problema de predição de estrutura tridimensional de proteínas
title Explorando a diversidade em algoritmos genéticos distribuídos para o problema de predição de estrutura tridimensional de proteínas
spellingShingle Explorando a diversidade em algoritmos genéticos distribuídos para o problema de predição de estrutura tridimensional de proteínas
Alixandre, Bruno Ferreira de Faria
Bioinformática
Algoritmos genéticos
Structural Bioinformatics
Diversity Control
Distributed Genetic Algorithm
Metaheuristics
Optimization
Three-dimensional Protein Strucute Prediction
title_short Explorando a diversidade em algoritmos genéticos distribuídos para o problema de predição de estrutura tridimensional de proteínas
title_full Explorando a diversidade em algoritmos genéticos distribuídos para o problema de predição de estrutura tridimensional de proteínas
title_fullStr Explorando a diversidade em algoritmos genéticos distribuídos para o problema de predição de estrutura tridimensional de proteínas
title_full_unstemmed Explorando a diversidade em algoritmos genéticos distribuídos para o problema de predição de estrutura tridimensional de proteínas
title_sort Explorando a diversidade em algoritmos genéticos distribuídos para o problema de predição de estrutura tridimensional de proteínas
author Alixandre, Bruno Ferreira de Faria
author_facet Alixandre, Bruno Ferreira de Faria
author_role author
dc.contributor.author.fl_str_mv Alixandre, Bruno Ferreira de Faria
dc.contributor.advisor1.fl_str_mv Dorn, Márcio
contributor_str_mv Dorn, Márcio
dc.subject.por.fl_str_mv Bioinformática
Algoritmos genéticos
topic Bioinformática
Algoritmos genéticos
Structural Bioinformatics
Diversity Control
Distributed Genetic Algorithm
Metaheuristics
Optimization
Three-dimensional Protein Strucute Prediction
dc.subject.eng.fl_str_mv Structural Bioinformatics
Diversity Control
Distributed Genetic Algorithm
Metaheuristics
Optimization
Three-dimensional Protein Strucute Prediction
description Conhecer a estrutura tridimensional de uma proteína é um passo fundamental para se determinar seu papel biológico. Ainda que o problema de predição da estrutura de proteínas permaneça sem solução definitiva, diversos métodos foram propostos nos últimos anos no intuito de solucioná-lo. Como principal alternativa, meta-heurísticas como o Algoritmo Genético e versões similares vem sendo aplicadas ao problema. Apesar de eficientes em diversas tarefas, estes algoritmos encontram alguns obstáculos ao tratarem o problema, principalmente devido à convergência prematura. Isso ocorre quando a população do algoritmo perde diversidade, convergindo então em valores não satisfatórios. Muitas maneiras de lidar com este problema foram desenvolvidas. O Algoritmo Genético Distribuído se divide em múltiplas populações, de modo a desacelerar a convergência global. Nesta dissertação, um Algoritmo Genético Distribuído com controle de diversidade é apresentado. Para tal, uma nova política de migração foi proposta, a qual busca manter e explorar de maneira eficiente a diversidade populacional. Antes de aplicá-la ao problema de predição da estrutura de proteínas, uma série de testes foram realizados, com o objetivo de se obter a versão mais adequada ao problema. Em uma primeira etapa, esta nova política foi testada em conjunto com outras cinco políticas distintas, todas aplicadas no Algoritmo Genético canônico e no Biased Random-Key Genetic Algorithm (BRKGA), uma versão também baseada em diversidade. Os resultados apontam para um melhor desempenho da política proposta em relação às demais, principalmente combinada ao BRKGA. Na etapa seguinte, uma série de operadores genéticos foram propostos, no intuito de agregar informações específicas do problema à tomada de decisão. Além disso, utilizou-se também uma base de conhecimento experimental visando reduzir o espaço de busca conformacional. Como resultado, um novo método foi gerado (política proposta + BRKGA), incorporando novos operadores de inicialização baseado em conhecimento experimental, além de operadores de recombinação e mutação que utilizam informação da estrutura secundária. Por fim, este método foi comparado a outros dois que também fazem uso de informação da estrutura secundária e de bases de conhecimento. Os resultados apontam para um desempenho competitivo, se mostrando superior em diversos casos.
publishDate 2018
dc.date.issued.fl_str_mv 2018
dc.date.accessioned.fl_str_mv 2022-06-22T05:04:07Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/240676
dc.identifier.nrb.pt_BR.fl_str_mv 001065466
url http://hdl.handle.net/10183/240676
identifier_str_mv 001065466
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/240676/2/001065466.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/240676/1/001065466.pdf
bitstream.checksum.fl_str_mv 2bf3b43a6ca4d10ad0f4c099f2298f20
b8cb4afa1e57eacaa6b9044c8c279a86
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831316134722273280