GRASP com path-relinking para agrupamento de dados biológicos
Ano de defesa: | 2011 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Minas Gerais
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://hdl.handle.net/1843/SLSS-8GQJ46 |
Resumo: | O agrupamento é um método não supervisionado de classificação de dados em grupos (clusters). Em problemas de agrupamento, não se sabe previamente quantas e quais as classes necessárias para descrever coerentemente um conjunto de dados. Na biologia computacional, o agrupamento mostrou-se ferramenta útil em problemas de descoberta de padrões em dados como classificação de proteínas, predição da localização de proteínas em unidades celulares e diagnóstico de câncer. Recentemente, técnicas de otimização, como as metaheurísticas, têm sido utilizadas na literatura como método alternativo ou auxiliar para aumentar a eficiência e eficácia das ferramentas clássicas de agrupamento, geralmente baseadas em métodos estatísticos e matemáticos. O objetivo deste trabalho é propor algoritmos híbridos fundamentados nas metaheurísticas Greedy Randomized Adaptative Search Procedure (GRASP) e Path-Relinking para o problema de agrupamento de dados biológicos, com intuito de obter melhores soluções quando considerado unicamente o GRASP na sua forma padrão. Portanto, neste trabalho, considera-se a hipótese que o Path-Relinking como estratégia de intensificação do GRASP, melhora o desempenho e qualidade das soluções. Considera-se a hibridização do GRASP proposto por Nascimento et al. [2010b], com quatro variações do Path-Relinking: Forward, Backward, Mixed, e Greedy Randomized Adaptative. A validação das soluções obtidas dá-se por meio da comparação com os algoritmos clássicos k-means, k-medians, PAM (Partitioning Around Medoids) bem como o GRASP proposto por Nascimento et al. [2010b]. Os experimentos foram realizados com dados reais de 10 instâncias biológicas, e os resultados mostraram que o modelo híbrido melhorou a tarefa de agrupamento. Obteve-se maior exploração do espaço de busca, maior coesão de agrupamentos, aumento da robustez e redução do tempo computacional. As variantes Greedy Randomized Adaptative e Mixed apresentaram os melhores resultados. |
id |
UFMG_82ab64432b52b0a488635e62c549a0d7 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/SLSS-8GQJ46 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Ricardo Martins de Abreu SilvaGeraldo Robson MateusMaurício Guilherme de Carvalho ResendeThiago Ferreira de NoronhaRafael de Magalhaes Dias Frinhani2019-08-11T08:51:37Z2019-08-11T08:51:37Z2011-03-02http://hdl.handle.net/1843/SLSS-8GQJ46O agrupamento é um método não supervisionado de classificação de dados em grupos (clusters). Em problemas de agrupamento, não se sabe previamente quantas e quais as classes necessárias para descrever coerentemente um conjunto de dados. Na biologia computacional, o agrupamento mostrou-se ferramenta útil em problemas de descoberta de padrões em dados como classificação de proteínas, predição da localização de proteínas em unidades celulares e diagnóstico de câncer. Recentemente, técnicas de otimização, como as metaheurísticas, têm sido utilizadas na literatura como método alternativo ou auxiliar para aumentar a eficiência e eficácia das ferramentas clássicas de agrupamento, geralmente baseadas em métodos estatísticos e matemáticos. O objetivo deste trabalho é propor algoritmos híbridos fundamentados nas metaheurísticas Greedy Randomized Adaptative Search Procedure (GRASP) e Path-Relinking para o problema de agrupamento de dados biológicos, com intuito de obter melhores soluções quando considerado unicamente o GRASP na sua forma padrão. Portanto, neste trabalho, considera-se a hipótese que o Path-Relinking como estratégia de intensificação do GRASP, melhora o desempenho e qualidade das soluções. Considera-se a hibridização do GRASP proposto por Nascimento et al. [2010b], com quatro variações do Path-Relinking: Forward, Backward, Mixed, e Greedy Randomized Adaptative. A validação das soluções obtidas dá-se por meio da comparação com os algoritmos clássicos k-means, k-medians, PAM (Partitioning Around Medoids) bem como o GRASP proposto por Nascimento et al. [2010b]. Os experimentos foram realizados com dados reais de 10 instâncias biológicas, e os resultados mostraram que o modelo híbrido melhorou a tarefa de agrupamento. Obteve-se maior exploração do espaço de busca, maior coesão de agrupamentos, aumento da robustez e redução do tempo computacional. As variantes Greedy Randomized Adaptative e Mixed apresentaram os melhores resultados.Clustering is an unsupervised method of classifying data into clusters. In clustering problems, it is not previously known how many and which classes are needed to describe coherently a set of data.In computational biology, data clustering proved to be useful in problems of patterns discovery in data such as protein classification, prediction of protein localization in cell units and cancer diagnosis.Recently, optimization techniques like metaheuristics, have been used frequently in the literature as an alternative or adjunct to increase the efficiency and effectiveness of the classic tools of clustering, usually based on statistical and mathematical methods. In this study we proposed hybrid algorithms based on metaheuristics GRASP and Path-Relinking for the clustering problem of biological data, aiming to obtain better solutions when compared to using only the GRASP in its standard form. Therefore, in this work, we considered the hypothesis that using the Path-Relinking as a strategy for intensifying GRASP, improves performance and quality of solutions. We consider hybridization of the GRASP proposed by Nascimento et al. [2010b], with four variants of Path-Relinking: forward, backward, mixed, and greedy randomized adaptative. The validation of solutions is given by comparing with the classic algorithms k-means, k-medians, PAM (Partitioning Around Medoids) as well as GRASP proposed by Nascimento et al. (2010).The experiments were performed with real data from 10 biological instances, and results showed that the hybrid model improved the clustering task. We obtained further exploration of the search space, more cohesive clusters, increase of robustness and reduction of computational time. Greedy Randomized Adaptive and Mixed showed the best results.Universidade Federal de Minas GeraisUFMGComputaçãoBiologia computacionalBiologia ComputacionalAgrupamentoMetaheurísticasPath-RelinkingGRASPGRASP com path-relinking para agrupamento de dados biológicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALrafaeldiasfrinhani.pdfapplication/pdf2291731https://repositorio.ufmg.br/bitstream/1843/SLSS-8GQJ46/1/rafaeldiasfrinhani.pdf829251fa4377bd482c78b7b544f6ac4eMD51TEXTrafaeldiasfrinhani.pdf.txtrafaeldiasfrinhani.pdf.txtExtracted texttext/plain181469https://repositorio.ufmg.br/bitstream/1843/SLSS-8GQJ46/2/rafaeldiasfrinhani.pdf.txtc08d3fa83304df75ffe401783623110fMD521843/SLSS-8GQJ462019-11-14 06:04:28.904oai:repositorio.ufmg.br:1843/SLSS-8GQJ46Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T09:04:28Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
GRASP com path-relinking para agrupamento de dados biológicos |
title |
GRASP com path-relinking para agrupamento de dados biológicos |
spellingShingle |
GRASP com path-relinking para agrupamento de dados biológicos Rafael de Magalhaes Dias Frinhani Biologia Computacional Agrupamento Metaheurísticas Path-Relinking GRASP Computação Biologia computacional |
title_short |
GRASP com path-relinking para agrupamento de dados biológicos |
title_full |
GRASP com path-relinking para agrupamento de dados biológicos |
title_fullStr |
GRASP com path-relinking para agrupamento de dados biológicos |
title_full_unstemmed |
GRASP com path-relinking para agrupamento de dados biológicos |
title_sort |
GRASP com path-relinking para agrupamento de dados biológicos |
author |
Rafael de Magalhaes Dias Frinhani |
author_facet |
Rafael de Magalhaes Dias Frinhani |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Ricardo Martins de Abreu Silva |
dc.contributor.advisor-co1.fl_str_mv |
Geraldo Robson Mateus |
dc.contributor.referee1.fl_str_mv |
Maurício Guilherme de Carvalho Resende |
dc.contributor.referee2.fl_str_mv |
Thiago Ferreira de Noronha |
dc.contributor.author.fl_str_mv |
Rafael de Magalhaes Dias Frinhani |
contributor_str_mv |
Ricardo Martins de Abreu Silva Geraldo Robson Mateus Maurício Guilherme de Carvalho Resende Thiago Ferreira de Noronha |
dc.subject.por.fl_str_mv |
Biologia Computacional Agrupamento Metaheurísticas Path-Relinking GRASP |
topic |
Biologia Computacional Agrupamento Metaheurísticas Path-Relinking GRASP Computação Biologia computacional |
dc.subject.other.pt_BR.fl_str_mv |
Computação Biologia computacional |
description |
O agrupamento é um método não supervisionado de classificação de dados em grupos (clusters). Em problemas de agrupamento, não se sabe previamente quantas e quais as classes necessárias para descrever coerentemente um conjunto de dados. Na biologia computacional, o agrupamento mostrou-se ferramenta útil em problemas de descoberta de padrões em dados como classificação de proteínas, predição da localização de proteínas em unidades celulares e diagnóstico de câncer. Recentemente, técnicas de otimização, como as metaheurísticas, têm sido utilizadas na literatura como método alternativo ou auxiliar para aumentar a eficiência e eficácia das ferramentas clássicas de agrupamento, geralmente baseadas em métodos estatísticos e matemáticos. O objetivo deste trabalho é propor algoritmos híbridos fundamentados nas metaheurísticas Greedy Randomized Adaptative Search Procedure (GRASP) e Path-Relinking para o problema de agrupamento de dados biológicos, com intuito de obter melhores soluções quando considerado unicamente o GRASP na sua forma padrão. Portanto, neste trabalho, considera-se a hipótese que o Path-Relinking como estratégia de intensificação do GRASP, melhora o desempenho e qualidade das soluções. Considera-se a hibridização do GRASP proposto por Nascimento et al. [2010b], com quatro variações do Path-Relinking: Forward, Backward, Mixed, e Greedy Randomized Adaptative. A validação das soluções obtidas dá-se por meio da comparação com os algoritmos clássicos k-means, k-medians, PAM (Partitioning Around Medoids) bem como o GRASP proposto por Nascimento et al. [2010b]. Os experimentos foram realizados com dados reais de 10 instâncias biológicas, e os resultados mostraram que o modelo híbrido melhorou a tarefa de agrupamento. Obteve-se maior exploração do espaço de busca, maior coesão de agrupamentos, aumento da robustez e redução do tempo computacional. As variantes Greedy Randomized Adaptative e Mixed apresentaram os melhores resultados. |
publishDate |
2011 |
dc.date.issued.fl_str_mv |
2011-03-02 |
dc.date.accessioned.fl_str_mv |
2019-08-11T08:51:37Z |
dc.date.available.fl_str_mv |
2019-08-11T08:51:37Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/SLSS-8GQJ46 |
url |
http://hdl.handle.net/1843/SLSS-8GQJ46 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/SLSS-8GQJ46/1/rafaeldiasfrinhani.pdf https://repositorio.ufmg.br/bitstream/1843/SLSS-8GQJ46/2/rafaeldiasfrinhani.pdf.txt |
bitstream.checksum.fl_str_mv |
829251fa4377bd482c78b7b544f6ac4e c08d3fa83304df75ffe401783623110f |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589710799437824 |