Exportação concluída — 

Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Ferrari, Daniel Gomes lattes
Orientador(a): Silva, Leandro Nunes de Castro lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Presbiteriana Mackenzie
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://dspace.mackenzie.br/handle/10899/24259
Resumo: Data clustering is an important data mining task that aims to segment a database into groups of objects based on their similarity or dissimilarity. Due to the unsupervised nature of clustering, the search for a good quality solution can become a complex process. There is currently a wide range of clustering algorithms and selecting the most suitable one for a given problem can be a slow and costly process. In 1976, Rice formulated the algorithm selection problem (PSA) postulating that a good performance algorithm can be chosen according to the problem s structural characteristics. Meta-learning brings the concept of learning about learning, that is, the meta-knowledge obtained from the algorithms learning process allows it to improve its performance. Meta-learning has a major intersection with data mining in classification problems, where it is used to select algorithms. This thesis proposes an approach to the algorithm selection problem by using meta-learning techniques for clustering. The characterization of 84 problems is performed by a classical approach, based on the problems, and a new proposal based on the similarity among the objects. Ten internal indices are used to provide different performance assessments of seven algorithms, where the combination of the indices determine the ranking for the algorithms. Several analyzes are performed in order to assess the quality of the obtained meta-knowledge in facilitating the mapping between the problem s features and the performance of the algorithms. The results show that the new characterization approach and method to combine the indices provide a good quality algorithm selection mechanism for data clustering problems.
id UPM_f62c19efcc1fb0dd890ffb709d2c94d8
oai_identifier_str oai:dspace.mackenzie.br:10899/24259
network_acronym_str UPM
network_name_str Repositório Digital do Mackenzie
repository_id_str
spelling http://lattes.cnpq.br/2741458816539568Ferrari, Daniel GomesSilva, Leandro Nunes de Castrohttp://lattes.cnpq.br/26506917130575092016-03-15T19:38:50Z2020-05-28T18:07:56Z2014-06-302020-05-28T18:07:56Z2014-03-27Data clustering is an important data mining task that aims to segment a database into groups of objects based on their similarity or dissimilarity. Due to the unsupervised nature of clustering, the search for a good quality solution can become a complex process. There is currently a wide range of clustering algorithms and selecting the most suitable one for a given problem can be a slow and costly process. In 1976, Rice formulated the algorithm selection problem (PSA) postulating that a good performance algorithm can be chosen according to the problem s structural characteristics. Meta-learning brings the concept of learning about learning, that is, the meta-knowledge obtained from the algorithms learning process allows it to improve its performance. Meta-learning has a major intersection with data mining in classification problems, where it is used to select algorithms. This thesis proposes an approach to the algorithm selection problem by using meta-learning techniques for clustering. The characterization of 84 problems is performed by a classical approach, based on the problems, and a new proposal based on the similarity among the objects. Ten internal indices are used to provide different performance assessments of seven algorithms, where the combination of the indices determine the ranking for the algorithms. Several analyzes are performed in order to assess the quality of the obtained meta-knowledge in facilitating the mapping between the problem s features and the performance of the algorithms. The results show that the new characterization approach and method to combine the indices provide a good quality algorithm selection mechanism for data clustering problems.Agrupamento é uma tarefa importante na mineração de dados, tendo como objetivo segmentar uma base de dados em grupos de objetos baseando-se na similaridade ou dissimilaridade entre os mesmos. Devido à natureza não supervisionada da tarefa, a busca por uma solução de boa qualidade pode se tornar um processo complexo. Atualmente, existe na literatura acadêmica uma grande quantidade de algoritmos que podem ser utilizados na resolução deste problema. A seleção do algoritmo mais adequado para um determinado problema pode ser um processo lento e custoso. Em 1976, Rice formulou o Problema de Seleção de Algoritmos (PSA), postulando que um algoritmo de bom desempenho pode ser escolhido de acordo com as características estruturais do problema em que o mesmo será aplicado. A meta-aprendizagem traz consigo o conceito de aprender sobre o aprender, isto é, por meio do meta-conhecimento obtido do processo de aprendizagem dos algoritmos é possível aprimorar o desempenho do processo. Meta-aprendizagem possui grande interseção com mineração de dados no que tange problemas de classificação, sendo utilizada no desenvolvimento de sistemas de seleção de algoritmos. Nesta tese é proposta a abordagem ao PSA por meio de técnicas de meta-aprendizagem para agrupamento de dados. A caracterização de 84 problemas é realizada pela abordagem clássica, baseada nos problemas, e por uma nova proposta baseada na similaridade entre os objetos. São utilizados dez índices internos para promover diferentes avaliações do desempenho de sete algoritmos, onde a combinação desses índices determina o ranking dos algoritmos. São realizadas diversas análises no intuito de avaliar a qualidade do meta-conhecimento obtido em viabilizar o mapeamento entre as características do problema e o desempenho dos algoritmos. Os resultados mostram que a nova caracterização e combinação dos índices proporcionam a seleção, com qualidade, de algoritmos para agrupamento de dados.Natcomp Informatica e Equipamentos Eletronicos LTDAapplication/pdfFERRARI, Daniel Gomes. Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem. 2014. 204 f. Tese (Doutorado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2014.http://dspace.mackenzie.br/handle/10899/24259porUniversidade Presbiteriana Mackenzieagrupamento de dadosmeta-aprendizagemmeta-conhecimentoseleção de algoritmosdata clusteringmeta-learningmeta-knowledgealgorithm selectionCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAhttp://tede.mackenzie.br/jspui/retrieve/3809/Daniel%20Gomes%20Ferrari.pdf.jpgSeleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizageminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Digital do Mackenzieinstname:Universidade Presbiteriana Mackenzie (MACKENZIE)instacron:MACKENZIEOmar, Nizamhttp://lattes.cnpq.br/2067336430076971Silva, Leandro Augusto dahttp://lattes.cnpq.br/1396385111251741Carvalho, André Carlos Ponce de Leon Ferreira dehttp://lattes.cnpq.br/9674541381385819Medeiros, Claudia Maria Bauzerhttp://lattes.cnpq.br/4643608666899616BREngenharia ElétricaUPMEngenharia ElétricaORIGINALDaniel Gomes Ferrari.pdfDaniel Gomes Ferrari.pdfapplication/pdf2637556https://dspace.mackenzie.br/bitstreams/e0b19585-829e-416c-be67-cfbabfce86a2/downloadfc7c75a731da823faa511fb163acf06aMD51TEXTDaniel Gomes Ferrari.pdf.txtDaniel Gomes Ferrari.pdf.txtExtracted texttext/plain355103https://dspace.mackenzie.br/bitstreams/3e575407-c008-4a99-a7d3-d1b3be1dc5f3/downloadfa826d7ac1f3a42143310195b1274ddfMD52THUMBNAILDaniel Gomes Ferrari.pdf.jpgDaniel Gomes Ferrari.pdf.jpgGenerated Thumbnailimage/jpeg1275https://dspace.mackenzie.br/bitstreams/23169dee-8480-4f48-80e4-e9d96e56c28f/download8468b4e52d32fcef2319c6aadef596c7MD5310899/242592022-03-14 16:55:53.061oai:dspace.mackenzie.br:10899/24259https://dspace.mackenzie.brBiblioteca Digital de Teses e Dissertaçõeshttp://tede.mackenzie.br/jspui/PRIhttps://adelpha-api.mackenzie.br/server/oai/repositorio@mackenzie.br||paola.damato@mackenzie.bropendoar:102772022-03-14T16:55:53Repositório Digital do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)false
dc.title.por.fl_str_mv Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem
title Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem
spellingShingle Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem
Ferrari, Daniel Gomes
agrupamento de dados
meta-aprendizagem
meta-conhecimento
seleção de algoritmos
data clustering
meta-learning
meta-knowledge
algorithm selection
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
title_short Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem
title_full Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem
title_fullStr Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem
title_full_unstemmed Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem
title_sort Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem
author Ferrari, Daniel Gomes
author_facet Ferrari, Daniel Gomes
author_role author
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2741458816539568
dc.contributor.author.fl_str_mv Ferrari, Daniel Gomes
dc.contributor.advisor1.fl_str_mv Silva, Leandro Nunes de Castro
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2650691713057509
contributor_str_mv Silva, Leandro Nunes de Castro
dc.subject.por.fl_str_mv agrupamento de dados
meta-aprendizagem
meta-conhecimento
seleção de algoritmos
topic agrupamento de dados
meta-aprendizagem
meta-conhecimento
seleção de algoritmos
data clustering
meta-learning
meta-knowledge
algorithm selection
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
dc.subject.eng.fl_str_mv data clustering
meta-learning
meta-knowledge
algorithm selection
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
description Data clustering is an important data mining task that aims to segment a database into groups of objects based on their similarity or dissimilarity. Due to the unsupervised nature of clustering, the search for a good quality solution can become a complex process. There is currently a wide range of clustering algorithms and selecting the most suitable one for a given problem can be a slow and costly process. In 1976, Rice formulated the algorithm selection problem (PSA) postulating that a good performance algorithm can be chosen according to the problem s structural characteristics. Meta-learning brings the concept of learning about learning, that is, the meta-knowledge obtained from the algorithms learning process allows it to improve its performance. Meta-learning has a major intersection with data mining in classification problems, where it is used to select algorithms. This thesis proposes an approach to the algorithm selection problem by using meta-learning techniques for clustering. The characterization of 84 problems is performed by a classical approach, based on the problems, and a new proposal based on the similarity among the objects. Ten internal indices are used to provide different performance assessments of seven algorithms, where the combination of the indices determine the ranking for the algorithms. Several analyzes are performed in order to assess the quality of the obtained meta-knowledge in facilitating the mapping between the problem s features and the performance of the algorithms. The results show that the new characterization approach and method to combine the indices provide a good quality algorithm selection mechanism for data clustering problems.
publishDate 2014
dc.date.available.fl_str_mv 2014-06-30
2020-05-28T18:07:56Z
dc.date.issued.fl_str_mv 2014-03-27
dc.date.accessioned.fl_str_mv 2016-03-15T19:38:50Z
2020-05-28T18:07:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FERRARI, Daniel Gomes. Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem. 2014. 204 f. Tese (Doutorado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2014.
dc.identifier.uri.fl_str_mv http://dspace.mackenzie.br/handle/10899/24259
identifier_str_mv FERRARI, Daniel Gomes. Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem. 2014. 204 f. Tese (Doutorado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2014.
url http://dspace.mackenzie.br/handle/10899/24259
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
dc.source.none.fl_str_mv reponame:Repositório Digital do Mackenzie
instname:Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron:MACKENZIE
instname_str Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron_str MACKENZIE
institution MACKENZIE
reponame_str Repositório Digital do Mackenzie
collection Repositório Digital do Mackenzie
bitstream.url.fl_str_mv https://dspace.mackenzie.br/bitstreams/e0b19585-829e-416c-be67-cfbabfce86a2/download
https://dspace.mackenzie.br/bitstreams/3e575407-c008-4a99-a7d3-d1b3be1dc5f3/download
https://dspace.mackenzie.br/bitstreams/23169dee-8480-4f48-80e4-e9d96e56c28f/download
bitstream.checksum.fl_str_mv fc7c75a731da823faa511fb163acf06a
fa826d7ac1f3a42143310195b1274ddf
8468b4e52d32fcef2319c6aadef596c7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Digital do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)
repository.mail.fl_str_mv repositorio@mackenzie.br||paola.damato@mackenzie.br
_version_ 1851945995729895424