Evolução automática de algoritmos de redes bayesianas de classificação

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Alex Guimarães Cardoso de Sá
Orientador(a): Gisele Lobo Pappa
Banca de defesa: Adriano César Machado Pereira, Marcio Porto Basgalupp, Renato Martins Assuncao
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Minas Gerais
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/1843/ESBF-9KHHLU
Resumo: Quando nos deparamos com um novo problema de classificação, selecionar o classificador mais adequado para a tarefa é geralmente um desafio. Isso porque cada base de dados tem características diferentes, que podem tornar um classificador mais apropriado que outro. A área de meta-aprendizado surgiu para resolver este tipo de problema: selecionar um algoritmo para uma determinada base de dados de acordo com um conjunto de meta-dados. Nessa direção, este trabalho propõe uma nova abordagem para construir um algoritmo adaptado à(s) base(s) de dados da aplicação de interesse. Mais especificadamente, propõe-se um algoritmo evolucionário (AE) para evoluir automaticamente algoritmos de Redes Bayesianas de Classificação (RBCs). RBCs são modelos de classificação interessantes por serem robustos à falta de dados e incerteza, além de gerarem modelos de classificação interpretáveis. O AE proposto recebe como entrada uma lista de componentes principais de algoritmos de RBCs e uma (ou um conjunto de) base(s) de dados de entrada. Com esses dois elementos, o AE testa diferentes combinações dos componentes, gerando um algoritmo personalizado para aqueles dados. Para validar o AE, os experimentos foram divididos em três partes principais: (i) testes do método proposto em execuções direcionadas a bases de dados específicas, (ii) testes em execuções direcionadas a conjuntos de bases dados semelhantes e (iii) testes com conjuntos bases de treino e teste distintos. Para a primeira parte, 15 bases de dados da UCI foram escolhidas para testes em bases específicas a fim de gerar algoritmos personalizados para as mesmas. Já para as outras duas partes, concentrouse na aplicação do método proposto em conjuntos de bases de dados. Nesse caso, 20 bases de dados com particularidades distintas foram selecionadas com o intuito de realizar um agrupamento sobre as mesmas, podendo assim criar os diferentes cenários dos experimentos onde exista conjuntos de bases de treinamento e teste. Testes sobre o AE foram realizados considerando as três partes dos experimentos e os resultados foram comparados separadamente com uma busca gulosa e, em seguida, com três algoritmos estado-da-arte de RBCs (Naïve Bayes, TAN e K2). Os resultados mostraram que os algoritmos gerados são competitivos com aqueles dos métodos do estado-da-arte, e que na maioria dos casos o uso de algoritmo evolucionário em invés de uma simples busca gulosa melhora estatisticamente os resultados.
id UFMG_198a7d3cab3b469c2f8b309edc92f3de
oai_identifier_str oai:repositorio.ufmg.br:1843/ESBF-9KHHLU
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Gisele Lobo PappaAdriano César Machado PereiraMarcio Porto BasgaluppRenato Martins AssuncaoAlex Guimarães Cardoso de Sá2019-08-13T21:32:39Z2019-08-13T21:32:39Z2014-02-26http://hdl.handle.net/1843/ESBF-9KHHLUQuando nos deparamos com um novo problema de classificação, selecionar o classificador mais adequado para a tarefa é geralmente um desafio. Isso porque cada base de dados tem características diferentes, que podem tornar um classificador mais apropriado que outro. A área de meta-aprendizado surgiu para resolver este tipo de problema: selecionar um algoritmo para uma determinada base de dados de acordo com um conjunto de meta-dados. Nessa direção, este trabalho propõe uma nova abordagem para construir um algoritmo adaptado à(s) base(s) de dados da aplicação de interesse. Mais especificadamente, propõe-se um algoritmo evolucionário (AE) para evoluir automaticamente algoritmos de Redes Bayesianas de Classificação (RBCs). RBCs são modelos de classificação interessantes por serem robustos à falta de dados e incerteza, além de gerarem modelos de classificação interpretáveis. O AE proposto recebe como entrada uma lista de componentes principais de algoritmos de RBCs e uma (ou um conjunto de) base(s) de dados de entrada. Com esses dois elementos, o AE testa diferentes combinações dos componentes, gerando um algoritmo personalizado para aqueles dados. Para validar o AE, os experimentos foram divididos em três partes principais: (i) testes do método proposto em execuções direcionadas a bases de dados específicas, (ii) testes em execuções direcionadas a conjuntos de bases dados semelhantes e (iii) testes com conjuntos bases de treino e teste distintos. Para a primeira parte, 15 bases de dados da UCI foram escolhidas para testes em bases específicas a fim de gerar algoritmos personalizados para as mesmas. Já para as outras duas partes, concentrouse na aplicação do método proposto em conjuntos de bases de dados. Nesse caso, 20 bases de dados com particularidades distintas foram selecionadas com o intuito de realizar um agrupamento sobre as mesmas, podendo assim criar os diferentes cenários dos experimentos onde exista conjuntos de bases de treinamento e teste. Testes sobre o AE foram realizados considerando as três partes dos experimentos e os resultados foram comparados separadamente com uma busca gulosa e, em seguida, com três algoritmos estado-da-arte de RBCs (Naïve Bayes, TAN e K2). Os resultados mostraram que os algoritmos gerados são competitivos com aqueles dos métodos do estado-da-arte, e que na maioria dos casos o uso de algoritmo evolucionário em invés de uma simples busca gulosa melhora estatisticamente os resultados.When faced with a new machine learning problem, selecting which classifier is the best to perform the task at hand is a very hard problem. The reason for this is the nature of the data used by the classifier, which can differ abruptly from one set to another, consequently affecting the classification outcome. In other words, the same classifier can not be adapted to different types of data. Most solutions proposed in the literature are based on meta-learning, and use meta-data about the problem to recommend an effective algorithm to solve the task. This work proposes a new approach to this problem: to build an algorithm tailored to the application problem at hand. More specifically, we propose an evolutionary algorithm (EA) to automatically evolve Bayesian Network Classifiers (BNCs). The method receives as input a list of the main components of BNC algorithms, and uses an EA to encode these components. Given an input dataset (or a group of datasets), the method tests different combinations of components and returns the best BNC algorithm to that specific application domain. For testing, we divided the experiments in three main parts: (i) tests in specific datasets domains; (ii) tests directed to sets of similar datasets; (iii) tests directed to sets of distinct datasets. For the first part, 15 UCI datasets were chosen to evaluate the proposed approach and generate tailored algorithms for these datasets. The other two parts focused on applying the EA on sets of datasets. In this case, 20 datasets with distinct characteristics were selected in order to cluster them and, thus, create different experiment scenarios. Tests were performed on the AE considering the three parts of experiments and results were compared separately with a greedy search method and, then, with three state-of-art BNC algorithms (Naïve Bayes, TAN and K2). Results showed that the generated BNC algorithms are competitive with those of the state-of-art methods, and in most cases the use of an evolutionary algorithm, rather than a simple greedy search, improved statistically the results.Universidade Federal de Minas GeraisUFMGAlgoritmos de computadorComputaçãoClassificação (Computadores)Redes Bayesianas de ClassificaçãoEvolução automáticaComponentes problema de classificaçãoAlgoritmo evolucionárioEvolução automática de algoritmos de redes bayesianas de classificaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALalexguimaraes_vers_ocorreta.pdfapplication/pdf2398040https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/1/alexguimaraes_vers_ocorreta.pdf2f7b7677593de0366f968b19000fbda3MD51TEXTalexguimaraes_vers_ocorreta.pdf.txtalexguimaraes_vers_ocorreta.pdf.txtExtracted texttext/plain229216https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/2/alexguimaraes_vers_ocorreta.pdf.txtf3a6e9f4abdddf1f6a047a7cebf4fce2MD521843/ESBF-9KHHLU2019-11-14 17:07:23.299oai:repositorio.ufmg.br:1843/ESBF-9KHHLURepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T20:07:23Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Evolução automática de algoritmos de redes bayesianas de classificação
title Evolução automática de algoritmos de redes bayesianas de classificação
spellingShingle Evolução automática de algoritmos de redes bayesianas de classificação
Alex Guimarães Cardoso de Sá
Redes Bayesianas de Classificação
Evolução automática
Componentes problema de classificação
Algoritmo evolucionário
Algoritmos de computador
Computação
Classificação (Computadores)
title_short Evolução automática de algoritmos de redes bayesianas de classificação
title_full Evolução automática de algoritmos de redes bayesianas de classificação
title_fullStr Evolução automática de algoritmos de redes bayesianas de classificação
title_full_unstemmed Evolução automática de algoritmos de redes bayesianas de classificação
title_sort Evolução automática de algoritmos de redes bayesianas de classificação
author Alex Guimarães Cardoso de Sá
author_facet Alex Guimarães Cardoso de Sá
author_role author
dc.contributor.advisor1.fl_str_mv Gisele Lobo Pappa
dc.contributor.referee1.fl_str_mv Adriano César Machado Pereira
dc.contributor.referee2.fl_str_mv Marcio Porto Basgalupp
dc.contributor.referee3.fl_str_mv Renato Martins Assuncao
dc.contributor.author.fl_str_mv Alex Guimarães Cardoso de Sá
contributor_str_mv Gisele Lobo Pappa
Adriano César Machado Pereira
Marcio Porto Basgalupp
Renato Martins Assuncao
dc.subject.por.fl_str_mv Redes Bayesianas de Classificação
Evolução automática
Componentes problema de classificação
Algoritmo evolucionário
topic Redes Bayesianas de Classificação
Evolução automática
Componentes problema de classificação
Algoritmo evolucionário
Algoritmos de computador
Computação
Classificação (Computadores)
dc.subject.other.pt_BR.fl_str_mv Algoritmos de computador
Computação
Classificação (Computadores)
description Quando nos deparamos com um novo problema de classificação, selecionar o classificador mais adequado para a tarefa é geralmente um desafio. Isso porque cada base de dados tem características diferentes, que podem tornar um classificador mais apropriado que outro. A área de meta-aprendizado surgiu para resolver este tipo de problema: selecionar um algoritmo para uma determinada base de dados de acordo com um conjunto de meta-dados. Nessa direção, este trabalho propõe uma nova abordagem para construir um algoritmo adaptado à(s) base(s) de dados da aplicação de interesse. Mais especificadamente, propõe-se um algoritmo evolucionário (AE) para evoluir automaticamente algoritmos de Redes Bayesianas de Classificação (RBCs). RBCs são modelos de classificação interessantes por serem robustos à falta de dados e incerteza, além de gerarem modelos de classificação interpretáveis. O AE proposto recebe como entrada uma lista de componentes principais de algoritmos de RBCs e uma (ou um conjunto de) base(s) de dados de entrada. Com esses dois elementos, o AE testa diferentes combinações dos componentes, gerando um algoritmo personalizado para aqueles dados. Para validar o AE, os experimentos foram divididos em três partes principais: (i) testes do método proposto em execuções direcionadas a bases de dados específicas, (ii) testes em execuções direcionadas a conjuntos de bases dados semelhantes e (iii) testes com conjuntos bases de treino e teste distintos. Para a primeira parte, 15 bases de dados da UCI foram escolhidas para testes em bases específicas a fim de gerar algoritmos personalizados para as mesmas. Já para as outras duas partes, concentrouse na aplicação do método proposto em conjuntos de bases de dados. Nesse caso, 20 bases de dados com particularidades distintas foram selecionadas com o intuito de realizar um agrupamento sobre as mesmas, podendo assim criar os diferentes cenários dos experimentos onde exista conjuntos de bases de treinamento e teste. Testes sobre o AE foram realizados considerando as três partes dos experimentos e os resultados foram comparados separadamente com uma busca gulosa e, em seguida, com três algoritmos estado-da-arte de RBCs (Naïve Bayes, TAN e K2). Os resultados mostraram que os algoritmos gerados são competitivos com aqueles dos métodos do estado-da-arte, e que na maioria dos casos o uso de algoritmo evolucionário em invés de uma simples busca gulosa melhora estatisticamente os resultados.
publishDate 2014
dc.date.issued.fl_str_mv 2014-02-26
dc.date.accessioned.fl_str_mv 2019-08-13T21:32:39Z
dc.date.available.fl_str_mv 2019-08-13T21:32:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/ESBF-9KHHLU
url http://hdl.handle.net/1843/ESBF-9KHHLU
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/1/alexguimaraes_vers_ocorreta.pdf
https://repositorio.ufmg.br/bitstream/1843/ESBF-9KHHLU/2/alexguimaraes_vers_ocorreta.pdf.txt
bitstream.checksum.fl_str_mv 2f7b7677593de0366f968b19000fbda3
f3a6e9f4abdddf1f6a047a7cebf4fce2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801677224436301824