Indução de árvore de decisão utilizando meta-aprendizado

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Ferreira, Caíque Augusto
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/59/59143/tde-05122022-145141/
Resumo: Os modelos de aprendizado simbólico destacam-se dentro da área do Aprendizado de Máquina devido às suas representações serem interpretáveis pelo homem. Uma característica deste modelo é ser excessivamente responsivo ao conjunto de exemplos utilizados, o que pode resultar em uma piora significativa no desempenho caso haja pequenas variações no conjunto de treinamento. A estratégia de combinação de modelos (ensembles) apresenta-se como uma alternativa para melhorar a precisão e a estabilidade dos modelos. A estratégia consiste em gerar diferentes modelos por meio do mesmo conjunto de treinamento e combiná-los em um único modelo final, geralmente, por meio de um processo de votação. Uma característica indesejável da estratégia ensemble é a complexidade do modelo final, já que este é formado por um conjunto de modelos. Nesta pesquisa é proposta uma abordagem para induzir uma meta-árvore de decisão com base na combinação das árvores de decisão de uma floresta (Random Forest). Experimentos foram realizados em 150 datasets de diferentes domínios. A abordagem proposta aplicada em 43 datasets categóricos dos 150 analisados, obteve um desempenho tão bom quanto uma floresta com 128 árvores sem diferenças estatisticamente significativas. Trata-se de um resultado interessante, levando em consideração a interpretabilidade fornecida por uma única árvore de decisão como modelo resultante.
id USP_7e79442bf5d4f0ceae1bef779a13632d
oai_identifier_str oai:teses.usp.br:tde-05122022-145141
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Indução de árvore de decisão utilizando meta-aprendizadoDecision tree induction using meta-learningÁrvore de decisãoCombinação de modelosDecision treeMeta-aprendizadoMeta-learningModel combinationOs modelos de aprendizado simbólico destacam-se dentro da área do Aprendizado de Máquina devido às suas representações serem interpretáveis pelo homem. Uma característica deste modelo é ser excessivamente responsivo ao conjunto de exemplos utilizados, o que pode resultar em uma piora significativa no desempenho caso haja pequenas variações no conjunto de treinamento. A estratégia de combinação de modelos (ensembles) apresenta-se como uma alternativa para melhorar a precisão e a estabilidade dos modelos. A estratégia consiste em gerar diferentes modelos por meio do mesmo conjunto de treinamento e combiná-los em um único modelo final, geralmente, por meio de um processo de votação. Uma característica indesejável da estratégia ensemble é a complexidade do modelo final, já que este é formado por um conjunto de modelos. Nesta pesquisa é proposta uma abordagem para induzir uma meta-árvore de decisão com base na combinação das árvores de decisão de uma floresta (Random Forest). Experimentos foram realizados em 150 datasets de diferentes domínios. A abordagem proposta aplicada em 43 datasets categóricos dos 150 analisados, obteve um desempenho tão bom quanto uma floresta com 128 árvores sem diferenças estatisticamente significativas. Trata-se de um resultado interessante, levando em consideração a interpretabilidade fornecida por uma única árvore de decisão como modelo resultante.Symbolic learning models stand out within the Machine Learning area due to their representations being human-interpretable. A characteristic of this model is that it is excessively responsive to the set of examples used, which can result in a significant decrease in performance if there are small variations in the training set. The strategy of combining models (ensembles) is presented as an alternative to improve the accuracy and stability of the models. The strategy is to generate different models using the same training set and combine them into a single final model, usually through a voting process. An undesirable characteristic of the ensemble strategy is the complexity of the final model, since it is formed by a set of models. In this research, an approach is proposed to induce a meta-decision tree based on the combination of decision trees of a forest (Random Forest). Experiments were performed on 150 datasets from different domains. The proposed approach applied to 43 categorical datasets of the 150 analyzed, performed as well as a forest with 128 trees without statistically significant differences. This is an interesting result, considering the interpretability provided by a single decision tree as the resulting model.Biblioteca Digitais de Teses e Dissertações da USPBaranauskas, José AugustoFerreira, Caíque Augusto2022-09-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/59/59143/tde-05122022-145141/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-12-12T12:38:51Zoai:teses.usp.br:tde-05122022-145141Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-12-12T12:38:51Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Indução de árvore de decisão utilizando meta-aprendizado
Decision tree induction using meta-learning
title Indução de árvore de decisão utilizando meta-aprendizado
spellingShingle Indução de árvore de decisão utilizando meta-aprendizado
Ferreira, Caíque Augusto
Árvore de decisão
Combinação de modelos
Decision tree
Meta-aprendizado
Meta-learning
Model combination
title_short Indução de árvore de decisão utilizando meta-aprendizado
title_full Indução de árvore de decisão utilizando meta-aprendizado
title_fullStr Indução de árvore de decisão utilizando meta-aprendizado
title_full_unstemmed Indução de árvore de decisão utilizando meta-aprendizado
title_sort Indução de árvore de decisão utilizando meta-aprendizado
author Ferreira, Caíque Augusto
author_facet Ferreira, Caíque Augusto
author_role author
dc.contributor.none.fl_str_mv Baranauskas, José Augusto
dc.contributor.author.fl_str_mv Ferreira, Caíque Augusto
dc.subject.por.fl_str_mv Árvore de decisão
Combinação de modelos
Decision tree
Meta-aprendizado
Meta-learning
Model combination
topic Árvore de decisão
Combinação de modelos
Decision tree
Meta-aprendizado
Meta-learning
Model combination
description Os modelos de aprendizado simbólico destacam-se dentro da área do Aprendizado de Máquina devido às suas representações serem interpretáveis pelo homem. Uma característica deste modelo é ser excessivamente responsivo ao conjunto de exemplos utilizados, o que pode resultar em uma piora significativa no desempenho caso haja pequenas variações no conjunto de treinamento. A estratégia de combinação de modelos (ensembles) apresenta-se como uma alternativa para melhorar a precisão e a estabilidade dos modelos. A estratégia consiste em gerar diferentes modelos por meio do mesmo conjunto de treinamento e combiná-los em um único modelo final, geralmente, por meio de um processo de votação. Uma característica indesejável da estratégia ensemble é a complexidade do modelo final, já que este é formado por um conjunto de modelos. Nesta pesquisa é proposta uma abordagem para induzir uma meta-árvore de decisão com base na combinação das árvores de decisão de uma floresta (Random Forest). Experimentos foram realizados em 150 datasets de diferentes domínios. A abordagem proposta aplicada em 43 datasets categóricos dos 150 analisados, obteve um desempenho tão bom quanto uma floresta com 128 árvores sem diferenças estatisticamente significativas. Trata-se de um resultado interessante, levando em consideração a interpretabilidade fornecida por uma única árvore de decisão como modelo resultante.
publishDate 2022
dc.date.none.fl_str_mv 2022-09-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/59/59143/tde-05122022-145141/
url https://www.teses.usp.br/teses/disponiveis/59/59143/tde-05122022-145141/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257932223217664