Indução de árvore de decisão utilizando meta-aprendizado
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/59/59143/tde-05122022-145141/ |
Resumo: | Os modelos de aprendizado simbólico destacam-se dentro da área do Aprendizado de Máquina devido às suas representações serem interpretáveis pelo homem. Uma característica deste modelo é ser excessivamente responsivo ao conjunto de exemplos utilizados, o que pode resultar em uma piora significativa no desempenho caso haja pequenas variações no conjunto de treinamento. A estratégia de combinação de modelos (ensembles) apresenta-se como uma alternativa para melhorar a precisão e a estabilidade dos modelos. A estratégia consiste em gerar diferentes modelos por meio do mesmo conjunto de treinamento e combiná-los em um único modelo final, geralmente, por meio de um processo de votação. Uma característica indesejável da estratégia ensemble é a complexidade do modelo final, já que este é formado por um conjunto de modelos. Nesta pesquisa é proposta uma abordagem para induzir uma meta-árvore de decisão com base na combinação das árvores de decisão de uma floresta (Random Forest). Experimentos foram realizados em 150 datasets de diferentes domínios. A abordagem proposta aplicada em 43 datasets categóricos dos 150 analisados, obteve um desempenho tão bom quanto uma floresta com 128 árvores sem diferenças estatisticamente significativas. Trata-se de um resultado interessante, levando em consideração a interpretabilidade fornecida por uma única árvore de decisão como modelo resultante. |
| id |
USP_7e79442bf5d4f0ceae1bef779a13632d |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-05122022-145141 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Indução de árvore de decisão utilizando meta-aprendizadoDecision tree induction using meta-learningÁrvore de decisãoCombinação de modelosDecision treeMeta-aprendizadoMeta-learningModel combinationOs modelos de aprendizado simbólico destacam-se dentro da área do Aprendizado de Máquina devido às suas representações serem interpretáveis pelo homem. Uma característica deste modelo é ser excessivamente responsivo ao conjunto de exemplos utilizados, o que pode resultar em uma piora significativa no desempenho caso haja pequenas variações no conjunto de treinamento. A estratégia de combinação de modelos (ensembles) apresenta-se como uma alternativa para melhorar a precisão e a estabilidade dos modelos. A estratégia consiste em gerar diferentes modelos por meio do mesmo conjunto de treinamento e combiná-los em um único modelo final, geralmente, por meio de um processo de votação. Uma característica indesejável da estratégia ensemble é a complexidade do modelo final, já que este é formado por um conjunto de modelos. Nesta pesquisa é proposta uma abordagem para induzir uma meta-árvore de decisão com base na combinação das árvores de decisão de uma floresta (Random Forest). Experimentos foram realizados em 150 datasets de diferentes domínios. A abordagem proposta aplicada em 43 datasets categóricos dos 150 analisados, obteve um desempenho tão bom quanto uma floresta com 128 árvores sem diferenças estatisticamente significativas. Trata-se de um resultado interessante, levando em consideração a interpretabilidade fornecida por uma única árvore de decisão como modelo resultante.Symbolic learning models stand out within the Machine Learning area due to their representations being human-interpretable. A characteristic of this model is that it is excessively responsive to the set of examples used, which can result in a significant decrease in performance if there are small variations in the training set. The strategy of combining models (ensembles) is presented as an alternative to improve the accuracy and stability of the models. The strategy is to generate different models using the same training set and combine them into a single final model, usually through a voting process. An undesirable characteristic of the ensemble strategy is the complexity of the final model, since it is formed by a set of models. In this research, an approach is proposed to induce a meta-decision tree based on the combination of decision trees of a forest (Random Forest). Experiments were performed on 150 datasets from different domains. The proposed approach applied to 43 categorical datasets of the 150 analyzed, performed as well as a forest with 128 trees without statistically significant differences. This is an interesting result, considering the interpretability provided by a single decision tree as the resulting model.Biblioteca Digitais de Teses e Dissertações da USPBaranauskas, José AugustoFerreira, Caíque Augusto2022-09-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/59/59143/tde-05122022-145141/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-12-12T12:38:51Zoai:teses.usp.br:tde-05122022-145141Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-12-12T12:38:51Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Indução de árvore de decisão utilizando meta-aprendizado Decision tree induction using meta-learning |
| title |
Indução de árvore de decisão utilizando meta-aprendizado |
| spellingShingle |
Indução de árvore de decisão utilizando meta-aprendizado Ferreira, Caíque Augusto Árvore de decisão Combinação de modelos Decision tree Meta-aprendizado Meta-learning Model combination |
| title_short |
Indução de árvore de decisão utilizando meta-aprendizado |
| title_full |
Indução de árvore de decisão utilizando meta-aprendizado |
| title_fullStr |
Indução de árvore de decisão utilizando meta-aprendizado |
| title_full_unstemmed |
Indução de árvore de decisão utilizando meta-aprendizado |
| title_sort |
Indução de árvore de decisão utilizando meta-aprendizado |
| author |
Ferreira, Caíque Augusto |
| author_facet |
Ferreira, Caíque Augusto |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Baranauskas, José Augusto |
| dc.contributor.author.fl_str_mv |
Ferreira, Caíque Augusto |
| dc.subject.por.fl_str_mv |
Árvore de decisão Combinação de modelos Decision tree Meta-aprendizado Meta-learning Model combination |
| topic |
Árvore de decisão Combinação de modelos Decision tree Meta-aprendizado Meta-learning Model combination |
| description |
Os modelos de aprendizado simbólico destacam-se dentro da área do Aprendizado de Máquina devido às suas representações serem interpretáveis pelo homem. Uma característica deste modelo é ser excessivamente responsivo ao conjunto de exemplos utilizados, o que pode resultar em uma piora significativa no desempenho caso haja pequenas variações no conjunto de treinamento. A estratégia de combinação de modelos (ensembles) apresenta-se como uma alternativa para melhorar a precisão e a estabilidade dos modelos. A estratégia consiste em gerar diferentes modelos por meio do mesmo conjunto de treinamento e combiná-los em um único modelo final, geralmente, por meio de um processo de votação. Uma característica indesejável da estratégia ensemble é a complexidade do modelo final, já que este é formado por um conjunto de modelos. Nesta pesquisa é proposta uma abordagem para induzir uma meta-árvore de decisão com base na combinação das árvores de decisão de uma floresta (Random Forest). Experimentos foram realizados em 150 datasets de diferentes domínios. A abordagem proposta aplicada em 43 datasets categóricos dos 150 analisados, obteve um desempenho tão bom quanto uma floresta com 128 árvores sem diferenças estatisticamente significativas. Trata-se de um resultado interessante, levando em consideração a interpretabilidade fornecida por uma única árvore de decisão como modelo resultante. |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-09-20 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-05122022-145141/ |
| url |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-05122022-145141/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1815257932223217664 |