Classificação associativa em contextos desbalanceados: aspectos de extração e ranqueamento de regras

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Privatto, Vitor Hugo Monteiro [UNESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/11449/295530
Resumo: Em diversos problemas é interessante o uso de algoritmos inerentemente interpretáveis, uma vez que facilita o entendimento do conhecimento obtido e das predições realizadas. Dentre estes algoritmos encontram-se os classificadores associativos. Estes mesclam as tarefas de associação e classificação e são, portanto, induzidos em etapas, a saber: [a] extração de um conjunto de regras, [b] ranqueamento das regras via medidas objetivas e [c] poda das regras. Embora a classificação associativa, assim como outras técnicas, apresente bons resultados, quando aplicada a problemas desbalanceados o desempenho não se mantém o mesmo. O desbalanceamento ocorre quando o número de instâncias de uma dada classe, chamada de majoritária, supera em muito o número de instâncias da outra classe, chamada de minoritária. Deste modo, soluções vem sendo desenvolvidas de modo a diferenciar corretamente as instâncias de ambas as classes. Assim, este trabalho explora o uso de classificadores associativos quando aplicados em dados desbalanceados via abordagens internas, i.e., em nível de algoritmo. Para tanto, três objetivos são propostos. O primeiro se refere a execução de uma revisão sistemática da literatura a fim de identificar as abordagens internas que vêm sendo adotadas e/ou propostas a fim de fundamentar este trabalho, assim como identificar lacunas e oportunidades na área. Tendo como base as lacunas identificadas, o segundo objetivo explora o impacto das diferentes estratégias levantadas na revisão para se realizar a extração de regras (etapa [a]) visando identificar a mais adequada a ser utilizada no contexto aqui apresentado. Como resultado recomenda-se o uso da estratégia Apriori-C, já adotada pelo CBA2, algoritmo baseline neste contexto. Por fim, o terceiro objetivo é voltado a proposta de um método de seleção dinâmica de medidas objetivas, denominado DyOMS, a fim de ranquear as regras da melhor maneira possível (etapa [b]). A motivação ocorre em função dos trabalhos identificados na revisão utilizarem poucas das medidas objetivas existentes na literatura de maneira estática, i.e., pré-estabelecida, mesmo sabendo-se que não existe uma medida que seja adequada a todas as explorações, já que o seu desempenho depende das próprias características das regras extraídas e, portanto, do conjunto de dados utilizado. Como resultado foi possível notar que o DyOMS se apresenta como uma solução viável ao contexto aqui apresentado em relação a alguns baselines.
id UNSP_5ebf28d467b2e77382ac93b6dcac08ba
oai_identifier_str oai:repositorio.unesp.br:11449/295530
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str
spelling Classificação associativa em contextos desbalanceados: aspectos de extração e ranqueamento de regrasAssociative classification in unbalanced contexts: aspects of rule extraction and rankingClassificadores associativosDados desbalanceadosEstratégias de extração de regrasRanqueamento de regrasSeleção dinâmica de medidas objetivasAssociative classifiersImbalanced dataRule extraction strategiesRules rankingDynamic selection of objective measuresEm diversos problemas é interessante o uso de algoritmos inerentemente interpretáveis, uma vez que facilita o entendimento do conhecimento obtido e das predições realizadas. Dentre estes algoritmos encontram-se os classificadores associativos. Estes mesclam as tarefas de associação e classificação e são, portanto, induzidos em etapas, a saber: [a] extração de um conjunto de regras, [b] ranqueamento das regras via medidas objetivas e [c] poda das regras. Embora a classificação associativa, assim como outras técnicas, apresente bons resultados, quando aplicada a problemas desbalanceados o desempenho não se mantém o mesmo. O desbalanceamento ocorre quando o número de instâncias de uma dada classe, chamada de majoritária, supera em muito o número de instâncias da outra classe, chamada de minoritária. Deste modo, soluções vem sendo desenvolvidas de modo a diferenciar corretamente as instâncias de ambas as classes. Assim, este trabalho explora o uso de classificadores associativos quando aplicados em dados desbalanceados via abordagens internas, i.e., em nível de algoritmo. Para tanto, três objetivos são propostos. O primeiro se refere a execução de uma revisão sistemática da literatura a fim de identificar as abordagens internas que vêm sendo adotadas e/ou propostas a fim de fundamentar este trabalho, assim como identificar lacunas e oportunidades na área. Tendo como base as lacunas identificadas, o segundo objetivo explora o impacto das diferentes estratégias levantadas na revisão para se realizar a extração de regras (etapa [a]) visando identificar a mais adequada a ser utilizada no contexto aqui apresentado. Como resultado recomenda-se o uso da estratégia Apriori-C, já adotada pelo CBA2, algoritmo baseline neste contexto. Por fim, o terceiro objetivo é voltado a proposta de um método de seleção dinâmica de medidas objetivas, denominado DyOMS, a fim de ranquear as regras da melhor maneira possível (etapa [b]). A motivação ocorre em função dos trabalhos identificados na revisão utilizarem poucas das medidas objetivas existentes na literatura de maneira estática, i.e., pré-estabelecida, mesmo sabendo-se que não existe uma medida que seja adequada a todas as explorações, já que o seu desempenho depende das próprias características das regras extraídas e, portanto, do conjunto de dados utilizado. Como resultado foi possível notar que o DyOMS se apresenta como uma solução viável ao contexto aqui apresentado em relação a alguns baselines.In several problems the use of inherently interpretable algorithms is interesting, as it facilitates the understanding of the obtained knowledge and the predictions made. Among these algorithms are the associative classifiers. They merge association and classification tasks and are, therefore, induced in steps, namely: [a] extraction of a set of rules, [b] ranking of the rules via objective measures and [c] pruning of the rules. Although associative classification, like other techniques, presents good results, when applied to imbalanced problems the performance does not remain the same. Imbalance occurs when the number of instances of a given class, named the majority class, greatly exceeds the number of instances of the other class, named the minority class. Therefore, solutions are being developed to correctly differentiate instances of both classes. Thus, this work explores the use of associative classifiers when applied to imbalanced data via internal approaches, i.e., at the algorithm level. To this end, three objectives are proposed. The first refers to the execution of a systematic review of the literature in order to identify the internal approaches that have been adopted and/or proposed in order to support this work, as well as to identify gaps and opportunities in the area. Based on the gaps identified, the second objective explores the impact of the different strategies raised in the review to carry out rule extraction (step [a]) with the aim of identifying the most appropriate one to be used in the context presented here. As a result, it is recommended to use the Apriori-C strategy, already adopted by CBA2, an algorithm baseline in this context. Finally, the third objective is aimed at proposing a dynamic selection method of objective measures, named DyOMS, in order to rank the rules in the best possible way (step [b]). The motivation occurs because the works identified in the review use few of the objective measures existing in the literature in a static way, i.e., pre-established, even knowing that there is no measure that is suitable for all explorations, since its performance depends on the characteristics of the rules extracted and, therefore, on the dataset used. As a result, it was possible to note that DyOMS presents itself as a viable solution to the context presented here in relation to some baselines.Universidade Estadual Paulista (Unesp)Carvalho, Veronica Oliveira de [UNESP]Universidade Estadual Paulista (Unesp)Privatto, Vitor Hugo Monteiro [UNESP]2025-03-17T14:36:52Z2025-03-17T14:36:52Z2025-02-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/11449/29553033004153073P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2025-06-02T18:38:36Zoai:repositorio.unesp.br:11449/295530Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462025-06-02T18:38:36Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Classificação associativa em contextos desbalanceados: aspectos de extração e ranqueamento de regras
Associative classification in unbalanced contexts: aspects of rule extraction and ranking
title Classificação associativa em contextos desbalanceados: aspectos de extração e ranqueamento de regras
spellingShingle Classificação associativa em contextos desbalanceados: aspectos de extração e ranqueamento de regras
Privatto, Vitor Hugo Monteiro [UNESP]
Classificadores associativos
Dados desbalanceados
Estratégias de extração de regras
Ranqueamento de regras
Seleção dinâmica de medidas objetivas
Associative classifiers
Imbalanced data
Rule extraction strategies
Rules ranking
Dynamic selection of objective measures
title_short Classificação associativa em contextos desbalanceados: aspectos de extração e ranqueamento de regras
title_full Classificação associativa em contextos desbalanceados: aspectos de extração e ranqueamento de regras
title_fullStr Classificação associativa em contextos desbalanceados: aspectos de extração e ranqueamento de regras
title_full_unstemmed Classificação associativa em contextos desbalanceados: aspectos de extração e ranqueamento de regras
title_sort Classificação associativa em contextos desbalanceados: aspectos de extração e ranqueamento de regras
author Privatto, Vitor Hugo Monteiro [UNESP]
author_facet Privatto, Vitor Hugo Monteiro [UNESP]
author_role author
dc.contributor.none.fl_str_mv Carvalho, Veronica Oliveira de [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Privatto, Vitor Hugo Monteiro [UNESP]
dc.subject.por.fl_str_mv Classificadores associativos
Dados desbalanceados
Estratégias de extração de regras
Ranqueamento de regras
Seleção dinâmica de medidas objetivas
Associative classifiers
Imbalanced data
Rule extraction strategies
Rules ranking
Dynamic selection of objective measures
topic Classificadores associativos
Dados desbalanceados
Estratégias de extração de regras
Ranqueamento de regras
Seleção dinâmica de medidas objetivas
Associative classifiers
Imbalanced data
Rule extraction strategies
Rules ranking
Dynamic selection of objective measures
description Em diversos problemas é interessante o uso de algoritmos inerentemente interpretáveis, uma vez que facilita o entendimento do conhecimento obtido e das predições realizadas. Dentre estes algoritmos encontram-se os classificadores associativos. Estes mesclam as tarefas de associação e classificação e são, portanto, induzidos em etapas, a saber: [a] extração de um conjunto de regras, [b] ranqueamento das regras via medidas objetivas e [c] poda das regras. Embora a classificação associativa, assim como outras técnicas, apresente bons resultados, quando aplicada a problemas desbalanceados o desempenho não se mantém o mesmo. O desbalanceamento ocorre quando o número de instâncias de uma dada classe, chamada de majoritária, supera em muito o número de instâncias da outra classe, chamada de minoritária. Deste modo, soluções vem sendo desenvolvidas de modo a diferenciar corretamente as instâncias de ambas as classes. Assim, este trabalho explora o uso de classificadores associativos quando aplicados em dados desbalanceados via abordagens internas, i.e., em nível de algoritmo. Para tanto, três objetivos são propostos. O primeiro se refere a execução de uma revisão sistemática da literatura a fim de identificar as abordagens internas que vêm sendo adotadas e/ou propostas a fim de fundamentar este trabalho, assim como identificar lacunas e oportunidades na área. Tendo como base as lacunas identificadas, o segundo objetivo explora o impacto das diferentes estratégias levantadas na revisão para se realizar a extração de regras (etapa [a]) visando identificar a mais adequada a ser utilizada no contexto aqui apresentado. Como resultado recomenda-se o uso da estratégia Apriori-C, já adotada pelo CBA2, algoritmo baseline neste contexto. Por fim, o terceiro objetivo é voltado a proposta de um método de seleção dinâmica de medidas objetivas, denominado DyOMS, a fim de ranquear as regras da melhor maneira possível (etapa [b]). A motivação ocorre em função dos trabalhos identificados na revisão utilizarem poucas das medidas objetivas existentes na literatura de maneira estática, i.e., pré-estabelecida, mesmo sabendo-se que não existe uma medida que seja adequada a todas as explorações, já que o seu desempenho depende das próprias características das regras extraídas e, portanto, do conjunto de dados utilizado. Como resultado foi possível notar que o DyOMS se apresenta como uma solução viável ao contexto aqui apresentado em relação a alguns baselines.
publishDate 2025
dc.date.none.fl_str_mv 2025-03-17T14:36:52Z
2025-03-17T14:36:52Z
2025-02-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/11449/295530
33004153073P2
url https://hdl.handle.net/11449/295530
identifier_str_mv 33004153073P2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv repositoriounesp@unesp.br
_version_ 1854955046930743296