Extração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASP

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Pavanelli, Genival
Orientador(a): Steiner, Maria Teresinha Arns, 1957-
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1884/36129
Resumo: Orientadora: Prof. Dr. Maria Teresinha Arns Steiner
id UFPR_fc34a6b75b5b5a362e726cb53f7db65f
oai_identifier_str oai:acervodigital.ufpr.br:1884/36129
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str
spelling Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Métodos Numéricos em EngenhariaSteiner, Maria Teresinha Arns, 1957-Pavanelli, Genival2025-05-12T18:23:31Z2025-05-12T18:23:31Z2014https://hdl.handle.net/1884/36129Orientadora: Prof. Dr. Maria Teresinha Arns SteinerTese (doutorado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Métodos Numéricos em Engenharia. Defesa: Curitiba, 28/05/2014Inclui referênciasResumo: O processo de gestão do conhecimento nas mais diversas áreas – seja em indústrias, hospitais, escolas, bancos, dentre outros – exige constante atenção à multiplicidade de decisões a serem tomadas acerca de suas atividades. Para a tomada de decisões, faz-se necessária a utilização de técnicas científicas que lhes garantam a máxima acurácia. O presente trabalho faz o uso de ferramentas matemáticas que cumpram a finalidade de extração de conhecimento de base de dados. O objetivo é a proposição de uma nova meta-heurística, baseada no procedimento GRASP (Greedy Randomized Adaptive Search Procedure) como ferramenta de Data Mining (DM), no contexto do processo denominado Knowledge Discovery in Databases (KDD) para a tarefa de extração de regras de classificação em bases de dados. Assim, a metodologia aqui proposta possui três grandes blocos segundo o processo KDD: pré-processamento dos dados, no qual todos os atributos previsores são codificados de maneira a corresponder a uma ou mais coordenadas binárias; aplicação da meta-heurística propriamente dita para extração de regras de classificação; construção do classificador, momento em que as regras extraídas são ordenadas segundo critérios baseados no "fator de suporte" e na "confiança". A fim de validar esta proposta, a metodologia foi implementada e aplicada a sete bases de dados distintas, com um número variável de instâncias, de atributos e de classes. Os resultados obtidos apresentam elevada precisão preditiva, atingindo, por exemplo, 98% de acurácia para a base de dados zoo, 97% para a base íris e 94% para a base wine. Buscando ratificar os resultados obtidos, foram estabelecidas comparações entre a meta-heurística aqui proposta e os algoritmos BFTree, RepTree e J4.8, todos de árvore de decisão. A partir destas comparações, observa-se que em seis das sete bases analisadas a proposta implementada é superior, em termos de acurácia, aos algoritmos de árvore de decisão utilizados. Desta forma, conclui-se que a meta-heurística proposta atende os pré-requisitos para a tarefa de extração de conhecimento de base de dados.Abstract: The process of knowledge management in several areas – existing in industries, hospitals, schools, banks, among others - requires constant attention to the multiplicity of decisions to be made about their activities. In order to make decisions, it is necessary to use scientific techniques that will ensure their maximum accuracy. This study makes use of mathematical tools that meet the purpose of extracting knowledge from a database. The aim is to propose a new metaheuristic based on GRASP (Greedy Randomized Adaptive Search Procedure) procedure as a tool of Data Mining (DM) within the context of the process called Knowledge Discovery in Databases (KDD) for the task of extracting classification rules in databases. Thus, the methodology proposed herein has three large blocks according to the KDD process: data pre-processing, in which all predictor attributes are encoded to correspond to one or more binary coordinates; application of the metaheuristic itself for extracting classification rules; construction of the classifier, when the extracted rules are ordered in accordance with criteria based on "support factor" and "trust." In order to validate this proposal, the methodology has been implemented and applied to seven different databases, with a variable number of instances, attributes and classes. The results show high predictive accuracy, reaching, for example, 98% accuracy in the zoo database, 97% for the iris base and 94% for the wine base. Seeking to ratify the results, comparisons between the metaheuristic proposed herein and BFTree, RepTree and J4.8 decision tree algorithms were established. Based on these comparisons, it is observed that in six out of seven analyzed bases the implemented proposal is superior, in terms of accuracy, to the used decision tree algorithms. In this way, it is concluded that the meta-heuristic proposed meets the prerequisites for the task of extracting knowledge from a database.130f. : il. algumas color., grafs., tabs.application/pdfDisponível em formato digitalAnálise numéricaOtimização combinatoriaMineração de dados (Computação)PercepçãoExtração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASPinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - T - GENIVAL PAVANELLI.pdfapplication/pdf2424846https://acervodigital.ufpr.br/bitstream/1884/36129/1/R%20-%20T%20-%20GENIVAL%20PAVANELLI.pdffd40fbe21112fdadcdd651e9116742c6MD51open accessTEXTR - T - GENIVAL PAVANELLI.pdf.txtExtracted Texttext/plain212944https://acervodigital.ufpr.br/bitstream/1884/36129/2/R%20-%20T%20-%20GENIVAL%20PAVANELLI.pdf.txt46e29d63f7ea0728f8bc7d2e54a8cd9cMD52open accessTHUMBNAILR - T - GENIVAL PAVANELLI.pdf.jpgGenerated Thumbnailimage/jpeg1223https://acervodigital.ufpr.br/bitstream/1884/36129/3/R%20-%20T%20-%20GENIVAL%20PAVANELLI.pdf.jpgcf262302d7768fa26805f5ee271f90a2MD53open access1884/361292025-05-12 15:23:31.768open accessoai:acervodigital.ufpr.br:1884/36129Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082025-05-12T18:23:31Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Extração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASP
title Extração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASP
spellingShingle Extração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASP
Pavanelli, Genival
Análise numérica
Otimização combinatoria
Mineração de dados (Computação)
Percepção
title_short Extração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASP
title_full Extração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASP
title_fullStr Extração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASP
title_full_unstemmed Extração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASP
title_sort Extração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASP
author Pavanelli, Genival
author_facet Pavanelli, Genival
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Métodos Numéricos em Engenharia
dc.contributor.advisor1.fl_str_mv Steiner, Maria Teresinha Arns, 1957-
dc.contributor.author.fl_str_mv Pavanelli, Genival
contributor_str_mv Steiner, Maria Teresinha Arns, 1957-
dc.subject.por.fl_str_mv Análise numérica
Otimização combinatoria
Mineração de dados (Computação)
Percepção
topic Análise numérica
Otimização combinatoria
Mineração de dados (Computação)
Percepção
description Orientadora: Prof. Dr. Maria Teresinha Arns Steiner
publishDate 2014
dc.date.issued.fl_str_mv 2014
dc.date.accessioned.fl_str_mv 2025-05-12T18:23:31Z
dc.date.available.fl_str_mv 2025-05-12T18:23:31Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/36129
url https://hdl.handle.net/1884/36129
dc.language.iso.fl_str_mv por
language por
dc.relation.pt_BR.fl_str_mv Disponível em formato digital
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 130f. : il. algumas color., grafs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/36129/1/R%20-%20T%20-%20GENIVAL%20PAVANELLI.pdf
https://acervodigital.ufpr.br/bitstream/1884/36129/2/R%20-%20T%20-%20GENIVAL%20PAVANELLI.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/36129/3/R%20-%20T%20-%20GENIVAL%20PAVANELLI.pdf.jpg
bitstream.checksum.fl_str_mv fd40fbe21112fdadcdd651e9116742c6
46e29d63f7ea0728f8bc7d2e54a8cd9c
cf262302d7768fa26805f5ee271f90a2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv informacaodigital@ufpr.br
_version_ 1847526222047739904