Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Alves, Alexandre Henrick da Silva
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufu.br/handle/123456789/28888
http://doi.org/10.14393/ufu.di.2020.260
Resumo: The classification task is among the most used in Data Mining and is widely researched nowadays. Several works have already been developed using Genetic Algorithms for classification tasks through the evolution of IF-THEN classification rules and good results have been obtained. These methods often use the same chromosome structure, integer, and real values, and this structure may impose some limitations on their operation. Also, these methods use the same approach for choosing the attributes that will compose the rules. In this work, two new methods were proposed, called BIN-NLCEE and IG-CEE. BIN-NLCEE uses a new chromosomal structure by binary values. The IG-CEE method uses an attribute evaluation measure, called Information Gain, to select the attributes that can compose the rules. Four medical domain datasets were used for BIN-NLCEE validation and 3 synthetic datasets for IG-CEE validation. Both were compared with their source methods and 4 other traditional classifiers (J48, IBK, Naive Bayes and SVM). The results showed that the proposed methods were able to generate better fitness values and better convergence rates.
id UFU_5d190e342fe7199eac258e7f24b89f92
oai_identifier_str oai:repositorio.ufu.br:123456789/28888
network_acronym_str UFU
network_name_str Repositório Institucional da UFU
repository_id_str
spelling Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticosAnalysis of New Approaches to Mining Classification Rules Using Genetic AlgorithmsAlgoritmos GenéticosClassificação de DadosRegras SE-ENTÃOCromossomo BinárioGanho de InformaçãoGenetic AlgorithmsData classificationIF-THEN RulesBinary ChromosomeInformation GainCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThe classification task is among the most used in Data Mining and is widely researched nowadays. Several works have already been developed using Genetic Algorithms for classification tasks through the evolution of IF-THEN classification rules and good results have been obtained. These methods often use the same chromosome structure, integer, and real values, and this structure may impose some limitations on their operation. Also, these methods use the same approach for choosing the attributes that will compose the rules. In this work, two new methods were proposed, called BIN-NLCEE and IG-CEE. BIN-NLCEE uses a new chromosomal structure by binary values. The IG-CEE method uses an attribute evaluation measure, called Information Gain, to select the attributes that can compose the rules. Four medical domain datasets were used for BIN-NLCEE validation and 3 synthetic datasets for IG-CEE validation. Both were compared with their source methods and 4 other traditional classifiers (J48, IBK, Naive Bayes and SVM). The results showed that the proposed methods were able to generate better fitness values and better convergence rates.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorDissertação (Mestrado)A tarefa de classificação está entre as mais utilizadas em Mineração de Dados e é amplamente pesquisada nos dias atuais. Vários trabalhos já foram desenvolvidos utilizando Algoritmos Genéticos para tarefa de classificação através da evolução de regras de classificação do tipo SE-ENTÃO e bons resultados já foram obtidos. Esses métodos geralmente utilizam a mesma estrutura cromossômica, números inteiros e reais, e essa estrutura pode impor algumas limitações na sua operação. Além da representação cromossômica, esses métodos também utilizam a mesma abordagem para escolha dos atributos para compor as regras. Nesse trabalho, foram propostos dois novos métodos, chamados de BIN-NLCEE e IG-CEE. O BIN-NLCEE utiliza uma nova estrutura cromossômica, através de valores binários. Já o método IG-CEE utiliza uma medida de avaliação de atributos, o Information Gain, para selecionar os atributos que podem compor as regras. Foram utilizados 4 datasets de domíno médico para a validação do BIN-NLCEE e 3 datasets sintéticos para a validação do IG-CEE. Ambos foram comparados com seus métodos de origem e outros 4 classificadores tradicionais (J48, IBK, Naive Bayes e SVM). Os resultados mostraram que os métodos propostos foram capazes de gerar melhores valores de fitness e melhores taxas de convergência.Universidade Federal de UberlândiaBrasilPrograma de Pós-graduação em Ciência da ComputaçãoAmaral, Laurence Rodrigues dohttp://lattes.cnpq.br/6978567037098928Carneiro, Murillo GuimarãesXavier, Carolina RIbeiroAlves, Alexandre Henrick da Silva2020-03-04T18:45:40Z2020-03-04T18:45:40Z2020-02-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfALVES, Alexandre Henrick da Silva. Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos. 2020. 134 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2020. DOI http://doi.org/10.14393/ufu.di.2020.260.https://repositorio.ufu.br/handle/123456789/28888http://doi.org/10.14393/ufu.di.2020.260porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2020-03-05T06:12:08Zoai:repositorio.ufu.br:123456789/28888Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2020-03-05T06:12:08Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos
Analysis of New Approaches to Mining Classification Rules Using Genetic Algorithms
title Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos
spellingShingle Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos
Alves, Alexandre Henrick da Silva
Algoritmos Genéticos
Classificação de Dados
Regras SE-ENTÃO
Cromossomo Binário
Ganho de Informação
Genetic Algorithms
Data classification
IF-THEN Rules
Binary Chromosome
Information Gain
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos
title_full Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos
title_fullStr Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos
title_full_unstemmed Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos
title_sort Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos
author Alves, Alexandre Henrick da Silva
author_facet Alves, Alexandre Henrick da Silva
author_role author
dc.contributor.none.fl_str_mv Amaral, Laurence Rodrigues do
http://lattes.cnpq.br/6978567037098928
Carneiro, Murillo Guimarães
Xavier, Carolina RIbeiro
dc.contributor.author.fl_str_mv Alves, Alexandre Henrick da Silva
dc.subject.por.fl_str_mv Algoritmos Genéticos
Classificação de Dados
Regras SE-ENTÃO
Cromossomo Binário
Ganho de Informação
Genetic Algorithms
Data classification
IF-THEN Rules
Binary Chromosome
Information Gain
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Algoritmos Genéticos
Classificação de Dados
Regras SE-ENTÃO
Cromossomo Binário
Ganho de Informação
Genetic Algorithms
Data classification
IF-THEN Rules
Binary Chromosome
Information Gain
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description The classification task is among the most used in Data Mining and is widely researched nowadays. Several works have already been developed using Genetic Algorithms for classification tasks through the evolution of IF-THEN classification rules and good results have been obtained. These methods often use the same chromosome structure, integer, and real values, and this structure may impose some limitations on their operation. Also, these methods use the same approach for choosing the attributes that will compose the rules. In this work, two new methods were proposed, called BIN-NLCEE and IG-CEE. BIN-NLCEE uses a new chromosomal structure by binary values. The IG-CEE method uses an attribute evaluation measure, called Information Gain, to select the attributes that can compose the rules. Four medical domain datasets were used for BIN-NLCEE validation and 3 synthetic datasets for IG-CEE validation. Both were compared with their source methods and 4 other traditional classifiers (J48, IBK, Naive Bayes and SVM). The results showed that the proposed methods were able to generate better fitness values and better convergence rates.
publishDate 2020
dc.date.none.fl_str_mv 2020-03-04T18:45:40Z
2020-03-04T18:45:40Z
2020-02-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ALVES, Alexandre Henrick da Silva. Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos. 2020. 134 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2020. DOI http://doi.org/10.14393/ufu.di.2020.260.
https://repositorio.ufu.br/handle/123456789/28888
http://doi.org/10.14393/ufu.di.2020.260
identifier_str_mv ALVES, Alexandre Henrick da Silva. Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos. 2020. 134 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2020. DOI http://doi.org/10.14393/ufu.di.2020.260.
url https://repositorio.ufu.br/handle/123456789/28888
http://doi.org/10.14393/ufu.di.2020.260
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Ciência da Computação
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFU
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Repositório Institucional da UFU
collection Repositório Institucional da UFU
repository.name.fl_str_mv Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv diinf@dirbi.ufu.br
_version_ 1827843478088843264