Exportação concluída — 

Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Almeida, Thissiany Beatriz
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Ponta Grossa
Brasil
Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/3334
Resumo: The technological advance brings as a consequence a great challenge, which is to find a way to store and extract useful knowledge of a mass of data. An alternative to this scenario is the use of Data Mining tools, being one of the techniques used, the Attribute Selection. The selection of attributes is one of the techniques that can be used to reduce the dimensionality of a database, with the main objective to identify the relevant attributes, thus increasing the predictive power of the classifier. Basically, there are three approaches to Attribute Selection: Embedded, Filter, and Wrapper. In the context of multi-label hierarchical classification, where classes to be predicted are structured according to a hierarchy, few works in the literature present proposals for attribute selection techniques. Thus, in this work, we propose a new method of attribute selection based on the Wrapper approach for global multi-label hierarchical classification. The FSW-HMC method is divided into two main steps: the search strategy (Artificial Immune System and Genetic Algorithm) and subset evaluation (Clus-HMC multi-label hierarchical classifier and AUPRC performance measure). In order to perform the experiments, biological data from 10 Genetic Ontology databases are used, and the classes are structured in a hierarchy in the form of a Directed Acyclic Graph (DAG). When performing the analysis of the generated subsets it can be noted that there was a significant reduction in the number of attributes greater than 63 %. After analyzing the subsets, it can be seen that the difference of the AUPRC measure obtained in the subsets for the base with all the attributes is less than 0.025.
id UTFPR-12_b23801ba505710e14c30dfecc6975b9f
oai_identifier_str oai:repositorio.utfpr.edu.br:1/3334
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótuloFeature selection using the Wrapper approach for hierarchical multi-label classificationMineração de dados (Computação)Banco de dadosAlgorítmos genéticosData miningData basesGenetic algorithmsCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOCiência da ComputaçãoThe technological advance brings as a consequence a great challenge, which is to find a way to store and extract useful knowledge of a mass of data. An alternative to this scenario is the use of Data Mining tools, being one of the techniques used, the Attribute Selection. The selection of attributes is one of the techniques that can be used to reduce the dimensionality of a database, with the main objective to identify the relevant attributes, thus increasing the predictive power of the classifier. Basically, there are three approaches to Attribute Selection: Embedded, Filter, and Wrapper. In the context of multi-label hierarchical classification, where classes to be predicted are structured according to a hierarchy, few works in the literature present proposals for attribute selection techniques. Thus, in this work, we propose a new method of attribute selection based on the Wrapper approach for global multi-label hierarchical classification. The FSW-HMC method is divided into two main steps: the search strategy (Artificial Immune System and Genetic Algorithm) and subset evaluation (Clus-HMC multi-label hierarchical classifier and AUPRC performance measure). In order to perform the experiments, biological data from 10 Genetic Ontology databases are used, and the classes are structured in a hierarchy in the form of a Directed Acyclic Graph (DAG). When performing the analysis of the generated subsets it can be noted that there was a significant reduction in the number of attributes greater than 63 %. After analyzing the subsets, it can be seen that the difference of the AUPRC measure obtained in the subsets for the base with all the attributes is less than 0.025.O avanço tecnológico traz como consequência um grande desafio, que é o de encontrar uma forma de armazenar e extrair conhecimento útil de uma massa de dados. Uma alternativa para esse cenário é a utilização de ferramentas da Mineração de Dados, sendo uma das técnicas empregadas, a Seleção de Atributos. A Seleção de Atributos é uma das técnicas que podem ser utilizadas para a redução de dimensionalidade de base de dados, tendo como objetivo principal identificar os atributos relevantes aumentando assim o poder preditivo do classificador. Basicamente, são três as abordagens para a Seleção de Atributos: Embutida, Filtro e Wrapper. No contexto de classificação hierárquica multirrótulo, onde as classes a serem preditas estão estruturadas de acordo com uma hierarquia, poucos trabalhos na literatura apresentam propostas de técnicas de seleção de atributos. Desse modo, neste trabalho propõe-se um novo método de seleção de atributos baseado na abordagem Wrapper para classificação hierárquica multirrótulo global. O método FSW-HMC é dividido em duas etapas principais, sendo estas a estratégia de busca (Sistema Imunológico Artificial e Algoritmo Genético) e avaliação do subconjunto (classificador hierárquico multirrótulo Clus-HMC e medida de desempenho AUPRC). Para a realização dos experimentos são utilizados dados biológicos de 10 bases de dados da Ontologia Gênica, sendo que as classes das mesmas estão estruturadas em uma hierarquia no formato de um Grafo Acíclico Direcionado (DAG). Ao realizar-se a análise dos subconjuntos gerados pode-se notar que houve uma redução significativa do número de atributos superior a 63%. Após a análise dos subconjuntos, pode-se observar que a diferença da medida AUPRC obtida nos subconjuntos para a base com todos os atributos é inferior a 0,025.Universidade Tecnológica Federal do ParanáPonta GrossaBrasilPrograma de Pós-Graduação em Ciência da ComputaçãoBrasilBorges, Helyane Bronoskihttp://lattes.cnpq.br/8340106221427112Nievola, Júlio CésarAlmeida, Simone deBorges, Helyane BronoskiAlmeida, Thissiany Beatriz2018-08-15T16:28:11Z2018-08-15T16:28:11Z2018-06-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfALMEIDA, Thissiany Beatriz. Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo. 2018. 97 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/3334porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2018-08-15T16:28:11Zoai:repositorio.utfpr.edu.br:1/3334Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2018-08-15T16:28:11Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo
Feature selection using the Wrapper approach for hierarchical multi-label classification
title Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo
spellingShingle Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo
Almeida, Thissiany Beatriz
Mineração de dados (Computação)
Banco de dados
Algorítmos genéticos
Data mining
Data bases
Genetic algorithms
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Ciência da Computação
title_short Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo
title_full Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo
title_fullStr Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo
title_full_unstemmed Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo
title_sort Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo
author Almeida, Thissiany Beatriz
author_facet Almeida, Thissiany Beatriz
author_role author
dc.contributor.none.fl_str_mv Borges, Helyane Bronoski
http://lattes.cnpq.br/8340106221427112
Nievola, Júlio César
Almeida, Simone de
Borges, Helyane Bronoski
dc.contributor.author.fl_str_mv Almeida, Thissiany Beatriz
dc.subject.por.fl_str_mv Mineração de dados (Computação)
Banco de dados
Algorítmos genéticos
Data mining
Data bases
Genetic algorithms
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Ciência da Computação
topic Mineração de dados (Computação)
Banco de dados
Algorítmos genéticos
Data mining
Data bases
Genetic algorithms
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Ciência da Computação
description The technological advance brings as a consequence a great challenge, which is to find a way to store and extract useful knowledge of a mass of data. An alternative to this scenario is the use of Data Mining tools, being one of the techniques used, the Attribute Selection. The selection of attributes is one of the techniques that can be used to reduce the dimensionality of a database, with the main objective to identify the relevant attributes, thus increasing the predictive power of the classifier. Basically, there are three approaches to Attribute Selection: Embedded, Filter, and Wrapper. In the context of multi-label hierarchical classification, where classes to be predicted are structured according to a hierarchy, few works in the literature present proposals for attribute selection techniques. Thus, in this work, we propose a new method of attribute selection based on the Wrapper approach for global multi-label hierarchical classification. The FSW-HMC method is divided into two main steps: the search strategy (Artificial Immune System and Genetic Algorithm) and subset evaluation (Clus-HMC multi-label hierarchical classifier and AUPRC performance measure). In order to perform the experiments, biological data from 10 Genetic Ontology databases are used, and the classes are structured in a hierarchy in the form of a Directed Acyclic Graph (DAG). When performing the analysis of the generated subsets it can be noted that there was a significant reduction in the number of attributes greater than 63 %. After analyzing the subsets, it can be seen that the difference of the AUPRC measure obtained in the subsets for the base with all the attributes is less than 0.025.
publishDate 2018
dc.date.none.fl_str_mv 2018-08-15T16:28:11Z
2018-08-15T16:28:11Z
2018-06-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ALMEIDA, Thissiany Beatriz. Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo. 2018. 97 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2018.
http://repositorio.utfpr.edu.br/jspui/handle/1/3334
identifier_str_mv ALMEIDA, Thissiany Beatriz. Seleção de atributos usando abordagem Wrapper para classificação hierárquica multirrótulo. 2018. 97 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2018.
url http://repositorio.utfpr.edu.br/jspui/handle/1/3334
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
Brasil
Programa de Pós-Graduação em Ciência da Computação
Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
Brasil
Programa de Pós-Graduação em Ciência da Computação
Brasil
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498286559952896