Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: Pereira, Luís Augusto Martins [UNESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/122160
Resumo: In conventional problems of pattern recognition, given a set of classes, each instance of the problem is associated with one and only one class. However, some real classification problems have instances that can be associated with more than one class at the same time, these problems are denoted as classification with multilabel. Among such problems, we highlight movies and music categorization, document classification, functional gene analysis etc. Nevertheless, the classification problems with multilabel are not directly treatable by conventional techniques, which explains the interest of pattern recognition community in these types of problems. Although many methods have been proposed in the literature, there is still much to be explored, especially in the use of novel conventional machine learning algorithms adapted or not to problems with multlabels. The Optimum-Path Forest (OPF) classifier is a supervised and deterministic algorithm applied to conventional classification problems, however, it has been not investigated in problems with multilabel. In this context, we investigated in this work the application of OPF-based classifiers on multilabel problems. We analyzed two versions of OPF-based classi ers: (i) the traditional one based on complete graph and (ii) the one based on k-nearest neighbors graph (OPFkNN). For manipulation of multilabel datasets, we used two transformation methods, the Binary Relevance and Label Powerset. We also proposed some changes in the training and classification phases of OPFkNN aiming to achieve better results when combined it with transformation methods. Experiments performed in seven public datasets showed that changes in OPFkNN improve outcomes. Comparison with the J48 classifier, ...
id UNSP_7adb87724e5a5ef53c84a474cf8ab406
oai_identifier_str oai:repositorio.unesp.br:11449/122160
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str
spelling Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimosComputação - MatematicaProcessamento de imagens - Tecnicas digitaisReconhecimento de padrõesFloresta de caminhos ótimosArvores (Teoria dos grafos)Computer science MathematicsIn conventional problems of pattern recognition, given a set of classes, each instance of the problem is associated with one and only one class. However, some real classification problems have instances that can be associated with more than one class at the same time, these problems are denoted as classification with multilabel. Among such problems, we highlight movies and music categorization, document classification, functional gene analysis etc. Nevertheless, the classification problems with multilabel are not directly treatable by conventional techniques, which explains the interest of pattern recognition community in these types of problems. Although many methods have been proposed in the literature, there is still much to be explored, especially in the use of novel conventional machine learning algorithms adapted or not to problems with multlabels. The Optimum-Path Forest (OPF) classifier is a supervised and deterministic algorithm applied to conventional classification problems, however, it has been not investigated in problems with multilabel. In this context, we investigated in this work the application of OPF-based classifiers on multilabel problems. We analyzed two versions of OPF-based classi ers: (i) the traditional one based on complete graph and (ii) the one based on k-nearest neighbors graph (OPFkNN). For manipulation of multilabel datasets, we used two transformation methods, the Binary Relevance and Label Powerset. We also proposed some changes in the training and classification phases of OPFkNN aiming to achieve better results when combined it with transformation methods. Experiments performed in seven public datasets showed that changes in OPFkNN improve outcomes. Comparison with the J48 classifier, ...Em problemas convencionais de reconhecimento de padrões, dado um conjunto de classes, cada instância do problema e associada a uma e somente uma classe. No entanto, alguns problemas reais de classificaço apresentam instâncias que podem ser associadas a mais de uma classe simultaneamente, esses problemas são denotados como classificação com múltiplos rótulos. Entre problemas dessa natureza, podemos destacar categorização de filmes e músicas, classificação de documentos, análise funcional de genes etc. Contudo, os problemas de classificação com múltiplos rótulos não são diretamente tratáveis por técnicas convencionais, o que justifica o interesse da comunidade de reconhecimento de padrões nesses tipos de problemas. Embora muitos métodos tenham sido propostos na literatura, há ainda muito a ser explorado, principalmente no uso de novos algoritmos convencionais de aprendizado de máquinas adaptados ou não aos problemas com múltiplos rótulos. O classificador supervisionado Floresta de Caminhos Otimos (Optimum- Path Forest - OPF) e um algoritmo determinístico aplicado a problemas convencionais de classificação, no entanto, ainda não foi investigado em problemas com múltiplos rótulos. Nesse contexto, investigamos neste trabalho a aplicação de classificadores baseados em OPF em problemas de múltiplos rótulos. Analisamos duas versões do classificador OPF: (i) a tradicional baseada em grafo completo e (ii) a versão baseada no grafo k-vizinhos mais próximos (OPFkNN). Para manipulação das bases com múltiplos rótulos, utilizamos dois métodos de transformação de problemas, o Binary Relevance e Label Powerset. Propusemos também algumas modificações nas fases de treinamento e classificação do OPFkNN com o objetivo de melhor os resultados desse classificador combinado a métodos de transformação de problemas. Os experimentos realizados em sete bases de dados públicas mostraram que as modifica ções ...Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)FAPESP: 2011/14094-1Universidade Estadual Paulista (Unesp)Papa, João Paulo [UNESP]Universidade Estadual Paulista (Unesp)Pereira, Luís Augusto Martins [UNESP]2015-04-09T12:28:25Z2015-04-09T12:28:25Z2013-02-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis64 f. : il. color., tabs.application/pdfPEREIRA, Luís Augusto Martins. Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos. 2014. 64 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2014.http://hdl.handle.net/11449/122160000811257000811257.pdf33004153073P2Alephreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESPporinfo:eu-repo/semantics/openAccess2024-11-05T13:26:02Zoai:repositorio.unesp.br:11449/122160Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462024-11-05T13:26:02Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos
title Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos
spellingShingle Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos
Pereira, Luís Augusto Martins [UNESP]
Computação - Matematica
Processamento de imagens - Tecnicas digitais
Reconhecimento de padrões
Floresta de caminhos ótimos
Arvores (Teoria dos grafos)
Computer science Mathematics
title_short Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos
title_full Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos
title_fullStr Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos
title_full_unstemmed Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos
title_sort Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos
author Pereira, Luís Augusto Martins [UNESP]
author_facet Pereira, Luís Augusto Martins [UNESP]
author_role author
dc.contributor.none.fl_str_mv Papa, João Paulo [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Pereira, Luís Augusto Martins [UNESP]
dc.subject.por.fl_str_mv Computação - Matematica
Processamento de imagens - Tecnicas digitais
Reconhecimento de padrões
Floresta de caminhos ótimos
Arvores (Teoria dos grafos)
Computer science Mathematics
topic Computação - Matematica
Processamento de imagens - Tecnicas digitais
Reconhecimento de padrões
Floresta de caminhos ótimos
Arvores (Teoria dos grafos)
Computer science Mathematics
description In conventional problems of pattern recognition, given a set of classes, each instance of the problem is associated with one and only one class. However, some real classification problems have instances that can be associated with more than one class at the same time, these problems are denoted as classification with multilabel. Among such problems, we highlight movies and music categorization, document classification, functional gene analysis etc. Nevertheless, the classification problems with multilabel are not directly treatable by conventional techniques, which explains the interest of pattern recognition community in these types of problems. Although many methods have been proposed in the literature, there is still much to be explored, especially in the use of novel conventional machine learning algorithms adapted or not to problems with multlabels. The Optimum-Path Forest (OPF) classifier is a supervised and deterministic algorithm applied to conventional classification problems, however, it has been not investigated in problems with multilabel. In this context, we investigated in this work the application of OPF-based classifiers on multilabel problems. We analyzed two versions of OPF-based classi ers: (i) the traditional one based on complete graph and (ii) the one based on k-nearest neighbors graph (OPFkNN). For manipulation of multilabel datasets, we used two transformation methods, the Binary Relevance and Label Powerset. We also proposed some changes in the training and classification phases of OPFkNN aiming to achieve better results when combined it with transformation methods. Experiments performed in seven public datasets showed that changes in OPFkNN improve outcomes. Comparison with the J48 classifier, ...
publishDate 2013
dc.date.none.fl_str_mv 2013-02-25
2015-04-09T12:28:25Z
2015-04-09T12:28:25Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PEREIRA, Luís Augusto Martins. Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos. 2014. 64 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2014.
http://hdl.handle.net/11449/122160
000811257
000811257.pdf
33004153073P2
identifier_str_mv PEREIRA, Luís Augusto Martins. Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos. 2014. 64 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2014.
000811257
000811257.pdf
33004153073P2
url http://hdl.handle.net/11449/122160
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 64 f. : il. color., tabs.
application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv Aleph
reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv repositoriounesp@unesp.br
_version_ 1854955029061959680