Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos

Detalhes bibliográficos
Ano de defesa: 2011
Autor(a) principal: Castelo Fernández, César Christian
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: [s.n.]
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/20.500.12733/1615770
Resumo: Orientadores: Pedro Jussieu de Rezende, Alexandre Xavier Falcão
id UNICAMP-30_d819138beb8860a09c1362e484451bdb
oai_identifier_str oai::803009
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimosNew learning algorithms for pattern classification using optimum-path forestReconhecimento de padrõesAprendizado de máquinaTeoria dos grafosValores estranhos (Estatistica)Processamento de imagensVisão por computadorPattern recognitionMachine learningGraph theoryOutliers (Statistics)Image processingMachine visionOrientadores: Pedro Jussieu de Rezende, Alexandre Xavier FalcãoDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: O Reconhecimento de Padrões pode ser definido como a capacidade de identificar a classe de algum objeto dentre um dado conjunto de classes, baseando-se na informação fornecida por amostras conhecidas (conjunto de treinamento). Nesta dissertação, o foco de estudo é o paradigma de classificação supervisionada, no qual se conhece a classe de todas as amostras utilizadas para o projeto do classificador. Especificamente, estuda-se o Classificador baseado em Floresta de Caminhos Ótimos (Optimum-Path Forest - OPF) e propõem três novos algoritmos de aprendizado, os quais representam melhorias em comparação com o Classificador OPF tradicional. Primeiramente, é desenvolvida uma metodologia simples, porém efetiva, para detecção de outliers no conjunto de treinamento. O método visa uma melhoria na acurácia do Classificador OPF tradicional através da troca desses outliers por novas amostras do conjunto de avaliação e sua exclusão do processo de aprendizagem. Os outliers são detectados computando uma penalidade para cada amostra baseada nos seus acertos e erros na classificação, o qual pode ser medido através do número de falsos positivos/negativos e verdadeiros positivos/negativos obtidos por cada amostra. O método obteve uma melhoria na acurácia em comparação com o OPF tradicional, com apenas um pequeno aumento no tempo de treinamento. Em seguida, é proposto um aprimoramento ao primeiro algoritmo, que permite detectar com maior precisão os outliers presentes na base de dados. Neste caso, utiliza-se a informação de falsos positivos/negativos e verdadeiros positivos/negativos de cada amostra para explorar intrinsecamente as relações de adjacência de cada amostra e determinar se é outlier. Uma inovação do método é que não existe necessidade de se computar explicitamente tal adjacência, como é feito nas técnicas tradicionais, o qual pode ser inviável para grandes bases de dados. O método obteve uma boa taxa de detecção de outliers e um tempo de treinamento muito baixo em vista do tamanho das bases de dados utilizadas. Finalmente, é abordado o problema de se selecionar um úmero tão pequeno quanto possível de amostras de treinamento e se obter a maior acurácia possível sobre o conjunto de teste. Propõe-se uma metodologia que se inicia com um pequeno conjunto de treinamento e, através da classificação de um conjunto bem maior de avaliação, aprende quais amostras são as mais representativas para o conjunto de treinamento. Os resultados mostram que é possível obter uma melhor acurácia que o Classificador OPF tradicional ao custo de um pequeno incremento no tempo de treinamento, mantendo, no entanto, o conjunto de treinamento menor que o conjunto inicial, o que significa um tempo de teste reduzidoAbstract: Pattern recognition can be defined as the capacity of identifying the class of an object among a given set of classes, based on the information provided by known samples (training set). In this dissertation, the focus is on the supervised classification approach, for which we are given the classes of all the samples used in the design of the classifier. Specifically, the Optimum-Path Forest Classifier (OPF) is studied and three new learning algorithms are proposed, which represent improvements to the traditional OPF classifier. First of all, a simple yet effective methodology is developed for the detection of outliers in a training set. This method aims at improving OPF's accuracy through the swapping of outliers for new samples from the evaluating set and their exclusion from the learning process itself. Outliers are detected by computing a penalty for each sample based on its classification-hits and -misses, which can be measured through the number of false positive/negatives and true positives/negatives obtained by each sample. The method achieved an accuracy improvement over the traditional OPF, with just a slight increment in the training time. An improvement to the first algorithm is proposed, allowing for a more precise detection of outliers present in the dataset. In this case, the information on the number of false positive/negatives and true positives/negatives of each sample is used to explore the adjacency relations of each sample and determine whether it is an outlier. The method's merit is that there is no need of explicitly computing an actual vicinity, as the traditional techniques do, which could be infeasible for large datasets. The method achieves a good outlier detection rate and a very low training time, considering the size of the datasets. Finally, the problem of choosing a small number of training samples while achieving a high accuracy in the testing set is addressed. We propose a methodology which starts with a small training set and, through the classification of a much larger evaluating set, it learns which are the most representative samples for the training set. The results show that it is possible to achieve higher accuracy than the traditional OPF's at the cost of a slight increment in the training time, preserving, however, a smaller training set than the original one, leading to a lower testing timeMestradoCiência da ComputaçãoMestre em Ciência da Computação[s.n.]Rezende, Pedro Jussieu de, 1955-Falcão, Alexandre Xavier, 1966-Hashimoto, Ronaldo FumioPedrini, HélioUniversidade Estadual de Campinas. Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASCastelo Fernández, César Christian20112011-11-05T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf82 p. : il.https://hdl.handle.net/20.500.12733/1615770CASTELO FERNÁNDEZ, César Christian. Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos. 2011. 82 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1615770. Acesso em: 25 abr. 2024.https://repositorio.unicamp.br/acervo/detalhe/803009porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T06:19:58Zoai::803009Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T06:19:58Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos
New learning algorithms for pattern classification using optimum-path forest
title Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos
spellingShingle Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos
Castelo Fernández, César Christian
Reconhecimento de padrões
Aprendizado de máquina
Teoria dos grafos
Valores estranhos (Estatistica)
Processamento de imagens
Visão por computador
Pattern recognition
Machine learning
Graph theory
Outliers (Statistics)
Image processing
Machine vision
title_short Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos
title_full Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos
title_fullStr Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos
title_full_unstemmed Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos
title_sort Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos
author Castelo Fernández, César Christian
author_facet Castelo Fernández, César Christian
author_role author
dc.contributor.none.fl_str_mv Rezende, Pedro Jussieu de, 1955-
Falcão, Alexandre Xavier, 1966-
Hashimoto, Ronaldo Fumio
Pedrini, Hélio
Universidade Estadual de Campinas. Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Castelo Fernández, César Christian
dc.subject.por.fl_str_mv Reconhecimento de padrões
Aprendizado de máquina
Teoria dos grafos
Valores estranhos (Estatistica)
Processamento de imagens
Visão por computador
Pattern recognition
Machine learning
Graph theory
Outliers (Statistics)
Image processing
Machine vision
topic Reconhecimento de padrões
Aprendizado de máquina
Teoria dos grafos
Valores estranhos (Estatistica)
Processamento de imagens
Visão por computador
Pattern recognition
Machine learning
Graph theory
Outliers (Statistics)
Image processing
Machine vision
description Orientadores: Pedro Jussieu de Rezende, Alexandre Xavier Falcão
publishDate 2011
dc.date.none.fl_str_mv 2011
2011-11-05T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1615770
CASTELO FERNÁNDEZ, César Christian. Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos. 2011. 82 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1615770. Acesso em: 25 abr. 2024.
url https://hdl.handle.net/20.500.12733/1615770
identifier_str_mv CASTELO FERNÁNDEZ, César Christian. Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos. 2011. 82 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1615770. Acesso em: 25 abr. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/803009
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
82 p. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1797405452444631040