Multi-class discriminant analysis based on support vector machine ensembles

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Filisbino, Tiene Andre
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
Brasil
LNCC
Programa de Pós-Graduação em Modelagem Computacional
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.lncc.br/handle/tede/311
Resumo: Many areas such as pattern recognition and analysis of image databases require the managing of datasets originally represented in high dimensional spaces. Besides, the original data representation suffers, in general, of redundancy and noise. Thus, we must compute a more suitable feature space, reducing both the dimension and redundancy of representation in order to minimize the computational cost of further operations. Once a feature space has been defined there is the necessity of determining the most important discriminant features for pattern recognition tasks, like classification. Discriminant analysis techniques, which in the literature are known as discriminant functions, seek to solve this type of problem. Thus, the goal of the proposed thesis is to develop discriminant analysis methods for multi-class classification problems. The key idea is to combine N classifiers to form a global discriminant function, which allows to rank the components of the space according to the importance of each feature to the classification. To achieve this goal, we use separate hyperplanes computed by linear support vector machines (SVMs) or defined by a Kernel SVM (KSVM) decision boundary, and use the ensemble methodology known as AdaBoost.M2 to combine the weak linear classifiers. More specifically, our proposed techniques seek to generate multi-class versions of the Discriminant Principal Component Analysis (DPCA), which was originally developed for binary problems. In this work, principal components analysis (PCA), Convolutional neural networks (CNNs) and texture descriptors, are used to create feature spaces that serve as input to perform discriminant analysis. In terms of application for validation of the proposed techniques our focus are human face and texture images obtained from granite tiles. Our experimental results have shown that the features selected by our proposal allow higher recognition rates using less features when compared with related methods as well as robust reconstruction and interpretation of the data. Further works will be undertaken by exploring deep learning methods, color images, tensor subspaces as well as to improve performance.
id LNCC_30cd4991a7833f4966f738ebf59bce36
oai_identifier_str oai:tede-server.lncc.br:tede/311
network_acronym_str LNCC
network_name_str Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling Multi-class discriminant analysis based on support vector machine ensemblesProbabilidadesEstatísticaAnálise multivariadaCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAOMany areas such as pattern recognition and analysis of image databases require the managing of datasets originally represented in high dimensional spaces. Besides, the original data representation suffers, in general, of redundancy and noise. Thus, we must compute a more suitable feature space, reducing both the dimension and redundancy of representation in order to minimize the computational cost of further operations. Once a feature space has been defined there is the necessity of determining the most important discriminant features for pattern recognition tasks, like classification. Discriminant analysis techniques, which in the literature are known as discriminant functions, seek to solve this type of problem. Thus, the goal of the proposed thesis is to develop discriminant analysis methods for multi-class classification problems. The key idea is to combine N classifiers to form a global discriminant function, which allows to rank the components of the space according to the importance of each feature to the classification. To achieve this goal, we use separate hyperplanes computed by linear support vector machines (SVMs) or defined by a Kernel SVM (KSVM) decision boundary, and use the ensemble methodology known as AdaBoost.M2 to combine the weak linear classifiers. More specifically, our proposed techniques seek to generate multi-class versions of the Discriminant Principal Component Analysis (DPCA), which was originally developed for binary problems. In this work, principal components analysis (PCA), Convolutional neural networks (CNNs) and texture descriptors, are used to create feature spaces that serve as input to perform discriminant analysis. In terms of application for validation of the proposed techniques our focus are human face and texture images obtained from granite tiles. Our experimental results have shown that the features selected by our proposal allow higher recognition rates using less features when compared with related methods as well as robust reconstruction and interpretation of the data. Further works will be undertaken by exploring deep learning methods, color images, tensor subspaces as well as to improve performance.Muitas áreas, como reconhecimento de padrões e análise de bancos de dados de imagens requerem o gerenciamento de conjuntos de dados originalmente representados em espaços de alta dimensionais. Além disso, a representação original dos dados sofre, em geral, de redundância e ruído. Assim, nós devemos determinar um espaço de características mais adequado, reduzindo tanto a dimensão quanto a redundância da representação, a fim de minimizar o custo computacional de outras operações. Uma vez que um espaço de características tenha sido definido há a necessidade de determinar as características discriminantes mais importantes para reconhecimento de padrões, como classificação. Técnicas de análise discriminante, que na literatura são conhecidas como funções discrim- inantes, procuram resolver este tipo de problema. Então, o objetivo da tese proposta é desenvolver métodos de análise discriminante para problemas de classificação multi classe. A ideia chave é combinar N classificadores para formar uma função discriminante global, que permita ordenar as componentes do espaço de acordo com a importância de cada característica para a classificação. Para atingir esse objetivo, nós usamos hiperplanos computados por SVMs lineares (support vector machines) ou definidos por uma superfície de decisão gerada pelo Kernel SVM (Kernel support vector machine) e usamos metodologia ensemble conhecida como AdaBoost.M2 para combinar os classificadores lineares fracos. Mais especificamente, as técnicas propostas procuram gerar versões multi-classe do DPCA ( Discriminant Principal Component Analysis), que foi originalmente desenvolvido para problemas binários. Neste trabalho, PCA (Principal Component Analysis), redes neurais convolucionais (Convolution Neural Networks (CNNs)) e descritores de textura, são usados para criar espaços de características que servem como entrada para realizar análise discrim- inante. Em termos de aplicação, para validação das técnicas propostas, nosso foco são faces humanas e imagens de textura obtidas a partir de ladrilhos de granito. Nossos resultados experimentais mostraram que as características selecionados por nossa proposta permitem taxas de reconhecimento mais altas usando menos características quando comparado com métodos relacionados, bem como reconstrução e interpretação robustas dos dados. Como trabalhos futuros, nós exploraremos técnicas de aprendizagem profunda, imagens coloridas, subespaços tensoriais, bem como buscaremos melhorar o desempenho.Conselho Nacional de Desenvolvimento Científico e TecnológicoLaboratório Nacional de Computação CientíficaCoordenação de Pós-Graduação e Aperfeiçoamento (COPGA)BrasilLNCCPrograma de Pós-Graduação em Modelagem ComputacionalGiraldi, Gilson AntonioGiraldi, Gilson AntonioPorto, Fabio André MachadoFeitosa, Raul QueirozConci, AuraFilisbino, Tiene Andre2023-03-02T18:21:51Z2019-05-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfFILISBINO, T. A. Multi-class discriminant analysis based on support vector machine ensembles. 2019. 114 f. Tese (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2019.https://tede.lncc.br/handle/tede/311enghttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCC2023-03-03T04:06:37Zoai:tede-server.lncc.br:tede/311Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-03-03T04:06:37Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.none.fl_str_mv Multi-class discriminant analysis based on support vector machine ensembles
title Multi-class discriminant analysis based on support vector machine ensembles
spellingShingle Multi-class discriminant analysis based on support vector machine ensembles
Filisbino, Tiene Andre
Probabilidades
Estatística
Análise multivariada
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO
title_short Multi-class discriminant analysis based on support vector machine ensembles
title_full Multi-class discriminant analysis based on support vector machine ensembles
title_fullStr Multi-class discriminant analysis based on support vector machine ensembles
title_full_unstemmed Multi-class discriminant analysis based on support vector machine ensembles
title_sort Multi-class discriminant analysis based on support vector machine ensembles
author Filisbino, Tiene Andre
author_facet Filisbino, Tiene Andre
author_role author
dc.contributor.none.fl_str_mv Giraldi, Gilson Antonio
Giraldi, Gilson Antonio
Porto, Fabio André Machado
Feitosa, Raul Queiroz
Conci, Aura
dc.contributor.author.fl_str_mv Filisbino, Tiene Andre
dc.subject.por.fl_str_mv Probabilidades
Estatística
Análise multivariada
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO
topic Probabilidades
Estatística
Análise multivariada
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO
description Many areas such as pattern recognition and analysis of image databases require the managing of datasets originally represented in high dimensional spaces. Besides, the original data representation suffers, in general, of redundancy and noise. Thus, we must compute a more suitable feature space, reducing both the dimension and redundancy of representation in order to minimize the computational cost of further operations. Once a feature space has been defined there is the necessity of determining the most important discriminant features for pattern recognition tasks, like classification. Discriminant analysis techniques, which in the literature are known as discriminant functions, seek to solve this type of problem. Thus, the goal of the proposed thesis is to develop discriminant analysis methods for multi-class classification problems. The key idea is to combine N classifiers to form a global discriminant function, which allows to rank the components of the space according to the importance of each feature to the classification. To achieve this goal, we use separate hyperplanes computed by linear support vector machines (SVMs) or defined by a Kernel SVM (KSVM) decision boundary, and use the ensemble methodology known as AdaBoost.M2 to combine the weak linear classifiers. More specifically, our proposed techniques seek to generate multi-class versions of the Discriminant Principal Component Analysis (DPCA), which was originally developed for binary problems. In this work, principal components analysis (PCA), Convolutional neural networks (CNNs) and texture descriptors, are used to create feature spaces that serve as input to perform discriminant analysis. In terms of application for validation of the proposed techniques our focus are human face and texture images obtained from granite tiles. Our experimental results have shown that the features selected by our proposal allow higher recognition rates using less features when compared with related methods as well as robust reconstruction and interpretation of the data. Further works will be undertaken by exploring deep learning methods, color images, tensor subspaces as well as to improve performance.
publishDate 2019
dc.date.none.fl_str_mv 2019-05-17
2023-03-02T18:21:51Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv FILISBINO, T. A. Multi-class discriminant analysis based on support vector machine ensembles. 2019. 114 f. Tese (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2019.
https://tede.lncc.br/handle/tede/311
identifier_str_mv FILISBINO, T. A. Multi-class discriminant analysis based on support vector machine ensembles. 2019. 114 f. Tese (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2019.
url https://tede.lncc.br/handle/tede/311
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
Brasil
LNCC
Programa de Pós-Graduação em Modelagem Computacional
publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
Brasil
LNCC
Programa de Pós-Graduação em Modelagem Computacional
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do LNCC
instname:Laboratório Nacional de Computação Científica (LNCC)
instacron:LNCC
instname_str Laboratório Nacional de Computação Científica (LNCC)
instacron_str LNCC
institution LNCC
reponame_str Biblioteca Digital de Teses e Dissertações do LNCC
collection Biblioteca Digital de Teses e Dissertações do LNCC
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv library@lncc.br||library@lncc.br
_version_ 1832738027813732352