Classificação baseada em protótipos de decisão mais próximos e distâncias adaptativas

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: SILVA FILHO, Telmo de Menezes e
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/29396
Resumo: A aprendizagem de máquina é um ramo da inteligência artificial, cujo objetivo é desenvolver algoritmos capazes de aprender a partir de dados a fim de realizar diferentes tarefas, como por exemplo, classificação e estimação de probabilidades de classe supervisionadas e semi-supervisionadas. Essas tarefas podem ser realizadas de forma intuitiva e com predições interpretáveis pelos métodos baseados em protótipos. Quanto a esses métodos, é preciso considerar dois pontos importantes: (i) são suscetíveis a mínimos locais causados pela má inicialização dos protótipos e (ii) são sensíveis à distância escolhida para comparar protótipos e instâncias, pois essa precisa ser capaz de modelar a variabilidade interna dos protótipos e classes para alcançar um bom desempenho. Assim, este trabalho visa a explorar a versatilidade dos métodos baseados em protótipos para apresentar soluções para as tarefas de classificação supervisionada e semi-supervisionada, ao mesmo tempo em que apresenta soluções para os dois pontos mencionados acima, principalmente na forma de novas distâncias adaptativas. Para a primeira tarefa, este trabalho introduz um novo método que apresenta uma solução para o problema dos mínimos locais e usa uma distância generalizada aplicada a dados intervalares, capaz de modelar classes desbalanceadas e sub-regiões de classe de diferentes formas e tamanhos. Esse algoritmo também é capaz de eliminar protótipos inativos e selecionar atributos automaticamente. Para a tarefa de classificação semi-supervisionada, este trabalho propõe um algoritmo de propagação de rótulos através de grafos que, ao contrário dos métodos presentes na literatura, não foca apenas na classificação de instâncias não-rotuladas, mas sim na predição de probabilidades de classe apropriadas. Este trabalho também provê uma análise de desempenho dos dois métodos propostos, comparando-os a métodos existentes, em termos de taxa de erro de classificação (primeiro método) e funções de escore apropriadas (segundo método), usando conjuntos de dados reais e sintéticos. Experimentos mostram que ambos os métodos apresentam desempenhos significativamente superiores ao estado da arte.
id UFPE_837f7f3eed5610e2d214c4bb92c96258
oai_identifier_str oai:repositorio.ufpe.br:123456789/29396
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling Classificação baseada em protótipos de decisão mais próximos e distâncias adaptativasInteligência computacionalAprendizado de computadorInteligência artificialA aprendizagem de máquina é um ramo da inteligência artificial, cujo objetivo é desenvolver algoritmos capazes de aprender a partir de dados a fim de realizar diferentes tarefas, como por exemplo, classificação e estimação de probabilidades de classe supervisionadas e semi-supervisionadas. Essas tarefas podem ser realizadas de forma intuitiva e com predições interpretáveis pelos métodos baseados em protótipos. Quanto a esses métodos, é preciso considerar dois pontos importantes: (i) são suscetíveis a mínimos locais causados pela má inicialização dos protótipos e (ii) são sensíveis à distância escolhida para comparar protótipos e instâncias, pois essa precisa ser capaz de modelar a variabilidade interna dos protótipos e classes para alcançar um bom desempenho. Assim, este trabalho visa a explorar a versatilidade dos métodos baseados em protótipos para apresentar soluções para as tarefas de classificação supervisionada e semi-supervisionada, ao mesmo tempo em que apresenta soluções para os dois pontos mencionados acima, principalmente na forma de novas distâncias adaptativas. Para a primeira tarefa, este trabalho introduz um novo método que apresenta uma solução para o problema dos mínimos locais e usa uma distância generalizada aplicada a dados intervalares, capaz de modelar classes desbalanceadas e sub-regiões de classe de diferentes formas e tamanhos. Esse algoritmo também é capaz de eliminar protótipos inativos e selecionar atributos automaticamente. Para a tarefa de classificação semi-supervisionada, este trabalho propõe um algoritmo de propagação de rótulos através de grafos que, ao contrário dos métodos presentes na literatura, não foca apenas na classificação de instâncias não-rotuladas, mas sim na predição de probabilidades de classe apropriadas. Este trabalho também provê uma análise de desempenho dos dois métodos propostos, comparando-os a métodos existentes, em termos de taxa de erro de classificação (primeiro método) e funções de escore apropriadas (segundo método), usando conjuntos de dados reais e sintéticos. Experimentos mostram que ambos os métodos apresentam desempenhos significativamente superiores ao estado da arte.CNPqMachine learning is a subfield of artificial intelligence, whose goal is to develop algorithms that are able to learn from data in order to perform different tasks, such as supervised and semi-supervised classification and probability estimation. These tasks can be performed intuitively and with interpretable predictions by prototype-based methods. Regarding these methods, one needs to consider two important points: (i) they are susceptible to local minima due to poor prototype initialization and (ii) they are sensible to the distance that is chosen to compare prototypes and samples, because it has to be able to model the internal variability of prototypes and classes to perform well. Therefore, this work aims at exploring the versatility of prototype-based methods to provide solutions to the tasks of supervised and semi-supervised classification, while also presenting solutions to both points mentioned above, especially regarding new adaptive distances. For the first task, this work introduces a new method that provides a solution to the local minima problem and uses a generalized distance applied to interval data, which is capable of modeling imbalanced classes and class subregions with different shapes and sizes. This algorithm is also capable of eliminating inactive prototypes and automatically selecting features. For the semi-supervised classification task, this work proposes a graph-based label propagation algorithm, which, in contrast to existing methods from literature, does not focus only on unlabeled instance classification, but on the prediction of proper class probabilities. This work also provides a performance analysis of the two proposed methods, comparing them to existing algorithms, in terms of classification error rate (first method) and proper scoring rules (second method), using real and synthetic datasets. Experiments show that both methods perform significantly better than the state of the art.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Ciencia da ComputacaoSOUZA, Renata Maria Cardoso Rodrigues dePRUDÊNCIO, Ricardo Bastos Cavalcantehttp://lattes.cnpq.br/4640945954423515http://lattes.cnpq.br/9289080285504453SILVA FILHO, Telmo de Menezes e2019-02-21T22:42:28Z2019-02-21T22:42:28Z2017-09-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://repositorio.ufpe.br/handle/123456789/29396porAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2019-10-25T11:11:27Zoai:repositorio.ufpe.br:123456789/29396Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T11:11:27Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.none.fl_str_mv Classificação baseada em protótipos de decisão mais próximos e distâncias adaptativas
title Classificação baseada em protótipos de decisão mais próximos e distâncias adaptativas
spellingShingle Classificação baseada em protótipos de decisão mais próximos e distâncias adaptativas
SILVA FILHO, Telmo de Menezes e
Inteligência computacional
Aprendizado de computador
Inteligência artificial
title_short Classificação baseada em protótipos de decisão mais próximos e distâncias adaptativas
title_full Classificação baseada em protótipos de decisão mais próximos e distâncias adaptativas
title_fullStr Classificação baseada em protótipos de decisão mais próximos e distâncias adaptativas
title_full_unstemmed Classificação baseada em protótipos de decisão mais próximos e distâncias adaptativas
title_sort Classificação baseada em protótipos de decisão mais próximos e distâncias adaptativas
author SILVA FILHO, Telmo de Menezes e
author_facet SILVA FILHO, Telmo de Menezes e
author_role author
dc.contributor.none.fl_str_mv SOUZA, Renata Maria Cardoso Rodrigues de
PRUDÊNCIO, Ricardo Bastos Cavalcante
http://lattes.cnpq.br/4640945954423515
http://lattes.cnpq.br/9289080285504453
dc.contributor.author.fl_str_mv SILVA FILHO, Telmo de Menezes e
dc.subject.por.fl_str_mv Inteligência computacional
Aprendizado de computador
Inteligência artificial
topic Inteligência computacional
Aprendizado de computador
Inteligência artificial
description A aprendizagem de máquina é um ramo da inteligência artificial, cujo objetivo é desenvolver algoritmos capazes de aprender a partir de dados a fim de realizar diferentes tarefas, como por exemplo, classificação e estimação de probabilidades de classe supervisionadas e semi-supervisionadas. Essas tarefas podem ser realizadas de forma intuitiva e com predições interpretáveis pelos métodos baseados em protótipos. Quanto a esses métodos, é preciso considerar dois pontos importantes: (i) são suscetíveis a mínimos locais causados pela má inicialização dos protótipos e (ii) são sensíveis à distância escolhida para comparar protótipos e instâncias, pois essa precisa ser capaz de modelar a variabilidade interna dos protótipos e classes para alcançar um bom desempenho. Assim, este trabalho visa a explorar a versatilidade dos métodos baseados em protótipos para apresentar soluções para as tarefas de classificação supervisionada e semi-supervisionada, ao mesmo tempo em que apresenta soluções para os dois pontos mencionados acima, principalmente na forma de novas distâncias adaptativas. Para a primeira tarefa, este trabalho introduz um novo método que apresenta uma solução para o problema dos mínimos locais e usa uma distância generalizada aplicada a dados intervalares, capaz de modelar classes desbalanceadas e sub-regiões de classe de diferentes formas e tamanhos. Esse algoritmo também é capaz de eliminar protótipos inativos e selecionar atributos automaticamente. Para a tarefa de classificação semi-supervisionada, este trabalho propõe um algoritmo de propagação de rótulos através de grafos que, ao contrário dos métodos presentes na literatura, não foca apenas na classificação de instâncias não-rotuladas, mas sim na predição de probabilidades de classe apropriadas. Este trabalho também provê uma análise de desempenho dos dois métodos propostos, comparando-os a métodos existentes, em termos de taxa de erro de classificação (primeiro método) e funções de escore apropriadas (segundo método), usando conjuntos de dados reais e sintéticos. Experimentos mostram que ambos os métodos apresentam desempenhos significativamente superiores ao estado da arte.
publishDate 2017
dc.date.none.fl_str_mv 2017-09-22
2019-02-21T22:42:28Z
2019-02-21T22:42:28Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/29396
url https://repositorio.ufpe.br/handle/123456789/29396
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1856042016611237888