Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: SIMÕES, Eduardo Cintra
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso embargado
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/64183
Resumo: Os algoritmos convencionais de agrupamento difuso c-means baseados no Kernel gaus- siano requerem a seleção de hiperparâmetros de largura, que são dependentes dos dados e fixos durante a execução completa. Não apenas isso, mas esses parâmetros são os mesmos para cada variável da base de dados. Ou seja, as variáveis possuem a mesma importância para o algoritmo de agrupamento, independente da sua relevância para uma melhor separação. Esta tese propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distância e computação automática dos parâmetros de largura. Esses parâmetros de largura são modificados a cada iteração dos algoritmos e são diferentes para cada variável e grupo. Dessa forma, esses algoritmos podem re-escalar as variáveis independentemente, destacando aquelas que são mais relevantes para a atividade de agrupamento. Algoritmos de agrupamento difuso com regularização se tornaram populares graças a sua alta performance em da- dos de agrupamento de larga-escala, robustez para inicialização, e baixa complexidade computacional. Já que os parâmetros de largura das variáveis também podem ser con- trolados pela entropia, então esta tese também propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distân- cia e computação automática dos parâmetros de largura a partir da regularização da entropia. Para demonstrar a sua utilidade, os algoritmos propostos foram comparados com o algoritmo convencional KFCM-K em 40 bases de dados e com o método de Monte Carlo em 7 base sintéticas, utilizando métricas para as partições exclusiva e difusa dos elementos. Dessa forma, foi possível determinar que os métodos propostos se comportam de forma competitiva em relação aos modelos de referência.
id UFPE_e406fc945160ee93bad9e7a0fdbd630d
oai_identifier_str oai:repositorio.ufpe.br:123456789/64183
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de larguraAgrupamento particionalGrupos difusosKernelização da métrica de distânciaKernel gaussianoParâmetros de larguraRegularização da entropiaOs algoritmos convencionais de agrupamento difuso c-means baseados no Kernel gaus- siano requerem a seleção de hiperparâmetros de largura, que são dependentes dos dados e fixos durante a execução completa. Não apenas isso, mas esses parâmetros são os mesmos para cada variável da base de dados. Ou seja, as variáveis possuem a mesma importância para o algoritmo de agrupamento, independente da sua relevância para uma melhor separação. Esta tese propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distância e computação automática dos parâmetros de largura. Esses parâmetros de largura são modificados a cada iteração dos algoritmos e são diferentes para cada variável e grupo. Dessa forma, esses algoritmos podem re-escalar as variáveis independentemente, destacando aquelas que são mais relevantes para a atividade de agrupamento. Algoritmos de agrupamento difuso com regularização se tornaram populares graças a sua alta performance em da- dos de agrupamento de larga-escala, robustez para inicialização, e baixa complexidade computacional. Já que os parâmetros de largura das variáveis também podem ser con- trolados pela entropia, então esta tese também propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distân- cia e computação automática dos parâmetros de largura a partir da regularização da entropia. Para demonstrar a sua utilidade, os algoritmos propostos foram comparados com o algoritmo convencional KFCM-K em 40 bases de dados e com o método de Monte Carlo em 7 base sintéticas, utilizando métricas para as partições exclusiva e difusa dos elementos. Dessa forma, foi possível determinar que os métodos propostos se comportam de forma competitiva em relação aos modelos de referência.The conventional Gaussian kernel fuzzy c-means clustering algorithms require selecting the width hyper-parameter, which is data-dependent and fixed for the entire execution. Not only that, but these parameters are the same for every variable from the dataset. Therefore, the variables have the same importance in the clustering task, independent of how relevant they are for a better separation. This thesis proposes Gaussian kernel fuzzy c-means algorithms with kernelization of the metric and automated computation of width parameters. These width parameters change at each iteration of the algorithms and vary from each variable and from each cluster. Thus, this algorithms can re- scale the variables differently, highlighting those that are relevant to the clustering task. Fuzzy clustering algorithms with regularization have become popular due to their high performance in large-scale data clustering, robustness for initialization, and low computational complexity. Because the width parameters of the variables can also be controlled by entropy, so this thesis also proposes the Gaussian kernel fuzzy c- means algorithms with kernelization of the metric and automated computation of width parameters through entropy regularization. To demonstrate their usefulness, the proposed algorithms are compared with the conventional KFCM-K algorithm on 40 datasets and applying the Monter Carlo method with 7 synthetic datasets, using metrics for both the hard and fuzzy partitions. That way, it was possible to determine that the proposed methods behave competitively in relation to reference models.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Ciencia da ComputacaoCARVALHO, Francisco de Assis Tenorio dehttp://lattes.cnpq.br/0683753132362016http://lattes.cnpq.br/3909162572623711SIMÕES, Eduardo Cintra2025-07-08T14:10:13Z2025-07-08T14:10:13Z2024-08-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfSIMÕES, Eduardo Cintra. Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura. 2024. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2024.https://repositorio.ufpe.br/handle/123456789/64183porhttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/embargoedAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2025-07-13T17:30:30Zoai:repositorio.ufpe.br:123456789/64183Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212025-07-13T17:30:30Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.none.fl_str_mv Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura
title Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura
spellingShingle Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura
SIMÕES, Eduardo Cintra
Agrupamento particional
Grupos difusos
Kernelização da métrica de distância
Kernel gaussiano
Parâmetros de largura
Regularização da entropia
title_short Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura
title_full Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura
title_fullStr Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura
title_full_unstemmed Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura
title_sort Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura
author SIMÕES, Eduardo Cintra
author_facet SIMÕES, Eduardo Cintra
author_role author
dc.contributor.none.fl_str_mv CARVALHO, Francisco de Assis Tenorio de
http://lattes.cnpq.br/0683753132362016
http://lattes.cnpq.br/3909162572623711
dc.contributor.author.fl_str_mv SIMÕES, Eduardo Cintra
dc.subject.por.fl_str_mv Agrupamento particional
Grupos difusos
Kernelização da métrica de distância
Kernel gaussiano
Parâmetros de largura
Regularização da entropia
topic Agrupamento particional
Grupos difusos
Kernelização da métrica de distância
Kernel gaussiano
Parâmetros de largura
Regularização da entropia
description Os algoritmos convencionais de agrupamento difuso c-means baseados no Kernel gaus- siano requerem a seleção de hiperparâmetros de largura, que são dependentes dos dados e fixos durante a execução completa. Não apenas isso, mas esses parâmetros são os mesmos para cada variável da base de dados. Ou seja, as variáveis possuem a mesma importância para o algoritmo de agrupamento, independente da sua relevância para uma melhor separação. Esta tese propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distância e computação automática dos parâmetros de largura. Esses parâmetros de largura são modificados a cada iteração dos algoritmos e são diferentes para cada variável e grupo. Dessa forma, esses algoritmos podem re-escalar as variáveis independentemente, destacando aquelas que são mais relevantes para a atividade de agrupamento. Algoritmos de agrupamento difuso com regularização se tornaram populares graças a sua alta performance em da- dos de agrupamento de larga-escala, robustez para inicialização, e baixa complexidade computacional. Já que os parâmetros de largura das variáveis também podem ser con- trolados pela entropia, então esta tese também propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distân- cia e computação automática dos parâmetros de largura a partir da regularização da entropia. Para demonstrar a sua utilidade, os algoritmos propostos foram comparados com o algoritmo convencional KFCM-K em 40 bases de dados e com o método de Monte Carlo em 7 base sintéticas, utilizando métricas para as partições exclusiva e difusa dos elementos. Dessa forma, foi possível determinar que os métodos propostos se comportam de forma competitiva em relação aos modelos de referência.
publishDate 2024
dc.date.none.fl_str_mv 2024-08-30
2025-07-08T14:10:13Z
2025-07-08T14:10:13Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SIMÕES, Eduardo Cintra. Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura. 2024. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2024.
https://repositorio.ufpe.br/handle/123456789/64183
identifier_str_mv SIMÕES, Eduardo Cintra. Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura. 2024. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2024.
url https://repositorio.ufpe.br/handle/123456789/64183
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/embargoedAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv embargoedAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1856041853561864192