Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso embargado |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/64183 |
Resumo: | Os algoritmos convencionais de agrupamento difuso c-means baseados no Kernel gaus- siano requerem a seleção de hiperparâmetros de largura, que são dependentes dos dados e fixos durante a execução completa. Não apenas isso, mas esses parâmetros são os mesmos para cada variável da base de dados. Ou seja, as variáveis possuem a mesma importância para o algoritmo de agrupamento, independente da sua relevância para uma melhor separação. Esta tese propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distância e computação automática dos parâmetros de largura. Esses parâmetros de largura são modificados a cada iteração dos algoritmos e são diferentes para cada variável e grupo. Dessa forma, esses algoritmos podem re-escalar as variáveis independentemente, destacando aquelas que são mais relevantes para a atividade de agrupamento. Algoritmos de agrupamento difuso com regularização se tornaram populares graças a sua alta performance em da- dos de agrupamento de larga-escala, robustez para inicialização, e baixa complexidade computacional. Já que os parâmetros de largura das variáveis também podem ser con- trolados pela entropia, então esta tese também propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distân- cia e computação automática dos parâmetros de largura a partir da regularização da entropia. Para demonstrar a sua utilidade, os algoritmos propostos foram comparados com o algoritmo convencional KFCM-K em 40 bases de dados e com o método de Monte Carlo em 7 base sintéticas, utilizando métricas para as partições exclusiva e difusa dos elementos. Dessa forma, foi possível determinar que os métodos propostos se comportam de forma competitiva em relação aos modelos de referência. |
| id |
UFPE_e406fc945160ee93bad9e7a0fdbd630d |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/64183 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de larguraAgrupamento particionalGrupos difusosKernelização da métrica de distânciaKernel gaussianoParâmetros de larguraRegularização da entropiaOs algoritmos convencionais de agrupamento difuso c-means baseados no Kernel gaus- siano requerem a seleção de hiperparâmetros de largura, que são dependentes dos dados e fixos durante a execução completa. Não apenas isso, mas esses parâmetros são os mesmos para cada variável da base de dados. Ou seja, as variáveis possuem a mesma importância para o algoritmo de agrupamento, independente da sua relevância para uma melhor separação. Esta tese propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distância e computação automática dos parâmetros de largura. Esses parâmetros de largura são modificados a cada iteração dos algoritmos e são diferentes para cada variável e grupo. Dessa forma, esses algoritmos podem re-escalar as variáveis independentemente, destacando aquelas que são mais relevantes para a atividade de agrupamento. Algoritmos de agrupamento difuso com regularização se tornaram populares graças a sua alta performance em da- dos de agrupamento de larga-escala, robustez para inicialização, e baixa complexidade computacional. Já que os parâmetros de largura das variáveis também podem ser con- trolados pela entropia, então esta tese também propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distân- cia e computação automática dos parâmetros de largura a partir da regularização da entropia. Para demonstrar a sua utilidade, os algoritmos propostos foram comparados com o algoritmo convencional KFCM-K em 40 bases de dados e com o método de Monte Carlo em 7 base sintéticas, utilizando métricas para as partições exclusiva e difusa dos elementos. Dessa forma, foi possível determinar que os métodos propostos se comportam de forma competitiva em relação aos modelos de referência.The conventional Gaussian kernel fuzzy c-means clustering algorithms require selecting the width hyper-parameter, which is data-dependent and fixed for the entire execution. Not only that, but these parameters are the same for every variable from the dataset. Therefore, the variables have the same importance in the clustering task, independent of how relevant they are for a better separation. This thesis proposes Gaussian kernel fuzzy c-means algorithms with kernelization of the metric and automated computation of width parameters. These width parameters change at each iteration of the algorithms and vary from each variable and from each cluster. Thus, this algorithms can re- scale the variables differently, highlighting those that are relevant to the clustering task. Fuzzy clustering algorithms with regularization have become popular due to their high performance in large-scale data clustering, robustness for initialization, and low computational complexity. Because the width parameters of the variables can also be controlled by entropy, so this thesis also proposes the Gaussian kernel fuzzy c- means algorithms with kernelization of the metric and automated computation of width parameters through entropy regularization. To demonstrate their usefulness, the proposed algorithms are compared with the conventional KFCM-K algorithm on 40 datasets and applying the Monter Carlo method with 7 synthetic datasets, using metrics for both the hard and fuzzy partitions. That way, it was possible to determine that the proposed methods behave competitively in relation to reference models.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Ciencia da ComputacaoCARVALHO, Francisco de Assis Tenorio dehttp://lattes.cnpq.br/0683753132362016http://lattes.cnpq.br/3909162572623711SIMÕES, Eduardo Cintra2025-07-08T14:10:13Z2025-07-08T14:10:13Z2024-08-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfSIMÕES, Eduardo Cintra. Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura. 2024. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2024.https://repositorio.ufpe.br/handle/123456789/64183porhttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/embargoedAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2025-07-13T17:30:30Zoai:repositorio.ufpe.br:123456789/64183Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212025-07-13T17:30:30Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.none.fl_str_mv |
Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura |
| title |
Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura |
| spellingShingle |
Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura SIMÕES, Eduardo Cintra Agrupamento particional Grupos difusos Kernelização da métrica de distância Kernel gaussiano Parâmetros de largura Regularização da entropia |
| title_short |
Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura |
| title_full |
Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura |
| title_fullStr |
Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura |
| title_full_unstemmed |
Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura |
| title_sort |
Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura |
| author |
SIMÕES, Eduardo Cintra |
| author_facet |
SIMÕES, Eduardo Cintra |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
CARVALHO, Francisco de Assis Tenorio de http://lattes.cnpq.br/0683753132362016 http://lattes.cnpq.br/3909162572623711 |
| dc.contributor.author.fl_str_mv |
SIMÕES, Eduardo Cintra |
| dc.subject.por.fl_str_mv |
Agrupamento particional Grupos difusos Kernelização da métrica de distância Kernel gaussiano Parâmetros de largura Regularização da entropia |
| topic |
Agrupamento particional Grupos difusos Kernelização da métrica de distância Kernel gaussiano Parâmetros de largura Regularização da entropia |
| description |
Os algoritmos convencionais de agrupamento difuso c-means baseados no Kernel gaus- siano requerem a seleção de hiperparâmetros de largura, que são dependentes dos dados e fixos durante a execução completa. Não apenas isso, mas esses parâmetros são os mesmos para cada variável da base de dados. Ou seja, as variáveis possuem a mesma importância para o algoritmo de agrupamento, independente da sua relevância para uma melhor separação. Esta tese propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distância e computação automática dos parâmetros de largura. Esses parâmetros de largura são modificados a cada iteração dos algoritmos e são diferentes para cada variável e grupo. Dessa forma, esses algoritmos podem re-escalar as variáveis independentemente, destacando aquelas que são mais relevantes para a atividade de agrupamento. Algoritmos de agrupamento difuso com regularização se tornaram populares graças a sua alta performance em da- dos de agrupamento de larga-escala, robustez para inicialização, e baixa complexidade computacional. Já que os parâmetros de largura das variáveis também podem ser con- trolados pela entropia, então esta tese também propõe algoritmos de agrupamento difuso c-means baseados no Kernel gaussiano com kernelização da métrica de distân- cia e computação automática dos parâmetros de largura a partir da regularização da entropia. Para demonstrar a sua utilidade, os algoritmos propostos foram comparados com o algoritmo convencional KFCM-K em 40 bases de dados e com o método de Monte Carlo em 7 base sintéticas, utilizando métricas para as partições exclusiva e difusa dos elementos. Dessa forma, foi possível determinar que os métodos propostos se comportam de forma competitiva em relação aos modelos de referência. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-08-30 2025-07-08T14:10:13Z 2025-07-08T14:10:13Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
SIMÕES, Eduardo Cintra. Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura. 2024. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2024. https://repositorio.ufpe.br/handle/123456789/64183 |
| identifier_str_mv |
SIMÕES, Eduardo Cintra. Agrupamento difuso c-means com kernel gaussiano, kernelização da métrica, cálculo e regularização automática dos parâmetros de largura. 2024. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2024. |
| url |
https://repositorio.ufpe.br/handle/123456789/64183 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/embargoedAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
embargoedAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1856041853561864192 |