Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Arnaldo, Heloína Alves
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Rio Grande do Norte
BR
UFRN
Programa de Pós-Graduação em Sistemas e Computação
Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/18109
Resumo: Data clustering is applied to various fields such as data mining, image processing and pattern recognition technique. Clustering algorithms splits a data set into clusters such that elements within the same cluster have a high degree of similarity, while elements belonging to different clusters have a high degree of dissimilarity. The Fuzzy C-Means Algorithm (FCM) is a fuzzy clustering algorithm most used and discussed in the literature. The performance of the FCM is strongly affected by the selection of the initial centers of the clusters. Therefore, the choice of a good set of initial cluster centers is very important for the performance of the algorithm. However, in FCM, the choice of initial centers is made randomly, making it difficult to find a good set. This paper proposes three new methods to obtain initial cluster centers, deterministically, the FCM algorithm, and can also be used in variants of the FCM. In this work these initialization methods were applied in variant ckMeans.With the proposed methods, we intend to obtain a set of initial centers which are close to the real cluster centers. With these new approaches startup if you want to reduce the number of iterations to converge these algorithms and processing time without affecting the quality of the cluster or even improve the quality in some cases. Accordingly, cluster validation indices were used to measure the quality of the clusters obtained by the modified FCM and ckMeans algorithms with the proposed initialization methods when applied to various data sets
id UFRN_7d804311e0141a0a467a0791df88a43b
oai_identifier_str oai:repositorio.ufrn.br:123456789/18109
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantesAgrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validaçãoData clustering. Fuzzy C-Means. Cluster centers initialization. Validation indicesCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOData clustering is applied to various fields such as data mining, image processing and pattern recognition technique. Clustering algorithms splits a data set into clusters such that elements within the same cluster have a high degree of similarity, while elements belonging to different clusters have a high degree of dissimilarity. The Fuzzy C-Means Algorithm (FCM) is a fuzzy clustering algorithm most used and discussed in the literature. The performance of the FCM is strongly affected by the selection of the initial centers of the clusters. Therefore, the choice of a good set of initial cluster centers is very important for the performance of the algorithm. However, in FCM, the choice of initial centers is made randomly, making it difficult to find a good set. This paper proposes three new methods to obtain initial cluster centers, deterministically, the FCM algorithm, and can also be used in variants of the FCM. In this work these initialization methods were applied in variant ckMeans.With the proposed methods, we intend to obtain a set of initial centers which are close to the real cluster centers. With these new approaches startup if you want to reduce the number of iterations to converge these algorithms and processing time without affecting the quality of the cluster or even improve the quality in some cases. Accordingly, cluster validation indices were used to measure the quality of the clusters obtained by the modified FCM and ckMeans algorithms with the proposed initialization methods when applied to various data setsCoordenação de Aperfeiçoamento de Pessoal de Nível SuperiorAgrupamento de dados é uma técnica aplicada a diversas áreas como mineração de dados, processamento de imagens e reconhecimento de padrões. Algoritmos de agrupamento particionam um conjunto de dados em grupos, de tal forma, que elementos dentro de um mesmo grupo tenham alto grau de similaridade, enquanto elementos pertencentes a diferentes grupos tenham alto grau de dissimilaridade. O algoritmo Fuzzy C-Means (FCM) é um dos algoritmos de agrupamento fuzzy de dados mais utilizados e discutidos na literatura. O desempenho do FCM é fortemente afetado pela seleção dos centros iniciais dos grupos. Portanto, a escolha de um bom conjunto de centros iniciais é muito importante para o desempenho do algoritmo. No entanto, no FCM, a escolha dos centros iniciais é feita de forma aleatória, tornando difícil encontrar um bom conjunto. Este trabalho propõe três novos métodos para obter os centros iniciais dos grupos, de forma determinística, no algoritmo FCM, e que podem também ser usados em variantes do FCM. Neste trabalho esses métodos de inicialização foram aplicados na variante ckMeans. Com os métodos propostos, pretende-se obter um conjunto de centros iniciais que esteja próximo dos centros reais dos grupos. Com estas novas abordagens de inicialização deseja-se reduzir o número de iterações para estes algoritmos convergirem e o tempo de processamento, sem afetar a qualidade do agrupamento ou até melhorar a qualidade em alguns casos. Neste sentido, foram utilizados índices de validação de agrupamento para medir a qualidade dos agrupamentos obtidos pelos algoritmos FCM e ckMeans, modificados com os métodos de inicialização propostos, quando aplicados a diversas bases de dadosUniversidade Federal do Rio Grande do NorteBRUFRNPrograma de Pós-Graduação em Sistemas e ComputaçãoCiência da ComputaçãoBedregal, Benjamin René Callejashttp://lattes.cnpq.br/5580392803736306http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7Canuto, Anne Magaly de Paulahttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8Santiago, Regivan Hugo Nuneshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032Z4Dimuro, Graçaliz Pereirahttp://lattes.cnpq.br/9414212573217453Arnaldo, Heloína Alves2014-12-17T15:48:11Z2014-11-262014-12-17T15:48:11Z2014-02-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfARNALDO, Heloína Alves. Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes. 2014. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.https://repositorio.ufrn.br/jspui/handle/123456789/18109porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRN2017-11-04T16:44:22Zoai:repositorio.ufrn.br:123456789/18109Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2017-11-04T16:44:22Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.none.fl_str_mv Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
title Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
spellingShingle Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
Arnaldo, Heloína Alves
Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação
Data clustering. Fuzzy C-Means. Cluster centers initialization. Validation indices
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
title_full Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
title_fullStr Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
title_full_unstemmed Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
title_sort Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
author Arnaldo, Heloína Alves
author_facet Arnaldo, Heloína Alves
author_role author
dc.contributor.none.fl_str_mv Bedregal, Benjamin René Callejas

http://lattes.cnpq.br/5580392803736306

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7
Canuto, Anne Magaly de Paula

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8
Santiago, Regivan Hugo Nunes

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032Z4
Dimuro, Graçaliz Pereira

http://lattes.cnpq.br/9414212573217453
dc.contributor.author.fl_str_mv Arnaldo, Heloína Alves
dc.subject.por.fl_str_mv Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação
Data clustering. Fuzzy C-Means. Cluster centers initialization. Validation indices
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
topic Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação
Data clustering. Fuzzy C-Means. Cluster centers initialization. Validation indices
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description Data clustering is applied to various fields such as data mining, image processing and pattern recognition technique. Clustering algorithms splits a data set into clusters such that elements within the same cluster have a high degree of similarity, while elements belonging to different clusters have a high degree of dissimilarity. The Fuzzy C-Means Algorithm (FCM) is a fuzzy clustering algorithm most used and discussed in the literature. The performance of the FCM is strongly affected by the selection of the initial centers of the clusters. Therefore, the choice of a good set of initial cluster centers is very important for the performance of the algorithm. However, in FCM, the choice of initial centers is made randomly, making it difficult to find a good set. This paper proposes three new methods to obtain initial cluster centers, deterministically, the FCM algorithm, and can also be used in variants of the FCM. In this work these initialization methods were applied in variant ckMeans.With the proposed methods, we intend to obtain a set of initial centers which are close to the real cluster centers. With these new approaches startup if you want to reduce the number of iterations to converge these algorithms and processing time without affecting the quality of the cluster or even improve the quality in some cases. Accordingly, cluster validation indices were used to measure the quality of the clusters obtained by the modified FCM and ckMeans algorithms with the proposed initialization methods when applied to various data sets
publishDate 2014
dc.date.none.fl_str_mv 2014-12-17T15:48:11Z
2014-11-26
2014-12-17T15:48:11Z
2014-02-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ARNALDO, Heloína Alves. Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes. 2014. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.
https://repositorio.ufrn.br/jspui/handle/123456789/18109
identifier_str_mv ARNALDO, Heloína Alves. Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes. 2014. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.
url https://repositorio.ufrn.br/jspui/handle/123456789/18109
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
BR
UFRN
Programa de Pós-Graduação em Sistemas e Computação
Ciência da Computação
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
BR
UFRN
Programa de Pós-Graduação em Sistemas e Computação
Ciência da Computação
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv repositorio@bczm.ufrn.br
_version_ 1855758811224080384