Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Rio Grande do Norte
Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufrn.br/handle/123456789/46634 |
Resumo: | Data clustering consists of grouping similar objects according to some characteristic. In literature, there are several clustering algorithms, among which stands out the Fuzzy CMeans (FCM), one of the most discussed algorithms, being used in different applications. Although it is a simple and easy to manipulate clustering method, the FCM requires as its initial parameter the number of clusters. Usually, this information is unknown, beforehand and this becomes a relevant problem in the data cluster analysis process. Moreover, the design of the FCM algorithm strongly depends on the selection of the initial centers of the clusters. In general, the selection of the initial set of centers is random, which may compromise the performance of the FCM and, consequently, of the cluster analysis process. In this context, this work proposes a new methodology to determine the number of clusters and the set of initial centers of the partial algorithms, using the FCM algorithm and some of its variants as a case study. The idea is to use a subset of the original data to define the number of clusters and determine the set of initial centers through a method based on mean type functions. With this new methodology, we intend to reduce the side effects of the clusters definition phase, possibly speeding up the processing time and decreasing the computational cost. To evaluate the proposed methodology, different cluster validation indices will be used to evaluate the quality of the clusters obtained by the FCM algorithms and some of its variants, when applied to different databases. |
| id |
UFRN_2c21661df9b81433c9170cf9d9b6559d |
|---|---|
| oai_identifier_str |
oai:repositorio.ufrn.br:123456789/46634 |
| network_acronym_str |
UFRN |
| network_name_str |
Repositório Institucional da UFRN |
| repository_id_str |
|
| spelling |
Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionaisA methodology for defining the number of clusters and the set of initial centers for partitions algorithmsComputaçãoAgrupamento de dadosNúmero de gruposFuzzy C-MeansCentros iniciaisData clustering consists of grouping similar objects according to some characteristic. In literature, there are several clustering algorithms, among which stands out the Fuzzy CMeans (FCM), one of the most discussed algorithms, being used in different applications. Although it is a simple and easy to manipulate clustering method, the FCM requires as its initial parameter the number of clusters. Usually, this information is unknown, beforehand and this becomes a relevant problem in the data cluster analysis process. Moreover, the design of the FCM algorithm strongly depends on the selection of the initial centers of the clusters. In general, the selection of the initial set of centers is random, which may compromise the performance of the FCM and, consequently, of the cluster analysis process. In this context, this work proposes a new methodology to determine the number of clusters and the set of initial centers of the partial algorithms, using the FCM algorithm and some of its variants as a case study. The idea is to use a subset of the original data to define the number of clusters and determine the set of initial centers through a method based on mean type functions. With this new methodology, we intend to reduce the side effects of the clusters definition phase, possibly speeding up the processing time and decreasing the computational cost. To evaluate the proposed methodology, different cluster validation indices will be used to evaluate the quality of the clusters obtained by the FCM algorithms and some of its variants, when applied to different databases.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESO agrupamento de dados consiste em agrupar objetos semelhantes de acordo com alguma característica. Na literatura, existem diversos algoritmos de agrupamento, dentre os quais destaca-se o algoritmo Fuzzy C-Means (FCM), um dos mais discutidos e utilizados em diferentes aplicações. Embora seja um método de agrupamento simples e fácil de manipular, o algoritmo FCM requer como parâmetro inicial o número de grupos. No geral, essa informação é desconhecida, a priori, e se torna um problema relevante no processo de análise de agrupamento de dados. Além disso, o desenho do algoritmo FCM depende fortemente da seleção dos centros iniciais dos grupos. Normalmente, a escolha do conjunto de centros iniciais é feita aleatoriamente, o que pode comprometer o desempenho do FCM e, consequentemente, o processo de análise de agrupamento. Neste contexto, este trabalho propõe uma nova metodologia pra determinar o número de grupos e o conjunto de centros iniciais de algoritmos particionais, usando como estudo de caso o algoritmo FCM e algumas de suas variantes. A ideia é usar um subconjunto dos dados originais para definir o número de grupos e determinar o conjunto de centros iniciais através de um método baseado em funções do tipo média. Com essa nova metodologia, pretende-se reduzir os efeitos colaterais da fase de definição de grupos, possivelmente tornando mais rápido o tempo de processamento e diminuindo o custo computacional. Para avaliar a metodologia proposta, serão utilizados diferentes índices de validação de agrupamento, capazes de avaliar a qualidade dos agrupamentos obtidos pelo algoritmo FCM e algumas de suas variantes, quando aplicados a diferentes bases de dados.Universidade Federal do Rio Grande do NorteBrasilUFRNPROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃOBedregal, Benjamin Rene Callejashttp://lattes.cnpq.br/1797223363490431http://lattes.cnpq.br/4601263005352005Canuto, Anne Magaly de Paula66487099449http://lattes.cnpq.br/1357887401899097Santos, Araken de Medeiroshttp://lattes.cnpq.br/8059198436766378Dimuro, Graçaliz Pereirahttp://lattes.cnpq.br/9414212573217453Moura, Ronildo Pinheiro de Araújohttp://lattes.cnpq.br/8664977292629302Silva, Huliane Medeiros da2022-03-21T16:17:36Z2022-03-21T16:17:36Z2021-02-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfSILVA, Huliane Medeiros da. Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais. 2021. 100f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/46634ark:/41046/001300001pttninfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRN2022-05-02T16:01:42Zoai:repositorio.ufrn.br:123456789/46634Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2022-05-02T16:01:42Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
| dc.title.none.fl_str_mv |
Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais A methodology for defining the number of clusters and the set of initial centers for partitions algorithms |
| title |
Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais |
| spellingShingle |
Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais Silva, Huliane Medeiros da Computação Agrupamento de dados Número de grupos Fuzzy C-Means Centros iniciais |
| title_short |
Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais |
| title_full |
Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais |
| title_fullStr |
Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais |
| title_full_unstemmed |
Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais |
| title_sort |
Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais |
| author |
Silva, Huliane Medeiros da |
| author_facet |
Silva, Huliane Medeiros da |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Bedregal, Benjamin Rene Callejas http://lattes.cnpq.br/1797223363490431 http://lattes.cnpq.br/4601263005352005 Canuto, Anne Magaly de Paula 66487099449 http://lattes.cnpq.br/1357887401899097 Santos, Araken de Medeiros http://lattes.cnpq.br/8059198436766378 Dimuro, Graçaliz Pereira http://lattes.cnpq.br/9414212573217453 Moura, Ronildo Pinheiro de Araújo http://lattes.cnpq.br/8664977292629302 |
| dc.contributor.author.fl_str_mv |
Silva, Huliane Medeiros da |
| dc.subject.por.fl_str_mv |
Computação Agrupamento de dados Número de grupos Fuzzy C-Means Centros iniciais |
| topic |
Computação Agrupamento de dados Número de grupos Fuzzy C-Means Centros iniciais |
| description |
Data clustering consists of grouping similar objects according to some characteristic. In literature, there are several clustering algorithms, among which stands out the Fuzzy CMeans (FCM), one of the most discussed algorithms, being used in different applications. Although it is a simple and easy to manipulate clustering method, the FCM requires as its initial parameter the number of clusters. Usually, this information is unknown, beforehand and this becomes a relevant problem in the data cluster analysis process. Moreover, the design of the FCM algorithm strongly depends on the selection of the initial centers of the clusters. In general, the selection of the initial set of centers is random, which may compromise the performance of the FCM and, consequently, of the cluster analysis process. In this context, this work proposes a new methodology to determine the number of clusters and the set of initial centers of the partial algorithms, using the FCM algorithm and some of its variants as a case study. The idea is to use a subset of the original data to define the number of clusters and determine the set of initial centers through a method based on mean type functions. With this new methodology, we intend to reduce the side effects of the clusters definition phase, possibly speeding up the processing time and decreasing the computational cost. To evaluate the proposed methodology, different cluster validation indices will be used to evaluate the quality of the clusters obtained by the FCM algorithms and some of its variants, when applied to different databases. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021-02-05 2022-03-21T16:17:36Z 2022-03-21T16:17:36Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
SILVA, Huliane Medeiros da. Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais. 2021. 100f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2021. https://repositorio.ufrn.br/handle/123456789/46634 |
| dc.identifier.dark.fl_str_mv |
ark:/41046/001300001pttn |
| identifier_str_mv |
SILVA, Huliane Medeiros da. Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais. 2021. 100f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2021. ark:/41046/001300001pttn |
| url |
https://repositorio.ufrn.br/handle/123456789/46634 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO |
| publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
| instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
| instacron_str |
UFRN |
| institution |
UFRN |
| reponame_str |
Repositório Institucional da UFRN |
| collection |
Repositório Institucional da UFRN |
| repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
| repository.mail.fl_str_mv |
repositorio@bczm.ufrn.br |
| _version_ |
1846688836842684416 |