Um método difuso multivariado baseado em medoids
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/51332 |
Resumo: | A Análise de agrupamentos foi inicialmente utilizada por Tyron em 1939, em que visa organizar dados que possuam características similares dentro de um mesmo grupo e no caso contrário em que os dados possuem características distintas, eles serão alocados em grupos diferentes. Ou seja, se é levado em consideração a ideia de minimizar a distância intra-grupos e maximizar a distância inter-grupos. Com isso, dentre outros benefícios, podem ser visua- lizadas algumas vantagens da utilização desta técnica, como por exemplo a diminuição da dimensionalidade dos dados e a extração das características dos grupos. O principal método de agrupamento difuso é o Fuzzy C-Means (FCM), o qual possui algumas desvantagens tal como considerar que todos os grupos possuem formas esféricas e ser altamente influenciado em casos de conjuntos de dados ruidosos. O Fuzzy C-medoid (FCMdd) foi criado com o intuito de tentar mitigar esta problemática, porém não leva em consideração o impacto de cada variá- vel no cálculo dos graus de pertinências. Diante desse cenário, o Multivariate Fuzzy C-means (MFCM) foi criado com o intuito de levar em consideração o efeito de cada variável no cálculo dos protótipos, porém, utiliza a média para o cálculo dos centróides podendo ser fortemente influenciada negativamente por dados ruidosos. Este trabalho introduz o método Multivariate Fuzzy C-medoids (MFCMdd), em que como o próprio nome já diz, os graus de pertinência são multivariados e utilizam observações do próprio conjunto de dados para serem os centróides, também conhecidos como medoids. Diante deste cenário, o método proposto MFCMdd, é comparado com os outros três métodos (FCM, FCMdd e MFCM) abordados de acordo com as métricas utilizadas para avaliação dos algoritmos, sendo elas o Índice de Rand Ajustado e o F-score. Com o objetivo de avaliar o desempenho dos métodos, um estudo comparativo em relação aos agrupamentos difusos usando o experimento Monte Carlo é realizado. Além disso, foram planejados experimentos com dados sintéticos e reais. Os resultados mostraram que o método proposto MFCMdd, perante o MFCM é preferível quando se há conjuntos de dados sem ruído ou também quando os conjuntos de dados possuem caráter esférico com dados ruidosos. |
| id |
UFPE_019095548051f97b2329aefaf11a2e8d |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/51332 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
Um método difuso multivariado baseado em medoidsInteligência computacionalAgrupamento difusoA Análise de agrupamentos foi inicialmente utilizada por Tyron em 1939, em que visa organizar dados que possuam características similares dentro de um mesmo grupo e no caso contrário em que os dados possuem características distintas, eles serão alocados em grupos diferentes. Ou seja, se é levado em consideração a ideia de minimizar a distância intra-grupos e maximizar a distância inter-grupos. Com isso, dentre outros benefícios, podem ser visua- lizadas algumas vantagens da utilização desta técnica, como por exemplo a diminuição da dimensionalidade dos dados e a extração das características dos grupos. O principal método de agrupamento difuso é o Fuzzy C-Means (FCM), o qual possui algumas desvantagens tal como considerar que todos os grupos possuem formas esféricas e ser altamente influenciado em casos de conjuntos de dados ruidosos. O Fuzzy C-medoid (FCMdd) foi criado com o intuito de tentar mitigar esta problemática, porém não leva em consideração o impacto de cada variá- vel no cálculo dos graus de pertinências. Diante desse cenário, o Multivariate Fuzzy C-means (MFCM) foi criado com o intuito de levar em consideração o efeito de cada variável no cálculo dos protótipos, porém, utiliza a média para o cálculo dos centróides podendo ser fortemente influenciada negativamente por dados ruidosos. Este trabalho introduz o método Multivariate Fuzzy C-medoids (MFCMdd), em que como o próprio nome já diz, os graus de pertinência são multivariados e utilizam observações do próprio conjunto de dados para serem os centróides, também conhecidos como medoids. Diante deste cenário, o método proposto MFCMdd, é comparado com os outros três métodos (FCM, FCMdd e MFCM) abordados de acordo com as métricas utilizadas para avaliação dos algoritmos, sendo elas o Índice de Rand Ajustado e o F-score. Com o objetivo de avaliar o desempenho dos métodos, um estudo comparativo em relação aos agrupamentos difusos usando o experimento Monte Carlo é realizado. Além disso, foram planejados experimentos com dados sintéticos e reais. Os resultados mostraram que o método proposto MFCMdd, perante o MFCM é preferível quando se há conjuntos de dados sem ruído ou também quando os conjuntos de dados possuem caráter esférico com dados ruidosos.CNPqThe cluster analysis was firstly used by Tyron in 1939, with aims to organize data with similar characteristics within the same group, while data with distinct aspects are assigned to different groups. With this, it’s possible to see that some of the benefits of using this technique are the reduction of data dimensionality and the extraction of group characteristics. The most commonly used fuzzy clustering method is Fuzzy C-Means (FCM), but it has some drawbacks, such as considering all groups to be spherically shaped and in cases of noisy data sets, is con- sidered being highly influenced by . To address this issue, the Fuzzy C-medoid (FCMdd) was developed, but it does not account for the impact of each variable when calculating mem- bership degrees. Given this scenario, the Multivariate Fuzzy C-means (MFCM) was developed to account for the effect of each variable in the calculation of the prototypes, but it relies on the means to calculate the centroids, which can be heavily influenced by noisy data. This paper introduces the Multivariate Fuzzy C-medoids (MFCMdd) method, in which the mem- bership degrees are multivariate and the centroids, also known as medoids, are observations from the data set itself. Given this scenario, the proposed method MFCMdd is compared to the other three methods (FCM, FDMdd, and MFCM) based on the metrics used to evaluate the algorithms, which are the Adjusted Rand Index and the F-score. A comparative study of fuzzy clustering using Monte Carlo experiment is performed to evaluate the performance of the methods. Experiments with both synthetic and real data were also carried out. The results showed that the proposed method MFCMdd, rather than MFCM, is preferable when the data sets are noiseless or have a spherical character with noisy data.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Ciencia da ComputacaoSOUZA, Renata Maria Cardoso Rodrigues dePIMENTEL, Bruno Almeidahttp://lattes.cnpq.br/4216568349594897http://lattes.cnpq.br/9289080285504453http://lattes.cnpq.br/5575405279834457SILVA, Victor Viana de Araújo2023-06-29T12:10:49Z2023-06-29T12:10:49Z2022-12-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Victor Viana de Araújo. Um método difuso multivariado baseado em medoids. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.https://repositorio.ufpe.br/handle/123456789/51332porhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2023-06-30T05:26:11Zoai:repositorio.ufpe.br:123456789/51332Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212023-06-30T05:26:11Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.none.fl_str_mv |
Um método difuso multivariado baseado em medoids |
| title |
Um método difuso multivariado baseado em medoids |
| spellingShingle |
Um método difuso multivariado baseado em medoids SILVA, Victor Viana de Araújo Inteligência computacional Agrupamento difuso |
| title_short |
Um método difuso multivariado baseado em medoids |
| title_full |
Um método difuso multivariado baseado em medoids |
| title_fullStr |
Um método difuso multivariado baseado em medoids |
| title_full_unstemmed |
Um método difuso multivariado baseado em medoids |
| title_sort |
Um método difuso multivariado baseado em medoids |
| author |
SILVA, Victor Viana de Araújo |
| author_facet |
SILVA, Victor Viana de Araújo |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
SOUZA, Renata Maria Cardoso Rodrigues de PIMENTEL, Bruno Almeida http://lattes.cnpq.br/4216568349594897 http://lattes.cnpq.br/9289080285504453 http://lattes.cnpq.br/5575405279834457 |
| dc.contributor.author.fl_str_mv |
SILVA, Victor Viana de Araújo |
| dc.subject.por.fl_str_mv |
Inteligência computacional Agrupamento difuso |
| topic |
Inteligência computacional Agrupamento difuso |
| description |
A Análise de agrupamentos foi inicialmente utilizada por Tyron em 1939, em que visa organizar dados que possuam características similares dentro de um mesmo grupo e no caso contrário em que os dados possuem características distintas, eles serão alocados em grupos diferentes. Ou seja, se é levado em consideração a ideia de minimizar a distância intra-grupos e maximizar a distância inter-grupos. Com isso, dentre outros benefícios, podem ser visua- lizadas algumas vantagens da utilização desta técnica, como por exemplo a diminuição da dimensionalidade dos dados e a extração das características dos grupos. O principal método de agrupamento difuso é o Fuzzy C-Means (FCM), o qual possui algumas desvantagens tal como considerar que todos os grupos possuem formas esféricas e ser altamente influenciado em casos de conjuntos de dados ruidosos. O Fuzzy C-medoid (FCMdd) foi criado com o intuito de tentar mitigar esta problemática, porém não leva em consideração o impacto de cada variá- vel no cálculo dos graus de pertinências. Diante desse cenário, o Multivariate Fuzzy C-means (MFCM) foi criado com o intuito de levar em consideração o efeito de cada variável no cálculo dos protótipos, porém, utiliza a média para o cálculo dos centróides podendo ser fortemente influenciada negativamente por dados ruidosos. Este trabalho introduz o método Multivariate Fuzzy C-medoids (MFCMdd), em que como o próprio nome já diz, os graus de pertinência são multivariados e utilizam observações do próprio conjunto de dados para serem os centróides, também conhecidos como medoids. Diante deste cenário, o método proposto MFCMdd, é comparado com os outros três métodos (FCM, FCMdd e MFCM) abordados de acordo com as métricas utilizadas para avaliação dos algoritmos, sendo elas o Índice de Rand Ajustado e o F-score. Com o objetivo de avaliar o desempenho dos métodos, um estudo comparativo em relação aos agrupamentos difusos usando o experimento Monte Carlo é realizado. Além disso, foram planejados experimentos com dados sintéticos e reais. Os resultados mostraram que o método proposto MFCMdd, perante o MFCM é preferível quando se há conjuntos de dados sem ruído ou também quando os conjuntos de dados possuem caráter esférico com dados ruidosos. |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-12-15 2023-06-29T12:10:49Z 2023-06-29T12:10:49Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
SILVA, Victor Viana de Araújo. Um método difuso multivariado baseado em medoids. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022. https://repositorio.ufpe.br/handle/123456789/51332 |
| identifier_str_mv |
SILVA, Victor Viana de Araújo. Um método difuso multivariado baseado em medoids. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022. |
| url |
https://repositorio.ufpe.br/handle/123456789/51332 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1856042041653329920 |