Métodos de agrupamento difuso aplicados a dados simbólicos poligonais

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: SOUZA, Pedro José Carneiro de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso embargado
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/66909
Resumo: Diante do grande volume de dados e da elevada capacidade computacional necessária para analisá-los, a Análise de Dados Simbólicos (ADS) surge como um paradigma poderoso para auxiliar na análise de representações mais complexas, chamadas de dados simbólicos, resultantes da agregação de dados em classes. Dentre as abordagens simbólicas, os dados poligonais se destacam por sua capacidade de encapsular de forma mais rica a informação de dados agregados quando comparados com dados intervalares. Embora a literatura recente tenha introduzido um algoritmo de agrupamento dinâmico rígido (pDCA) para este tipo de dado, a inflexibilidade da alocação exclusiva de objetos a clusters limita a análise de estrutu ras de dados ambíguas ou sobrepostas. Neste contexto, o objetivo principal deste trabalho é desenvolver e formalizar algoritmos de agrupamento difuso para dados simbólicos poligonais, visando oferecer maior flexibilidade e robustez à análise de agrupamento. Partindo do algoritmo pDCAe sua métrica de similaridade, propõe-se inicialmente o Algoritmo de agrupamento di fuso poligonal (FpDCA), o qual estende o método rígido ao incorporar o conceito de graus de pertinência, permitindo que cada polígono pertença a múltiplos clusters simultaneamente, com base em metodologias consolidadas do fuzzy c-means. Adicionalmente, o trabalho avança para o desenvolvimento do Algoritmo de agrupamento difuso poligonal adaptativo (AFpDCA), no qual se introduz um mecanismo de ponderação que atribui um peso de relevância para cada variável em cada cluster, permitindo que o algoritmo aprenda automaticamente quais carac terísticas são mais importantes para a formação de cada grupo específico. A metodologia será validada por meio de experimentos com dados sintéticos gerados em diferentes cenários para avaliar a performance e a robustez dos algoritmos propostos. Para demonstrar a aplicabilidade e usabilidade da metodologia, será conduzido um estudo de caso inédito com dados reais sobre as despesas com saúde pública no Brasil, os quais, originalmente referentes aos municípios, serão agregados por unidades federativas, dando origem às variáveis poligonais. O objetivo da aplicação é utilizar o AFpDCA para identificar e caracterizar perfis distintos de gastos com saúde no país, revelando quais tipos de despesas são mais determinantes para a formação de cada perfil e, assim, gerando insights valiosos para a gestão pública e o planejamento de políticas de saúde.
id UFPE_e5f7d85f316295b6c9cd9c30edd3c450
oai_identifier_str oai:repositorio.ufpe.br:123456789/66909
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling Métodos de agrupamento difuso aplicados a dados simbólicos poligonaisAnálise de dados simbólicosDados poligonaisAgrupamento difusoDistância adaptativaDespesas com Saúde PúblicaDiante do grande volume de dados e da elevada capacidade computacional necessária para analisá-los, a Análise de Dados Simbólicos (ADS) surge como um paradigma poderoso para auxiliar na análise de representações mais complexas, chamadas de dados simbólicos, resultantes da agregação de dados em classes. Dentre as abordagens simbólicas, os dados poligonais se destacam por sua capacidade de encapsular de forma mais rica a informação de dados agregados quando comparados com dados intervalares. Embora a literatura recente tenha introduzido um algoritmo de agrupamento dinâmico rígido (pDCA) para este tipo de dado, a inflexibilidade da alocação exclusiva de objetos a clusters limita a análise de estrutu ras de dados ambíguas ou sobrepostas. Neste contexto, o objetivo principal deste trabalho é desenvolver e formalizar algoritmos de agrupamento difuso para dados simbólicos poligonais, visando oferecer maior flexibilidade e robustez à análise de agrupamento. Partindo do algoritmo pDCAe sua métrica de similaridade, propõe-se inicialmente o Algoritmo de agrupamento di fuso poligonal (FpDCA), o qual estende o método rígido ao incorporar o conceito de graus de pertinência, permitindo que cada polígono pertença a múltiplos clusters simultaneamente, com base em metodologias consolidadas do fuzzy c-means. Adicionalmente, o trabalho avança para o desenvolvimento do Algoritmo de agrupamento difuso poligonal adaptativo (AFpDCA), no qual se introduz um mecanismo de ponderação que atribui um peso de relevância para cada variável em cada cluster, permitindo que o algoritmo aprenda automaticamente quais carac terísticas são mais importantes para a formação de cada grupo específico. A metodologia será validada por meio de experimentos com dados sintéticos gerados em diferentes cenários para avaliar a performance e a robustez dos algoritmos propostos. Para demonstrar a aplicabilidade e usabilidade da metodologia, será conduzido um estudo de caso inédito com dados reais sobre as despesas com saúde pública no Brasil, os quais, originalmente referentes aos municípios, serão agregados por unidades federativas, dando origem às variáveis poligonais. O objetivo da aplicação é utilizar o AFpDCA para identificar e caracterizar perfis distintos de gastos com saúde no país, revelando quais tipos de despesas são mais determinantes para a formação de cada perfil e, assim, gerando insights valiosos para a gestão pública e o planejamento de políticas de saúde.Faced with the large volume of data and the high computational capacity required to ana lyze it, Symbolic Data Analysis (SDA) emerges as a powerful paradigm to assist in the analysis of more complex representations, called symbolic data, resulting from the aggregation of data into classes. Among symbolic approaches, polygonal data stand out for their ability to more richly encapsulate information from aggregated data when compared to interval-valued data. Although recent literature has introduced a hard dynamical clustering algorithm (pDCA) for this data type, the inflexibility of exclusively allocating objects to clusters limits the analysis of ambiguous or overlapping data structures. In this context, the main objective of this work is to develop and formalize a new family of fuzzy clustering algorithms for symbolic polygonal data, aiming to offer greater flexibility and robustness to cluster analysis. Building upon the pDCA algorithm and its Hausdorff distance metric, we initially propose the Fuzzy Polygonal Dynamic Clustering Algorithm (FpDCA), which incorporate the concept of membership degrees, al lowing each polygon to belong to multiple clusters simultaneously, based on established fuzzy c-means methodologies. Additionally, the work advances to the development of the Adaptive Fuzzy Polygonal Dynamic Clustering Algorithm (AFpDCA), in which a weighting mechanism is introduced that assigns a relevance weight to each variable in each cluster, allowing the al gorithm to automatically learn which features are most important for the formation of each specific group. Experiments with synthetic data generated in different scenarios to evaluate the performance and robustness of the proposed algorithms. To demonstrate the applicabil ity and interpretive potential of the methodology, a novel case study will be conducted with real data on public health expenditures in Brazil. The expenditure data, originally referring to municipalities, will be aggregated by federative units, giving rise to the polygonal variables. The application’s objective is to use the AFpDCA to identify and characterize distinct health spending profiles in the country, revealing which types of expenditures are most determinant for the formation of each profile, thereby generating valuable insights for public administration and health policy planningUniversidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Ciencia da ComputacaoSOUZA, Renata Maria Cardoso Rodrigues dePIMENTEL, Bruno Almeidahttp://lattes.cnpq.br/9190507857341560http://lattes.cnpq.br/9289080285504453http://lattes.cnpq.br/5575405279834457SOUZA, Pedro José Carneiro de2025-11-19T12:07:01Z2025-11-19T12:07:01Z2025-10-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSOUZA, Pedro José Carneiro de. Métodos de agrupamento difuso aplicados a dados simbólicos poligonais. 2025. Dissertação (Mestrado Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2025.https://repositorio.ufpe.br/handle/123456789/66909porhttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/embargoedAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2025-11-23T19:36:22Zoai:repositorio.ufpe.br:123456789/66909Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212025-11-23T19:36:22Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.none.fl_str_mv Métodos de agrupamento difuso aplicados a dados simbólicos poligonais
title Métodos de agrupamento difuso aplicados a dados simbólicos poligonais
spellingShingle Métodos de agrupamento difuso aplicados a dados simbólicos poligonais
SOUZA, Pedro José Carneiro de
Análise de dados simbólicos
Dados poligonais
Agrupamento difuso
Distância adaptativa
Despesas com Saúde Pública
title_short Métodos de agrupamento difuso aplicados a dados simbólicos poligonais
title_full Métodos de agrupamento difuso aplicados a dados simbólicos poligonais
title_fullStr Métodos de agrupamento difuso aplicados a dados simbólicos poligonais
title_full_unstemmed Métodos de agrupamento difuso aplicados a dados simbólicos poligonais
title_sort Métodos de agrupamento difuso aplicados a dados simbólicos poligonais
author SOUZA, Pedro José Carneiro de
author_facet SOUZA, Pedro José Carneiro de
author_role author
dc.contributor.none.fl_str_mv SOUZA, Renata Maria Cardoso Rodrigues de
PIMENTEL, Bruno Almeida
http://lattes.cnpq.br/9190507857341560
http://lattes.cnpq.br/9289080285504453
http://lattes.cnpq.br/5575405279834457
dc.contributor.author.fl_str_mv SOUZA, Pedro José Carneiro de
dc.subject.por.fl_str_mv Análise de dados simbólicos
Dados poligonais
Agrupamento difuso
Distância adaptativa
Despesas com Saúde Pública
topic Análise de dados simbólicos
Dados poligonais
Agrupamento difuso
Distância adaptativa
Despesas com Saúde Pública
description Diante do grande volume de dados e da elevada capacidade computacional necessária para analisá-los, a Análise de Dados Simbólicos (ADS) surge como um paradigma poderoso para auxiliar na análise de representações mais complexas, chamadas de dados simbólicos, resultantes da agregação de dados em classes. Dentre as abordagens simbólicas, os dados poligonais se destacam por sua capacidade de encapsular de forma mais rica a informação de dados agregados quando comparados com dados intervalares. Embora a literatura recente tenha introduzido um algoritmo de agrupamento dinâmico rígido (pDCA) para este tipo de dado, a inflexibilidade da alocação exclusiva de objetos a clusters limita a análise de estrutu ras de dados ambíguas ou sobrepostas. Neste contexto, o objetivo principal deste trabalho é desenvolver e formalizar algoritmos de agrupamento difuso para dados simbólicos poligonais, visando oferecer maior flexibilidade e robustez à análise de agrupamento. Partindo do algoritmo pDCAe sua métrica de similaridade, propõe-se inicialmente o Algoritmo de agrupamento di fuso poligonal (FpDCA), o qual estende o método rígido ao incorporar o conceito de graus de pertinência, permitindo que cada polígono pertença a múltiplos clusters simultaneamente, com base em metodologias consolidadas do fuzzy c-means. Adicionalmente, o trabalho avança para o desenvolvimento do Algoritmo de agrupamento difuso poligonal adaptativo (AFpDCA), no qual se introduz um mecanismo de ponderação que atribui um peso de relevância para cada variável em cada cluster, permitindo que o algoritmo aprenda automaticamente quais carac terísticas são mais importantes para a formação de cada grupo específico. A metodologia será validada por meio de experimentos com dados sintéticos gerados em diferentes cenários para avaliar a performance e a robustez dos algoritmos propostos. Para demonstrar a aplicabilidade e usabilidade da metodologia, será conduzido um estudo de caso inédito com dados reais sobre as despesas com saúde pública no Brasil, os quais, originalmente referentes aos municípios, serão agregados por unidades federativas, dando origem às variáveis poligonais. O objetivo da aplicação é utilizar o AFpDCA para identificar e caracterizar perfis distintos de gastos com saúde no país, revelando quais tipos de despesas são mais determinantes para a formação de cada perfil e, assim, gerando insights valiosos para a gestão pública e o planejamento de políticas de saúde.
publishDate 2025
dc.date.none.fl_str_mv 2025-11-19T12:07:01Z
2025-11-19T12:07:01Z
2025-10-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SOUZA, Pedro José Carneiro de. Métodos de agrupamento difuso aplicados a dados simbólicos poligonais. 2025. Dissertação (Mestrado Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2025.
https://repositorio.ufpe.br/handle/123456789/66909
identifier_str_mv SOUZA, Pedro José Carneiro de. Métodos de agrupamento difuso aplicados a dados simbólicos poligonais. 2025. Dissertação (Mestrado Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2025.
url https://repositorio.ufpe.br/handle/123456789/66909
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/embargoedAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv embargoedAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1856041995393302528