Métodos de agrupamento difuso aplicados a dados simbólicos poligonais
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso embargado |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/66909 |
Resumo: | Diante do grande volume de dados e da elevada capacidade computacional necessária para analisá-los, a Análise de Dados Simbólicos (ADS) surge como um paradigma poderoso para auxiliar na análise de representações mais complexas, chamadas de dados simbólicos, resultantes da agregação de dados em classes. Dentre as abordagens simbólicas, os dados poligonais se destacam por sua capacidade de encapsular de forma mais rica a informação de dados agregados quando comparados com dados intervalares. Embora a literatura recente tenha introduzido um algoritmo de agrupamento dinâmico rígido (pDCA) para este tipo de dado, a inflexibilidade da alocação exclusiva de objetos a clusters limita a análise de estrutu ras de dados ambíguas ou sobrepostas. Neste contexto, o objetivo principal deste trabalho é desenvolver e formalizar algoritmos de agrupamento difuso para dados simbólicos poligonais, visando oferecer maior flexibilidade e robustez à análise de agrupamento. Partindo do algoritmo pDCAe sua métrica de similaridade, propõe-se inicialmente o Algoritmo de agrupamento di fuso poligonal (FpDCA), o qual estende o método rígido ao incorporar o conceito de graus de pertinência, permitindo que cada polígono pertença a múltiplos clusters simultaneamente, com base em metodologias consolidadas do fuzzy c-means. Adicionalmente, o trabalho avança para o desenvolvimento do Algoritmo de agrupamento difuso poligonal adaptativo (AFpDCA), no qual se introduz um mecanismo de ponderação que atribui um peso de relevância para cada variável em cada cluster, permitindo que o algoritmo aprenda automaticamente quais carac terísticas são mais importantes para a formação de cada grupo específico. A metodologia será validada por meio de experimentos com dados sintéticos gerados em diferentes cenários para avaliar a performance e a robustez dos algoritmos propostos. Para demonstrar a aplicabilidade e usabilidade da metodologia, será conduzido um estudo de caso inédito com dados reais sobre as despesas com saúde pública no Brasil, os quais, originalmente referentes aos municípios, serão agregados por unidades federativas, dando origem às variáveis poligonais. O objetivo da aplicação é utilizar o AFpDCA para identificar e caracterizar perfis distintos de gastos com saúde no país, revelando quais tipos de despesas são mais determinantes para a formação de cada perfil e, assim, gerando insights valiosos para a gestão pública e o planejamento de políticas de saúde. |
| id |
UFPE_e5f7d85f316295b6c9cd9c30edd3c450 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/66909 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
Métodos de agrupamento difuso aplicados a dados simbólicos poligonaisAnálise de dados simbólicosDados poligonaisAgrupamento difusoDistância adaptativaDespesas com Saúde PúblicaDiante do grande volume de dados e da elevada capacidade computacional necessária para analisá-los, a Análise de Dados Simbólicos (ADS) surge como um paradigma poderoso para auxiliar na análise de representações mais complexas, chamadas de dados simbólicos, resultantes da agregação de dados em classes. Dentre as abordagens simbólicas, os dados poligonais se destacam por sua capacidade de encapsular de forma mais rica a informação de dados agregados quando comparados com dados intervalares. Embora a literatura recente tenha introduzido um algoritmo de agrupamento dinâmico rígido (pDCA) para este tipo de dado, a inflexibilidade da alocação exclusiva de objetos a clusters limita a análise de estrutu ras de dados ambíguas ou sobrepostas. Neste contexto, o objetivo principal deste trabalho é desenvolver e formalizar algoritmos de agrupamento difuso para dados simbólicos poligonais, visando oferecer maior flexibilidade e robustez à análise de agrupamento. Partindo do algoritmo pDCAe sua métrica de similaridade, propõe-se inicialmente o Algoritmo de agrupamento di fuso poligonal (FpDCA), o qual estende o método rígido ao incorporar o conceito de graus de pertinência, permitindo que cada polígono pertença a múltiplos clusters simultaneamente, com base em metodologias consolidadas do fuzzy c-means. Adicionalmente, o trabalho avança para o desenvolvimento do Algoritmo de agrupamento difuso poligonal adaptativo (AFpDCA), no qual se introduz um mecanismo de ponderação que atribui um peso de relevância para cada variável em cada cluster, permitindo que o algoritmo aprenda automaticamente quais carac terísticas são mais importantes para a formação de cada grupo específico. A metodologia será validada por meio de experimentos com dados sintéticos gerados em diferentes cenários para avaliar a performance e a robustez dos algoritmos propostos. Para demonstrar a aplicabilidade e usabilidade da metodologia, será conduzido um estudo de caso inédito com dados reais sobre as despesas com saúde pública no Brasil, os quais, originalmente referentes aos municípios, serão agregados por unidades federativas, dando origem às variáveis poligonais. O objetivo da aplicação é utilizar o AFpDCA para identificar e caracterizar perfis distintos de gastos com saúde no país, revelando quais tipos de despesas são mais determinantes para a formação de cada perfil e, assim, gerando insights valiosos para a gestão pública e o planejamento de políticas de saúde.Faced with the large volume of data and the high computational capacity required to ana lyze it, Symbolic Data Analysis (SDA) emerges as a powerful paradigm to assist in the analysis of more complex representations, called symbolic data, resulting from the aggregation of data into classes. Among symbolic approaches, polygonal data stand out for their ability to more richly encapsulate information from aggregated data when compared to interval-valued data. Although recent literature has introduced a hard dynamical clustering algorithm (pDCA) for this data type, the inflexibility of exclusively allocating objects to clusters limits the analysis of ambiguous or overlapping data structures. In this context, the main objective of this work is to develop and formalize a new family of fuzzy clustering algorithms for symbolic polygonal data, aiming to offer greater flexibility and robustness to cluster analysis. Building upon the pDCA algorithm and its Hausdorff distance metric, we initially propose the Fuzzy Polygonal Dynamic Clustering Algorithm (FpDCA), which incorporate the concept of membership degrees, al lowing each polygon to belong to multiple clusters simultaneously, based on established fuzzy c-means methodologies. Additionally, the work advances to the development of the Adaptive Fuzzy Polygonal Dynamic Clustering Algorithm (AFpDCA), in which a weighting mechanism is introduced that assigns a relevance weight to each variable in each cluster, allowing the al gorithm to automatically learn which features are most important for the formation of each specific group. Experiments with synthetic data generated in different scenarios to evaluate the performance and robustness of the proposed algorithms. To demonstrate the applicabil ity and interpretive potential of the methodology, a novel case study will be conducted with real data on public health expenditures in Brazil. The expenditure data, originally referring to municipalities, will be aggregated by federative units, giving rise to the polygonal variables. The application’s objective is to use the AFpDCA to identify and characterize distinct health spending profiles in the country, revealing which types of expenditures are most determinant for the formation of each profile, thereby generating valuable insights for public administration and health policy planningUniversidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Ciencia da ComputacaoSOUZA, Renata Maria Cardoso Rodrigues dePIMENTEL, Bruno Almeidahttp://lattes.cnpq.br/9190507857341560http://lattes.cnpq.br/9289080285504453http://lattes.cnpq.br/5575405279834457SOUZA, Pedro José Carneiro de2025-11-19T12:07:01Z2025-11-19T12:07:01Z2025-10-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSOUZA, Pedro José Carneiro de. Métodos de agrupamento difuso aplicados a dados simbólicos poligonais. 2025. Dissertação (Mestrado Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2025.https://repositorio.ufpe.br/handle/123456789/66909porhttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/embargoedAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2025-11-23T19:36:22Zoai:repositorio.ufpe.br:123456789/66909Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212025-11-23T19:36:22Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.none.fl_str_mv |
Métodos de agrupamento difuso aplicados a dados simbólicos poligonais |
| title |
Métodos de agrupamento difuso aplicados a dados simbólicos poligonais |
| spellingShingle |
Métodos de agrupamento difuso aplicados a dados simbólicos poligonais SOUZA, Pedro José Carneiro de Análise de dados simbólicos Dados poligonais Agrupamento difuso Distância adaptativa Despesas com Saúde Pública |
| title_short |
Métodos de agrupamento difuso aplicados a dados simbólicos poligonais |
| title_full |
Métodos de agrupamento difuso aplicados a dados simbólicos poligonais |
| title_fullStr |
Métodos de agrupamento difuso aplicados a dados simbólicos poligonais |
| title_full_unstemmed |
Métodos de agrupamento difuso aplicados a dados simbólicos poligonais |
| title_sort |
Métodos de agrupamento difuso aplicados a dados simbólicos poligonais |
| author |
SOUZA, Pedro José Carneiro de |
| author_facet |
SOUZA, Pedro José Carneiro de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
SOUZA, Renata Maria Cardoso Rodrigues de PIMENTEL, Bruno Almeida http://lattes.cnpq.br/9190507857341560 http://lattes.cnpq.br/9289080285504453 http://lattes.cnpq.br/5575405279834457 |
| dc.contributor.author.fl_str_mv |
SOUZA, Pedro José Carneiro de |
| dc.subject.por.fl_str_mv |
Análise de dados simbólicos Dados poligonais Agrupamento difuso Distância adaptativa Despesas com Saúde Pública |
| topic |
Análise de dados simbólicos Dados poligonais Agrupamento difuso Distância adaptativa Despesas com Saúde Pública |
| description |
Diante do grande volume de dados e da elevada capacidade computacional necessária para analisá-los, a Análise de Dados Simbólicos (ADS) surge como um paradigma poderoso para auxiliar na análise de representações mais complexas, chamadas de dados simbólicos, resultantes da agregação de dados em classes. Dentre as abordagens simbólicas, os dados poligonais se destacam por sua capacidade de encapsular de forma mais rica a informação de dados agregados quando comparados com dados intervalares. Embora a literatura recente tenha introduzido um algoritmo de agrupamento dinâmico rígido (pDCA) para este tipo de dado, a inflexibilidade da alocação exclusiva de objetos a clusters limita a análise de estrutu ras de dados ambíguas ou sobrepostas. Neste contexto, o objetivo principal deste trabalho é desenvolver e formalizar algoritmos de agrupamento difuso para dados simbólicos poligonais, visando oferecer maior flexibilidade e robustez à análise de agrupamento. Partindo do algoritmo pDCAe sua métrica de similaridade, propõe-se inicialmente o Algoritmo de agrupamento di fuso poligonal (FpDCA), o qual estende o método rígido ao incorporar o conceito de graus de pertinência, permitindo que cada polígono pertença a múltiplos clusters simultaneamente, com base em metodologias consolidadas do fuzzy c-means. Adicionalmente, o trabalho avança para o desenvolvimento do Algoritmo de agrupamento difuso poligonal adaptativo (AFpDCA), no qual se introduz um mecanismo de ponderação que atribui um peso de relevância para cada variável em cada cluster, permitindo que o algoritmo aprenda automaticamente quais carac terísticas são mais importantes para a formação de cada grupo específico. A metodologia será validada por meio de experimentos com dados sintéticos gerados em diferentes cenários para avaliar a performance e a robustez dos algoritmos propostos. Para demonstrar a aplicabilidade e usabilidade da metodologia, será conduzido um estudo de caso inédito com dados reais sobre as despesas com saúde pública no Brasil, os quais, originalmente referentes aos municípios, serão agregados por unidades federativas, dando origem às variáveis poligonais. O objetivo da aplicação é utilizar o AFpDCA para identificar e caracterizar perfis distintos de gastos com saúde no país, revelando quais tipos de despesas são mais determinantes para a formação de cada perfil e, assim, gerando insights valiosos para a gestão pública e o planejamento de políticas de saúde. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-11-19T12:07:01Z 2025-11-19T12:07:01Z 2025-10-20 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
SOUZA, Pedro José Carneiro de. Métodos de agrupamento difuso aplicados a dados simbólicos poligonais. 2025. Dissertação (Mestrado Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2025. https://repositorio.ufpe.br/handle/123456789/66909 |
| identifier_str_mv |
SOUZA, Pedro José Carneiro de. Métodos de agrupamento difuso aplicados a dados simbólicos poligonais. 2025. Dissertação (Mestrado Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2025. |
| url |
https://repositorio.ufpe.br/handle/123456789/66909 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/embargoedAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
embargoedAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1856041995393302528 |