Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel

Detalhes bibliográficos
Ano de defesa: 2026
Autor(a) principal: SIQUEIRA NETO, Geraldo da Costa
Orientador(a): SOUZA, Renata Maria Cardoso Rodrigues de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso embargado
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/68287
Resumo: O crescimento no volume de dados e na complexidade das representações tem impulsi onado a busca por métodos capazes de extrair estruturas relevantes sem descaracterizar as informações originais. Nesse contexto, a Análise de Dados Simbólicos (ADS) destaca-se por permitir a modelagem de unidades de informação mais complexas, como intervalos, possi bilitando representar incerteza, variabilidade e heterogeneidade interna dos dados. Entre os diferentes tipos simbólicos, os dados intervalares são amplamente utilizados por preservarem a amplitude observada de cada variável ao longo de múltiplas ocorrências agregadas. No con texto de ADS, os métodos de agrupamento são amplamente utilizados, porém a literatura apresenta poucas extensões difusas do método Fuzzy C-Means voltadas para dados intervala res, deixando certos problemas sem solução. Métodos kernelizados vêm sendo propostos como alternativa para lidar com distribuições não lineares, enquanto o método multivariado se propõe a lidar com diferenças nas variáveis. Este trabalho tem como objetivo desenvolver e implemen tar o método de agrupamento multivariado para dados intervalares usando funções de kernel, visando oferecer maior flexibilidade e robustez à análise de agrupamentos para intervalos. A validação será feita por meio de comparação do método proposto com os algoritmos de agru pamento difuso para dados intervalares existentes na literatura. Essa metodologia será aplicada em dados sintéticos construídos para simular diferentes cenários que avaliam diferentes carac terísticas da abordagem. Além disso, a mesma comparação será aplicada em bases reais usadas na literatura e, por fim, para demonstrar a aplicabilidade do método, conduz-se um estudo de caso com dados reais de periódicos científicos, nos quais indicadores bibliométricos agregados são representados como variáveis intervalares. Nesse estudo, avalia-se a capacidade dos mé todos de identificar perfis de periódicos com características editoriais semelhantes, fornecendo uma análise interpretável e alinhada à estrutura simbólica dos dados
id UFPE_dc6cd0a5f20401d0e637bdb3622022a3
oai_identifier_str oai:repositorio.ufpe.br:123456789/68287
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling SIQUEIRA NETO, Geraldo da Costahttp://lattes.cnpq.br/3202819633195550http://lattes.cnpq.br/9289080285504453http://lattes.cnpq.br/5575405279834457https://orcid.org/0000-0002-2849-1273https://orcid.org/0000-0001-5771-8783SOUZA, Renata Maria Cardoso Rodrigues dePIMENTEL, Bruno Almeida2026-02-10T16:15:07Z2026-02-10T16:15:07Z2026-01-23SIQUEIRA NETO, Geraldo da Costa. Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel. 2026. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2026.https://repositorio.ufpe.br/handle/123456789/68287O crescimento no volume de dados e na complexidade das representações tem impulsi onado a busca por métodos capazes de extrair estruturas relevantes sem descaracterizar as informações originais. Nesse contexto, a Análise de Dados Simbólicos (ADS) destaca-se por permitir a modelagem de unidades de informação mais complexas, como intervalos, possi bilitando representar incerteza, variabilidade e heterogeneidade interna dos dados. Entre os diferentes tipos simbólicos, os dados intervalares são amplamente utilizados por preservarem a amplitude observada de cada variável ao longo de múltiplas ocorrências agregadas. No con texto de ADS, os métodos de agrupamento são amplamente utilizados, porém a literatura apresenta poucas extensões difusas do método Fuzzy C-Means voltadas para dados intervala res, deixando certos problemas sem solução. Métodos kernelizados vêm sendo propostos como alternativa para lidar com distribuições não lineares, enquanto o método multivariado se propõe a lidar com diferenças nas variáveis. Este trabalho tem como objetivo desenvolver e implemen tar o método de agrupamento multivariado para dados intervalares usando funções de kernel, visando oferecer maior flexibilidade e robustez à análise de agrupamentos para intervalos. A validação será feita por meio de comparação do método proposto com os algoritmos de agru pamento difuso para dados intervalares existentes na literatura. Essa metodologia será aplicada em dados sintéticos construídos para simular diferentes cenários que avaliam diferentes carac terísticas da abordagem. Além disso, a mesma comparação será aplicada em bases reais usadas na literatura e, por fim, para demonstrar a aplicabilidade do método, conduz-se um estudo de caso com dados reais de periódicos científicos, nos quais indicadores bibliométricos agregados são representados como variáveis intervalares. Nesse estudo, avalia-se a capacidade dos mé todos de identificar perfis de periódicos com características editoriais semelhantes, fornecendo uma análise interpretável e alinhada à estrutura simbólica dos dadosThe growth in data volume and the complexity of representations has driven the search for methods capable of extracting relevant structures without distorting the original infor mation. In this context, Symbolic Data Analysis (SDA) stands out by allowing the modeling of more complex information units, such as intervals, allowing the representation of uncer tainty, variability, and internal heterogeneity within the data. Among the different symbolic types, interval-valued data is widely used because it preserves the observed range of each vari able across multiple aggregated occurrences. In the context of SDA, clustering methods are widely employed; however, the literature presents few fuzzy extensions of the Fuzzy C-Means method designed for interval data. Kernel-based approaches have been proposed as an alter native for handling nonlinear distributions (KFCM-IV ), while the multivariate method aims to deal with differences among variables (IMFCM). This work aims to develop and imple ment a multivariate clustering method for interval-valued data, using kernel-based functions (KMFCM-IV), in order to provide greater flexibility and robustness to interval clustering analysis. Validation will be carried out by comparing the proposed method with existing fuzzy clustering algorithms for interval data available in the literature. This methodology will be applied to synthetic datasets constructed to simulate different scenarios that evaluate various characteristics of the approach. In addition, the same comparison will be conducted on real datasets commonly used in the interval-data literature and, finally, to demonstrate the appli cability of the method, a case study will be performed using real data from scientific journals, in which aggregated bibliometric indicators are represented as interval-valued variables. In this study, we assess the ability of the methods to identify groups of journals with similar editorial profiles, providing an interpretable analysis aligned with the symbolic structure of the data.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilhttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/embargoedAccessAnálise de dados simbólicosDados intervalaresAgrupamento difuso multivariadoFunções de KernelDados de periódicos científicosAgrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernelinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPELICENSElicense.txtlicense.txttext/plain; charset=utf-82362https://repositorio.ufpe.br/bitstream/123456789/68287/2/license.txt5e89a1613ddc8510c6576f4b23a78973MD52ORIGINALDISSERTAÇÃO Geraldo da Costa Siqueira Neto.pdfDISSERTAÇÃO Geraldo da Costa Siqueira Neto.pdfapplication/pdf1612858https://repositorio.ufpe.br/bitstream/123456789/68287/1/DISSERTA%c3%87%c3%83O%20Geraldo%20da%20Costa%20Siqueira%20Neto.pdfee7f228535ca91b5033df629f6e3c4d6MD51123456789/682872026-02-10 13:15:09.908oai:repositorio.ufpe.br:123456789/68287VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2l6YcOnw6NvIGRlIERvY3VtZW50b3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRQoKCkRlY2xhcm8gZXN0YXIgY2llbnRlIGRlIHF1ZSBlc3RlIFRlcm1vIGRlIERlcMOzc2l0byBMZWdhbCBlIEF1dG9yaXphw6fDo28gdGVtIG8gb2JqZXRpdm8gZGUgZGl2dWxnYcOnw6NvIGRvcyBkb2N1bWVudG9zIGRlcG9zaXRhZG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgZSBkZWNsYXJvIHF1ZToKCkkgLSBvcyBkYWRvcyBwcmVlbmNoaWRvcyBubyBmb3JtdWzDoXJpbyBkZSBkZXDDs3NpdG8gc8OjbyB2ZXJkYWRlaXJvcyBlIGF1dMOqbnRpY29zOwoKSUkgLSAgbyBjb250ZcO6ZG8gZGlzcG9uaWJpbGl6YWRvIMOpIGRlIHJlc3BvbnNhYmlsaWRhZGUgZGUgc3VhIGF1dG9yaWE7CgpJSUkgLSBvIGNvbnRlw7pkbyDDqSBvcmlnaW5hbCwgZSBzZSBvIHRyYWJhbGhvIGUvb3UgcGFsYXZyYXMgZGUgb3V0cmFzIHBlc3NvYXMgZm9yYW0gdXRpbGl6YWRvcywgZXN0YXMgZm9yYW0gZGV2aWRhbWVudGUgcmVjb25oZWNpZGFzOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIG9icmEgY29sZXRpdmEgKG1haXMgZGUgdW0gYXV0b3IpOiB0b2RvcyBvcyBhdXRvcmVzIGVzdMOjbyBjaWVudGVzIGRvIGRlcMOzc2l0byBlIGRlIGFjb3JkbyBjb20gZXN0ZSB0ZXJtbzsKClYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogbyBhcnF1aXZvIGRlcG9zaXRhZG8gY29ycmVzcG9uZGUgw6AgdmVyc8OjbyBmaW5hbCBkbyB0cmFiYWxobzsKClZJIC0gcXVhbmRvIHRyYXRhci1zZSBkZSBUcmFiYWxobyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvLCBEaXNzZXJ0YcOnw6NvIG91IFRlc2U6IGVzdG91IGNpZW50ZSBkZSBxdWUgYSBhbHRlcmHDp8OjbyBkYSBtb2RhbGlkYWRlIGRlIGFjZXNzbyBhbyBkb2N1bWVudG8gYXDDs3MgbyBkZXDDs3NpdG8gZSBhbnRlcyBkZSBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvLCBxdWFuZG8gZm9yIGVzY29saGlkbyBhY2Vzc28gcmVzdHJpdG8sIHNlcsOhIHBlcm1pdGlkYSBtZWRpYW50ZSBzb2xpY2l0YcOnw6NvIGRvIChhKSBhdXRvciAoYSkgYW8gU2lzdGVtYSBJbnRlZ3JhZG8gZGUgQmlibGlvdGVjYXMgZGEgVUZQRSAoU0lCL1VGUEUpLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gQWJlcnRvOgoKTmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRlIGF1dG9yIHF1ZSByZWNhZW0gc29icmUgZXN0ZSBkb2N1bWVudG8sIGZ1bmRhbWVudGFkbyBuYSBMZWkgZGUgRGlyZWl0byBBdXRvcmFsIG5vIDkuNjEwLCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIGEgcGFydGlyIGRhIGRhdGEgZGUgZGVww7NzaXRvLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gUmVzdHJpdG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAgZGUgMTkgZGUgZmV2ZXJlaXJvIGRlIDE5OTgsIGFydC4gMjksIGluY2lzbyBJSUksIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVybmFtYnVjbyBhIGRpc3BvbmliaWxpemFyIGdyYXR1aXRhbWVudGUsIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCAoYXF1aXNpw6fDo28pIGF0cmF2w6lzIGRvIHNpdGUgZG8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBubyBlbmRlcmXDp28gaHR0cDovL3d3dy5yZXBvc2l0b3Jpby51ZnBlLmJyLCBxdWFuZG8gZmluZGFyIG8gcGVyw61vZG8gZGUgZW1iYXJnbyBjb25kaXplbnRlIGFvIHRpcG8gZGUgZG9jdW1lbnRvLCBjb25mb3JtZSBpbmRpY2FkbyBubyBjYW1wbyBEYXRhIGRlIEVtYmFyZ28uCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212026-02-10T16:15:09Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel
title Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel
spellingShingle Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel
SIQUEIRA NETO, Geraldo da Costa
Análise de dados simbólicos
Dados intervalares
Agrupamento difuso multivariado
Funções de Kernel
Dados de periódicos científicos
title_short Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel
title_full Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel
title_fullStr Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel
title_full_unstemmed Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel
title_sort Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel
author SIQUEIRA NETO, Geraldo da Costa
author_facet SIQUEIRA NETO, Geraldo da Costa
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3202819633195550
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/9289080285504453
dc.contributor.advisor-coLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/5575405279834457
dc.contributor.advisorORCID.pt_BR.fl_str_mv https://orcid.org/0000-0002-2849-1273
dc.contributor.advisor-coORCID.pt_BR.fl_str_mv https://orcid.org/0000-0001-5771-8783
dc.contributor.author.fl_str_mv SIQUEIRA NETO, Geraldo da Costa
dc.contributor.advisor1.fl_str_mv SOUZA, Renata Maria Cardoso Rodrigues de
dc.contributor.advisor-co1.fl_str_mv PIMENTEL, Bruno Almeida
contributor_str_mv SOUZA, Renata Maria Cardoso Rodrigues de
PIMENTEL, Bruno Almeida
dc.subject.por.fl_str_mv Análise de dados simbólicos
Dados intervalares
Agrupamento difuso multivariado
Funções de Kernel
Dados de periódicos científicos
topic Análise de dados simbólicos
Dados intervalares
Agrupamento difuso multivariado
Funções de Kernel
Dados de periódicos científicos
description O crescimento no volume de dados e na complexidade das representações tem impulsi onado a busca por métodos capazes de extrair estruturas relevantes sem descaracterizar as informações originais. Nesse contexto, a Análise de Dados Simbólicos (ADS) destaca-se por permitir a modelagem de unidades de informação mais complexas, como intervalos, possi bilitando representar incerteza, variabilidade e heterogeneidade interna dos dados. Entre os diferentes tipos simbólicos, os dados intervalares são amplamente utilizados por preservarem a amplitude observada de cada variável ao longo de múltiplas ocorrências agregadas. No con texto de ADS, os métodos de agrupamento são amplamente utilizados, porém a literatura apresenta poucas extensões difusas do método Fuzzy C-Means voltadas para dados intervala res, deixando certos problemas sem solução. Métodos kernelizados vêm sendo propostos como alternativa para lidar com distribuições não lineares, enquanto o método multivariado se propõe a lidar com diferenças nas variáveis. Este trabalho tem como objetivo desenvolver e implemen tar o método de agrupamento multivariado para dados intervalares usando funções de kernel, visando oferecer maior flexibilidade e robustez à análise de agrupamentos para intervalos. A validação será feita por meio de comparação do método proposto com os algoritmos de agru pamento difuso para dados intervalares existentes na literatura. Essa metodologia será aplicada em dados sintéticos construídos para simular diferentes cenários que avaliam diferentes carac terísticas da abordagem. Além disso, a mesma comparação será aplicada em bases reais usadas na literatura e, por fim, para demonstrar a aplicabilidade do método, conduz-se um estudo de caso com dados reais de periódicos científicos, nos quais indicadores bibliométricos agregados são representados como variáveis intervalares. Nesse estudo, avalia-se a capacidade dos mé todos de identificar perfis de periódicos com características editoriais semelhantes, fornecendo uma análise interpretável e alinhada à estrutura simbólica dos dados
publishDate 2026
dc.date.accessioned.fl_str_mv 2026-02-10T16:15:07Z
dc.date.available.fl_str_mv 2026-02-10T16:15:07Z
dc.date.issued.fl_str_mv 2026-01-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SIQUEIRA NETO, Geraldo da Costa. Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel. 2026. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2026.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/68287
identifier_str_mv SIQUEIRA NETO, Geraldo da Costa. Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel. 2026. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2026.
url https://repositorio.ufpe.br/handle/123456789/68287
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/embargoedAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv embargoedAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/68287/2/license.txt
https://repositorio.ufpe.br/bitstream/123456789/68287/1/DISSERTA%c3%87%c3%83O%20Geraldo%20da%20Costa%20Siqueira%20Neto.pdf
bitstream.checksum.fl_str_mv 5e89a1613ddc8510c6576f4b23a78973
ee7f228535ca91b5033df629f6e3c4d6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1862741572702961664