Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel
| Ano de defesa: | 2026 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso embargado |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
|
| Programa de Pós-Graduação: |
Programa de Pos Graduacao em Ciencia da Computacao
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/68287 |
Resumo: | O crescimento no volume de dados e na complexidade das representações tem impulsi onado a busca por métodos capazes de extrair estruturas relevantes sem descaracterizar as informações originais. Nesse contexto, a Análise de Dados Simbólicos (ADS) destaca-se por permitir a modelagem de unidades de informação mais complexas, como intervalos, possi bilitando representar incerteza, variabilidade e heterogeneidade interna dos dados. Entre os diferentes tipos simbólicos, os dados intervalares são amplamente utilizados por preservarem a amplitude observada de cada variável ao longo de múltiplas ocorrências agregadas. No con texto de ADS, os métodos de agrupamento são amplamente utilizados, porém a literatura apresenta poucas extensões difusas do método Fuzzy C-Means voltadas para dados intervala res, deixando certos problemas sem solução. Métodos kernelizados vêm sendo propostos como alternativa para lidar com distribuições não lineares, enquanto o método multivariado se propõe a lidar com diferenças nas variáveis. Este trabalho tem como objetivo desenvolver e implemen tar o método de agrupamento multivariado para dados intervalares usando funções de kernel, visando oferecer maior flexibilidade e robustez à análise de agrupamentos para intervalos. A validação será feita por meio de comparação do método proposto com os algoritmos de agru pamento difuso para dados intervalares existentes na literatura. Essa metodologia será aplicada em dados sintéticos construídos para simular diferentes cenários que avaliam diferentes carac terísticas da abordagem. Além disso, a mesma comparação será aplicada em bases reais usadas na literatura e, por fim, para demonstrar a aplicabilidade do método, conduz-se um estudo de caso com dados reais de periódicos científicos, nos quais indicadores bibliométricos agregados são representados como variáveis intervalares. Nesse estudo, avalia-se a capacidade dos mé todos de identificar perfis de periódicos com características editoriais semelhantes, fornecendo uma análise interpretável e alinhada à estrutura simbólica dos dados |
| id |
UFPE_dc6cd0a5f20401d0e637bdb3622022a3 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/68287 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
SIQUEIRA NETO, Geraldo da Costahttp://lattes.cnpq.br/3202819633195550http://lattes.cnpq.br/9289080285504453http://lattes.cnpq.br/5575405279834457https://orcid.org/0000-0002-2849-1273https://orcid.org/0000-0001-5771-8783SOUZA, Renata Maria Cardoso Rodrigues dePIMENTEL, Bruno Almeida2026-02-10T16:15:07Z2026-02-10T16:15:07Z2026-01-23SIQUEIRA NETO, Geraldo da Costa. Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel. 2026. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2026.https://repositorio.ufpe.br/handle/123456789/68287O crescimento no volume de dados e na complexidade das representações tem impulsi onado a busca por métodos capazes de extrair estruturas relevantes sem descaracterizar as informações originais. Nesse contexto, a Análise de Dados Simbólicos (ADS) destaca-se por permitir a modelagem de unidades de informação mais complexas, como intervalos, possi bilitando representar incerteza, variabilidade e heterogeneidade interna dos dados. Entre os diferentes tipos simbólicos, os dados intervalares são amplamente utilizados por preservarem a amplitude observada de cada variável ao longo de múltiplas ocorrências agregadas. No con texto de ADS, os métodos de agrupamento são amplamente utilizados, porém a literatura apresenta poucas extensões difusas do método Fuzzy C-Means voltadas para dados intervala res, deixando certos problemas sem solução. Métodos kernelizados vêm sendo propostos como alternativa para lidar com distribuições não lineares, enquanto o método multivariado se propõe a lidar com diferenças nas variáveis. Este trabalho tem como objetivo desenvolver e implemen tar o método de agrupamento multivariado para dados intervalares usando funções de kernel, visando oferecer maior flexibilidade e robustez à análise de agrupamentos para intervalos. A validação será feita por meio de comparação do método proposto com os algoritmos de agru pamento difuso para dados intervalares existentes na literatura. Essa metodologia será aplicada em dados sintéticos construídos para simular diferentes cenários que avaliam diferentes carac terísticas da abordagem. Além disso, a mesma comparação será aplicada em bases reais usadas na literatura e, por fim, para demonstrar a aplicabilidade do método, conduz-se um estudo de caso com dados reais de periódicos científicos, nos quais indicadores bibliométricos agregados são representados como variáveis intervalares. Nesse estudo, avalia-se a capacidade dos mé todos de identificar perfis de periódicos com características editoriais semelhantes, fornecendo uma análise interpretável e alinhada à estrutura simbólica dos dadosThe growth in data volume and the complexity of representations has driven the search for methods capable of extracting relevant structures without distorting the original infor mation. In this context, Symbolic Data Analysis (SDA) stands out by allowing the modeling of more complex information units, such as intervals, allowing the representation of uncer tainty, variability, and internal heterogeneity within the data. Among the different symbolic types, interval-valued data is widely used because it preserves the observed range of each vari able across multiple aggregated occurrences. In the context of SDA, clustering methods are widely employed; however, the literature presents few fuzzy extensions of the Fuzzy C-Means method designed for interval data. Kernel-based approaches have been proposed as an alter native for handling nonlinear distributions (KFCM-IV ), while the multivariate method aims to deal with differences among variables (IMFCM). This work aims to develop and imple ment a multivariate clustering method for interval-valued data, using kernel-based functions (KMFCM-IV), in order to provide greater flexibility and robustness to interval clustering analysis. Validation will be carried out by comparing the proposed method with existing fuzzy clustering algorithms for interval data available in the literature. This methodology will be applied to synthetic datasets constructed to simulate different scenarios that evaluate various characteristics of the approach. In addition, the same comparison will be conducted on real datasets commonly used in the interval-data literature and, finally, to demonstrate the appli cability of the method, a case study will be performed using real data from scientific journals, in which aggregated bibliometric indicators are represented as interval-valued variables. In this study, we assess the ability of the methods to identify groups of journals with similar editorial profiles, providing an interpretable analysis aligned with the symbolic structure of the data.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilhttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/embargoedAccessAnálise de dados simbólicosDados intervalaresAgrupamento difuso multivariadoFunções de KernelDados de periódicos científicosAgrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernelinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPELICENSElicense.txtlicense.txttext/plain; charset=utf-82362https://repositorio.ufpe.br/bitstream/123456789/68287/2/license.txt5e89a1613ddc8510c6576f4b23a78973MD52ORIGINALDISSERTAÇÃO Geraldo da Costa Siqueira Neto.pdfDISSERTAÇÃO Geraldo da Costa Siqueira Neto.pdfapplication/pdf1612858https://repositorio.ufpe.br/bitstream/123456789/68287/1/DISSERTA%c3%87%c3%83O%20Geraldo%20da%20Costa%20Siqueira%20Neto.pdfee7f228535ca91b5033df629f6e3c4d6MD51123456789/682872026-02-10 13:15:09.908oai:repositorio.ufpe.br:123456789/68287VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2l6YcOnw6NvIGRlIERvY3VtZW50b3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRQoKCkRlY2xhcm8gZXN0YXIgY2llbnRlIGRlIHF1ZSBlc3RlIFRlcm1vIGRlIERlcMOzc2l0byBMZWdhbCBlIEF1dG9yaXphw6fDo28gdGVtIG8gb2JqZXRpdm8gZGUgZGl2dWxnYcOnw6NvIGRvcyBkb2N1bWVudG9zIGRlcG9zaXRhZG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgZSBkZWNsYXJvIHF1ZToKCkkgLSBvcyBkYWRvcyBwcmVlbmNoaWRvcyBubyBmb3JtdWzDoXJpbyBkZSBkZXDDs3NpdG8gc8OjbyB2ZXJkYWRlaXJvcyBlIGF1dMOqbnRpY29zOwoKSUkgLSAgbyBjb250ZcO6ZG8gZGlzcG9uaWJpbGl6YWRvIMOpIGRlIHJlc3BvbnNhYmlsaWRhZGUgZGUgc3VhIGF1dG9yaWE7CgpJSUkgLSBvIGNvbnRlw7pkbyDDqSBvcmlnaW5hbCwgZSBzZSBvIHRyYWJhbGhvIGUvb3UgcGFsYXZyYXMgZGUgb3V0cmFzIHBlc3NvYXMgZm9yYW0gdXRpbGl6YWRvcywgZXN0YXMgZm9yYW0gZGV2aWRhbWVudGUgcmVjb25oZWNpZGFzOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIG9icmEgY29sZXRpdmEgKG1haXMgZGUgdW0gYXV0b3IpOiB0b2RvcyBvcyBhdXRvcmVzIGVzdMOjbyBjaWVudGVzIGRvIGRlcMOzc2l0byBlIGRlIGFjb3JkbyBjb20gZXN0ZSB0ZXJtbzsKClYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogbyBhcnF1aXZvIGRlcG9zaXRhZG8gY29ycmVzcG9uZGUgw6AgdmVyc8OjbyBmaW5hbCBkbyB0cmFiYWxobzsKClZJIC0gcXVhbmRvIHRyYXRhci1zZSBkZSBUcmFiYWxobyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvLCBEaXNzZXJ0YcOnw6NvIG91IFRlc2U6IGVzdG91IGNpZW50ZSBkZSBxdWUgYSBhbHRlcmHDp8OjbyBkYSBtb2RhbGlkYWRlIGRlIGFjZXNzbyBhbyBkb2N1bWVudG8gYXDDs3MgbyBkZXDDs3NpdG8gZSBhbnRlcyBkZSBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvLCBxdWFuZG8gZm9yIGVzY29saGlkbyBhY2Vzc28gcmVzdHJpdG8sIHNlcsOhIHBlcm1pdGlkYSBtZWRpYW50ZSBzb2xpY2l0YcOnw6NvIGRvIChhKSBhdXRvciAoYSkgYW8gU2lzdGVtYSBJbnRlZ3JhZG8gZGUgQmlibGlvdGVjYXMgZGEgVUZQRSAoU0lCL1VGUEUpLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gQWJlcnRvOgoKTmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRlIGF1dG9yIHF1ZSByZWNhZW0gc29icmUgZXN0ZSBkb2N1bWVudG8sIGZ1bmRhbWVudGFkbyBuYSBMZWkgZGUgRGlyZWl0byBBdXRvcmFsIG5vIDkuNjEwLCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIGEgcGFydGlyIGRhIGRhdGEgZGUgZGVww7NzaXRvLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gUmVzdHJpdG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAgZGUgMTkgZGUgZmV2ZXJlaXJvIGRlIDE5OTgsIGFydC4gMjksIGluY2lzbyBJSUksIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVybmFtYnVjbyBhIGRpc3BvbmliaWxpemFyIGdyYXR1aXRhbWVudGUsIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCAoYXF1aXNpw6fDo28pIGF0cmF2w6lzIGRvIHNpdGUgZG8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBubyBlbmRlcmXDp28gaHR0cDovL3d3dy5yZXBvc2l0b3Jpby51ZnBlLmJyLCBxdWFuZG8gZmluZGFyIG8gcGVyw61vZG8gZGUgZW1iYXJnbyBjb25kaXplbnRlIGFvIHRpcG8gZGUgZG9jdW1lbnRvLCBjb25mb3JtZSBpbmRpY2FkbyBubyBjYW1wbyBEYXRhIGRlIEVtYmFyZ28uCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212026-02-10T16:15:09Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.pt_BR.fl_str_mv |
Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel |
| title |
Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel |
| spellingShingle |
Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel SIQUEIRA NETO, Geraldo da Costa Análise de dados simbólicos Dados intervalares Agrupamento difuso multivariado Funções de Kernel Dados de periódicos científicos |
| title_short |
Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel |
| title_full |
Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel |
| title_fullStr |
Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel |
| title_full_unstemmed |
Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel |
| title_sort |
Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel |
| author |
SIQUEIRA NETO, Geraldo da Costa |
| author_facet |
SIQUEIRA NETO, Geraldo da Costa |
| author_role |
author |
| dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3202819633195550 |
| dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/9289080285504453 |
| dc.contributor.advisor-coLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/5575405279834457 |
| dc.contributor.advisorORCID.pt_BR.fl_str_mv |
https://orcid.org/0000-0002-2849-1273 |
| dc.contributor.advisor-coORCID.pt_BR.fl_str_mv |
https://orcid.org/0000-0001-5771-8783 |
| dc.contributor.author.fl_str_mv |
SIQUEIRA NETO, Geraldo da Costa |
| dc.contributor.advisor1.fl_str_mv |
SOUZA, Renata Maria Cardoso Rodrigues de |
| dc.contributor.advisor-co1.fl_str_mv |
PIMENTEL, Bruno Almeida |
| contributor_str_mv |
SOUZA, Renata Maria Cardoso Rodrigues de PIMENTEL, Bruno Almeida |
| dc.subject.por.fl_str_mv |
Análise de dados simbólicos Dados intervalares Agrupamento difuso multivariado Funções de Kernel Dados de periódicos científicos |
| topic |
Análise de dados simbólicos Dados intervalares Agrupamento difuso multivariado Funções de Kernel Dados de periódicos científicos |
| description |
O crescimento no volume de dados e na complexidade das representações tem impulsi onado a busca por métodos capazes de extrair estruturas relevantes sem descaracterizar as informações originais. Nesse contexto, a Análise de Dados Simbólicos (ADS) destaca-se por permitir a modelagem de unidades de informação mais complexas, como intervalos, possi bilitando representar incerteza, variabilidade e heterogeneidade interna dos dados. Entre os diferentes tipos simbólicos, os dados intervalares são amplamente utilizados por preservarem a amplitude observada de cada variável ao longo de múltiplas ocorrências agregadas. No con texto de ADS, os métodos de agrupamento são amplamente utilizados, porém a literatura apresenta poucas extensões difusas do método Fuzzy C-Means voltadas para dados intervala res, deixando certos problemas sem solução. Métodos kernelizados vêm sendo propostos como alternativa para lidar com distribuições não lineares, enquanto o método multivariado se propõe a lidar com diferenças nas variáveis. Este trabalho tem como objetivo desenvolver e implemen tar o método de agrupamento multivariado para dados intervalares usando funções de kernel, visando oferecer maior flexibilidade e robustez à análise de agrupamentos para intervalos. A validação será feita por meio de comparação do método proposto com os algoritmos de agru pamento difuso para dados intervalares existentes na literatura. Essa metodologia será aplicada em dados sintéticos construídos para simular diferentes cenários que avaliam diferentes carac terísticas da abordagem. Além disso, a mesma comparação será aplicada em bases reais usadas na literatura e, por fim, para demonstrar a aplicabilidade do método, conduz-se um estudo de caso com dados reais de periódicos científicos, nos quais indicadores bibliométricos agregados são representados como variáveis intervalares. Nesse estudo, avalia-se a capacidade dos mé todos de identificar perfis de periódicos com características editoriais semelhantes, fornecendo uma análise interpretável e alinhada à estrutura simbólica dos dados |
| publishDate |
2026 |
| dc.date.accessioned.fl_str_mv |
2026-02-10T16:15:07Z |
| dc.date.available.fl_str_mv |
2026-02-10T16:15:07Z |
| dc.date.issued.fl_str_mv |
2026-01-23 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
SIQUEIRA NETO, Geraldo da Costa. Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel. 2026. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2026. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/68287 |
| identifier_str_mv |
SIQUEIRA NETO, Geraldo da Costa. Agrupamento difuso multivariado para dados simbólicos intervalares usando funções de Kernel. 2026. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2026. |
| url |
https://repositorio.ufpe.br/handle/123456789/68287 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/embargoedAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
embargoedAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
| dc.publisher.initials.fl_str_mv |
UFPE |
| dc.publisher.country.fl_str_mv |
Brasil |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/68287/2/license.txt https://repositorio.ufpe.br/bitstream/123456789/68287/1/DISSERTA%c3%87%c3%83O%20Geraldo%20da%20Costa%20Siqueira%20Neto.pdf |
| bitstream.checksum.fl_str_mv |
5e89a1613ddc8510c6576f4b23a78973 ee7f228535ca91b5033df629f6e3c4d6 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1862741572702961664 |