Método de agrupamento multinível para dados mistos.

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Paz, Hellen Oliveira da lattes
Orientador(a): Souza, Anderson Luiz Ara lattes
Banca de defesa: Souza, Anderson Luiz Ara lattes, da Costa, Lilia Carolina Carneiro lattes, Ferreira, Marcelo Rodrigo Portela lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal da Bahia
Programa de Pós-Graduação: Pós-Graduação em Matemática (PGMAT) 
Departamento: Instituto de Matemática
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufba.br/handle/ri/40414
Resumo: A Análise de agrupamento é uma área com vasto desenvolvimento metodológico nas diversas áreas do conhecimento. Esta dissertação propõe um novo método de agrupamento para dados mistos, levando em consideração a estrutura multinível das observações. A identificação de quão similares ou próximas as unidades de análise se encontram pode ser quantificada por meio de medidas de proximidade, que, juntamente com os algoritmos utilizados, são essenciais na metodologia de análise de agrupamento. Dados mistos são caracterizados pela presença conjunta de variáveis quantitativas e qualitativas. O termo “Agrupamento Multinível” é utilizado em diversas áreas do conhecimento, referindo-se a diferentes conceitos. Nossa proposta de agrupamento multinível adapta o algoritmo k-médias para dados multiníveis, incorporando a estrutura hierárquica dos dados no cálculo das distâncias entre as observações através de uma abordagem de ponderação da distância de Hellinger. Os resultados obtidos a partir de estudos de simulação e aplicações práticas são satisfatórios, apresentando melhores agrupamentos quando se tem mais de uma variável quantitativa. No entanto, ainda são necessários mais estudos em diversos cenários para aumentar a robustez da metodologia proposta.
id UFBA-2_e1f18fdf06f381a12ac18f1bcbf7ce6a
oai_identifier_str oai:repositorio.ufba.br:ri/40414
network_acronym_str UFBA-2
network_name_str Repositório Institucional da UFBA
repository_id_str
spelling 2024-10-14T10:39:29Z2024-10-14T10:39:29Z2024-06-26PAZ, Hellen Oliveira da. Método de agrupamento multinível para dados mistos. 2024. 100 f. Dissertação (Mestrado em Matemática) - Instituto de Matemática e Estatística - IME, Universidade Federal da Bahia, Salvador (Bahia), 2024.https://repositorio.ufba.br/handle/ri/40414A Análise de agrupamento é uma área com vasto desenvolvimento metodológico nas diversas áreas do conhecimento. Esta dissertação propõe um novo método de agrupamento para dados mistos, levando em consideração a estrutura multinível das observações. A identificação de quão similares ou próximas as unidades de análise se encontram pode ser quantificada por meio de medidas de proximidade, que, juntamente com os algoritmos utilizados, são essenciais na metodologia de análise de agrupamento. Dados mistos são caracterizados pela presença conjunta de variáveis quantitativas e qualitativas. O termo “Agrupamento Multinível” é utilizado em diversas áreas do conhecimento, referindo-se a diferentes conceitos. Nossa proposta de agrupamento multinível adapta o algoritmo k-médias para dados multiníveis, incorporando a estrutura hierárquica dos dados no cálculo das distâncias entre as observações através de uma abordagem de ponderação da distância de Hellinger. Os resultados obtidos a partir de estudos de simulação e aplicações práticas são satisfatórios, apresentando melhores agrupamentos quando se tem mais de uma variável quantitativa. No entanto, ainda são necessários mais estudos em diversos cenários para aumentar a robustez da metodologia proposta.Cluster Analysis is an area with vast methodological development in different areas of knowledge. This dissertation proposes a new clustering method for mixed data, taking into account the multilevel structure of observations. The identification of how similar or close the units of analysis are can be quantified through proximity measures, which, together with the algorithms used, are essential in the cluster analysis methodology. Mixed data is characterized by the joint presence of quantitative and qualitative variables. The term “Multilevel Clustering” is used in different areas of knowledge, referring to different concepts. Our multilevel clustering proposal adapts the k-means algorithm to multilevel data, incorporating the hierarchical structure of the data in calculating the distances between observations through a Hellinger distance weighting approach. The results obtained from simulation studies and practical applications are satisfactory, presenting better groupings when there is more than one quantitative variable. However, more studies are still needed in different scenarios to increase the robustness of the proposed methodology.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, CAPESporUniversidade Federal da BahiaPós-Graduação em Matemática (PGMAT) UFBABrasilInstituto de MatemáticaCluster analysisMultilevel clusteringK-meansMultilevel dataMixed dataCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICAAnálise de agrupamentoAgrupamento multinívelK-meansDados multiníveisDados mistosMétodo de agrupamento multinível para dados mistos.Multilevel clustering method for mixed data.Mestrado Acadêmicoinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionSouza, Anderson Luiz Arahttps://orcid.org/0000-0002-1041-2768http://lattes.cnpq.br/8916772290938469Fiaccone, Rosemeire Leovigildohttps://orcid.org/0000-0001-5439-1551http://lattes.cnpq.br/1839882342448396Souza, Anderson Luiz Arahttps://orcid.org/0000-0002-1041-2768http://lattes.cnpq.br/8916772290938469da Costa, Lilia Carolina Carneirohttps://orcid.org/0000-0001-5107-2723http://lattes.cnpq.br/7905206547630006Ferreira, Marcelo Rodrigo Portelahttps://orcid.org/0000-0003-0242-0255http://lattes.cnpq.br/2620157217100077http://lattes.cnpq.br/6712262587708162Paz, Hellen Oliveira dainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAORIGINALDissertacao_HellenPaz_vsfinal.pdfDissertacao_HellenPaz_vsfinal.pdfDissertação Hellen Pazapplication/pdf1697666https://repositorio.ufba.br/bitstream/ri/40414/1/Dissertacao_HellenPaz_vsfinal.pdfe4d4d52fac07ed3725a4c3e8c637c0b3MD51open accessLICENSElicense.txtlicense.txttext/plain1720https://repositorio.ufba.br/bitstream/ri/40414/2/license.txtd9b7566281c22d808dbf8f29ff0425c8MD52open accessri/404142024-10-14 07:39:30.079open accessoai:repositorio.ufba.br:ri/40414TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNhw6fDo28gKGluY2x1aW5kbyBvIHJlc3Vtbykgbm8gZm9ybWF0byBpbXByZXNzbyBlL291IGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBlL291IHbDrWRlby4KCk8gYXV0b3Igb3UgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgY29uY29yZGEgcXVlIG8gUmVwb3NpdMOzcmlvIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIGUvb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8OjbywgcG9kZW5kbyBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLiAKCk8gYXV0b3Igb3UgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIG7Do28sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIGFvIFJlcG9zaXTDs3JpbyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBSRVNVTFRFIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTywgVk9Dw4ogREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklTw4NPLCBDT01PIFRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l0w7NyaW8gc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyLCBjbGFyYW1lbnRlLCBvIChzKSBzZXUocykgbm9tZSAocykgb3UgbyAocykgbm9tZSAocykgZG8gKHMpIGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHB1YmxpY2HDp8OjbyBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufba.br/oai/requestrepositorio@ufba.bropendoar:19322024-10-14T10:39:30Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false
dc.title.pt_BR.fl_str_mv Método de agrupamento multinível para dados mistos.
dc.title.alternative.pt_BR.fl_str_mv Multilevel clustering method for mixed data.
title Método de agrupamento multinível para dados mistos.
spellingShingle Método de agrupamento multinível para dados mistos.
Paz, Hellen Oliveira da
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
Análise de agrupamento
Agrupamento multinível
K-means
Dados multiníveis
Dados mistos
Cluster analysis
Multilevel clustering
K-means
Multilevel data
Mixed data
title_short Método de agrupamento multinível para dados mistos.
title_full Método de agrupamento multinível para dados mistos.
title_fullStr Método de agrupamento multinível para dados mistos.
title_full_unstemmed Método de agrupamento multinível para dados mistos.
title_sort Método de agrupamento multinível para dados mistos.
author Paz, Hellen Oliveira da
author_facet Paz, Hellen Oliveira da
author_role author
dc.contributor.advisor1.fl_str_mv Souza, Anderson Luiz Ara
dc.contributor.advisor1ID.fl_str_mv https://orcid.org/0000-0002-1041-2768
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8916772290938469
dc.contributor.advisor-co1.fl_str_mv Fiaccone, Rosemeire Leovigildo
dc.contributor.advisor-co1ID.fl_str_mv https://orcid.org/0000-0001-5439-1551
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/1839882342448396
dc.contributor.referee1.fl_str_mv Souza, Anderson Luiz Ara
dc.contributor.referee1ID.fl_str_mv https://orcid.org/0000-0002-1041-2768
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/8916772290938469
dc.contributor.referee2.fl_str_mv da Costa, Lilia Carolina Carneiro
dc.contributor.referee2ID.fl_str_mv https://orcid.org/0000-0001-5107-2723
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/7905206547630006
dc.contributor.referee3.fl_str_mv Ferreira, Marcelo Rodrigo Portela
dc.contributor.referee3ID.fl_str_mv https://orcid.org/0000-0003-0242-0255
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/2620157217100077
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/6712262587708162
dc.contributor.author.fl_str_mv Paz, Hellen Oliveira da
contributor_str_mv Souza, Anderson Luiz Ara
Fiaccone, Rosemeire Leovigildo
Souza, Anderson Luiz Ara
da Costa, Lilia Carolina Carneiro
Ferreira, Marcelo Rodrigo Portela
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
topic CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
Análise de agrupamento
Agrupamento multinível
K-means
Dados multiníveis
Dados mistos
Cluster analysis
Multilevel clustering
K-means
Multilevel data
Mixed data
dc.subject.por.fl_str_mv Análise de agrupamento
Agrupamento multinível
K-means
Dados multiníveis
Dados mistos
dc.subject.other.pt_BR.fl_str_mv Cluster analysis
Multilevel clustering
K-means
Multilevel data
Mixed data
description A Análise de agrupamento é uma área com vasto desenvolvimento metodológico nas diversas áreas do conhecimento. Esta dissertação propõe um novo método de agrupamento para dados mistos, levando em consideração a estrutura multinível das observações. A identificação de quão similares ou próximas as unidades de análise se encontram pode ser quantificada por meio de medidas de proximidade, que, juntamente com os algoritmos utilizados, são essenciais na metodologia de análise de agrupamento. Dados mistos são caracterizados pela presença conjunta de variáveis quantitativas e qualitativas. O termo “Agrupamento Multinível” é utilizado em diversas áreas do conhecimento, referindo-se a diferentes conceitos. Nossa proposta de agrupamento multinível adapta o algoritmo k-médias para dados multiníveis, incorporando a estrutura hierárquica dos dados no cálculo das distâncias entre as observações através de uma abordagem de ponderação da distância de Hellinger. Os resultados obtidos a partir de estudos de simulação e aplicações práticas são satisfatórios, apresentando melhores agrupamentos quando se tem mais de uma variável quantitativa. No entanto, ainda são necessários mais estudos em diversos cenários para aumentar a robustez da metodologia proposta.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-10-14T10:39:29Z
dc.date.available.fl_str_mv 2024-10-14T10:39:29Z
dc.date.issued.fl_str_mv 2024-06-26
dc.type.driver.fl_str_mv Mestrado Acadêmico
info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PAZ, Hellen Oliveira da. Método de agrupamento multinível para dados mistos. 2024. 100 f. Dissertação (Mestrado em Matemática) - Instituto de Matemática e Estatística - IME, Universidade Federal da Bahia, Salvador (Bahia), 2024.
dc.identifier.uri.fl_str_mv https://repositorio.ufba.br/handle/ri/40414
identifier_str_mv PAZ, Hellen Oliveira da. Método de agrupamento multinível para dados mistos. 2024. 100 f. Dissertação (Mestrado em Matemática) - Instituto de Matemática e Estatística - IME, Universidade Federal da Bahia, Salvador (Bahia), 2024.
url https://repositorio.ufba.br/handle/ri/40414
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Bahia
dc.publisher.program.fl_str_mv Pós-Graduação em Matemática (PGMAT) 
dc.publisher.initials.fl_str_mv UFBA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Matemática
publisher.none.fl_str_mv Universidade Federal da Bahia
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFBA
instname:Universidade Federal da Bahia (UFBA)
instacron:UFBA
instname_str Universidade Federal da Bahia (UFBA)
instacron_str UFBA
institution UFBA
reponame_str Repositório Institucional da UFBA
collection Repositório Institucional da UFBA
bitstream.url.fl_str_mv https://repositorio.ufba.br/bitstream/ri/40414/1/Dissertacao_HellenPaz_vsfinal.pdf
https://repositorio.ufba.br/bitstream/ri/40414/2/license.txt
bitstream.checksum.fl_str_mv e4d4d52fac07ed3725a4c3e8c637c0b3
d9b7566281c22d808dbf8f29ff0425c8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)
repository.mail.fl_str_mv repositorio@ufba.br
_version_ 1847342294320021504