Método de agrupamento multinível para dados mistos.
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal da Bahia
|
| Programa de Pós-Graduação: |
Pós-Graduação em Matemática (PGMAT)
|
| Departamento: |
Instituto de Matemática
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufba.br/handle/ri/40414 |
Resumo: | A Análise de agrupamento é uma área com vasto desenvolvimento metodológico nas diversas áreas do conhecimento. Esta dissertação propõe um novo método de agrupamento para dados mistos, levando em consideração a estrutura multinível das observações. A identificação de quão similares ou próximas as unidades de análise se encontram pode ser quantificada por meio de medidas de proximidade, que, juntamente com os algoritmos utilizados, são essenciais na metodologia de análise de agrupamento. Dados mistos são caracterizados pela presença conjunta de variáveis quantitativas e qualitativas. O termo “Agrupamento Multinível” é utilizado em diversas áreas do conhecimento, referindo-se a diferentes conceitos. Nossa proposta de agrupamento multinível adapta o algoritmo k-médias para dados multiníveis, incorporando a estrutura hierárquica dos dados no cálculo das distâncias entre as observações através de uma abordagem de ponderação da distância de Hellinger. Os resultados obtidos a partir de estudos de simulação e aplicações práticas são satisfatórios, apresentando melhores agrupamentos quando se tem mais de uma variável quantitativa. No entanto, ainda são necessários mais estudos em diversos cenários para aumentar a robustez da metodologia proposta. |
| id |
UFBA-2_e1f18fdf06f381a12ac18f1bcbf7ce6a |
|---|---|
| oai_identifier_str |
oai:repositorio.ufba.br:ri/40414 |
| network_acronym_str |
UFBA-2 |
| network_name_str |
Repositório Institucional da UFBA |
| repository_id_str |
|
| spelling |
2024-10-14T10:39:29Z2024-10-14T10:39:29Z2024-06-26PAZ, Hellen Oliveira da. Método de agrupamento multinível para dados mistos. 2024. 100 f. Dissertação (Mestrado em Matemática) - Instituto de Matemática e Estatística - IME, Universidade Federal da Bahia, Salvador (Bahia), 2024.https://repositorio.ufba.br/handle/ri/40414A Análise de agrupamento é uma área com vasto desenvolvimento metodológico nas diversas áreas do conhecimento. Esta dissertação propõe um novo método de agrupamento para dados mistos, levando em consideração a estrutura multinível das observações. A identificação de quão similares ou próximas as unidades de análise se encontram pode ser quantificada por meio de medidas de proximidade, que, juntamente com os algoritmos utilizados, são essenciais na metodologia de análise de agrupamento. Dados mistos são caracterizados pela presença conjunta de variáveis quantitativas e qualitativas. O termo “Agrupamento Multinível” é utilizado em diversas áreas do conhecimento, referindo-se a diferentes conceitos. Nossa proposta de agrupamento multinível adapta o algoritmo k-médias para dados multiníveis, incorporando a estrutura hierárquica dos dados no cálculo das distâncias entre as observações através de uma abordagem de ponderação da distância de Hellinger. Os resultados obtidos a partir de estudos de simulação e aplicações práticas são satisfatórios, apresentando melhores agrupamentos quando se tem mais de uma variável quantitativa. No entanto, ainda são necessários mais estudos em diversos cenários para aumentar a robustez da metodologia proposta.Cluster Analysis is an area with vast methodological development in different areas of knowledge. This dissertation proposes a new clustering method for mixed data, taking into account the multilevel structure of observations. The identification of how similar or close the units of analysis are can be quantified through proximity measures, which, together with the algorithms used, are essential in the cluster analysis methodology. Mixed data is characterized by the joint presence of quantitative and qualitative variables. The term “Multilevel Clustering” is used in different areas of knowledge, referring to different concepts. Our multilevel clustering proposal adapts the k-means algorithm to multilevel data, incorporating the hierarchical structure of the data in calculating the distances between observations through a Hellinger distance weighting approach. The results obtained from simulation studies and practical applications are satisfactory, presenting better groupings when there is more than one quantitative variable. However, more studies are still needed in different scenarios to increase the robustness of the proposed methodology.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, CAPESporUniversidade Federal da BahiaPós-Graduação em Matemática (PGMAT) UFBABrasilInstituto de MatemáticaCluster analysisMultilevel clusteringK-meansMultilevel dataMixed dataCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICAAnálise de agrupamentoAgrupamento multinívelK-meansDados multiníveisDados mistosMétodo de agrupamento multinível para dados mistos.Multilevel clustering method for mixed data.Mestrado Acadêmicoinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionSouza, Anderson Luiz Arahttps://orcid.org/0000-0002-1041-2768http://lattes.cnpq.br/8916772290938469Fiaccone, Rosemeire Leovigildohttps://orcid.org/0000-0001-5439-1551http://lattes.cnpq.br/1839882342448396Souza, Anderson Luiz Arahttps://orcid.org/0000-0002-1041-2768http://lattes.cnpq.br/8916772290938469da Costa, Lilia Carolina Carneirohttps://orcid.org/0000-0001-5107-2723http://lattes.cnpq.br/7905206547630006Ferreira, Marcelo Rodrigo Portelahttps://orcid.org/0000-0003-0242-0255http://lattes.cnpq.br/2620157217100077http://lattes.cnpq.br/6712262587708162Paz, Hellen Oliveira dainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAORIGINALDissertacao_HellenPaz_vsfinal.pdfDissertacao_HellenPaz_vsfinal.pdfDissertação Hellen Pazapplication/pdf1697666https://repositorio.ufba.br/bitstream/ri/40414/1/Dissertacao_HellenPaz_vsfinal.pdfe4d4d52fac07ed3725a4c3e8c637c0b3MD51open accessLICENSElicense.txtlicense.txttext/plain1720https://repositorio.ufba.br/bitstream/ri/40414/2/license.txtd9b7566281c22d808dbf8f29ff0425c8MD52open accessri/404142024-10-14 07:39:30.079open accessoai:repositorio.ufba.br:ri/40414TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNhw6fDo28gKGluY2x1aW5kbyBvIHJlc3Vtbykgbm8gZm9ybWF0byBpbXByZXNzbyBlL291IGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBlL291IHbDrWRlby4KCk8gYXV0b3Igb3UgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgY29uY29yZGEgcXVlIG8gUmVwb3NpdMOzcmlvIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIGUvb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8OjbywgcG9kZW5kbyBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLiAKCk8gYXV0b3Igb3UgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIG7Do28sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIGFvIFJlcG9zaXTDs3JpbyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBSRVNVTFRFIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTywgVk9Dw4ogREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklTw4NPLCBDT01PIFRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l0w7NyaW8gc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyLCBjbGFyYW1lbnRlLCBvIChzKSBzZXUocykgbm9tZSAocykgb3UgbyAocykgbm9tZSAocykgZG8gKHMpIGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHB1YmxpY2HDp8OjbyBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufba.br/oai/requestrepositorio@ufba.bropendoar:19322024-10-14T10:39:30Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false |
| dc.title.pt_BR.fl_str_mv |
Método de agrupamento multinível para dados mistos. |
| dc.title.alternative.pt_BR.fl_str_mv |
Multilevel clustering method for mixed data. |
| title |
Método de agrupamento multinível para dados mistos. |
| spellingShingle |
Método de agrupamento multinível para dados mistos. Paz, Hellen Oliveira da CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA Análise de agrupamento Agrupamento multinível K-means Dados multiníveis Dados mistos Cluster analysis Multilevel clustering K-means Multilevel data Mixed data |
| title_short |
Método de agrupamento multinível para dados mistos. |
| title_full |
Método de agrupamento multinível para dados mistos. |
| title_fullStr |
Método de agrupamento multinível para dados mistos. |
| title_full_unstemmed |
Método de agrupamento multinível para dados mistos. |
| title_sort |
Método de agrupamento multinível para dados mistos. |
| author |
Paz, Hellen Oliveira da |
| author_facet |
Paz, Hellen Oliveira da |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Souza, Anderson Luiz Ara |
| dc.contributor.advisor1ID.fl_str_mv |
https://orcid.org/0000-0002-1041-2768 |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/8916772290938469 |
| dc.contributor.advisor-co1.fl_str_mv |
Fiaccone, Rosemeire Leovigildo |
| dc.contributor.advisor-co1ID.fl_str_mv |
https://orcid.org/0000-0001-5439-1551 |
| dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/1839882342448396 |
| dc.contributor.referee1.fl_str_mv |
Souza, Anderson Luiz Ara |
| dc.contributor.referee1ID.fl_str_mv |
https://orcid.org/0000-0002-1041-2768 |
| dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/8916772290938469 |
| dc.contributor.referee2.fl_str_mv |
da Costa, Lilia Carolina Carneiro |
| dc.contributor.referee2ID.fl_str_mv |
https://orcid.org/0000-0001-5107-2723 |
| dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/7905206547630006 |
| dc.contributor.referee3.fl_str_mv |
Ferreira, Marcelo Rodrigo Portela |
| dc.contributor.referee3ID.fl_str_mv |
https://orcid.org/0000-0003-0242-0255 |
| dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/2620157217100077 |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/6712262587708162 |
| dc.contributor.author.fl_str_mv |
Paz, Hellen Oliveira da |
| contributor_str_mv |
Souza, Anderson Luiz Ara Fiaccone, Rosemeire Leovigildo Souza, Anderson Luiz Ara da Costa, Lilia Carolina Carneiro Ferreira, Marcelo Rodrigo Portela |
| dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
| topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA Análise de agrupamento Agrupamento multinível K-means Dados multiníveis Dados mistos Cluster analysis Multilevel clustering K-means Multilevel data Mixed data |
| dc.subject.por.fl_str_mv |
Análise de agrupamento Agrupamento multinível K-means Dados multiníveis Dados mistos |
| dc.subject.other.pt_BR.fl_str_mv |
Cluster analysis Multilevel clustering K-means Multilevel data Mixed data |
| description |
A Análise de agrupamento é uma área com vasto desenvolvimento metodológico nas diversas áreas do conhecimento. Esta dissertação propõe um novo método de agrupamento para dados mistos, levando em consideração a estrutura multinível das observações. A identificação de quão similares ou próximas as unidades de análise se encontram pode ser quantificada por meio de medidas de proximidade, que, juntamente com os algoritmos utilizados, são essenciais na metodologia de análise de agrupamento. Dados mistos são caracterizados pela presença conjunta de variáveis quantitativas e qualitativas. O termo “Agrupamento Multinível” é utilizado em diversas áreas do conhecimento, referindo-se a diferentes conceitos. Nossa proposta de agrupamento multinível adapta o algoritmo k-médias para dados multiníveis, incorporando a estrutura hierárquica dos dados no cálculo das distâncias entre as observações através de uma abordagem de ponderação da distância de Hellinger. Os resultados obtidos a partir de estudos de simulação e aplicações práticas são satisfatórios, apresentando melhores agrupamentos quando se tem mais de uma variável quantitativa. No entanto, ainda são necessários mais estudos em diversos cenários para aumentar a robustez da metodologia proposta. |
| publishDate |
2024 |
| dc.date.accessioned.fl_str_mv |
2024-10-14T10:39:29Z |
| dc.date.available.fl_str_mv |
2024-10-14T10:39:29Z |
| dc.date.issued.fl_str_mv |
2024-06-26 |
| dc.type.driver.fl_str_mv |
Mestrado Acadêmico info:eu-repo/semantics/masterThesis |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
PAZ, Hellen Oliveira da. Método de agrupamento multinível para dados mistos. 2024. 100 f. Dissertação (Mestrado em Matemática) - Instituto de Matemática e Estatística - IME, Universidade Federal da Bahia, Salvador (Bahia), 2024. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufba.br/handle/ri/40414 |
| identifier_str_mv |
PAZ, Hellen Oliveira da. Método de agrupamento multinível para dados mistos. 2024. 100 f. Dissertação (Mestrado em Matemática) - Instituto de Matemática e Estatística - IME, Universidade Federal da Bahia, Salvador (Bahia), 2024. |
| url |
https://repositorio.ufba.br/handle/ri/40414 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal da Bahia |
| dc.publisher.program.fl_str_mv |
Pós-Graduação em Matemática (PGMAT) |
| dc.publisher.initials.fl_str_mv |
UFBA |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Instituto de Matemática |
| publisher.none.fl_str_mv |
Universidade Federal da Bahia |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFBA instname:Universidade Federal da Bahia (UFBA) instacron:UFBA |
| instname_str |
Universidade Federal da Bahia (UFBA) |
| instacron_str |
UFBA |
| institution |
UFBA |
| reponame_str |
Repositório Institucional da UFBA |
| collection |
Repositório Institucional da UFBA |
| bitstream.url.fl_str_mv |
https://repositorio.ufba.br/bitstream/ri/40414/1/Dissertacao_HellenPaz_vsfinal.pdf https://repositorio.ufba.br/bitstream/ri/40414/2/license.txt |
| bitstream.checksum.fl_str_mv |
e4d4d52fac07ed3725a4c3e8c637c0b3 d9b7566281c22d808dbf8f29ff0425c8 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA) |
| repository.mail.fl_str_mv |
repositorio@ufba.br |
| _version_ |
1847342294320021504 |