Avaliação de agrupamentos em mistura de variáveis

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: Vidigal, Bruno Caetano
Orientador(a): Cecon, Paulo Roberto lattes
Banca de defesa: Ferreira, Adésio lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Viçosa
Programa de Pós-Graduação: Mestrado em Estatística Aplicada e Biometria
Departamento: Estatística Aplicada e Biometria
País: BR
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://locus.ufv.br/handle/123456789/4065
Resumo: Cluster analysis is widely used in many research areas in order to recognize a standard structure of variability between individuals or objects studied, classifying them into homogeneous groups. However, the studies that are published, most of them deal only on numeric variables, excluding the analysis, the information contained in categorical variables. Thus, this study aims to evaluate some similarity measures and clustering algorithms in databases and also simulated on a case study in Genetics. The similarity measures evaluated were: euclidean, squared euclidean, mean euclidean, mahalanobis, manhattan, combined measures and gower. The hierarchical clustering algorithms are: nearest neighbor, furthest neighbor, UPGMA and Ward. The algorithms evaluated from the class of non-hierarchical are the kmeans and k-prototypes, which is an extension of the first. The results were compared and we concluded the non-hierarquical were better than hierarquical methods.
id UFV_26119dae91091f6d6350260a39de3864
oai_identifier_str oai:locus.ufv.br:123456789/4065
network_acronym_str UFV
network_name_str LOCUS Repositório Institucional da UFV
repository_id_str
spelling Vidigal, Bruno Caetanohttp://lattes.cnpq.br/4686534144477456Nascimento, Moyséshttp://lattes.cnpq.br/6544887498494945Cruz, Cosme Damiãohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6Cecon, Paulo Robertohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5Ferreira, Adésiohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777896Y82015-03-26T13:32:18Z2013-06-262015-03-26T13:32:18Z2013-02-06VIDIGAL, Bruno Caetano. Evaluation of cluster variables in a mixture. 2013. 69 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013.http://locus.ufv.br/handle/123456789/4065Cluster analysis is widely used in many research areas in order to recognize a standard structure of variability between individuals or objects studied, classifying them into homogeneous groups. However, the studies that are published, most of them deal only on numeric variables, excluding the analysis, the information contained in categorical variables. Thus, this study aims to evaluate some similarity measures and clustering algorithms in databases and also simulated on a case study in Genetics. The similarity measures evaluated were: euclidean, squared euclidean, mean euclidean, mahalanobis, manhattan, combined measures and gower. The hierarchical clustering algorithms are: nearest neighbor, furthest neighbor, UPGMA and Ward. The algorithms evaluated from the class of non-hierarchical are the kmeans and k-prototypes, which is an extension of the first. The results were compared and we concluded the non-hierarquical were better than hierarquical methods.A análise de agrupamento é amplamente utilizada em muitas áreas de pesquisa a fim de se reconhecer uma estrutura padrão de variabilidade entre os indivíduos ou objetos estudados, classificando-os em grupos homogêneos. No entanto, dos trabalhos publicados, a maioria deles versam apenas sobre variáveis numéricas, excluindo da análise, as informações contidas nas variáveis categóricas. Dessa forma, esse trabalho teve o objetivo de avaliar várias formas de agrupamentos em um banco de dados simulado e também de disponibilizar uma rotina em R do algoritmo kprotótipos e uma rotina para se realizar agrupamentos hierárquicos. As medidas de distâncias avaliadas foram: euclidiana, euclidiana ao quadrado, euclidiana média, mahalanobis, manhattan, medidas combinadas e a de gower. Quanto aos algoritmos de agrupamento hierárquicos utilizados foram: vizinho mais próximo, vizinho mais distante, UPGMA e ward . Os algoritmos não-hierárquicos foram: k-médias e o kprotótipos. Os resultados obtidos foram confrontados entre si e concluiu-se que os algoritmos não-hierárquicos foram superiores aos hierárquicos e que incluir variáveis categóricas na análise é viável.Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorapplication/pdfporUniversidade Federal de ViçosaMestrado em Estatística Aplicada e BiometriaUFVBREstatística Aplicada e BiometriaAnálise de agrupamentosSimulaçãoAlgoritmosCluster analysisSimulationAlgorithmsCNPQ::CIENCIAS AGRARIASAvaliação de agrupamentos em mistura de variáveisEvaluation of cluster variables in a mixtureinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdfapplication/pdf765144https://locus.ufv.br//bitstream/123456789/4065/1/texto%20completo.pdf57b7456f9464c0ead5c7fb45295d0b99MD51TEXTtexto completo.pdf.txttexto completo.pdf.txtExtracted texttext/plain93374https://locus.ufv.br//bitstream/123456789/4065/2/texto%20completo.pdf.txt56b50cef725e06e1750bbe1ddd2a27d5MD52THUMBNAILtexto completo.pdf.jpgtexto completo.pdf.jpgIM Thumbnailimage/jpeg3470https://locus.ufv.br//bitstream/123456789/4065/3/texto%20completo.pdf.jpgf4826ed01cdbea4713331072b441d1f8MD53123456789/40652016-04-09 23:18:19.203oai:locus.ufv.br:123456789/4065Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452016-04-10T02:18:19LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.por.fl_str_mv Avaliação de agrupamentos em mistura de variáveis
dc.title.alternative.eng.fl_str_mv Evaluation of cluster variables in a mixture
title Avaliação de agrupamentos em mistura de variáveis
spellingShingle Avaliação de agrupamentos em mistura de variáveis
Vidigal, Bruno Caetano
Análise de agrupamentos
Simulação
Algoritmos
Cluster analysis
Simulation
Algorithms
CNPQ::CIENCIAS AGRARIAS
title_short Avaliação de agrupamentos em mistura de variáveis
title_full Avaliação de agrupamentos em mistura de variáveis
title_fullStr Avaliação de agrupamentos em mistura de variáveis
title_full_unstemmed Avaliação de agrupamentos em mistura de variáveis
title_sort Avaliação de agrupamentos em mistura de variáveis
author Vidigal, Bruno Caetano
author_facet Vidigal, Bruno Caetano
author_role author
dc.contributor.authorLattes.por.fl_str_mv http://lattes.cnpq.br/4686534144477456
dc.contributor.author.fl_str_mv Vidigal, Bruno Caetano
dc.contributor.advisor-co1.fl_str_mv Nascimento, Moysés
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/6544887498494945
dc.contributor.advisor-co2.fl_str_mv Cruz, Cosme Damião
dc.contributor.advisor-co2Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6
dc.contributor.advisor1.fl_str_mv Cecon, Paulo Roberto
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5
dc.contributor.referee1.fl_str_mv Ferreira, Adésio
dc.contributor.referee1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777896Y8
contributor_str_mv Nascimento, Moysés
Cruz, Cosme Damião
Cecon, Paulo Roberto
Ferreira, Adésio
dc.subject.por.fl_str_mv Análise de agrupamentos
Simulação
Algoritmos
topic Análise de agrupamentos
Simulação
Algoritmos
Cluster analysis
Simulation
Algorithms
CNPQ::CIENCIAS AGRARIAS
dc.subject.eng.fl_str_mv Cluster analysis
Simulation
Algorithms
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS AGRARIAS
description Cluster analysis is widely used in many research areas in order to recognize a standard structure of variability between individuals or objects studied, classifying them into homogeneous groups. However, the studies that are published, most of them deal only on numeric variables, excluding the analysis, the information contained in categorical variables. Thus, this study aims to evaluate some similarity measures and clustering algorithms in databases and also simulated on a case study in Genetics. The similarity measures evaluated were: euclidean, squared euclidean, mean euclidean, mahalanobis, manhattan, combined measures and gower. The hierarchical clustering algorithms are: nearest neighbor, furthest neighbor, UPGMA and Ward. The algorithms evaluated from the class of non-hierarchical are the kmeans and k-prototypes, which is an extension of the first. The results were compared and we concluded the non-hierarquical were better than hierarquical methods.
publishDate 2013
dc.date.available.fl_str_mv 2013-06-26
2015-03-26T13:32:18Z
dc.date.issued.fl_str_mv 2013-02-06
dc.date.accessioned.fl_str_mv 2015-03-26T13:32:18Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv VIDIGAL, Bruno Caetano. Evaluation of cluster variables in a mixture. 2013. 69 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013.
dc.identifier.uri.fl_str_mv http://locus.ufv.br/handle/123456789/4065
identifier_str_mv VIDIGAL, Bruno Caetano. Evaluation of cluster variables in a mixture. 2013. 69 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013.
url http://locus.ufv.br/handle/123456789/4065
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.publisher.program.fl_str_mv Mestrado em Estatística Aplicada e Biometria
dc.publisher.initials.fl_str_mv UFV
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Estatística Aplicada e Biometria
publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.source.none.fl_str_mv reponame:LOCUS Repositório Institucional da UFV
instname:Universidade Federal de Viçosa (UFV)
instacron:UFV
instname_str Universidade Federal de Viçosa (UFV)
instacron_str UFV
institution UFV
reponame_str LOCUS Repositório Institucional da UFV
collection LOCUS Repositório Institucional da UFV
bitstream.url.fl_str_mv https://locus.ufv.br//bitstream/123456789/4065/1/texto%20completo.pdf
https://locus.ufv.br//bitstream/123456789/4065/2/texto%20completo.pdf.txt
https://locus.ufv.br//bitstream/123456789/4065/3/texto%20completo.pdf.jpg
bitstream.checksum.fl_str_mv 57b7456f9464c0ead5c7fb45295d0b99
56b50cef725e06e1750bbe1ddd2a27d5
f4826ed01cdbea4713331072b441d1f8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv fabiojreis@ufv.br
_version_ 1794528728845385728