Avaliação de agrupamentos em mistura de variáveis
Ano de defesa: | 2013 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Viçosa
|
Programa de Pós-Graduação: |
Mestrado em Estatística Aplicada e Biometria
|
Departamento: |
Estatística Aplicada e Biometria
|
País: |
BR
|
Palavras-chave em Português: | |
Palavras-chave em Inglês: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://locus.ufv.br/handle/123456789/4065 |
Resumo: | Cluster analysis is widely used in many research areas in order to recognize a standard structure of variability between individuals or objects studied, classifying them into homogeneous groups. However, the studies that are published, most of them deal only on numeric variables, excluding the analysis, the information contained in categorical variables. Thus, this study aims to evaluate some similarity measures and clustering algorithms in databases and also simulated on a case study in Genetics. The similarity measures evaluated were: euclidean, squared euclidean, mean euclidean, mahalanobis, manhattan, combined measures and gower. The hierarchical clustering algorithms are: nearest neighbor, furthest neighbor, UPGMA and Ward. The algorithms evaluated from the class of non-hierarchical are the kmeans and k-prototypes, which is an extension of the first. The results were compared and we concluded the non-hierarquical were better than hierarquical methods. |
id |
UFV_26119dae91091f6d6350260a39de3864 |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/4065 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
|
spelling |
Vidigal, Bruno Caetanohttp://lattes.cnpq.br/4686534144477456Nascimento, Moyséshttp://lattes.cnpq.br/6544887498494945Cruz, Cosme Damiãohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6Cecon, Paulo Robertohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5Ferreira, Adésiohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777896Y82015-03-26T13:32:18Z2013-06-262015-03-26T13:32:18Z2013-02-06VIDIGAL, Bruno Caetano. Evaluation of cluster variables in a mixture. 2013. 69 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013.http://locus.ufv.br/handle/123456789/4065Cluster analysis is widely used in many research areas in order to recognize a standard structure of variability between individuals or objects studied, classifying them into homogeneous groups. However, the studies that are published, most of them deal only on numeric variables, excluding the analysis, the information contained in categorical variables. Thus, this study aims to evaluate some similarity measures and clustering algorithms in databases and also simulated on a case study in Genetics. The similarity measures evaluated were: euclidean, squared euclidean, mean euclidean, mahalanobis, manhattan, combined measures and gower. The hierarchical clustering algorithms are: nearest neighbor, furthest neighbor, UPGMA and Ward. The algorithms evaluated from the class of non-hierarchical are the kmeans and k-prototypes, which is an extension of the first. The results were compared and we concluded the non-hierarquical were better than hierarquical methods.A análise de agrupamento é amplamente utilizada em muitas áreas de pesquisa a fim de se reconhecer uma estrutura padrão de variabilidade entre os indivíduos ou objetos estudados, classificando-os em grupos homogêneos. No entanto, dos trabalhos publicados, a maioria deles versam apenas sobre variáveis numéricas, excluindo da análise, as informações contidas nas variáveis categóricas. Dessa forma, esse trabalho teve o objetivo de avaliar várias formas de agrupamentos em um banco de dados simulado e também de disponibilizar uma rotina em R do algoritmo kprotótipos e uma rotina para se realizar agrupamentos hierárquicos. As medidas de distâncias avaliadas foram: euclidiana, euclidiana ao quadrado, euclidiana média, mahalanobis, manhattan, medidas combinadas e a de gower. Quanto aos algoritmos de agrupamento hierárquicos utilizados foram: vizinho mais próximo, vizinho mais distante, UPGMA e ward . Os algoritmos não-hierárquicos foram: k-médias e o kprotótipos. Os resultados obtidos foram confrontados entre si e concluiu-se que os algoritmos não-hierárquicos foram superiores aos hierárquicos e que incluir variáveis categóricas na análise é viável.Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorapplication/pdfporUniversidade Federal de ViçosaMestrado em Estatística Aplicada e BiometriaUFVBREstatística Aplicada e BiometriaAnálise de agrupamentosSimulaçãoAlgoritmosCluster analysisSimulationAlgorithmsCNPQ::CIENCIAS AGRARIASAvaliação de agrupamentos em mistura de variáveisEvaluation of cluster variables in a mixtureinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdfapplication/pdf765144https://locus.ufv.br//bitstream/123456789/4065/1/texto%20completo.pdf57b7456f9464c0ead5c7fb45295d0b99MD51TEXTtexto completo.pdf.txttexto completo.pdf.txtExtracted texttext/plain93374https://locus.ufv.br//bitstream/123456789/4065/2/texto%20completo.pdf.txt56b50cef725e06e1750bbe1ddd2a27d5MD52THUMBNAILtexto completo.pdf.jpgtexto completo.pdf.jpgIM Thumbnailimage/jpeg3470https://locus.ufv.br//bitstream/123456789/4065/3/texto%20completo.pdf.jpgf4826ed01cdbea4713331072b441d1f8MD53123456789/40652016-04-09 23:18:19.203oai:locus.ufv.br:123456789/4065Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452016-04-10T02:18:19LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.por.fl_str_mv |
Avaliação de agrupamentos em mistura de variáveis |
dc.title.alternative.eng.fl_str_mv |
Evaluation of cluster variables in a mixture |
title |
Avaliação de agrupamentos em mistura de variáveis |
spellingShingle |
Avaliação de agrupamentos em mistura de variáveis Vidigal, Bruno Caetano Análise de agrupamentos Simulação Algoritmos Cluster analysis Simulation Algorithms CNPQ::CIENCIAS AGRARIAS |
title_short |
Avaliação de agrupamentos em mistura de variáveis |
title_full |
Avaliação de agrupamentos em mistura de variáveis |
title_fullStr |
Avaliação de agrupamentos em mistura de variáveis |
title_full_unstemmed |
Avaliação de agrupamentos em mistura de variáveis |
title_sort |
Avaliação de agrupamentos em mistura de variáveis |
author |
Vidigal, Bruno Caetano |
author_facet |
Vidigal, Bruno Caetano |
author_role |
author |
dc.contributor.authorLattes.por.fl_str_mv |
http://lattes.cnpq.br/4686534144477456 |
dc.contributor.author.fl_str_mv |
Vidigal, Bruno Caetano |
dc.contributor.advisor-co1.fl_str_mv |
Nascimento, Moysés |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/6544887498494945 |
dc.contributor.advisor-co2.fl_str_mv |
Cruz, Cosme Damião |
dc.contributor.advisor-co2Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6 |
dc.contributor.advisor1.fl_str_mv |
Cecon, Paulo Roberto |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5 |
dc.contributor.referee1.fl_str_mv |
Ferreira, Adésio |
dc.contributor.referee1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777896Y8 |
contributor_str_mv |
Nascimento, Moysés Cruz, Cosme Damião Cecon, Paulo Roberto Ferreira, Adésio |
dc.subject.por.fl_str_mv |
Análise de agrupamentos Simulação Algoritmos |
topic |
Análise de agrupamentos Simulação Algoritmos Cluster analysis Simulation Algorithms CNPQ::CIENCIAS AGRARIAS |
dc.subject.eng.fl_str_mv |
Cluster analysis Simulation Algorithms |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS AGRARIAS |
description |
Cluster analysis is widely used in many research areas in order to recognize a standard structure of variability between individuals or objects studied, classifying them into homogeneous groups. However, the studies that are published, most of them deal only on numeric variables, excluding the analysis, the information contained in categorical variables. Thus, this study aims to evaluate some similarity measures and clustering algorithms in databases and also simulated on a case study in Genetics. The similarity measures evaluated were: euclidean, squared euclidean, mean euclidean, mahalanobis, manhattan, combined measures and gower. The hierarchical clustering algorithms are: nearest neighbor, furthest neighbor, UPGMA and Ward. The algorithms evaluated from the class of non-hierarchical are the kmeans and k-prototypes, which is an extension of the first. The results were compared and we concluded the non-hierarquical were better than hierarquical methods. |
publishDate |
2013 |
dc.date.available.fl_str_mv |
2013-06-26 2015-03-26T13:32:18Z |
dc.date.issued.fl_str_mv |
2013-02-06 |
dc.date.accessioned.fl_str_mv |
2015-03-26T13:32:18Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
VIDIGAL, Bruno Caetano. Evaluation of cluster variables in a mixture. 2013. 69 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013. |
dc.identifier.uri.fl_str_mv |
http://locus.ufv.br/handle/123456789/4065 |
identifier_str_mv |
VIDIGAL, Bruno Caetano. Evaluation of cluster variables in a mixture. 2013. 69 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013. |
url |
http://locus.ufv.br/handle/123456789/4065 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.publisher.program.fl_str_mv |
Mestrado em Estatística Aplicada e Biometria |
dc.publisher.initials.fl_str_mv |
UFV |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Estatística Aplicada e Biometria |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/4065/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/4065/2/texto%20completo.pdf.txt https://locus.ufv.br//bitstream/123456789/4065/3/texto%20completo.pdf.jpg |
bitstream.checksum.fl_str_mv |
57b7456f9464c0ead5c7fb45295d0b99 56b50cef725e06e1750bbe1ddd2a27d5 f4826ed01cdbea4713331072b441d1f8 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1794528728845385728 |