Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Luchi, Diego
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Espírito Santo
BR
Doutorado em Ciência da Computação
Centro Tecnológico
UFES
Programa de Pós-Graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.ufes.br/handle/10/13791
Resumo: The cluster analysis is a set of techniques designed to identify groups of similar elements in a dataset. Such techniques are used in many different applica tions, such as image segmentation, signal processing, data compression, unsuper vised learning, selection of characteristics, sampling, among others. Although they are important in a wide range of applications, the use of these techniques in large cardinality data is a problem due to the poor scalability of several traditional al gorithms. One way to circumvent this problem is to sample, after all, reducing the cardinality of data sets greatly reduces the computational effort required by the methods. This thesis presents three new sampling methods specifically designed to be used in conjunction with the cluster analysis algorithms k-means and DBSCAN. The experimental results show that those designed for the DBSCAN algorithm obtained better results than the competitors. However, the proposed sampling ap proach for k-means returned lower quality results than DENDIS, a recently proposed method.
id UFES_94a9c2ef7ff9c09aa08ccebe70370d66
oai_identifier_str oai:repositorio.ufes.br:10/13791
network_acronym_str UFES
network_name_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository_id_str
spelling Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCANAmostragemUnsupervised learningCluster analysisSamplingAprendizado não supervisionadoAnálise de agrupamentosubject.br-rjbnCiência da ComputaçãoThe cluster analysis is a set of techniques designed to identify groups of similar elements in a dataset. Such techniques are used in many different applica tions, such as image segmentation, signal processing, data compression, unsuper vised learning, selection of characteristics, sampling, among others. Although they are important in a wide range of applications, the use of these techniques in large cardinality data is a problem due to the poor scalability of several traditional al gorithms. One way to circumvent this problem is to sample, after all, reducing the cardinality of data sets greatly reduces the computational effort required by the methods. This thesis presents three new sampling methods specifically designed to be used in conjunction with the cluster analysis algorithms k-means and DBSCAN. The experimental results show that those designed for the DBSCAN algorithm obtained better results than the competitors. However, the proposed sampling ap proach for k-means returned lower quality results than DENDIS, a recently proposed method.A análise de agrupamento é um conjunto de técnicas destinadas a identi f icação de grupos de elementos similares em um conjunto de dados. Tais técnicas são utilizadas nas mais variadas aplicações, como segmentação de imagens, proces samento de sinais, compressão de dados, aprendizado não supervisionado, seleção de características, amostragem, dentre outras. Embora sejam importantes nas mais diversas aplicações, a utilização dessas técnicas em conjunto de dados de grande cardinalidade é um problema em virtude da escalabilidade ruim de vários algorit mos tradicionais. Uma das formas de se contornar esse problema é a amostragem, afinal, reduzir a cardinalidade do conjuntos de dados reduz bastante o esforço com putacional exigido pelos métodos. Nesse trabalho são apresentados três métodos amostrais novos especificamente projetados para serem utilizados em conjunto com os algoritmos de análise de agrupamento k-médias e DBSCAN. Os resultados expe rimentais mostram que os métodos propostos para o algoritmo DBSCAN obtiveram melhores resultados que os competidores. Contudo, a abordagem amostral proposta para o k-médias ficou em segundo lugar, retornando resultados de qualidade inferior a outro método recentemente proposto denominado DENDISFundação Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Federal do Espírito SantoBRDoutorado em Ciência da ComputaçãoCentro TecnológicoUFESPrograma de Pós-Graduação em InformáticaVarejao, Flavio Miguelhttps://orcid.org/0000-0002-5444-1974http://lattes.cnpq.br/6501574961643171https://orcid.org/0009-0002-4384-7116 http://lattes.cnpq.br/4690522362645057Carvalho, Alexandre Plastino dehttps://orcid.org/0000-0003-4039-0915http://lattes.cnpq.br/4985266524417261Santos, Thiago Oliveira doshttps://orcid.org/0000-0001-7607-635Xhttp://lattes.cnpq.br/5117339495064254Rodrigues, Alexandre Loureiroshttps://orcid.org/http://lattes.cnpq.br/0000601083852823Rauber, Thomas Walterhttps://orcid.org/0000000263806584http://lattes.cnpq.br/0462549482032704Luchi, Diego2024-05-30T00:48:38Z2024-05-30T00:48:38Z2019-03-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTextapplication/pdfhttp://repositorio.ufes.br/handle/10/13791porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFES2025-04-15T23:54:09Zoai:repositorio.ufes.br:10/13791Repositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestriufes@ufes.bropendoar:21082025-04-15T23:54:09Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false
dc.title.none.fl_str_mv Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
title Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
spellingShingle Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
Luchi, Diego
Amostragem
Unsupervised learning
Cluster analysis
Sampling
Aprendizado não supervisionado
Análise de agrupamento
subject.br-rjbn
Ciência da Computação
title_short Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
title_full Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
title_fullStr Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
title_full_unstemmed Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
title_sort Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
author Luchi, Diego
author_facet Luchi, Diego
author_role author
dc.contributor.none.fl_str_mv Varejao, Flavio Miguel
https://orcid.org/0000-0002-5444-1974
http://lattes.cnpq.br/6501574961643171
https://orcid.org/0009-0002-4384-7116
http://lattes.cnpq.br/4690522362645057
Carvalho, Alexandre Plastino de
https://orcid.org/0000-0003-4039-0915
http://lattes.cnpq.br/4985266524417261
Santos, Thiago Oliveira dos
https://orcid.org/0000-0001-7607-635X
http://lattes.cnpq.br/5117339495064254
Rodrigues, Alexandre Loureiros
https://orcid.org/
http://lattes.cnpq.br/0000601083852823
Rauber, Thomas Walter
https://orcid.org/0000000263806584
http://lattes.cnpq.br/0462549482032704
dc.contributor.author.fl_str_mv Luchi, Diego
dc.subject.por.fl_str_mv Amostragem
Unsupervised learning
Cluster analysis
Sampling
Aprendizado não supervisionado
Análise de agrupamento
subject.br-rjbn
Ciência da Computação
topic Amostragem
Unsupervised learning
Cluster analysis
Sampling
Aprendizado não supervisionado
Análise de agrupamento
subject.br-rjbn
Ciência da Computação
description The cluster analysis is a set of techniques designed to identify groups of similar elements in a dataset. Such techniques are used in many different applica tions, such as image segmentation, signal processing, data compression, unsuper vised learning, selection of characteristics, sampling, among others. Although they are important in a wide range of applications, the use of these techniques in large cardinality data is a problem due to the poor scalability of several traditional al gorithms. One way to circumvent this problem is to sample, after all, reducing the cardinality of data sets greatly reduces the computational effort required by the methods. This thesis presents three new sampling methods specifically designed to be used in conjunction with the cluster analysis algorithms k-means and DBSCAN. The experimental results show that those designed for the DBSCAN algorithm obtained better results than the competitors. However, the proposed sampling ap proach for k-means returned lower quality results than DENDIS, a recently proposed method.
publishDate 2019
dc.date.none.fl_str_mv 2019-03-28
2024-05-30T00:48:38Z
2024-05-30T00:48:38Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufes.br/handle/10/13791
url http://repositorio.ufes.br/handle/10/13791
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv Text
application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Espírito Santo
BR
Doutorado em Ciência da Computação
Centro Tecnológico
UFES
Programa de Pós-Graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Espírito Santo
BR
Doutorado em Ciência da Computação
Centro Tecnológico
UFES
Programa de Pós-Graduação em Informática
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
instname:Universidade Federal do Espírito Santo (UFES)
instacron:UFES
instname_str Universidade Federal do Espírito Santo (UFES)
instacron_str UFES
institution UFES
reponame_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
collection Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)
repository.mail.fl_str_mv riufes@ufes.br
_version_ 1834479093250260992