Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Espírito Santo
BR Doutorado em Ciência da Computação Centro Tecnológico UFES Programa de Pós-Graduação em Informática |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.ufes.br/handle/10/13791 |
Resumo: | The cluster analysis is a set of techniques designed to identify groups of similar elements in a dataset. Such techniques are used in many different applica tions, such as image segmentation, signal processing, data compression, unsuper vised learning, selection of characteristics, sampling, among others. Although they are important in a wide range of applications, the use of these techniques in large cardinality data is a problem due to the poor scalability of several traditional al gorithms. One way to circumvent this problem is to sample, after all, reducing the cardinality of data sets greatly reduces the computational effort required by the methods. This thesis presents three new sampling methods specifically designed to be used in conjunction with the cluster analysis algorithms k-means and DBSCAN. The experimental results show that those designed for the DBSCAN algorithm obtained better results than the competitors. However, the proposed sampling ap proach for k-means returned lower quality results than DENDIS, a recently proposed method. |
| id |
UFES_94a9c2ef7ff9c09aa08ccebe70370d66 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufes.br:10/13791 |
| network_acronym_str |
UFES |
| network_name_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| repository_id_str |
|
| spelling |
Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCANAmostragemUnsupervised learningCluster analysisSamplingAprendizado não supervisionadoAnálise de agrupamentosubject.br-rjbnCiência da ComputaçãoThe cluster analysis is a set of techniques designed to identify groups of similar elements in a dataset. Such techniques are used in many different applica tions, such as image segmentation, signal processing, data compression, unsuper vised learning, selection of characteristics, sampling, among others. Although they are important in a wide range of applications, the use of these techniques in large cardinality data is a problem due to the poor scalability of several traditional al gorithms. One way to circumvent this problem is to sample, after all, reducing the cardinality of data sets greatly reduces the computational effort required by the methods. This thesis presents three new sampling methods specifically designed to be used in conjunction with the cluster analysis algorithms k-means and DBSCAN. The experimental results show that those designed for the DBSCAN algorithm obtained better results than the competitors. However, the proposed sampling ap proach for k-means returned lower quality results than DENDIS, a recently proposed method.A análise de agrupamento é um conjunto de técnicas destinadas a identi f icação de grupos de elementos similares em um conjunto de dados. Tais técnicas são utilizadas nas mais variadas aplicações, como segmentação de imagens, proces samento de sinais, compressão de dados, aprendizado não supervisionado, seleção de características, amostragem, dentre outras. Embora sejam importantes nas mais diversas aplicações, a utilização dessas técnicas em conjunto de dados de grande cardinalidade é um problema em virtude da escalabilidade ruim de vários algorit mos tradicionais. Uma das formas de se contornar esse problema é a amostragem, afinal, reduzir a cardinalidade do conjuntos de dados reduz bastante o esforço com putacional exigido pelos métodos. Nesse trabalho são apresentados três métodos amostrais novos especificamente projetados para serem utilizados em conjunto com os algoritmos de análise de agrupamento k-médias e DBSCAN. Os resultados expe rimentais mostram que os métodos propostos para o algoritmo DBSCAN obtiveram melhores resultados que os competidores. Contudo, a abordagem amostral proposta para o k-médias ficou em segundo lugar, retornando resultados de qualidade inferior a outro método recentemente proposto denominado DENDISFundação Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Federal do Espírito SantoBRDoutorado em Ciência da ComputaçãoCentro TecnológicoUFESPrograma de Pós-Graduação em InformáticaVarejao, Flavio Miguelhttps://orcid.org/0000-0002-5444-1974http://lattes.cnpq.br/6501574961643171https://orcid.org/0009-0002-4384-7116 http://lattes.cnpq.br/4690522362645057Carvalho, Alexandre Plastino dehttps://orcid.org/0000-0003-4039-0915http://lattes.cnpq.br/4985266524417261Santos, Thiago Oliveira doshttps://orcid.org/0000-0001-7607-635Xhttp://lattes.cnpq.br/5117339495064254Rodrigues, Alexandre Loureiroshttps://orcid.org/http://lattes.cnpq.br/0000601083852823Rauber, Thomas Walterhttps://orcid.org/0000000263806584http://lattes.cnpq.br/0462549482032704Luchi, Diego2024-05-30T00:48:38Z2024-05-30T00:48:38Z2019-03-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTextapplication/pdfhttp://repositorio.ufes.br/handle/10/13791porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFES2025-04-15T23:54:09Zoai:repositorio.ufes.br:10/13791Repositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestriufes@ufes.bropendoar:21082025-04-15T23:54:09Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false |
| dc.title.none.fl_str_mv |
Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN |
| title |
Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN |
| spellingShingle |
Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN Luchi, Diego Amostragem Unsupervised learning Cluster analysis Sampling Aprendizado não supervisionado Análise de agrupamento subject.br-rjbn Ciência da Computação |
| title_short |
Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN |
| title_full |
Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN |
| title_fullStr |
Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN |
| title_full_unstemmed |
Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN |
| title_sort |
Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN |
| author |
Luchi, Diego |
| author_facet |
Luchi, Diego |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Varejao, Flavio Miguel https://orcid.org/0000-0002-5444-1974 http://lattes.cnpq.br/6501574961643171 https://orcid.org/0009-0002-4384-7116 http://lattes.cnpq.br/4690522362645057 Carvalho, Alexandre Plastino de https://orcid.org/0000-0003-4039-0915 http://lattes.cnpq.br/4985266524417261 Santos, Thiago Oliveira dos https://orcid.org/0000-0001-7607-635X http://lattes.cnpq.br/5117339495064254 Rodrigues, Alexandre Loureiros https://orcid.org/ http://lattes.cnpq.br/0000601083852823 Rauber, Thomas Walter https://orcid.org/0000000263806584 http://lattes.cnpq.br/0462549482032704 |
| dc.contributor.author.fl_str_mv |
Luchi, Diego |
| dc.subject.por.fl_str_mv |
Amostragem Unsupervised learning Cluster analysis Sampling Aprendizado não supervisionado Análise de agrupamento subject.br-rjbn Ciência da Computação |
| topic |
Amostragem Unsupervised learning Cluster analysis Sampling Aprendizado não supervisionado Análise de agrupamento subject.br-rjbn Ciência da Computação |
| description |
The cluster analysis is a set of techniques designed to identify groups of similar elements in a dataset. Such techniques are used in many different applica tions, such as image segmentation, signal processing, data compression, unsuper vised learning, selection of characteristics, sampling, among others. Although they are important in a wide range of applications, the use of these techniques in large cardinality data is a problem due to the poor scalability of several traditional al gorithms. One way to circumvent this problem is to sample, after all, reducing the cardinality of data sets greatly reduces the computational effort required by the methods. This thesis presents three new sampling methods specifically designed to be used in conjunction with the cluster analysis algorithms k-means and DBSCAN. The experimental results show that those designed for the DBSCAN algorithm obtained better results than the competitors. However, the proposed sampling ap proach for k-means returned lower quality results than DENDIS, a recently proposed method. |
| publishDate |
2019 |
| dc.date.none.fl_str_mv |
2019-03-28 2024-05-30T00:48:38Z 2024-05-30T00:48:38Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://repositorio.ufes.br/handle/10/13791 |
| url |
http://repositorio.ufes.br/handle/10/13791 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
Text application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo BR Doutorado em Ciência da Computação Centro Tecnológico UFES Programa de Pós-Graduação em Informática |
| publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo BR Doutorado em Ciência da Computação Centro Tecnológico UFES Programa de Pós-Graduação em Informática |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) instname:Universidade Federal do Espírito Santo (UFES) instacron:UFES |
| instname_str |
Universidade Federal do Espírito Santo (UFES) |
| instacron_str |
UFES |
| institution |
UFES |
| reponame_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| collection |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES) |
| repository.mail.fl_str_mv |
riufes@ufes.br |
| _version_ |
1834479093250260992 |