BIRCHSCAN: UM MÉTODO DE APROXIMAÇÃO DO DBSCAN PARA GRANDES CONJUNTOS DE DADOS

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Ventorim, Igor de Moura
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Espírito Santo
BR
Mestrado em Informática
Centro Tecnológico
UFES
Programa de Pós-Graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.ufes.br/handle/10/15479
Resumo: The DBSCAN algorithm is a classic density-based clustering method. This algorithm allows to identify clusters of different shapes, with the ability to identify noisy patterns in the data. DBSCAN presents good results, however it has a high computational complexity due to several distance calculations in the clustering process. This low computational efficiency limits its application to large data sets. This work presents a new method of grouping whose first stage is the construction of representative elements to apply DBSCAN to a reduced set of examples The proposed method allows grouping large datasets with approximate results to the DBSCAN result applied in the entire dataset. From the experiments performed, it is observed that the proposed technique presents good results and consistency when compared to other algorithms with a similar proposal.
id UFES_7a13bb2cd611eaf997b0bd919f5981d2
oai_identifier_str oai:repositorio.ufes.br:10/15479
network_acronym_str UFES
network_name_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository_id_str
spelling BIRCHSCAN: UM MÉTODO DE APROXIMAÇÃO DO DBSCAN PARA GRANDES CONJUNTOS DE DADOStitle.alternativeAmostragemanálise de agrupamentoaprendizado não supervisionadosubject.br-rjbnCiência da ComputaçãoThe DBSCAN algorithm is a classic density-based clustering method. This algorithm allows to identify clusters of different shapes, with the ability to identify noisy patterns in the data. DBSCAN presents good results, however it has a high computational complexity due to several distance calculations in the clustering process. This low computational efficiency limits its application to large data sets. This work presents a new method of grouping whose first stage is the construction of representative elements to apply DBSCAN to a reduced set of examples The proposed method allows grouping large datasets with approximate results to the DBSCAN result applied in the entire dataset. From the experiments performed, it is observed that the proposed technique presents good results and consistency when compared to other algorithms with a similar proposal.O algoritmo DBSCAN é um método clássico de agrupamento baseado em densidade. Este algoritmo permite identificar grupos de diferentes formatos, com a capacidade de gerenciar padrões ruidosos. O DBSCAN apresenta bons resultados, porém possui uma alta complexidade computacional em decorrência de diversos cálculos de distâncias no processo de agrupamento. Essa baixa eficiência computacional limita sua aplicação em grandes conjuntos de dados. Este trabalho apresenta um novo método de agrupamento cuja primeira etapa é a construção de elementos representativos para aplicar o DBSCAN a um conjunto reduzido de exemplos. O método proposto permite agrupar grandes conjuntos de dados com resultados próximos do resultado do DBSCAN em todo o conjunto de dados. A partir dos experimentos realizados, é observado que a técnica proposta apresenta bons resultados e consistência quando comparada a outros algoritmos com proposta semelhante.Universidade Federal do Espírito SantoBRMestrado em InformáticaCentro TecnológicoUFESPrograma de Pós-Graduação em InformáticaVarejão, Flávio Miguelhttps://orcid.org/0000-0002-5444-1974http://lattes.cnpq.br/6501574961643171https://orcid.org/0000-0001-8276-7309http://lattes.cnpq.br/2463923178952379Santos, Thiago Oliveira doshttps://orcid.org/0000-0001-7607-635Xhttp://lattes.cnpq.br/5117339495064254Rodrigues, Alexandre Loureiroshttps://orcid.org/0000-0002-7619-2681http://lattes.cnpq.br/0000601083852823Ventorim, Igor de Moura2024-05-30T00:50:45Z2024-05-30T00:50:45Z2021-04-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTextapplication/pdfhttp://repositorio.ufes.br/handle/10/15479porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFES2024-10-24T10:17:19Zoai:repositorio.ufes.br:10/15479Repositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestriufes@ufes.bropendoar:21082024-10-24T10:17:19Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false
dc.title.none.fl_str_mv BIRCHSCAN: UM MÉTODO DE APROXIMAÇÃO DO DBSCAN PARA GRANDES CONJUNTOS DE DADOS
title.alternative
title BIRCHSCAN: UM MÉTODO DE APROXIMAÇÃO DO DBSCAN PARA GRANDES CONJUNTOS DE DADOS
spellingShingle BIRCHSCAN: UM MÉTODO DE APROXIMAÇÃO DO DBSCAN PARA GRANDES CONJUNTOS DE DADOS
Ventorim, Igor de Moura
Amostragem
análise de agrupamento
aprendizado não supervisionado
subject.br-rjbn
Ciência da Computação
title_short BIRCHSCAN: UM MÉTODO DE APROXIMAÇÃO DO DBSCAN PARA GRANDES CONJUNTOS DE DADOS
title_full BIRCHSCAN: UM MÉTODO DE APROXIMAÇÃO DO DBSCAN PARA GRANDES CONJUNTOS DE DADOS
title_fullStr BIRCHSCAN: UM MÉTODO DE APROXIMAÇÃO DO DBSCAN PARA GRANDES CONJUNTOS DE DADOS
title_full_unstemmed BIRCHSCAN: UM MÉTODO DE APROXIMAÇÃO DO DBSCAN PARA GRANDES CONJUNTOS DE DADOS
title_sort BIRCHSCAN: UM MÉTODO DE APROXIMAÇÃO DO DBSCAN PARA GRANDES CONJUNTOS DE DADOS
author Ventorim, Igor de Moura
author_facet Ventorim, Igor de Moura
author_role author
dc.contributor.none.fl_str_mv Varejão, Flávio Miguel
https://orcid.org/0000-0002-5444-1974
http://lattes.cnpq.br/6501574961643171
https://orcid.org/0000-0001-8276-7309
http://lattes.cnpq.br/2463923178952379
Santos, Thiago Oliveira dos
https://orcid.org/0000-0001-7607-635X
http://lattes.cnpq.br/5117339495064254
Rodrigues, Alexandre Loureiros
https://orcid.org/0000-0002-7619-2681
http://lattes.cnpq.br/0000601083852823
dc.contributor.author.fl_str_mv Ventorim, Igor de Moura
dc.subject.por.fl_str_mv Amostragem
análise de agrupamento
aprendizado não supervisionado
subject.br-rjbn
Ciência da Computação
topic Amostragem
análise de agrupamento
aprendizado não supervisionado
subject.br-rjbn
Ciência da Computação
description The DBSCAN algorithm is a classic density-based clustering method. This algorithm allows to identify clusters of different shapes, with the ability to identify noisy patterns in the data. DBSCAN presents good results, however it has a high computational complexity due to several distance calculations in the clustering process. This low computational efficiency limits its application to large data sets. This work presents a new method of grouping whose first stage is the construction of representative elements to apply DBSCAN to a reduced set of examples The proposed method allows grouping large datasets with approximate results to the DBSCAN result applied in the entire dataset. From the experiments performed, it is observed that the proposed technique presents good results and consistency when compared to other algorithms with a similar proposal.
publishDate 2021
dc.date.none.fl_str_mv 2021-04-12
2024-05-30T00:50:45Z
2024-05-30T00:50:45Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufes.br/handle/10/15479
url http://repositorio.ufes.br/handle/10/15479
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv Text
application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Espírito Santo
BR
Mestrado em Informática
Centro Tecnológico
UFES
Programa de Pós-Graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Espírito Santo
BR
Mestrado em Informática
Centro Tecnológico
UFES
Programa de Pós-Graduação em Informática
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
instname:Universidade Federal do Espírito Santo (UFES)
instacron:UFES
instname_str Universidade Federal do Espírito Santo (UFES)
instacron_str UFES
institution UFES
reponame_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
collection Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)
repository.mail.fl_str_mv riufes@ufes.br
_version_ 1834479151677964288