Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Oliveira, Andressa Stéfany Silva de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Rio Grande do Norte
Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufrn.br/handle/123456789/32366
Resumo: Situations that generate a continuous data stream under a changing environment, such as TCP / IP traffic, e-commerce, and industrial monitoring, can make the usability of offline algorithms for machine learning infeasible. That is due to the need for data storage, infinite growth of data generation, and memory restrictions, making models impossible to redesign and retrain. As a consequence of that, algorithms that work in a fully or partially on-line fashion have arisen. Among them, evolving algorithms is a prominent approach because such algorithms can develop and update models’ parameters and structure in unknown environments and detect concepts drift and evolution in the input-output data over time. Because evolving approaches and models are highly applicable in real-world problems, this work proposes a new evolving clustering algorithm named Macro SOStream. This algorithm performs on-line learning and is based on self-organizing density for data stream clustering. The Macro SOStream is based on the SOStream algorithm; however, we incorporate the notion of macroclusters as a microclusters’ composition. While microclusters have spherical shapes, macroclusters may assume arbitrary shapes. For the experiments, were used the benchmark datasets quite usual in the literature, the clustering performance metric Adjusted Rand Index (ARI), and is performed at the average time of the algorithms’ execution with the datasets. The results indicated that the performance and average execution time of the Macro SOStream algorithm are comparable to those of SOStream and DenStream.
id UFRN_68f8af1bfe8c00efcd96aa033d8bdd9a
oai_identifier_str oai:repositorio.ufrn.br:123456789/32366
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidadeSistemas evolutivosFluxo de dadosAprendizado onlineClusterizaçãoSituations that generate a continuous data stream under a changing environment, such as TCP / IP traffic, e-commerce, and industrial monitoring, can make the usability of offline algorithms for machine learning infeasible. That is due to the need for data storage, infinite growth of data generation, and memory restrictions, making models impossible to redesign and retrain. As a consequence of that, algorithms that work in a fully or partially on-line fashion have arisen. Among them, evolving algorithms is a prominent approach because such algorithms can develop and update models’ parameters and structure in unknown environments and detect concepts drift and evolution in the input-output data over time. Because evolving approaches and models are highly applicable in real-world problems, this work proposes a new evolving clustering algorithm named Macro SOStream. This algorithm performs on-line learning and is based on self-organizing density for data stream clustering. The Macro SOStream is based on the SOStream algorithm; however, we incorporate the notion of macroclusters as a microclusters’ composition. While microclusters have spherical shapes, macroclusters may assume arbitrary shapes. For the experiments, were used the benchmark datasets quite usual in the literature, the clustering performance metric Adjusted Rand Index (ARI), and is performed at the average time of the algorithms’ execution with the datasets. The results indicated that the performance and average execution time of the Macro SOStream algorithm are comparable to those of SOStream and DenStream.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESSituações que geram fluxo contínuo de dados sujeitos a mudança de comportamento ao longo do tempo, como são os casos de tráfego TCP/IP, e-commerce e monitoramento industrial, podem tornar inviável a utilização de algoritmos que possuem estratégias de aprendizagem de máquina off-line. Isto se deve à necessidade de armazenamento dos dados em função do crescimento infindável da geração dos dados e às restrições como memória limitada, impossibilitando um retreinamento do modelo. Para tratar essa classe de problemas, surgiram os algoritmos que possuem a aprendizagem total ou parcialmente on-line. Dentre eles, há os algoritmos evolutivos, os quais têm sido alvo de interesse pelo fato de possuírem a capacidade de se desenvolverem e atualizarem em ambientes desconhecidos, como também a habilidade de detecção de mudanças e desvios dos dados de entrada ao longo do tempo. Diante da vasta gama de possíveis aplicações de algoritmos evolutivos em problemas reais, nesta dissertação propomos um novo algoritmo evolutivo para agrupamento dinâmico de dados denominado de Macro SOStream. Esse algoritmo possui aprendizagem on-line e é baseado em densidade para agrupamento autoorganizável de fluxo de dados. O Macro SOStream tem como origem o algoritmo SOStream, porém aqui foi incorporado o conceito de macroclusters, os quais são formados pelos microclusters. Enquanto os microclusters possuem formas esféricas, os macroclusters têm formas arbitrárias. Ainda, utilizaram-se conjuntos de dados bem estabelecidas na literatura, a métrica de desempenho de clusterização Adjusted Rand Index (ARI) nos experimentos realizados, e é efetuada a medição do tempo médio de execução dos algoritmos com os conjuntos de dados. Os resultados indicaram que o desempenho e tempo de execução médio do algoritmo Macro SOStream é comparável aos do SOStream e do DenStream.Universidade Federal do Rio Grande do NorteBrasilUFRNPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOOliveira, Luiz Affonso Henderson Guedes dehttp://lattes.cnpq.br/3582580885769495http://lattes.cnpq.br/7987212907837941Leite, Daniel FurtadoAloise, DanielFernandes, Marcelo Augusto CostaOliveira, Andressa Stéfany Silva de2021-05-04T18:14:05Z2021-05-04T18:14:05Z2021-03-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfOLIVEIRA, Andressa Stéfany Silva de. Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade. 2021. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/32366info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRN2021-05-04T18:14:53Zoai:repositorio.ufrn.br:123456789/32366Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2021-05-04T18:14:53Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.none.fl_str_mv Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
title Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
spellingShingle Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
Oliveira, Andressa Stéfany Silva de
Sistemas evolutivos
Fluxo de dados
Aprendizado online
Clusterização
title_short Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
title_full Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
title_fullStr Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
title_full_unstemmed Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
title_sort Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
author Oliveira, Andressa Stéfany Silva de
author_facet Oliveira, Andressa Stéfany Silva de
author_role author
dc.contributor.none.fl_str_mv Oliveira, Luiz Affonso Henderson Guedes de

http://lattes.cnpq.br/3582580885769495

http://lattes.cnpq.br/7987212907837941
Leite, Daniel Furtado

Aloise, Daniel

Fernandes, Marcelo Augusto Costa

dc.contributor.author.fl_str_mv Oliveira, Andressa Stéfany Silva de
dc.subject.por.fl_str_mv Sistemas evolutivos
Fluxo de dados
Aprendizado online
Clusterização
topic Sistemas evolutivos
Fluxo de dados
Aprendizado online
Clusterização
description Situations that generate a continuous data stream under a changing environment, such as TCP / IP traffic, e-commerce, and industrial monitoring, can make the usability of offline algorithms for machine learning infeasible. That is due to the need for data storage, infinite growth of data generation, and memory restrictions, making models impossible to redesign and retrain. As a consequence of that, algorithms that work in a fully or partially on-line fashion have arisen. Among them, evolving algorithms is a prominent approach because such algorithms can develop and update models’ parameters and structure in unknown environments and detect concepts drift and evolution in the input-output data over time. Because evolving approaches and models are highly applicable in real-world problems, this work proposes a new evolving clustering algorithm named Macro SOStream. This algorithm performs on-line learning and is based on self-organizing density for data stream clustering. The Macro SOStream is based on the SOStream algorithm; however, we incorporate the notion of macroclusters as a microclusters’ composition. While microclusters have spherical shapes, macroclusters may assume arbitrary shapes. For the experiments, were used the benchmark datasets quite usual in the literature, the clustering performance metric Adjusted Rand Index (ARI), and is performed at the average time of the algorithms’ execution with the datasets. The results indicated that the performance and average execution time of the Macro SOStream algorithm are comparable to those of SOStream and DenStream.
publishDate 2021
dc.date.none.fl_str_mv 2021-05-04T18:14:05Z
2021-05-04T18:14:05Z
2021-03-19
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv OLIVEIRA, Andressa Stéfany Silva de. Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade. 2021. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.
https://repositorio.ufrn.br/handle/123456789/32366
identifier_str_mv OLIVEIRA, Andressa Stéfany Silva de. Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade. 2021. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.
url https://repositorio.ufrn.br/handle/123456789/32366
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv repositorio@bczm.ufrn.br
_version_ 1855758882092089344