Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Bezerra, Clauber Gomes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/24360
Resumo: In this thesis we propose a new approach to unsupervised data clustering and classification. The proposed approach is based on typicality and eccentricity concepts. This concepts are used by recently introduced TEDA algorithm for outlier detection. To perform data clustering and classification, it is proposed a new statistical algorithm, called Auto-Cloud. The data samples analyzed by Auto-Cloud are grouped in the form of unities called data clouds, which are structures without pre-defined shape or boundaries. Auto-Cloud allows each data sample to belong to multiple data clouds simultaneously. Auto-Cloud is an autonomous and evolving algorithm, which does not requires previous training or any prior knowledge about the data set. Auto-Cloud is able to create and merge data clouds autonomously, as data samples are obtained, without any human interference. The algorithm is suitable for data clustering and classification of online data streams and application that require real-time response. Auto-Cloud is also recursive, which makes it fast and with little computational effort. The data classification process works like a fuzzy classifier using the degree of membership between the analyzed data sample to each data cloud created in clustering process. The class to which each data sample belongs is determined by the cloud with the highest activation with respect to that sample. To validate the proposed method, we apply it to several existing datasets for data clustering and classification. Moreover, the method was also used in a fault detection in industrial processes application. In this case, we use real data obtained from a real world industrial plant.
id UFRN_2eccf2f09701b4370a05432792ecbe5e
oai_identifier_str oai:repositorio.ufrn.br:123456789/24360
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dadosDetecção de outliersAgrupamento de dadosClassificação de dadosStream de dadosTEDATipicidadeExcentricidadeData cloudAuto-CloudCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTAÇÃOIn this thesis we propose a new approach to unsupervised data clustering and classification. The proposed approach is based on typicality and eccentricity concepts. This concepts are used by recently introduced TEDA algorithm for outlier detection. To perform data clustering and classification, it is proposed a new statistical algorithm, called Auto-Cloud. The data samples analyzed by Auto-Cloud are grouped in the form of unities called data clouds, which are structures without pre-defined shape or boundaries. Auto-Cloud allows each data sample to belong to multiple data clouds simultaneously. Auto-Cloud is an autonomous and evolving algorithm, which does not requires previous training or any prior knowledge about the data set. Auto-Cloud is able to create and merge data clouds autonomously, as data samples are obtained, without any human interference. The algorithm is suitable for data clustering and classification of online data streams and application that require real-time response. Auto-Cloud is also recursive, which makes it fast and with little computational effort. The data classification process works like a fuzzy classifier using the degree of membership between the analyzed data sample to each data cloud created in clustering process. The class to which each data sample belongs is determined by the cloud with the highest activation with respect to that sample. To validate the proposed method, we apply it to several existing datasets for data clustering and classification. Moreover, the method was also used in a fault detection in industrial processes application. In this case, we use real data obtained from a real world industrial plant.Nesta tese apresentamos uma nova abordagem para realizar o agrupamento e a classificação de um conjunto de dados de forma não supervisionada. A abordagem proposta utiliza os conceitos de tipicidade e excentricidade usados pelo algoritmo TEDA na detecção de outliers. Para realizar o agrupamento e a classificação é proposto um algoritmo estatístico chamado Auto-Cloud. As amostras analisadas pelo Auto-Cloud são agrupadas em unidades chamadas de data clouds, que são estruturas que não possuem formato ou limites definidos. O Auto-Cloud permite que cada amostra analisada possa pertencer simultaneamente a várias data clouds. O Auto-Cloud é um algoritmo autônomo e evolutivo, que não necessita de treinamento ou qualquer conhecimento prévios sobre o conjunto de dados analisado. Ele permite a criação e a fusão das data clouds de forma autônoma, à medida que as amostras são lidas, sem qualquer intervenção humana. As características do algoritmo fazem com que ele seja indicado para o agrupamento e classificação de streams de dados e para aplicações que requerem respostas em tempo-real. O Auto- Cloud também é um algoritmo recursivo, o que o torna rápido e exige pouca quantidade de memória. Já no processo de classificação dos dados, o Auto-Cloud trabalha como um classificador fuzzy, calculando o grau de pertinência entre a amostra analisada e cada data cloud criada no processo de agrupamento. A classe a que pertence cada amostra é determinada pela data cloud com maior grau de pertinência com relação a amostra. Para validar o método proposto, aplicamos o mesmo em vários conjuntos de dados existentes na literatura sobre o assunto. Além disso, o método também foi validado numa aplicação de detecção e classificação de falhas em processos industriais, onde foram utilizados dados reais, obtidos de uma planta industrial.BrasilUFRNPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOOliveira, Luiz Affonso Henderson Guedes dehttp://lattes.cnpq.br/7987212907837941Martins, Allan de Medeirosttp://lattes.cnpq.br/4402694969508077http://lattes.cnpq.br/1125827309642732Silva, Diego Rodrigo CabralLemos, André Paimhttp://lattes.cnpq.br/2426104312592166Costa, Bruno Sielly Jaleshttp://lattes.cnpq.br/2486327435960311Bezerra, Clauber Gomes2017-11-23T23:24:44Z2017-11-23T23:24:44Z2017-05-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfBEZERRA, Clauber Gomes. Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados. 2017. 108f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2017.https://repositorio.ufrn.br/jspui/handle/123456789/24360porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRN2022-04-18T21:57:30Zoai:repositorio.ufrn.br:123456789/24360Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2022-04-18T21:57:30Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.none.fl_str_mv Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
title Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
spellingShingle Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
Bezerra, Clauber Gomes
Detecção de outliers
Agrupamento de dados
Classificação de dados
Stream de dados
TEDA
Tipicidade
Excentricidade
Data cloud
Auto-Cloud
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTAÇÃO
title_short Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
title_full Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
title_fullStr Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
title_full_unstemmed Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
title_sort Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados
author Bezerra, Clauber Gomes
author_facet Bezerra, Clauber Gomes
author_role author
dc.contributor.none.fl_str_mv Oliveira, Luiz Affonso Henderson Guedes de
http://lattes.cnpq.br/7987212907837941
Martins, Allan de Medeiros
ttp://lattes.cnpq.br/4402694969508077
http://lattes.cnpq.br/1125827309642732
Silva, Diego Rodrigo Cabral
Lemos, André Paim
http://lattes.cnpq.br/2426104312592166
Costa, Bruno Sielly Jales
http://lattes.cnpq.br/2486327435960311
dc.contributor.author.fl_str_mv Bezerra, Clauber Gomes
dc.subject.por.fl_str_mv Detecção de outliers
Agrupamento de dados
Classificação de dados
Stream de dados
TEDA
Tipicidade
Excentricidade
Data cloud
Auto-Cloud
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTAÇÃO
topic Detecção de outliers
Agrupamento de dados
Classificação de dados
Stream de dados
TEDA
Tipicidade
Excentricidade
Data cloud
Auto-Cloud
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTAÇÃO
description In this thesis we propose a new approach to unsupervised data clustering and classification. The proposed approach is based on typicality and eccentricity concepts. This concepts are used by recently introduced TEDA algorithm for outlier detection. To perform data clustering and classification, it is proposed a new statistical algorithm, called Auto-Cloud. The data samples analyzed by Auto-Cloud are grouped in the form of unities called data clouds, which are structures without pre-defined shape or boundaries. Auto-Cloud allows each data sample to belong to multiple data clouds simultaneously. Auto-Cloud is an autonomous and evolving algorithm, which does not requires previous training or any prior knowledge about the data set. Auto-Cloud is able to create and merge data clouds autonomously, as data samples are obtained, without any human interference. The algorithm is suitable for data clustering and classification of online data streams and application that require real-time response. Auto-Cloud is also recursive, which makes it fast and with little computational effort. The data classification process works like a fuzzy classifier using the degree of membership between the analyzed data sample to each data cloud created in clustering process. The class to which each data sample belongs is determined by the cloud with the highest activation with respect to that sample. To validate the proposed method, we apply it to several existing datasets for data clustering and classification. Moreover, the method was also used in a fault detection in industrial processes application. In this case, we use real data obtained from a real world industrial plant.
publishDate 2017
dc.date.none.fl_str_mv 2017-11-23T23:24:44Z
2017-11-23T23:24:44Z
2017-05-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv BEZERRA, Clauber Gomes. Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados. 2017. 108f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2017.
https://repositorio.ufrn.br/jspui/handle/123456789/24360
identifier_str_mv BEZERRA, Clauber Gomes. Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados. 2017. 108f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2017.
url https://repositorio.ufrn.br/jspui/handle/123456789/24360
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
publisher.none.fl_str_mv Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv repositorio@bczm.ufrn.br
_version_ 1855758841048727552