Extração e seleção de características para a classificação eficiente de séries temporais

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Freitas Júnior, Márcio Antônio
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
4T
TSC
Link de acesso: https://repositorio.ufu.br/handle/123456789/35084
https://doi.org/10.14393/ufu.di.2022.53
Resumo: As the production of time series increases, so does the need to mine them. Currently one of the most prominent mining tasks has been the time series classification. This task received many publications and solutions mainly focused on classification accuracy. This led to a state of the art specialized in high accuracy results, but also with a high processing time. This characteristic makes the solution usability infeasible for large scale problems. Aiming to obtain both accurate and fast results, this work proposes 4T. It is a dictionary-based algorithm of feature extraction and selection focused on the efficiency of time series classification. The efficiency was proposed in this dissertation as an evaluation metric and was defined as the fraction between score and fitting time of a classification. The results obtained by 4T show an average efficiency higher than the efficiency of the available state-of-the-art results. These results include two scores: accuracy and AUROC. Along with fitting time the scores were calculated by classifying 71 datasets of the UEA & UCR archive.
id UFU_05c8370d9a82eb7c97bf2f9418d1ed16
oai_identifier_str oai:repositorio.ufu.br:123456789/35084
network_acronym_str UFU
network_name_str Repositório Institucional da UFU
repository_id_str
spelling Extração e seleção de características para a classificação eficiente de séries temporaisFeature extraction and selection for efficient time series classification4TBaseado em dicionárioDictionary-basedClassificação eficienteEfficient classificationEficiênciaEfficiencySéries temporaisTime SeriesTSCComputaçãoComputingCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOComputaçãoAnálise de séries temporaisAlgorítmos computacionaisAs the production of time series increases, so does the need to mine them. Currently one of the most prominent mining tasks has been the time series classification. This task received many publications and solutions mainly focused on classification accuracy. This led to a state of the art specialized in high accuracy results, but also with a high processing time. This characteristic makes the solution usability infeasible for large scale problems. Aiming to obtain both accurate and fast results, this work proposes 4T. It is a dictionary-based algorithm of feature extraction and selection focused on the efficiency of time series classification. The efficiency was proposed in this dissertation as an evaluation metric and was defined as the fraction between score and fitting time of a classification. The results obtained by 4T show an average efficiency higher than the efficiency of the available state-of-the-art results. These results include two scores: accuracy and AUROC. Along with fitting time the scores were calculated by classifying 71 datasets of the UEA & UCR archive.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorDissertação (Mestrado)Com o aumento da produção de séries temporais, houve também o aumento da necessidade de minerá-las. Uma das tarefas de mineração que mais ganhou destaque nos últimos anos foi a classificação de séries temporais. Essa tarefa recebeu muitas publicações e soluções que focaram principalmente na acurácia das classificações. Isso levou a um estado da arte especializado em resultados de alta acurácia, mas também com um alto tempo de processamento. Essa particularidade inviabiliza o uso das soluções em problemas reais de maior escala. Com o objetivo de obter resultados tão acurados quanto rápidos, este trabalho propõe o 4T que é um algoritmo de extração e seleção de características baseado em dicionário com foco na eficiência da classificação de séries temporais. A eficiência, proposta nesta dissertação como uma métrica de avaliação, foi definida como a razão entre o score e o tempo de treinamento de uma classificação. Os resultados obtidos pelo 4T mostram uma eficiência média maior que a eficiência dos resultados disponíveis de todo o estado da arte. Esses resultados incluem os scores de acurácia e AUROC e o tempo de treinamento na classificação de 71 datasets do repositório UEA & UCR.Universidade Federal de UberlândiaBrasilPrograma de Pós-graduação em Ciência da ComputaçãoAlbertini, Marcelo Keesehttp://lattes.cnpq.br/1404596833493304Backes, André Ricardohttp://lattes.cnpq.br/8590140337571249Rios, Ricardo Araújohttp://lattes.cnpq.br/0427387583450747Freitas Júnior, Márcio Antônio2022-05-24T18:43:53Z2022-05-24T18:43:53Z2022-01-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfFREITAS JÚNIOR, Márcio Antônio. Extração e seleção de características para a classificação eficiente de séries temporais. 2022. 72 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI http://doi.org/10.14393/ufu.di.2022.53.https://repositorio.ufu.br/handle/123456789/35084https://doi.org/10.14393/ufu.di.2022.53porhttp://creativecommons.org/licenses/by-nc/3.0/us/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2022-05-25T06:17:40Zoai:repositorio.ufu.br:123456789/35084Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2022-05-25T06:17:40Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv Extração e seleção de características para a classificação eficiente de séries temporais
Feature extraction and selection for efficient time series classification
title Extração e seleção de características para a classificação eficiente de séries temporais
spellingShingle Extração e seleção de características para a classificação eficiente de séries temporais
Freitas Júnior, Márcio Antônio
4T
Baseado em dicionário
Dictionary-based
Classificação eficiente
Efficient classification
Eficiência
Efficiency
Séries temporais
Time Series
TSC
Computação
Computing
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
Computação
Análise de séries temporais
Algorítmos computacionais
title_short Extração e seleção de características para a classificação eficiente de séries temporais
title_full Extração e seleção de características para a classificação eficiente de séries temporais
title_fullStr Extração e seleção de características para a classificação eficiente de séries temporais
title_full_unstemmed Extração e seleção de características para a classificação eficiente de séries temporais
title_sort Extração e seleção de características para a classificação eficiente de séries temporais
author Freitas Júnior, Márcio Antônio
author_facet Freitas Júnior, Márcio Antônio
author_role author
dc.contributor.none.fl_str_mv Albertini, Marcelo Keese
http://lattes.cnpq.br/1404596833493304
Backes, André Ricardo
http://lattes.cnpq.br/8590140337571249
Rios, Ricardo Araújo
http://lattes.cnpq.br/0427387583450747
dc.contributor.author.fl_str_mv Freitas Júnior, Márcio Antônio
dc.subject.por.fl_str_mv 4T
Baseado em dicionário
Dictionary-based
Classificação eficiente
Efficient classification
Eficiência
Efficiency
Séries temporais
Time Series
TSC
Computação
Computing
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
Computação
Análise de séries temporais
Algorítmos computacionais
topic 4T
Baseado em dicionário
Dictionary-based
Classificação eficiente
Efficient classification
Eficiência
Efficiency
Séries temporais
Time Series
TSC
Computação
Computing
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
Computação
Análise de séries temporais
Algorítmos computacionais
description As the production of time series increases, so does the need to mine them. Currently one of the most prominent mining tasks has been the time series classification. This task received many publications and solutions mainly focused on classification accuracy. This led to a state of the art specialized in high accuracy results, but also with a high processing time. This characteristic makes the solution usability infeasible for large scale problems. Aiming to obtain both accurate and fast results, this work proposes 4T. It is a dictionary-based algorithm of feature extraction and selection focused on the efficiency of time series classification. The efficiency was proposed in this dissertation as an evaluation metric and was defined as the fraction between score and fitting time of a classification. The results obtained by 4T show an average efficiency higher than the efficiency of the available state-of-the-art results. These results include two scores: accuracy and AUROC. Along with fitting time the scores were calculated by classifying 71 datasets of the UEA & UCR archive.
publishDate 2022
dc.date.none.fl_str_mv 2022-05-24T18:43:53Z
2022-05-24T18:43:53Z
2022-01-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv FREITAS JÚNIOR, Márcio Antônio. Extração e seleção de características para a classificação eficiente de séries temporais. 2022. 72 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI http://doi.org/10.14393/ufu.di.2022.53.
https://repositorio.ufu.br/handle/123456789/35084
https://doi.org/10.14393/ufu.di.2022.53
identifier_str_mv FREITAS JÚNIOR, Márcio Antônio. Extração e seleção de características para a classificação eficiente de séries temporais. 2022. 72 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI http://doi.org/10.14393/ufu.di.2022.53.
url https://repositorio.ufu.br/handle/123456789/35084
https://doi.org/10.14393/ufu.di.2022.53
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc/3.0/us/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/3.0/us/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Ciência da Computação
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFU
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Repositório Institucional da UFU
collection Repositório Institucional da UFU
repository.name.fl_str_mv Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv diinf@dirbi.ufu.br
_version_ 1805397038061322240