Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Avila, Renan de Luca
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/
Resumo: A previsão de séries temporais é um tema de pesquisa de grande relevância, anterior ao surgimento do aprendizado de máquina. Modelos estatísticos tradicionais concentram-se na previsão da série-alvo exclusivamente a partir de seus próprios valores passados. Nos últimos anos, entretanto, demonstrou-se que a inclusão de múltiplas variáveis relacionadas ao contexto da série-alvo como entradas do modelo, bem como a extração de novos atributos a partir delas por exemplo, por meio de técnicas de decomposição de sinais e redução de dimensionalidade pode melhorar a acurácia preditiva. Contudo, à medida que mais dados sao adicionados ao modelo, torna-se mais difícil que o treinamento convirja para um ótimo global; por outro lado, quanto mais agressiva for a redução dos dados, maior o risco de perda de informações relevantes. Para lidar com esse trade-off, este trabalho investiga como um modelo de entrada única de ´ultima geração que utiliza decomposição de séries temporais para extração de atributos (CEEMDAN-LSTM) pode incorporar variáveis exógenas para melhorar sua acurácia, equilibrando os desafios de complexidade do treinamento. A investigação utilizou quatro conjuntos de dados de diferentes domínios e resultou em duas contribuições principais: a proposta de uma nova arquitetura, X-CEEMDAN-LSTM, que inclui variáveis exógenas como entradas e supera sua versão de entrada única; e a avaliação de diferentes métricas de relevância incluindo duas propostas neste trabalho para selecionar as variáveis exógenas mais significativas, reduzindo a dimensionalidade do conjunto de dados sem comprometer o desempenho do modelo X-CEEMDAN-LSTM.
id USP_975f13262e8842cbcd80e9d0a55745e7
oai_identifier_str oai:teses.usp.br:tde-10122025-101408
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Previsão de séries temporais via machine learning usando processamento de sinal e features exógenasTime series forecasting via machine learning using signal processing and exogenous featuresAprendizagem profundaCEEMDANExogenous featuresFeature extractionFeature selectionForecastingLSTMNeural networksPrevisão (Análise de séries temporais)Time seriesA previsão de séries temporais é um tema de pesquisa de grande relevância, anterior ao surgimento do aprendizado de máquina. Modelos estatísticos tradicionais concentram-se na previsão da série-alvo exclusivamente a partir de seus próprios valores passados. Nos últimos anos, entretanto, demonstrou-se que a inclusão de múltiplas variáveis relacionadas ao contexto da série-alvo como entradas do modelo, bem como a extração de novos atributos a partir delas por exemplo, por meio de técnicas de decomposição de sinais e redução de dimensionalidade pode melhorar a acurácia preditiva. Contudo, à medida que mais dados sao adicionados ao modelo, torna-se mais difícil que o treinamento convirja para um ótimo global; por outro lado, quanto mais agressiva for a redução dos dados, maior o risco de perda de informações relevantes. Para lidar com esse trade-off, este trabalho investiga como um modelo de entrada única de ´ultima geração que utiliza decomposição de séries temporais para extração de atributos (CEEMDAN-LSTM) pode incorporar variáveis exógenas para melhorar sua acurácia, equilibrando os desafios de complexidade do treinamento. A investigação utilizou quatro conjuntos de dados de diferentes domínios e resultou em duas contribuições principais: a proposta de uma nova arquitetura, X-CEEMDAN-LSTM, que inclui variáveis exógenas como entradas e supera sua versão de entrada única; e a avaliação de diferentes métricas de relevância incluindo duas propostas neste trabalho para selecionar as variáveis exógenas mais significativas, reduzindo a dimensionalidade do conjunto de dados sem comprometer o desempenho do modelo X-CEEMDAN-LSTM.Time series forecasting has long been an important topic of research, predating the advent of machine learning. Early statistical models focused on predicting the target series based solely on its own past. More recently, it has been shown that taking multiple variables related to the context of the target as inputs to the model, and extracting new features from themfor instance, with signal decomposition and dimensionality reduction techniquescan improve prediction accuracy. However, as more data are added to the model, it becomes more difficult for training to converge to a global optimum, and as the data are more aggressively reduced, the likelihood of losing valuable information increases. To address this trade-off, this work investigates how a single-input state-of-the-art model that leverages time series decomposition for feature extraction (CEEMDAN-LSTM) can make use of exogenous features to improve its accuracy while balancing training complexity issues. The investigation used a total of four data sets from different domains and led to two main results: the proposal of a new architecture, X-CEEMDAN-LSTM, which includes exogenous features as inputs and outperforms its single-input version; and the evaluation of different relevance metrics, with two proposed scores, in order to select the most significant exogenous features for the input, reducing the dimensionality of the data set while preserving the best results for the X-CEEMDAN-LSTM model.Biblioteca Digitais de Teses e Dissertações da USPBona, Glauber DeAvila, Renan de Luca2025-05-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-12-10T12:22:02Zoai:teses.usp.br:tde-10122025-101408Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-12-10T12:22:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
Time series forecasting via machine learning using signal processing and exogenous features
title Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
spellingShingle Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
Avila, Renan de Luca
Aprendizagem profunda
CEEMDAN
Exogenous features
Feature extraction
Feature selection
Forecasting
LSTM
Neural networks
Previsão (Análise de séries temporais)
Time series
title_short Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
title_full Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
title_fullStr Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
title_full_unstemmed Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
title_sort Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
author Avila, Renan de Luca
author_facet Avila, Renan de Luca
author_role author
dc.contributor.none.fl_str_mv Bona, Glauber De
dc.contributor.author.fl_str_mv Avila, Renan de Luca
dc.subject.por.fl_str_mv Aprendizagem profunda
CEEMDAN
Exogenous features
Feature extraction
Feature selection
Forecasting
LSTM
Neural networks
Previsão (Análise de séries temporais)
Time series
topic Aprendizagem profunda
CEEMDAN
Exogenous features
Feature extraction
Feature selection
Forecasting
LSTM
Neural networks
Previsão (Análise de séries temporais)
Time series
description A previsão de séries temporais é um tema de pesquisa de grande relevância, anterior ao surgimento do aprendizado de máquina. Modelos estatísticos tradicionais concentram-se na previsão da série-alvo exclusivamente a partir de seus próprios valores passados. Nos últimos anos, entretanto, demonstrou-se que a inclusão de múltiplas variáveis relacionadas ao contexto da série-alvo como entradas do modelo, bem como a extração de novos atributos a partir delas por exemplo, por meio de técnicas de decomposição de sinais e redução de dimensionalidade pode melhorar a acurácia preditiva. Contudo, à medida que mais dados sao adicionados ao modelo, torna-se mais difícil que o treinamento convirja para um ótimo global; por outro lado, quanto mais agressiva for a redução dos dados, maior o risco de perda de informações relevantes. Para lidar com esse trade-off, este trabalho investiga como um modelo de entrada única de ´ultima geração que utiliza decomposição de séries temporais para extração de atributos (CEEMDAN-LSTM) pode incorporar variáveis exógenas para melhorar sua acurácia, equilibrando os desafios de complexidade do treinamento. A investigação utilizou quatro conjuntos de dados de diferentes domínios e resultou em duas contribuições principais: a proposta de uma nova arquitetura, X-CEEMDAN-LSTM, que inclui variáveis exógenas como entradas e supera sua versão de entrada única; e a avaliação de diferentes métricas de relevância incluindo duas propostas neste trabalho para selecionar as variáveis exógenas mais significativas, reduzindo a dimensionalidade do conjunto de dados sem comprometer o desempenho do modelo X-CEEMDAN-LSTM.
publishDate 2025
dc.date.none.fl_str_mv 2025-05-07
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/
url https://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492190482923520