Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas

Avila, Renan de Luca

Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas

Detalhes bibliográficos
Ano de defesa:	2025
Autor(a) principal:	Avila, Renan de Luca
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Aprendizagem profunda CEEMDAN Exogenous features Feature extraction Feature selection Forecasting LSTM Neural networks Previsão (Análise de séries temporais) Time series
Link de acesso:	https://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/
Resumo:	A previsão de séries temporais é um tema de pesquisa de grande relevância, anterior ao surgimento do aprendizado de máquina. Modelos estatísticos tradicionais concentram-se na previsão da série-alvo exclusivamente a partir de seus próprios valores passados. Nos últimos anos, entretanto, demonstrou-se que a inclusão de múltiplas variáveis relacionadas ao contexto da série-alvo como entradas do modelo, bem como a extração de novos atributos a partir delas por exemplo, por meio de técnicas de decomposição de sinais e redução de dimensionalidade pode melhorar a acurácia preditiva. Contudo, à medida que mais dados sao adicionados ao modelo, torna-se mais difícil que o treinamento convirja para um ótimo global; por outro lado, quanto mais agressiva for a redução dos dados, maior o risco de perda de informações relevantes. Para lidar com esse trade-off, este trabalho investiga como um modelo de entrada única de ´ultima geração que utiliza decomposição de séries temporais para extração de atributos (CEEMDAN-LSTM) pode incorporar variáveis exógenas para melhorar sua acurácia, equilibrando os desafios de complexidade do treinamento. A investigação utilizou quatro conjuntos de dados de diferentes domínios e resultou em duas contribuições principais: a proposta de uma nova arquitetura, X-CEEMDAN-LSTM, que inclui variáveis exógenas como entradas e supera sua versão de entrada única; e a avaliação de diferentes métricas de relevância incluindo duas propostas neste trabalho para selecionar as variáveis exógenas mais significativas, reduzindo a dimensionalidade do conjunto de dados sem comprometer o desempenho do modelo X-CEEMDAN-LSTM.

Metadados do item

id	USP_975f13262e8842cbcd80e9d0a55745e7
oai_identifier_str	oai:teses.usp.br:tde-10122025-101408
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling	Previsão de séries temporais via machine learning usando processamento de sinal e features exógenasTime series forecasting via machine learning using signal processing and exogenous featuresAprendizagem profundaCEEMDANExogenous featuresFeature extractionFeature selectionForecastingLSTMNeural networksPrevisão (Análise de séries temporais)Time seriesA previsão de séries temporais é um tema de pesquisa de grande relevância, anterior ao surgimento do aprendizado de máquina. Modelos estatísticos tradicionais concentram-se na previsão da série-alvo exclusivamente a partir de seus próprios valores passados. Nos últimos anos, entretanto, demonstrou-se que a inclusão de múltiplas variáveis relacionadas ao contexto da série-alvo como entradas do modelo, bem como a extração de novos atributos a partir delas por exemplo, por meio de técnicas de decomposição de sinais e redução de dimensionalidade pode melhorar a acurácia preditiva. Contudo, à medida que mais dados sao adicionados ao modelo, torna-se mais difícil que o treinamento convirja para um ótimo global; por outro lado, quanto mais agressiva for a redução dos dados, maior o risco de perda de informações relevantes. Para lidar com esse trade-off, este trabalho investiga como um modelo de entrada única de ´ultima geração que utiliza decomposição de séries temporais para extração de atributos (CEEMDAN-LSTM) pode incorporar variáveis exógenas para melhorar sua acurácia, equilibrando os desafios de complexidade do treinamento. A investigação utilizou quatro conjuntos de dados de diferentes domínios e resultou em duas contribuições principais: a proposta de uma nova arquitetura, X-CEEMDAN-LSTM, que inclui variáveis exógenas como entradas e supera sua versão de entrada única; e a avaliação de diferentes métricas de relevância incluindo duas propostas neste trabalho para selecionar as variáveis exógenas mais significativas, reduzindo a dimensionalidade do conjunto de dados sem comprometer o desempenho do modelo X-CEEMDAN-LSTM.Time series forecasting has long been an important topic of research, predating the advent of machine learning. Early statistical models focused on predicting the target series based solely on its own past. More recently, it has been shown that taking multiple variables related to the context of the target as inputs to the model, and extracting new features from themfor instance, with signal decomposition and dimensionality reduction techniquescan improve prediction accuracy. However, as more data are added to the model, it becomes more difficult for training to converge to a global optimum, and as the data are more aggressively reduced, the likelihood of losing valuable information increases. To address this trade-off, this work investigates how a single-input state-of-the-art model that leverages time series decomposition for feature extraction (CEEMDAN-LSTM) can make use of exogenous features to improve its accuracy while balancing training complexity issues. The investigation used a total of four data sets from different domains and led to two main results: the proposal of a new architecture, X-CEEMDAN-LSTM, which includes exogenous features as inputs and outperforms its single-input version; and the evaluation of different relevance metrics, with two proposed scores, in order to select the most significant exogenous features for the input, reducing the dimensionality of the data set while preserving the best results for the X-CEEMDAN-LSTM model.Biblioteca Digitais de Teses e Dissertações da USPBona, Glauber DeAvila, Renan de Luca2025-05-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-12-10T12:22:02Zoai:teses.usp.br:tde-10122025-101408Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212025-12-10T12:22:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas Time series forecasting via machine learning using signal processing and exogenous features
title	Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
spellingShingle	Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas Avila, Renan de Luca Aprendizagem profunda CEEMDAN Exogenous features Feature extraction Feature selection Forecasting LSTM Neural networks Previsão (Análise de séries temporais) Time series
title_short	Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
title_full	Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
title_fullStr	Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
title_full_unstemmed	Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
title_sort	Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
author	Avila, Renan de Luca
author_facet	Avila, Renan de Luca
author_role	author
dc.contributor.none.fl_str_mv	Bona, Glauber De
dc.contributor.author.fl_str_mv	Avila, Renan de Luca
dc.subject.por.fl_str_mv	Aprendizagem profunda CEEMDAN Exogenous features Feature extraction Feature selection Forecasting LSTM Neural networks Previsão (Análise de séries temporais) Time series
topic	Aprendizagem profunda CEEMDAN Exogenous features Feature extraction Feature selection Forecasting LSTM Neural networks Previsão (Análise de séries temporais) Time series
description	A previsão de séries temporais é um tema de pesquisa de grande relevância, anterior ao surgimento do aprendizado de máquina. Modelos estatísticos tradicionais concentram-se na previsão da série-alvo exclusivamente a partir de seus próprios valores passados. Nos últimos anos, entretanto, demonstrou-se que a inclusão de múltiplas variáveis relacionadas ao contexto da série-alvo como entradas do modelo, bem como a extração de novos atributos a partir delas por exemplo, por meio de técnicas de decomposição de sinais e redução de dimensionalidade pode melhorar a acurácia preditiva. Contudo, à medida que mais dados sao adicionados ao modelo, torna-se mais difícil que o treinamento convirja para um ótimo global; por outro lado, quanto mais agressiva for a redução dos dados, maior o risco de perda de informações relevantes. Para lidar com esse trade-off, este trabalho investiga como um modelo de entrada única de ´ultima geração que utiliza decomposição de séries temporais para extração de atributos (CEEMDAN-LSTM) pode incorporar variáveis exógenas para melhorar sua acurácia, equilibrando os desafios de complexidade do treinamento. A investigação utilizou quatro conjuntos de dados de diferentes domínios e resultou em duas contribuições principais: a proposta de uma nova arquitetura, X-CEEMDAN-LSTM, que inclui variáveis exógenas como entradas e supera sua versão de entrada única; e a avaliação de diferentes métricas de relevância incluindo duas propostas neste trabalho para selecionar as variáveis exógenas mais significativas, reduzindo a dimensionalidade do conjunto de dados sem comprometer o desempenho do modelo X-CEEMDAN-LSTM.
publishDate	2025
dc.date.none.fl_str_mv	2025-05-07
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/
url	https://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1865492190482923520

Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas

Registros relacionados