Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/ |
Resumo: | A previsão de séries temporais é um tema de pesquisa de grande relevância, anterior ao surgimento do aprendizado de máquina. Modelos estatísticos tradicionais concentram-se na previsão da série-alvo exclusivamente a partir de seus próprios valores passados. Nos últimos anos, entretanto, demonstrou-se que a inclusão de múltiplas variáveis relacionadas ao contexto da série-alvo como entradas do modelo, bem como a extração de novos atributos a partir delas por exemplo, por meio de técnicas de decomposição de sinais e redução de dimensionalidade pode melhorar a acurácia preditiva. Contudo, à medida que mais dados sao adicionados ao modelo, torna-se mais difícil que o treinamento convirja para um ótimo global; por outro lado, quanto mais agressiva for a redução dos dados, maior o risco de perda de informações relevantes. Para lidar com esse trade-off, este trabalho investiga como um modelo de entrada única de ´ultima geração que utiliza decomposição de séries temporais para extração de atributos (CEEMDAN-LSTM) pode incorporar variáveis exógenas para melhorar sua acurácia, equilibrando os desafios de complexidade do treinamento. A investigação utilizou quatro conjuntos de dados de diferentes domínios e resultou em duas contribuições principais: a proposta de uma nova arquitetura, X-CEEMDAN-LSTM, que inclui variáveis exógenas como entradas e supera sua versão de entrada única; e a avaliação de diferentes métricas de relevância incluindo duas propostas neste trabalho para selecionar as variáveis exógenas mais significativas, reduzindo a dimensionalidade do conjunto de dados sem comprometer o desempenho do modelo X-CEEMDAN-LSTM. |
| id |
USP_975f13262e8842cbcd80e9d0a55745e7 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-10122025-101408 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Previsão de séries temporais via machine learning usando processamento de sinal e features exógenasTime series forecasting via machine learning using signal processing and exogenous featuresAprendizagem profundaCEEMDANExogenous featuresFeature extractionFeature selectionForecastingLSTMNeural networksPrevisão (Análise de séries temporais)Time seriesA previsão de séries temporais é um tema de pesquisa de grande relevância, anterior ao surgimento do aprendizado de máquina. Modelos estatísticos tradicionais concentram-se na previsão da série-alvo exclusivamente a partir de seus próprios valores passados. Nos últimos anos, entretanto, demonstrou-se que a inclusão de múltiplas variáveis relacionadas ao contexto da série-alvo como entradas do modelo, bem como a extração de novos atributos a partir delas por exemplo, por meio de técnicas de decomposição de sinais e redução de dimensionalidade pode melhorar a acurácia preditiva. Contudo, à medida que mais dados sao adicionados ao modelo, torna-se mais difícil que o treinamento convirja para um ótimo global; por outro lado, quanto mais agressiva for a redução dos dados, maior o risco de perda de informações relevantes. Para lidar com esse trade-off, este trabalho investiga como um modelo de entrada única de ´ultima geração que utiliza decomposição de séries temporais para extração de atributos (CEEMDAN-LSTM) pode incorporar variáveis exógenas para melhorar sua acurácia, equilibrando os desafios de complexidade do treinamento. A investigação utilizou quatro conjuntos de dados de diferentes domínios e resultou em duas contribuições principais: a proposta de uma nova arquitetura, X-CEEMDAN-LSTM, que inclui variáveis exógenas como entradas e supera sua versão de entrada única; e a avaliação de diferentes métricas de relevância incluindo duas propostas neste trabalho para selecionar as variáveis exógenas mais significativas, reduzindo a dimensionalidade do conjunto de dados sem comprometer o desempenho do modelo X-CEEMDAN-LSTM.Time series forecasting has long been an important topic of research, predating the advent of machine learning. Early statistical models focused on predicting the target series based solely on its own past. More recently, it has been shown that taking multiple variables related to the context of the target as inputs to the model, and extracting new features from themfor instance, with signal decomposition and dimensionality reduction techniquescan improve prediction accuracy. However, as more data are added to the model, it becomes more difficult for training to converge to a global optimum, and as the data are more aggressively reduced, the likelihood of losing valuable information increases. To address this trade-off, this work investigates how a single-input state-of-the-art model that leverages time series decomposition for feature extraction (CEEMDAN-LSTM) can make use of exogenous features to improve its accuracy while balancing training complexity issues. The investigation used a total of four data sets from different domains and led to two main results: the proposal of a new architecture, X-CEEMDAN-LSTM, which includes exogenous features as inputs and outperforms its single-input version; and the evaluation of different relevance metrics, with two proposed scores, in order to select the most significant exogenous features for the input, reducing the dimensionality of the data set while preserving the best results for the X-CEEMDAN-LSTM model.Biblioteca Digitais de Teses e Dissertações da USPBona, Glauber DeAvila, Renan de Luca2025-05-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-12-10T12:22:02Zoai:teses.usp.br:tde-10122025-101408Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-12-10T12:22:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas Time series forecasting via machine learning using signal processing and exogenous features |
| title |
Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas |
| spellingShingle |
Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas Avila, Renan de Luca Aprendizagem profunda CEEMDAN Exogenous features Feature extraction Feature selection Forecasting LSTM Neural networks Previsão (Análise de séries temporais) Time series |
| title_short |
Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas |
| title_full |
Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas |
| title_fullStr |
Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas |
| title_full_unstemmed |
Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas |
| title_sort |
Previsão de séries temporais via machine learning usando processamento de sinal e features exógenas |
| author |
Avila, Renan de Luca |
| author_facet |
Avila, Renan de Luca |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Bona, Glauber De |
| dc.contributor.author.fl_str_mv |
Avila, Renan de Luca |
| dc.subject.por.fl_str_mv |
Aprendizagem profunda CEEMDAN Exogenous features Feature extraction Feature selection Forecasting LSTM Neural networks Previsão (Análise de séries temporais) Time series |
| topic |
Aprendizagem profunda CEEMDAN Exogenous features Feature extraction Feature selection Forecasting LSTM Neural networks Previsão (Análise de séries temporais) Time series |
| description |
A previsão de séries temporais é um tema de pesquisa de grande relevância, anterior ao surgimento do aprendizado de máquina. Modelos estatísticos tradicionais concentram-se na previsão da série-alvo exclusivamente a partir de seus próprios valores passados. Nos últimos anos, entretanto, demonstrou-se que a inclusão de múltiplas variáveis relacionadas ao contexto da série-alvo como entradas do modelo, bem como a extração de novos atributos a partir delas por exemplo, por meio de técnicas de decomposição de sinais e redução de dimensionalidade pode melhorar a acurácia preditiva. Contudo, à medida que mais dados sao adicionados ao modelo, torna-se mais difícil que o treinamento convirja para um ótimo global; por outro lado, quanto mais agressiva for a redução dos dados, maior o risco de perda de informações relevantes. Para lidar com esse trade-off, este trabalho investiga como um modelo de entrada única de ´ultima geração que utiliza decomposição de séries temporais para extração de atributos (CEEMDAN-LSTM) pode incorporar variáveis exógenas para melhorar sua acurácia, equilibrando os desafios de complexidade do treinamento. A investigação utilizou quatro conjuntos de dados de diferentes domínios e resultou em duas contribuições principais: a proposta de uma nova arquitetura, X-CEEMDAN-LSTM, que inclui variáveis exógenas como entradas e supera sua versão de entrada única; e a avaliação de diferentes métricas de relevância incluindo duas propostas neste trabalho para selecionar as variáveis exógenas mais significativas, reduzindo a dimensionalidade do conjunto de dados sem comprometer o desempenho do modelo X-CEEMDAN-LSTM. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-05-07 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-10122025-101408/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492190482923520 |