Redes neurais do tipo Long Short-Term Memory aplicadas em previsões de demanda no mercado varejista

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Fukai, Fernanda Mayumi
Orientador(a): Cavalieri, Daniel Cruz
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Serra
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ifes.edu.br/handle/123456789/5445
Resumo: A previsão de vendas é um componente crítico na indústria do varejo, essencial para decisões estratégicas, planejamento operacional e manutenção da estabilidade finan- ceira, promovendo o crescimento dos negócios. Métodos estatísticos tradicionais têm sido amplamente utilizados para análise de séries temporais, mas frequentemente enfrentam dificuldades com relações complexas, não lineares e dinâmicas de alta dimensionalidade. Nesse contexto, redes Long Short-Term Memory (LSTM) ofere- cem vantagens significativas devido à sua capacidade de reter informações ao longo de longos períodos, tornando-as adequadas para lidar com interações dinâmicas e complexas nos dados. Esta dissertação avalia o desempenho de três redes neurais baseadas em variações da arquitetura LSTM: Vanilla LSTM, Conv1D-LSTM e Multiscale CNN-LSTM, aplicadas à previsão de vendas futuras. Para uma análise comparativa robusta, os modelos Average, XGBoost e LightGBM também são empregados como benchmarks, com desempenho avaliado por métricas como Erro Absoluto Médio (MAE), Raiz do Erro Quadrático Médio (RMSE) e Erro Absoluto Escalado Médio (MASE). A otimização de hiperparâmetros foi realizada para melhorar os resultados. Os resultados indicam que a arquitetura Conv1D-LSTM consistentemente supera os outros modelos LSTM em quase todas as métricas, alcançando o maior R2 e os menores valores de MAE, RMSE e MASE após a otimização Bayesiana. No entanto, modelos como LightGBM e XGBoost demonstraram desempenho superior aos modelos LSTM, com custos computacionais significativamente menores, tornando-os alternativas eficientes para previsão de vendas, especialmente em cenários com recursos computacionais limitados. Embora os modelos baseados em LSTM, particularmente o Conv1D-LSTM, sejam altamente eficazes para lidar com a complexidade dos dados de séries temporais, modelos como LightGBM e XGBoost permanecem competitivos, oferecendo um equilíbrio valioso entre desempenho e eficiência computacional.
id IFES-2_e05f19ff10a25b643b07823f3215b76b
oai_identifier_str oai:repositorio.ifes.edu.br:123456789/5445
network_acronym_str IFES-2
network_name_str Repositório Institucional do IFES
repository_id_str
spelling Fukai, Fernanda MayumiInstituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)Zago, Gabriel TozattoAndreão, Rodrigo VarejãoCavalieri, Daniel Cruzde Castro, Fidelis Zanetti2024-12-12T20:44:14Z2024-12-12T20:44:14Z2024FUKAI, Fernanda Mayumi. Redes Neurais do Tipo Long Short-Term Memory Aplicadas em Previsões de Demanda no Mercado Varejista. 2024. 91 f. Dissertação (Mestrado Profissional em Engenharia de Controle e Automação) - Instituto Federal do Espírito Santo, Campus Serra, Serra, 2024.https://repositorio.ifes.edu.br/handle/123456789/544530004012070P2A previsão de vendas é um componente crítico na indústria do varejo, essencial para decisões estratégicas, planejamento operacional e manutenção da estabilidade finan- ceira, promovendo o crescimento dos negócios. Métodos estatísticos tradicionais têm sido amplamente utilizados para análise de séries temporais, mas frequentemente enfrentam dificuldades com relações complexas, não lineares e dinâmicas de alta dimensionalidade. Nesse contexto, redes Long Short-Term Memory (LSTM) ofere- cem vantagens significativas devido à sua capacidade de reter informações ao longo de longos períodos, tornando-as adequadas para lidar com interações dinâmicas e complexas nos dados. Esta dissertação avalia o desempenho de três redes neurais baseadas em variações da arquitetura LSTM: Vanilla LSTM, Conv1D-LSTM e Multiscale CNN-LSTM, aplicadas à previsão de vendas futuras. Para uma análise comparativa robusta, os modelos Average, XGBoost e LightGBM também são empregados como benchmarks, com desempenho avaliado por métricas como Erro Absoluto Médio (MAE), Raiz do Erro Quadrático Médio (RMSE) e Erro Absoluto Escalado Médio (MASE). A otimização de hiperparâmetros foi realizada para melhorar os resultados. Os resultados indicam que a arquitetura Conv1D-LSTM consistentemente supera os outros modelos LSTM em quase todas as métricas, alcançando o maior R2 e os menores valores de MAE, RMSE e MASE após a otimização Bayesiana. No entanto, modelos como LightGBM e XGBoost demonstraram desempenho superior aos modelos LSTM, com custos computacionais significativamente menores, tornando-os alternativas eficientes para previsão de vendas, especialmente em cenários com recursos computacionais limitados. Embora os modelos baseados em LSTM, particularmente o Conv1D-LSTM, sejam altamente eficazes para lidar com a complexidade dos dados de séries temporais, modelos como LightGBM e XGBoost permanecem competitivos, oferecendo um equilíbrio valioso entre desempenho e eficiência computacional.ABSTRACT Sales forecasting is a critical component of the retail industry, essential for strategic decision-making, operational planning, and maintaining financial stability while promoting business growth. Traditional statistical methods have been widely used for time series analysis but often struggle with complex, nonlinear relationships and highdimensional dynamics among variables. In this context, Long Short-Term Memory (LSTM) networks offer significant advantages due to their ability to retain information over long periods, making them particularly suited to handle the complex and dynamic interactions inherent in the data. This dissertation evaluates the performance of three neural networks based on variations of the LSTM architecture: Vanilla LSTM, Conv1DLSTM, and Multiscale CNN-LSTM, applied to future sales forecasting. To provide a more robust comparative analysis, the Average, XGBoost, and LightGBM models are also employed as benchmarks. Model performance is assessed using metrics such as Mean Absolute Error (MAE), Root Mean Squared Error (RMSE), and Mean Absolute Scaled Error (MASE). Additionally, hyperpa- rameter tuning is conducted to optimize the models’ results. The results indicate that the Conv1D-LSTM architecture consistently outperforms other LSTM models across nearly all evaluation metrics, achieving the highest R 2 value and the lowest MAE, RMSE, and MASE after Bayesian optimization of a hyperparameter set. However, models like LightGBM and XGBoost demonstrated superior performance compared to LSTM-type model’s, while offering the advantage of significantly lower computational costs. This makes them highly efficient alternatives for sales forecasting, especially in scenarios where computational resources are limited. Overall, the study concludes that while LSTM-based models, particularly Conv1D-LSTM, are highly effective at navigating the complexities of time series data (in our context) and identifying intricate patterns over long periods, traditional models like LightGBM and XGBoost remain competitive, providing a valuable balance between performance and computational efficiency. Keywords: LSTM, Convolutional Neural Networks, Deep Learning, Sales Forecasting, RetailFundação de Amparo à Pesquisa e Inovação do Espírito Santo (FAPES)91 f.acesso_abertoinfo:eu-repo/semantics/openAccessLSTMSéries TemporaisVarejoAprendizado ProfundoPrevisão de VendasMachine LearningRedes neuraisRedes neurais do tipo Long Short-Term Memory aplicadas em previsões de demanda no mercado varejistainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisSerraporreponame:Repositório Institucional do IFESinstname:Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)instacron:IFESCampus Serrahttp://lattes.cnpq.br/8536454103542701https://orcid.org/0009-0003-4594-1701EngenhariaSistemas Inteligenteshttp://lattes.cnpq.br/9583314331960942http://lattes.cnpq.br/2373180848461397Mestrado Profissional em Engenharia de Controle e Automaçãohttp://lattes.cnpq.br/8771088249434104http://lattes.cnpq.br/5589662366089944TEXTDISSERTAÇÃO.pdf.txtDISSERTAÇÃO.pdf.txtExtracted texttext/plain155899https://repositorio.ifes.edu.br/bitstreams/a13072c3-8624-423f-9d6f-9fd121e83ebf/downloadf5745dc535d961dadbf8c9fe64d3bdc3MD53falseAnonymousREADTHUMBNAILDISSERTAÇÃO.pdf.jpgDISSERTAÇÃO.pdf.jpgGenerated Thumbnailimage/jpeg2185https://repositorio.ifes.edu.br/bitstreams/286a7dd2-46b4-4be0-ac76-4a3107c64fc1/downloadc7a90408577d22fac6f17dbdf25b9ca4MD54falseAnonymousREADORIGINALDISSERTAÇÃO.pdfDISSERTAÇÃO.pdfDissertaçãoapplication/pdf2219222https://repositorio.ifes.edu.br/bitstreams/cb3a25fe-aa6e-4e4a-9fa4-dd6fed1bd373/downloadfeff3ab60e81d1b58d2bb52c415769e1MD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-8934https://repositorio.ifes.edu.br/bitstreams/d1abc3f4-f37c-440f-9809-1ba993d7eb48/downloadac7cb971050ed632be934da23d966924MD52falseAnonymousREAD123456789/54452024-12-12T20:44:15.030Zopen.accessoai:repositorio.ifes.edu.br:123456789/5445https://repositorio.ifes.edu.brRepositório InstitucionalPUBhttps://repositorio.ifes.edu.br/server/oai/requestrepositorio@ifes.edu.bropendoar:2024-12-12T20:44:15Repositório Institucional do IFES - Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)falseQXV0b3JlcyBxdWUgc3VibWV0ZW0gYSBlc3RhIGNvbmZlcsOqbmNpYSBjb25jb3JkYW0gY29tIG9zIHNlZ3VpbnRlcyB0ZXJtb3M6CmEpIEF1dG9yZXMgbWFudMOpbSBvcyBkaXJlaXRvcyBhdXRvcmFpcyBzb2JyZSBvIHRyYWJhbGhvLCBwZXJtaXRpbmRvIMOgIGNvbmZlcsOqbmNpYSBjb2xvY8OhLWxvIHNvYiB1bWEgbGljZW7Dp2EgTGljZW7Dp2EgQ3JlYXRpdmUgQ29tbW9ucyBBdHRyaWJ1dGlvbiwgcXVlIHBlcm1pdGUgbGl2cmVtZW50ZSBhIG91dHJvcyBhY2Vzc2FyLCB1c2FyIGUgY29tcGFydGlsaGFyIG8gdHJhYmFsaG8gY29tIG8gY3LDqWRpdG8gZGUgYXV0b3JpYSBlIGFwcmVzZW50YcOnw6NvIGluaWNpYWwgbmVzdGEgY29uZmVyw6puY2lhLgpiKSBBdXRvcmVzIHBvZGVtIGFicmlyIG3Do28gZG9zIHRlcm1vcyBkYSBsaWNlbsOnYSBDQyBlIGRlZmluaXIgY29udHJhdG9zIGFkaWNpb25haXMgcGFyYSBhIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhIGUgc3Vic2Vxw7xlbnRlIHB1YmxpY2HDp8OjbyBkZXN0ZSB0cmFiYWxobyAoZXguOiBwdWJsaWNhciB1bWEgdmVyc8OjbyBhdHVhbGl6YWRhIGVtIHVtIHBlcmnDs2RpY28sIGRpc3BvbmliaWxpemFyIGVtIHJlcG9zaXTDs3JpbyBpbnN0aXR1Y2lvbmFsLCBvdSBwdWJsaWPDoS1sbyBlbSBsaXZybyksIGNvbSBvIGNyw6lkaXRvIGRlIGF1dG9yaWEgZSBhcHJlc2VudGHDp8OjbyBpbmljaWFsIG5lc3RhIGNvbmZlcsOqbmNpYS4KYykgQWzDqW0gZGlzc28sIGF1dG9yZXMgc8OjbyBpbmNlbnRpdmFkb3MgYSBwdWJsaWNhciBlIGNvbXBhcnRpbGhhciBzZXVzIHRyYWJhbGhvcyBvbmxpbmUgKGV4LjogZW0gcmVwb3NpdMOzcmlvIGluc3RpdHVjaW9uYWwgb3UgZW0gc3VhIHDDoWdpbmEgcGVzc29hbCkgYSBxdWFscXVlciBtb21lbnRvIGFudGVzIGUgZGVwb2lzIGRhIGNvbmZlcsOqCg==
dc.title.pt_BR.fl_str_mv Redes neurais do tipo Long Short-Term Memory aplicadas em previsões de demanda no mercado varejista
title Redes neurais do tipo Long Short-Term Memory aplicadas em previsões de demanda no mercado varejista
spellingShingle Redes neurais do tipo Long Short-Term Memory aplicadas em previsões de demanda no mercado varejista
Fukai, Fernanda Mayumi
LSTM
Séries Temporais
Varejo
Aprendizado Profundo
Previsão de Vendas
Machine Learning
Redes neurais
title_short Redes neurais do tipo Long Short-Term Memory aplicadas em previsões de demanda no mercado varejista
title_full Redes neurais do tipo Long Short-Term Memory aplicadas em previsões de demanda no mercado varejista
title_fullStr Redes neurais do tipo Long Short-Term Memory aplicadas em previsões de demanda no mercado varejista
title_full_unstemmed Redes neurais do tipo Long Short-Term Memory aplicadas em previsões de demanda no mercado varejista
title_sort Redes neurais do tipo Long Short-Term Memory aplicadas em previsões de demanda no mercado varejista
author Fukai, Fernanda Mayumi
author_facet Fukai, Fernanda Mayumi
author_role author
dc.contributor.institution.pt_BR.fl_str_mv Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)
dc.contributor.member.none.fl_str_mv Zago, Gabriel Tozatto
Andreão, Rodrigo Varejão
dc.contributor.author.fl_str_mv Fukai, Fernanda Mayumi
dc.contributor.advisor1.fl_str_mv Cavalieri, Daniel Cruz
dc.contributor.advisor-co1.fl_str_mv de Castro, Fidelis Zanetti
contributor_str_mv Cavalieri, Daniel Cruz
de Castro, Fidelis Zanetti
dc.subject.por.fl_str_mv LSTM
Séries Temporais
Varejo
Aprendizado Profundo
Previsão de Vendas
Machine Learning
Redes neurais
topic LSTM
Séries Temporais
Varejo
Aprendizado Profundo
Previsão de Vendas
Machine Learning
Redes neurais
description A previsão de vendas é um componente crítico na indústria do varejo, essencial para decisões estratégicas, planejamento operacional e manutenção da estabilidade finan- ceira, promovendo o crescimento dos negócios. Métodos estatísticos tradicionais têm sido amplamente utilizados para análise de séries temporais, mas frequentemente enfrentam dificuldades com relações complexas, não lineares e dinâmicas de alta dimensionalidade. Nesse contexto, redes Long Short-Term Memory (LSTM) ofere- cem vantagens significativas devido à sua capacidade de reter informações ao longo de longos períodos, tornando-as adequadas para lidar com interações dinâmicas e complexas nos dados. Esta dissertação avalia o desempenho de três redes neurais baseadas em variações da arquitetura LSTM: Vanilla LSTM, Conv1D-LSTM e Multiscale CNN-LSTM, aplicadas à previsão de vendas futuras. Para uma análise comparativa robusta, os modelos Average, XGBoost e LightGBM também são empregados como benchmarks, com desempenho avaliado por métricas como Erro Absoluto Médio (MAE), Raiz do Erro Quadrático Médio (RMSE) e Erro Absoluto Escalado Médio (MASE). A otimização de hiperparâmetros foi realizada para melhorar os resultados. Os resultados indicam que a arquitetura Conv1D-LSTM consistentemente supera os outros modelos LSTM em quase todas as métricas, alcançando o maior R2 e os menores valores de MAE, RMSE e MASE após a otimização Bayesiana. No entanto, modelos como LightGBM e XGBoost demonstraram desempenho superior aos modelos LSTM, com custos computacionais significativamente menores, tornando-os alternativas eficientes para previsão de vendas, especialmente em cenários com recursos computacionais limitados. Embora os modelos baseados em LSTM, particularmente o Conv1D-LSTM, sejam altamente eficazes para lidar com a complexidade dos dados de séries temporais, modelos como LightGBM e XGBoost permanecem competitivos, oferecendo um equilíbrio valioso entre desempenho e eficiência computacional.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-12-12T20:44:14Z
dc.date.available.fl_str_mv 2024-12-12T20:44:14Z
dc.date.issued.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FUKAI, Fernanda Mayumi. Redes Neurais do Tipo Long Short-Term Memory Aplicadas em Previsões de Demanda no Mercado Varejista. 2024. 91 f. Dissertação (Mestrado Profissional em Engenharia de Controle e Automação) - Instituto Federal do Espírito Santo, Campus Serra, Serra, 2024.
dc.identifier.uri.fl_str_mv https://repositorio.ifes.edu.br/handle/123456789/5445
dc.identifier.capes.pt_BR.fl_str_mv 30004012070P2
identifier_str_mv FUKAI, Fernanda Mayumi. Redes Neurais do Tipo Long Short-Term Memory Aplicadas em Previsões de Demanda no Mercado Varejista. 2024. 91 f. Dissertação (Mestrado Profissional em Engenharia de Controle e Automação) - Instituto Federal do Espírito Santo, Campus Serra, Serra, 2024.
30004012070P2
url https://repositorio.ifes.edu.br/handle/123456789/5445
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv acesso_aberto
info:eu-repo/semantics/openAccess
rights_invalid_str_mv acesso_aberto
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 91 f.
dc.publisher.none.fl_str_mv Serra
publisher.none.fl_str_mv Serra
dc.source.none.fl_str_mv reponame:Repositório Institucional do IFES
instname:Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)
instacron:IFES
instname_str Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)
instacron_str IFES
institution IFES
reponame_str Repositório Institucional do IFES
collection Repositório Institucional do IFES
bitstream.url.fl_str_mv https://repositorio.ifes.edu.br/bitstreams/a13072c3-8624-423f-9d6f-9fd121e83ebf/download
https://repositorio.ifes.edu.br/bitstreams/286a7dd2-46b4-4be0-ac76-4a3107c64fc1/download
https://repositorio.ifes.edu.br/bitstreams/cb3a25fe-aa6e-4e4a-9fa4-dd6fed1bd373/download
https://repositorio.ifes.edu.br/bitstreams/d1abc3f4-f37c-440f-9809-1ba993d7eb48/download
bitstream.checksum.fl_str_mv f5745dc535d961dadbf8c9fe64d3bdc3
c7a90408577d22fac6f17dbdf25b9ca4
feff3ab60e81d1b58d2bb52c415769e1
ac7cb971050ed632be934da23d966924
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional do IFES - Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)
repository.mail.fl_str_mv repositorio@ifes.edu.br
_version_ 1864451015639564288