Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Orssatto, Angelo José
Orientador(a): Brun, André Luiz
Banca de defesa: Catarina, Adair Santa, Paetzold, Gustavo Henrique
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual do Oeste do Paraná
Cascavel
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação
Departamento: Centro de Ciências Exatas e Tecnológicas
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://tede.unioeste.br/handle/tede/7816
Resumo: In Brazil, B3 is the stock exchange where various types of assets are traded, such as company shares, commodities, currencies, property funds, among others. The time series of stock market data represents a sequence of information, which can include the opening, closing, high and low prices of a stock, collected over time. Many economists, investors and researchers try to understand its behaviour in order to forecast financial actions, which is a challenge due to its non-linearity and complexity. This work aimed to analyse the applicability of machine learning and deep learning strategies in predicting the values of a set of the most traded shares on B3. These strategies involved MLP, SVM, Bagging, Random Forest, XGBoost models, recurrent neural networks with LSTM and GRU cells, CNN and hybrid networks combining convolutional and recurrent networks. Temporal data and other financial indices was collected from the specialised website investing.com over a period from 2013 to 2023, on a daily basis, and this data was used to build the image base for feeding the CNN, in the form of a block representation, a line graph and a candlestick graph. The study aimed to create a robust and effective machine learning model, from the perspective of univariate and multivariate analyses, and to compare it with consolidated methods in the literature applied to the same problem, analysing the MAE, RMSE metrics and Pearson’s correlation coefficient. The results showed that the MLP and Bagging models achieved the bests metrics for all the scenarios tested, obtaining RMSEs below 0.4 and 0.7, respectively, and emphasising the importance of calibrating their hyperparameters. The block approach for hybrid networks proved to be very promising, and although it didn’t achieve the best error metrics, its correlations were significantly high in general, which makes it possible to explore this context further. In addition, the applicability of structured data as inputs to a CNN aimed at predicting the value of stocks was demonstrated.
id UNIOESTE-1_25eeffbb8503efe67a07db1336ce2e2c
oai_identifier_str oai:tede.unioeste.br:tede/7816
network_acronym_str UNIOESTE-1
network_name_str Biblioteca Digital de Teses e Dissertações do UNIOESTE
repository_id_str
spelling Brun, André LuizCatarina, Adair SantaPaetzold, Gustavo HenriqueOrssatto, Angelo José2025-05-08T01:01:11Z2025-03-18Orssatto,Angelo José. Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro. 2025. 126 f. Dissertação( Mestrado em Ciência da Computação) - Universidade Estadual do Oeste do Paraná, Cascavel.https://tede.unioeste.br/handle/tede/7816In Brazil, B3 is the stock exchange where various types of assets are traded, such as company shares, commodities, currencies, property funds, among others. The time series of stock market data represents a sequence of information, which can include the opening, closing, high and low prices of a stock, collected over time. Many economists, investors and researchers try to understand its behaviour in order to forecast financial actions, which is a challenge due to its non-linearity and complexity. This work aimed to analyse the applicability of machine learning and deep learning strategies in predicting the values of a set of the most traded shares on B3. These strategies involved MLP, SVM, Bagging, Random Forest, XGBoost models, recurrent neural networks with LSTM and GRU cells, CNN and hybrid networks combining convolutional and recurrent networks. Temporal data and other financial indices was collected from the specialised website investing.com over a period from 2013 to 2023, on a daily basis, and this data was used to build the image base for feeding the CNN, in the form of a block representation, a line graph and a candlestick graph. The study aimed to create a robust and effective machine learning model, from the perspective of univariate and multivariate analyses, and to compare it with consolidated methods in the literature applied to the same problem, analysing the MAE, RMSE metrics and Pearson’s correlation coefficient. The results showed that the MLP and Bagging models achieved the bests metrics for all the scenarios tested, obtaining RMSEs below 0.4 and 0.7, respectively, and emphasising the importance of calibrating their hyperparameters. The block approach for hybrid networks proved to be very promising, and although it didn’t achieve the best error metrics, its correlations were significantly high in general, which makes it possible to explore this context further. In addition, the applicability of structured data as inputs to a CNN aimed at predicting the value of stocks was demonstrated.No Brasil, a B3 é a bolsa de valores onde ocorre a negociação de diversos tipos de ativos, como ações de empresas, commodities, moedas, fundos imobiliários, entre outros. A série temporal de dados do mercado de ações representa uma sequência de informações, que podem incluir preço de abertura, fechamento, preços máximo e mínimos de uma ação, coletados ao longo do tempo. Muitos economistas, investidores e pesquisadores tentam entender o seu comportamento a fim de obter uma previsão das ações financeiras, o que é um desafio devido à sua não linearidade e complexidade. Este trabalho se propôs a analisar a aplicabilidade de estratégias de aprendizado de máquina e de aprendizado profundo na predição dos valores de um conjunto das ações mais negociadas na B3. Tais estratégias envolveram modelos MLP, SVM, Bagging, Random Forest, XGBoost, redes neurais recorrentes com células LSTM e GRU, CNN e redes híbridas combinando redes convolucionais e redes recorrentes. Os dados temporais dos ativos e de outros índices financeiros foram coletados através do site especializado investing.com em um intervalo de 2013 à 2023, em amostragem diária, e através destes dados foram construídas a base de imagens para alimentação da CNN, sob a forma de representação de blocos, de gráfico de linhas e de gráfico de velas. O estudo teve como objetivo criar um modelo robusto e eficaz de aprendizado de máquina, sob a perspectiva de análises univariadas e multivariadas, e compará-lo com métodos consolidados na literatura aplicados ao mesmo problema, analisando as métricas MAE, RMSE e o coeficiente de correlação de Pearson. Os resultados mostraram que os modelos MLP e Bagging atingiram melhores métricas para todos os cenários testados, obtendo RMSEs abaixo de 0,4 e 0,7, respectivamente, e ressaltando a importância da calibração de seus hiperparâmetros. A abordagem de blocos para as redes híbridas se mostrou bastante promissora, que apesar de não obter as melhores métricas de erros, suas correlações foram significativamente altas em geral, o que possibilita uma maior exploração sobre esse contexto. Além disso, evidenciou-se a aplicabilidade de dados estruturados como entradas para uma CNN voltada para predição do valor de ações.Submitted by Edineia Teixeira (edineia.teixeira@unioeste.br) on 2025-05-08T01:01:11Z No. of bitstreams: 1 Angelo José Orssatto.pdf: 8152340 bytes, checksum: ef0f8f8afa9869d46ad255bd31fd74ad (MD5)Made available in DSpace on 2025-05-08T01:01:11Z (GMT). No. of bitstreams: 1 Angelo José Orssatto.pdf: 8152340 bytes, checksum: ef0f8f8afa9869d46ad255bd31fd74ad (MD5) Previous issue date: 2025-03-18CAPESapplication/pdfpor6588633818200016417500Universidade Estadual do Oeste do ParanáCascavelPrograma de Pós-Graduação em Ciência da ComputaçãoUNIOESTEBrasilCentro de Ciências Exatas e Tecnológicashttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessSéries TemporaisBolsa de valoresAprendizado de MáquinaRedes Neurais ConvolucionaisRedes Neurais RecorrentesPrediçãoTime SeriesStock MarketMachine LearningConvolutional Neural NetworksRecurrent Neural NetworksPredictionMETODOLOGIAS E TÉCNICAS DE COMPUTAÇÃOAplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações BrasileiroApplying Hybrid Deep Learning Strategies to Price Estimation in the Brazilian Stock Marketinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis19749965330812744706006002214374442868382015reponame:Biblioteca Digital de Teses e Dissertações do UNIOESTEinstname:Universidade Estadual do Oeste do Paraná (UNIOESTE)instacron:UNIOESTEORIGINALAngelo José Orssatto.pdfAngelo José Orssatto.pdfapplication/pdf8152340http://tede.unioeste.br:8080/tede/bitstream/tede/7816/2/Angelo+Jos%C3%A9+Orssatto.pdfef0f8f8afa9869d46ad255bd31fd74adMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://tede.unioeste.br:8080/tede/bitstream/tede/7816/1/license.txtbd3efa91386c1718a7f26a329fdcb468MD51tede/78162025-05-07 22:01:11.818oai:tede.unioeste.br:tede/7816Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede.unioeste.br/PUBhttp://tede.unioeste.br/oai/requestbiblioteca.repositorio@unioeste.bropendoar:2025-05-08T01:01:11Biblioteca Digital de Teses e Dissertações do UNIOESTE - Universidade Estadual do Oeste do Paraná (UNIOESTE)false
dc.title.por.fl_str_mv Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro
dc.title.alternative.eng.fl_str_mv Applying Hybrid Deep Learning Strategies to Price Estimation in the Brazilian Stock Market
title Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro
spellingShingle Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro
Orssatto, Angelo José
Séries Temporais
Bolsa de valores
Aprendizado de Máquina
Redes Neurais Convolucionais
Redes Neurais Recorrentes
Predição
Time Series
Stock Market
Machine Learning
Convolutional Neural Networks
Recurrent Neural Networks
Prediction
METODOLOGIAS E TÉCNICAS DE COMPUTAÇÃO
title_short Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro
title_full Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro
title_fullStr Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro
title_full_unstemmed Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro
title_sort Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro
author Orssatto, Angelo José
author_facet Orssatto, Angelo José
author_role author
dc.contributor.advisor1.fl_str_mv Brun, André Luiz
dc.contributor.referee1.fl_str_mv Catarina, Adair Santa
dc.contributor.referee2.fl_str_mv Paetzold, Gustavo Henrique
dc.contributor.author.fl_str_mv Orssatto, Angelo José
contributor_str_mv Brun, André Luiz
Catarina, Adair Santa
Paetzold, Gustavo Henrique
dc.subject.por.fl_str_mv Séries Temporais
Bolsa de valores
Aprendizado de Máquina
Redes Neurais Convolucionais
Redes Neurais Recorrentes
Predição
topic Séries Temporais
Bolsa de valores
Aprendizado de Máquina
Redes Neurais Convolucionais
Redes Neurais Recorrentes
Predição
Time Series
Stock Market
Machine Learning
Convolutional Neural Networks
Recurrent Neural Networks
Prediction
METODOLOGIAS E TÉCNICAS DE COMPUTAÇÃO
dc.subject.eng.fl_str_mv Time Series
Stock Market
Machine Learning
Convolutional Neural Networks
Recurrent Neural Networks
Prediction
dc.subject.cnpq.fl_str_mv METODOLOGIAS E TÉCNICAS DE COMPUTAÇÃO
description In Brazil, B3 is the stock exchange where various types of assets are traded, such as company shares, commodities, currencies, property funds, among others. The time series of stock market data represents a sequence of information, which can include the opening, closing, high and low prices of a stock, collected over time. Many economists, investors and researchers try to understand its behaviour in order to forecast financial actions, which is a challenge due to its non-linearity and complexity. This work aimed to analyse the applicability of machine learning and deep learning strategies in predicting the values of a set of the most traded shares on B3. These strategies involved MLP, SVM, Bagging, Random Forest, XGBoost models, recurrent neural networks with LSTM and GRU cells, CNN and hybrid networks combining convolutional and recurrent networks. Temporal data and other financial indices was collected from the specialised website investing.com over a period from 2013 to 2023, on a daily basis, and this data was used to build the image base for feeding the CNN, in the form of a block representation, a line graph and a candlestick graph. The study aimed to create a robust and effective machine learning model, from the perspective of univariate and multivariate analyses, and to compare it with consolidated methods in the literature applied to the same problem, analysing the MAE, RMSE metrics and Pearson’s correlation coefficient. The results showed that the MLP and Bagging models achieved the bests metrics for all the scenarios tested, obtaining RMSEs below 0.4 and 0.7, respectively, and emphasising the importance of calibrating their hyperparameters. The block approach for hybrid networks proved to be very promising, and although it didn’t achieve the best error metrics, its correlations were significantly high in general, which makes it possible to explore this context further. In addition, the applicability of structured data as inputs to a CNN aimed at predicting the value of stocks was demonstrated.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-05-08T01:01:11Z
dc.date.issued.fl_str_mv 2025-03-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Orssatto,Angelo José. Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro. 2025. 126 f. Dissertação( Mestrado em Ciência da Computação) - Universidade Estadual do Oeste do Paraná, Cascavel.
dc.identifier.uri.fl_str_mv https://tede.unioeste.br/handle/tede/7816
identifier_str_mv Orssatto,Angelo José. Aplicação de Estratégias Híbridas de Aprendizado Profundo na Estimação de Preços no Mercado de Ações Brasileiro. 2025. 126 f. Dissertação( Mestrado em Ciência da Computação) - Universidade Estadual do Oeste do Paraná, Cascavel.
url https://tede.unioeste.br/handle/tede/7816
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 600
600
dc.relation.department.fl_str_mv 2214374442868382015
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual do Oeste do Paraná
Cascavel
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UNIOESTE
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Centro de Ciências Exatas e Tecnológicas
publisher.none.fl_str_mv Universidade Estadual do Oeste do Paraná
Cascavel
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do UNIOESTE
instname:Universidade Estadual do Oeste do Paraná (UNIOESTE)
instacron:UNIOESTE
instname_str Universidade Estadual do Oeste do Paraná (UNIOESTE)
instacron_str UNIOESTE
institution UNIOESTE
reponame_str Biblioteca Digital de Teses e Dissertações do UNIOESTE
collection Biblioteca Digital de Teses e Dissertações do UNIOESTE
bitstream.url.fl_str_mv http://tede.unioeste.br:8080/tede/bitstream/tede/7816/2/Angelo+Jos%C3%A9+Orssatto.pdf
http://tede.unioeste.br:8080/tede/bitstream/tede/7816/1/license.txt
bitstream.checksum.fl_str_mv ef0f8f8afa9869d46ad255bd31fd74ad
bd3efa91386c1718a7f26a329fdcb468
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do UNIOESTE - Universidade Estadual do Oeste do Paraná (UNIOESTE)
repository.mail.fl_str_mv biblioteca.repositorio@unioeste.br
_version_ 1851949246579736576