Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Caio Mário Henriques Silva da Rocha Mesquita
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Minas Gerais
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1843/30444
Resumo: Throughout history several forecasting models have emerged with the objective of understanding the behavior of asset price series in the financial market. The advancement of computational power has facilitated the creation of new, increasingly complex models that arise for this purpose. However, even with the use of advanced machine learning techniques using a large volume of historical data, this task remains quite challenging, remaining an open problem. The objective of this work is to create automated strategies of operation in the market, based on a forecast model of trends in the prices of financial series, through machine learning. A recurrent neural network Long Short Term Memory is used as the predictive model. The paper also aims to demonstrate that several of the financial series have a temporal correlation, even if small, which allows the construction of forecasting models that are based on historical data. In order to demonstrate this correlation, the statistical properties of the series are analyzed and hypothesis tests are applied to them. The work presents a robust methodology from the data collection to the simulation of operation in the market involving the operating costs for 38 assets of the Brazilian stock exchange. The methodology further presents a method for creating a more correlated attribute with future values by means of a linear combination of the historical series in different time lags. The results obtained are promising since the best forecasting models obtained Accuracy values of up to 63% and financial return values of up to 47%. The best cases outperformed both in terms of prediction and in terms of financial return compared to baselines techniques as random classifier, Buy and Hold strategy, SELIC and CDI rates.
id UFMG_203f2c924e2760d971d6d63ea2fd4c5e
oai_identifier_str oai:repositorio.ufmg.br:1843/30444
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling 2019-10-17T13:29:24Z2025-09-08T23:24:27Z2019-10-17T13:29:24Z2019-06-19https://hdl.handle.net/1843/30444Throughout history several forecasting models have emerged with the objective of understanding the behavior of asset price series in the financial market. The advancement of computational power has facilitated the creation of new, increasingly complex models that arise for this purpose. However, even with the use of advanced machine learning techniques using a large volume of historical data, this task remains quite challenging, remaining an open problem. The objective of this work is to create automated strategies of operation in the market, based on a forecast model of trends in the prices of financial series, through machine learning. A recurrent neural network Long Short Term Memory is used as the predictive model. The paper also aims to demonstrate that several of the financial series have a temporal correlation, even if small, which allows the construction of forecasting models that are based on historical data. In order to demonstrate this correlation, the statistical properties of the series are analyzed and hypothesis tests are applied to them. The work presents a robust methodology from the data collection to the simulation of operation in the market involving the operating costs for 38 assets of the Brazilian stock exchange. The methodology further presents a method for creating a more correlated attribute with future values by means of a linear combination of the historical series in different time lags. The results obtained are promising since the best forecasting models obtained Accuracy values of up to 63% and financial return values of up to 47%. The best cases outperformed both in terms of prediction and in terms of financial return compared to baselines techniques as random classifier, Buy and Hold strategy, SELIC and CDI rates.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Minas GeraisMercado de AçõesCiência de DadosSéries FinanceirasAnálise EstatísticaAprendizado de MáquinaRedes NeuraisCiência de dadosAprendizado do ComputadorBolsa de ValoresCiência de dados e aprendizado de máquina para predição em séries temporais financeirasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCaio Mário Henriques Silva da Rocha Mesquitainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGhttp://lattes.cnpq.br/9071526158656506Adriano César Machado Pereirahttp://lattes.cnpq.br/6813736989856243Arthur Rodrigo Bosco de MagalhãesCristiano Abrex VallePedro Olmo Stancioli Vaz de MeloAo longo da história surgiram diversos modelos de previsão com o objetivo de compreender o comportamento de séries de preços de ativos no mercado financeiro. O avanço do poder computacional tem facilitado a criação de novos modelos, cada vez mais complexos, que surgem com este propósito. Entretanto, mesmo com a utilização de técnicas avançadas de aprendizado de máquina utilizando um volume grande de dados históricos, tal tarefa continua sendo bastante desafiadora, permanecendo como um problema em aberto. O objetivo deste trabalho é criar estratégias automatizadas de operação no mercado, baseadas em um modelo de previsão de tendências nos preços das séries financeiras, por meio de aprendizado de máquina. É utilizada uma rede neural recorrente Long Short Term Memory como modelo de previsão. O trabalho também tem como objetivo demonstrar que várias das séries financeiras possuem uma correlação temporal, mesmo que pequena, o que viabiliza a construção de modelos de previsão que se baseiam em dados históricos. Para demonstrar essa correlação são analisadas as propriedades estatísticas das séries e aplicados testes de hipóteses nas mesmas. O trabalho apresenta uma metodologia robusta desde a coleta dos dados, até a simulação de operação no mercado envolvendo os custos de operação para 38 ativos da bolsa de valores brasileira. A metodologia ainda apresenta um método para criação de uma nova série mais correlacionada com valores futuros por meio de uma combinação linear das séries históricas em diferentes lags de tempo. Os resultados obtidos demonstram ser promissores, uma vez que os melhores modelos de predição obtiveram valores de Acurácia de até 63% e valores de retorno financeiro de até 47%. Os melhores casos obtiveram desempenhos superiores, tanto em termos de classificação quanto em termos de retorno financeiro comparados aos baselines de classificador aleatório, estratégia de Buy and Hold, taxas SELIC e CDI.BrasilICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃOPrograma de Pós-Graduação em Ciência da ComputaçãoUFMGORIGINALCaioMarioHenriquesSilvaRochaMesquita.pdfapplication/pdf4003857https://repositorio.ufmg.br//bitstreams/8696091b-8b54-418c-93c6-6df5315eb309/download078cfa10c593b942d940fe9b1556764cMD51trueAnonymousREADLICENSElicense.txttext/plain2119https://repositorio.ufmg.br//bitstreams/0cf1843c-542a-4b89-85bb-98fcbc59dae1/download34badce4be7e31e3adb4575ae96af679MD52falseAnonymousREADTEXTCaioMarioHenriquesSilvaRochaMesquita.pdf.txttext/plain229660https://repositorio.ufmg.br//bitstreams/1792cc57-ad7d-40c9-9d15-c6d6213f8850/downloadbcf9fc6d6a80b8c13ff8bf61b13ffae1MD53falseAnonymousREADTHUMBNAILCaioMarioHenriquesSilvaRochaMesquita.pdf.jpgCaioMarioHenriquesSilvaRochaMesquita.pdf.jpgGenerated Thumbnailimage/jpeg2449https://repositorio.ufmg.br//bitstreams/133fd529-1486-456a-96b4-2d62dd0cb391/download9cf55344de184e2c908296e362f80332MD54falseAnonymousREAD1843/304442025-09-09 15:18:56.423open.accessoai:repositorio.ufmg.br:1843/30444https://repositorio.ufmg.br/Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2025-09-09T18:18:56Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KCg==
dc.title.none.fl_str_mv Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras
title Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras
spellingShingle Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras
Caio Mário Henriques Silva da Rocha Mesquita
Ciência de dados
Aprendizado do Computador
Bolsa de Valores
Mercado de Ações
Ciência de Dados
Séries Financeiras
Análise Estatística
Aprendizado de Máquina
Redes Neurais
title_short Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras
title_full Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras
title_fullStr Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras
title_full_unstemmed Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras
title_sort Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras
author Caio Mário Henriques Silva da Rocha Mesquita
author_facet Caio Mário Henriques Silva da Rocha Mesquita
author_role author
dc.contributor.author.fl_str_mv Caio Mário Henriques Silva da Rocha Mesquita
dc.subject.por.fl_str_mv Ciência de dados
Aprendizado do Computador
Bolsa de Valores
topic Ciência de dados
Aprendizado do Computador
Bolsa de Valores
Mercado de Ações
Ciência de Dados
Séries Financeiras
Análise Estatística
Aprendizado de Máquina
Redes Neurais
dc.subject.other.none.fl_str_mv Mercado de Ações
Ciência de Dados
Séries Financeiras
Análise Estatística
Aprendizado de Máquina
Redes Neurais
description Throughout history several forecasting models have emerged with the objective of understanding the behavior of asset price series in the financial market. The advancement of computational power has facilitated the creation of new, increasingly complex models that arise for this purpose. However, even with the use of advanced machine learning techniques using a large volume of historical data, this task remains quite challenging, remaining an open problem. The objective of this work is to create automated strategies of operation in the market, based on a forecast model of trends in the prices of financial series, through machine learning. A recurrent neural network Long Short Term Memory is used as the predictive model. The paper also aims to demonstrate that several of the financial series have a temporal correlation, even if small, which allows the construction of forecasting models that are based on historical data. In order to demonstrate this correlation, the statistical properties of the series are analyzed and hypothesis tests are applied to them. The work presents a robust methodology from the data collection to the simulation of operation in the market involving the operating costs for 38 assets of the Brazilian stock exchange. The methodology further presents a method for creating a more correlated attribute with future values by means of a linear combination of the historical series in different time lags. The results obtained are promising since the best forecasting models obtained Accuracy values of up to 63% and financial return values of up to 47%. The best cases outperformed both in terms of prediction and in terms of financial return compared to baselines techniques as random classifier, Buy and Hold strategy, SELIC and CDI rates.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-10-17T13:29:24Z
2025-09-08T23:24:27Z
dc.date.available.fl_str_mv 2019-10-17T13:29:24Z
dc.date.issued.fl_str_mv 2019-06-19
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1843/30444
url https://hdl.handle.net/1843/30444
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br//bitstreams/8696091b-8b54-418c-93c6-6df5315eb309/download
https://repositorio.ufmg.br//bitstreams/0cf1843c-542a-4b89-85bb-98fcbc59dae1/download
https://repositorio.ufmg.br//bitstreams/1792cc57-ad7d-40c9-9d15-c6d6213f8850/download
https://repositorio.ufmg.br//bitstreams/133fd529-1486-456a-96b4-2d62dd0cb391/download
bitstream.checksum.fl_str_mv 078cfa10c593b942d940fe9b1556764c
34badce4be7e31e3adb4575ae96af679
bcf9fc6d6a80b8c13ff8bf61b13ffae1
9cf55344de184e2c908296e362f80332
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv repositorio@ufmg.br
_version_ 1862105575547994112