Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Minas Gerais
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://hdl.handle.net/1843/30444 |
Resumo: | Throughout history several forecasting models have emerged with the objective of understanding the behavior of asset price series in the financial market. The advancement of computational power has facilitated the creation of new, increasingly complex models that arise for this purpose. However, even with the use of advanced machine learning techniques using a large volume of historical data, this task remains quite challenging, remaining an open problem. The objective of this work is to create automated strategies of operation in the market, based on a forecast model of trends in the prices of financial series, through machine learning. A recurrent neural network Long Short Term Memory is used as the predictive model. The paper also aims to demonstrate that several of the financial series have a temporal correlation, even if small, which allows the construction of forecasting models that are based on historical data. In order to demonstrate this correlation, the statistical properties of the series are analyzed and hypothesis tests are applied to them. The work presents a robust methodology from the data collection to the simulation of operation in the market involving the operating costs for 38 assets of the Brazilian stock exchange. The methodology further presents a method for creating a more correlated attribute with future values by means of a linear combination of the historical series in different time lags. The results obtained are promising since the best forecasting models obtained Accuracy values of up to 63% and financial return values of up to 47%. The best cases outperformed both in terms of prediction and in terms of financial return compared to baselines techniques as random classifier, Buy and Hold strategy, SELIC and CDI rates. |
| id |
UFMG_203f2c924e2760d971d6d63ea2fd4c5e |
|---|---|
| oai_identifier_str |
oai:repositorio.ufmg.br:1843/30444 |
| network_acronym_str |
UFMG |
| network_name_str |
Repositório Institucional da UFMG |
| repository_id_str |
|
| spelling |
2019-10-17T13:29:24Z2025-09-08T23:24:27Z2019-10-17T13:29:24Z2019-06-19https://hdl.handle.net/1843/30444Throughout history several forecasting models have emerged with the objective of understanding the behavior of asset price series in the financial market. The advancement of computational power has facilitated the creation of new, increasingly complex models that arise for this purpose. However, even with the use of advanced machine learning techniques using a large volume of historical data, this task remains quite challenging, remaining an open problem. The objective of this work is to create automated strategies of operation in the market, based on a forecast model of trends in the prices of financial series, through machine learning. A recurrent neural network Long Short Term Memory is used as the predictive model. The paper also aims to demonstrate that several of the financial series have a temporal correlation, even if small, which allows the construction of forecasting models that are based on historical data. In order to demonstrate this correlation, the statistical properties of the series are analyzed and hypothesis tests are applied to them. The work presents a robust methodology from the data collection to the simulation of operation in the market involving the operating costs for 38 assets of the Brazilian stock exchange. The methodology further presents a method for creating a more correlated attribute with future values by means of a linear combination of the historical series in different time lags. The results obtained are promising since the best forecasting models obtained Accuracy values of up to 63% and financial return values of up to 47%. The best cases outperformed both in terms of prediction and in terms of financial return compared to baselines techniques as random classifier, Buy and Hold strategy, SELIC and CDI rates.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Minas GeraisMercado de AçõesCiência de DadosSéries FinanceirasAnálise EstatísticaAprendizado de MáquinaRedes NeuraisCiência de dadosAprendizado do ComputadorBolsa de ValoresCiência de dados e aprendizado de máquina para predição em séries temporais financeirasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCaio Mário Henriques Silva da Rocha Mesquitainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGhttp://lattes.cnpq.br/9071526158656506Adriano César Machado Pereirahttp://lattes.cnpq.br/6813736989856243Arthur Rodrigo Bosco de MagalhãesCristiano Abrex VallePedro Olmo Stancioli Vaz de MeloAo longo da história surgiram diversos modelos de previsão com o objetivo de compreender o comportamento de séries de preços de ativos no mercado financeiro. O avanço do poder computacional tem facilitado a criação de novos modelos, cada vez mais complexos, que surgem com este propósito. Entretanto, mesmo com a utilização de técnicas avançadas de aprendizado de máquina utilizando um volume grande de dados históricos, tal tarefa continua sendo bastante desafiadora, permanecendo como um problema em aberto. O objetivo deste trabalho é criar estratégias automatizadas de operação no mercado, baseadas em um modelo de previsão de tendências nos preços das séries financeiras, por meio de aprendizado de máquina. É utilizada uma rede neural recorrente Long Short Term Memory como modelo de previsão. O trabalho também tem como objetivo demonstrar que várias das séries financeiras possuem uma correlação temporal, mesmo que pequena, o que viabiliza a construção de modelos de previsão que se baseiam em dados históricos. Para demonstrar essa correlação são analisadas as propriedades estatísticas das séries e aplicados testes de hipóteses nas mesmas. O trabalho apresenta uma metodologia robusta desde a coleta dos dados, até a simulação de operação no mercado envolvendo os custos de operação para 38 ativos da bolsa de valores brasileira. A metodologia ainda apresenta um método para criação de uma nova série mais correlacionada com valores futuros por meio de uma combinação linear das séries históricas em diferentes lags de tempo. Os resultados obtidos demonstram ser promissores, uma vez que os melhores modelos de predição obtiveram valores de Acurácia de até 63% e valores de retorno financeiro de até 47%. Os melhores casos obtiveram desempenhos superiores, tanto em termos de classificação quanto em termos de retorno financeiro comparados aos baselines de classificador aleatório, estratégia de Buy and Hold, taxas SELIC e CDI.BrasilICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃOPrograma de Pós-Graduação em Ciência da ComputaçãoUFMGORIGINALCaioMarioHenriquesSilvaRochaMesquita.pdfapplication/pdf4003857https://repositorio.ufmg.br//bitstreams/8696091b-8b54-418c-93c6-6df5315eb309/download078cfa10c593b942d940fe9b1556764cMD51trueAnonymousREADLICENSElicense.txttext/plain2119https://repositorio.ufmg.br//bitstreams/0cf1843c-542a-4b89-85bb-98fcbc59dae1/download34badce4be7e31e3adb4575ae96af679MD52falseAnonymousREADTEXTCaioMarioHenriquesSilvaRochaMesquita.pdf.txttext/plain229660https://repositorio.ufmg.br//bitstreams/1792cc57-ad7d-40c9-9d15-c6d6213f8850/downloadbcf9fc6d6a80b8c13ff8bf61b13ffae1MD53falseAnonymousREADTHUMBNAILCaioMarioHenriquesSilvaRochaMesquita.pdf.jpgCaioMarioHenriquesSilvaRochaMesquita.pdf.jpgGenerated Thumbnailimage/jpeg2449https://repositorio.ufmg.br//bitstreams/133fd529-1486-456a-96b4-2d62dd0cb391/download9cf55344de184e2c908296e362f80332MD54falseAnonymousREAD1843/304442025-09-09 15:18:56.423open.accessoai:repositorio.ufmg.br:1843/30444https://repositorio.ufmg.br/Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2025-09-09T18:18:56Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KCg== |
| dc.title.none.fl_str_mv |
Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras |
| title |
Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras |
| spellingShingle |
Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras Caio Mário Henriques Silva da Rocha Mesquita Ciência de dados Aprendizado do Computador Bolsa de Valores Mercado de Ações Ciência de Dados Séries Financeiras Análise Estatística Aprendizado de Máquina Redes Neurais |
| title_short |
Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras |
| title_full |
Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras |
| title_fullStr |
Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras |
| title_full_unstemmed |
Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras |
| title_sort |
Ciência de dados e aprendizado de máquina para predição em séries temporais financeiras |
| author |
Caio Mário Henriques Silva da Rocha Mesquita |
| author_facet |
Caio Mário Henriques Silva da Rocha Mesquita |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Caio Mário Henriques Silva da Rocha Mesquita |
| dc.subject.por.fl_str_mv |
Ciência de dados Aprendizado do Computador Bolsa de Valores |
| topic |
Ciência de dados Aprendizado do Computador Bolsa de Valores Mercado de Ações Ciência de Dados Séries Financeiras Análise Estatística Aprendizado de Máquina Redes Neurais |
| dc.subject.other.none.fl_str_mv |
Mercado de Ações Ciência de Dados Séries Financeiras Análise Estatística Aprendizado de Máquina Redes Neurais |
| description |
Throughout history several forecasting models have emerged with the objective of understanding the behavior of asset price series in the financial market. The advancement of computational power has facilitated the creation of new, increasingly complex models that arise for this purpose. However, even with the use of advanced machine learning techniques using a large volume of historical data, this task remains quite challenging, remaining an open problem. The objective of this work is to create automated strategies of operation in the market, based on a forecast model of trends in the prices of financial series, through machine learning. A recurrent neural network Long Short Term Memory is used as the predictive model. The paper also aims to demonstrate that several of the financial series have a temporal correlation, even if small, which allows the construction of forecasting models that are based on historical data. In order to demonstrate this correlation, the statistical properties of the series are analyzed and hypothesis tests are applied to them. The work presents a robust methodology from the data collection to the simulation of operation in the market involving the operating costs for 38 assets of the Brazilian stock exchange. The methodology further presents a method for creating a more correlated attribute with future values by means of a linear combination of the historical series in different time lags. The results obtained are promising since the best forecasting models obtained Accuracy values of up to 63% and financial return values of up to 47%. The best cases outperformed both in terms of prediction and in terms of financial return compared to baselines techniques as random classifier, Buy and Hold strategy, SELIC and CDI rates. |
| publishDate |
2019 |
| dc.date.accessioned.fl_str_mv |
2019-10-17T13:29:24Z 2025-09-08T23:24:27Z |
| dc.date.available.fl_str_mv |
2019-10-17T13:29:24Z |
| dc.date.issued.fl_str_mv |
2019-06-19 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1843/30444 |
| url |
https://hdl.handle.net/1843/30444 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
| publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
| instname_str |
Universidade Federal de Minas Gerais (UFMG) |
| instacron_str |
UFMG |
| institution |
UFMG |
| reponame_str |
Repositório Institucional da UFMG |
| collection |
Repositório Institucional da UFMG |
| bitstream.url.fl_str_mv |
https://repositorio.ufmg.br//bitstreams/8696091b-8b54-418c-93c6-6df5315eb309/download https://repositorio.ufmg.br//bitstreams/0cf1843c-542a-4b89-85bb-98fcbc59dae1/download https://repositorio.ufmg.br//bitstreams/1792cc57-ad7d-40c9-9d15-c6d6213f8850/download https://repositorio.ufmg.br//bitstreams/133fd529-1486-456a-96b4-2d62dd0cb391/download |
| bitstream.checksum.fl_str_mv |
078cfa10c593b942d940fe9b1556764c 34badce4be7e31e3adb4575ae96af679 bcf9fc6d6a80b8c13ff8bf61b13ffae1 9cf55344de184e2c908296e362f80332 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
| repository.mail.fl_str_mv |
repositorio@ufmg.br |
| _version_ |
1862105575547994112 |