Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/55/55137/tde-13052024-163432/ |
Resumo: | O arroz é um cereal essencial consumido por cerca de 2,5 bilhões de pessoas no mundo, e o Brasil se destaca entre os dez maiores produtores. A produção brasileira é reconhecida por sua produtividade, tecnologia e fiscalização, se concentrando no Rio Grande do Sul que contribui com cerca de 70% da produção total. Assim como qualquer commodity agrícola, o preço do arroz está sujeito às leis de mercado, sendo afetado por diversos fatores, como condições climáticas e preços dos insumos, além da demanda, refletida pelo poder de compra da população. Essa oscilação dos preços pode ser prejudicial tanto para os consumidores quanto produtores, especialmente considerando o tempo de 5 meses entre o plantio e a colheita. Diante dessas questões, o objetivo principal deste trabalho é desenvolver modelos de aprendizagem de máquina capazes de prever o preço dessa commodity, considerando um horizonte de 5 meses e utilizando variáveis representativas da oferta e da demanda. Embora existam pesquisas que buscam prever o preço do arroz e de outras commodities agrícolas utilizando diferentes modelos de aprendizagem de máquina, não foram encontrados estudos abordando especificamente a previsão com a mesma antecedência deste trabalho, nem utilizando variáveis representativas da oferta e da demanda. Portanto, este projeto preenche essa lacuna. Para a realização desta pesquisa, foram adotados diversos modelos de aprendizagem de máquina que foram aplicados com e sem a técnica de Eliminação Recursiva de Variáveis (RFE), utilizando subconjuntos de dados de treinamento e teste com diferentes períodos. Além disso, dois procedimentos de ajuste na base de dados foram realizados para prever com 5 meses de antecedência: um por meio de defasagem direta e outro utilizando variáveis independentes simuladas, como explicado no capítulo de Materiais e Métodos. Os resultados revelaram que foi possível desenvolver tais modelos, os quais apresentaram uma média de erro de aproximadamente 17%, notando-se erro mais elevado em períodos específicos, especialmente na segunda metade de 2020. O modelo de melhor desempenho na previsão com 5 meses de antecedência foi o Extreme Gradient Boosting com a técnica RFE no procedimento de defasagem direta, alcançando um MAPE de 10%. |
| id |
USP_23ef18ff46f0f4bb2be9fb6c29992565 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-13052024-163432 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demandaRice Price Prediction in Brazil using Machine Learning Models and Supply and Demand DataAprendizagem de máquinaArrozCommodityCommodityMachine learningPrevisão da preçoPrice forecastRiceO arroz é um cereal essencial consumido por cerca de 2,5 bilhões de pessoas no mundo, e o Brasil se destaca entre os dez maiores produtores. A produção brasileira é reconhecida por sua produtividade, tecnologia e fiscalização, se concentrando no Rio Grande do Sul que contribui com cerca de 70% da produção total. Assim como qualquer commodity agrícola, o preço do arroz está sujeito às leis de mercado, sendo afetado por diversos fatores, como condições climáticas e preços dos insumos, além da demanda, refletida pelo poder de compra da população. Essa oscilação dos preços pode ser prejudicial tanto para os consumidores quanto produtores, especialmente considerando o tempo de 5 meses entre o plantio e a colheita. Diante dessas questões, o objetivo principal deste trabalho é desenvolver modelos de aprendizagem de máquina capazes de prever o preço dessa commodity, considerando um horizonte de 5 meses e utilizando variáveis representativas da oferta e da demanda. Embora existam pesquisas que buscam prever o preço do arroz e de outras commodities agrícolas utilizando diferentes modelos de aprendizagem de máquina, não foram encontrados estudos abordando especificamente a previsão com a mesma antecedência deste trabalho, nem utilizando variáveis representativas da oferta e da demanda. Portanto, este projeto preenche essa lacuna. Para a realização desta pesquisa, foram adotados diversos modelos de aprendizagem de máquina que foram aplicados com e sem a técnica de Eliminação Recursiva de Variáveis (RFE), utilizando subconjuntos de dados de treinamento e teste com diferentes períodos. Além disso, dois procedimentos de ajuste na base de dados foram realizados para prever com 5 meses de antecedência: um por meio de defasagem direta e outro utilizando variáveis independentes simuladas, como explicado no capítulo de Materiais e Métodos. Os resultados revelaram que foi possível desenvolver tais modelos, os quais apresentaram uma média de erro de aproximadamente 17%, notando-se erro mais elevado em períodos específicos, especialmente na segunda metade de 2020. O modelo de melhor desempenho na previsão com 5 meses de antecedência foi o Extreme Gradient Boosting com a técnica RFE no procedimento de defasagem direta, alcançando um MAPE de 10%.Rice is an essential cereal consumed by around 2.5 billion people worldwide, and Brazil stands out among the top ten producers. Brazilian production is recognized for its productivity, technology, and monitoring, mainly concentrated in Rio Grande do Sul, contributing to about 70% of the total production. Like any agricultural commodity, the price of rice is subject to market forces, influenced by various factors such as weather conditions, input prices, and demand, reflected by the populations purchasing power. Price fluctuations can be detrimental to both consumers and producers, especially considering the 5-month period between planting and harvesting. Given these concerns, the main objective of this work is to develop machine learning models capable of predicting the price of this commodity, considering a 5-month horizon and using variables representing supply and demand. While there is existing research aiming to predict the price of rice and other agricultural commodities using different machine learning models, no studies were found specifically addressing forecasting with the same lead time as this work, nor using variables representing supply and demand. Therefore, this project fills this gap. For this research, various machine learning models were adopted, applied both with and without the Recursive Feature Elimination (RFE) technique, using subsets of training and test data with different periods. Additionally, two data adjustment procedures were performed to forecast 5 months in advance: one through direct lagging and another using simulated independent variables, as explained in the Materials and Methods chapter. The results revealed that it was possible to develop such models, which had an average error of approximately 17%, with higher errors noted in specific periods, especially in the second half of 2020. The best-performing model in the 5-month-ahead prediction was the Extreme Gradient Boosting with RFE technique in the direct lagging procedure, achieving a MAPE of 10%.Biblioteca Digitais de Teses e Dissertações da USPBoas, Paulino Ribeiro VillasMielke, Lucas Valle2024-03-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55137/tde-13052024-163432/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-05-13T19:43:02Zoai:teses.usp.br:tde-13052024-163432Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-05-13T19:43:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda Rice Price Prediction in Brazil using Machine Learning Models and Supply and Demand Data |
| title |
Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda |
| spellingShingle |
Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda Mielke, Lucas Valle Aprendizagem de máquina Arroz Commodity Commodity Machine learning Previsão da preço Price forecast Rice |
| title_short |
Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda |
| title_full |
Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda |
| title_fullStr |
Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda |
| title_full_unstemmed |
Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda |
| title_sort |
Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda |
| author |
Mielke, Lucas Valle |
| author_facet |
Mielke, Lucas Valle |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Boas, Paulino Ribeiro Villas |
| dc.contributor.author.fl_str_mv |
Mielke, Lucas Valle |
| dc.subject.por.fl_str_mv |
Aprendizagem de máquina Arroz Commodity Commodity Machine learning Previsão da preço Price forecast Rice |
| topic |
Aprendizagem de máquina Arroz Commodity Commodity Machine learning Previsão da preço Price forecast Rice |
| description |
O arroz é um cereal essencial consumido por cerca de 2,5 bilhões de pessoas no mundo, e o Brasil se destaca entre os dez maiores produtores. A produção brasileira é reconhecida por sua produtividade, tecnologia e fiscalização, se concentrando no Rio Grande do Sul que contribui com cerca de 70% da produção total. Assim como qualquer commodity agrícola, o preço do arroz está sujeito às leis de mercado, sendo afetado por diversos fatores, como condições climáticas e preços dos insumos, além da demanda, refletida pelo poder de compra da população. Essa oscilação dos preços pode ser prejudicial tanto para os consumidores quanto produtores, especialmente considerando o tempo de 5 meses entre o plantio e a colheita. Diante dessas questões, o objetivo principal deste trabalho é desenvolver modelos de aprendizagem de máquina capazes de prever o preço dessa commodity, considerando um horizonte de 5 meses e utilizando variáveis representativas da oferta e da demanda. Embora existam pesquisas que buscam prever o preço do arroz e de outras commodities agrícolas utilizando diferentes modelos de aprendizagem de máquina, não foram encontrados estudos abordando especificamente a previsão com a mesma antecedência deste trabalho, nem utilizando variáveis representativas da oferta e da demanda. Portanto, este projeto preenche essa lacuna. Para a realização desta pesquisa, foram adotados diversos modelos de aprendizagem de máquina que foram aplicados com e sem a técnica de Eliminação Recursiva de Variáveis (RFE), utilizando subconjuntos de dados de treinamento e teste com diferentes períodos. Além disso, dois procedimentos de ajuste na base de dados foram realizados para prever com 5 meses de antecedência: um por meio de defasagem direta e outro utilizando variáveis independentes simuladas, como explicado no capítulo de Materiais e Métodos. Os resultados revelaram que foi possível desenvolver tais modelos, os quais apresentaram uma média de erro de aproximadamente 17%, notando-se erro mais elevado em períodos específicos, especialmente na segunda metade de 2020. O modelo de melhor desempenho na previsão com 5 meses de antecedência foi o Extreme Gradient Boosting com a técnica RFE no procedimento de defasagem direta, alcançando um MAPE de 10%. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-03-15 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55137/tde-13052024-163432/ |
| url |
https://www.teses.usp.br/teses/disponiveis/55/55137/tde-13052024-163432/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492007948910592 |