Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Mielke, Lucas Valle
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55137/tde-13052024-163432/
Resumo: O arroz é um cereal essencial consumido por cerca de 2,5 bilhões de pessoas no mundo, e o Brasil se destaca entre os dez maiores produtores. A produção brasileira é reconhecida por sua produtividade, tecnologia e fiscalização, se concentrando no Rio Grande do Sul que contribui com cerca de 70% da produção total. Assim como qualquer commodity agrícola, o preço do arroz está sujeito às leis de mercado, sendo afetado por diversos fatores, como condições climáticas e preços dos insumos, além da demanda, refletida pelo poder de compra da população. Essa oscilação dos preços pode ser prejudicial tanto para os consumidores quanto produtores, especialmente considerando o tempo de 5 meses entre o plantio e a colheita. Diante dessas questões, o objetivo principal deste trabalho é desenvolver modelos de aprendizagem de máquina capazes de prever o preço dessa commodity, considerando um horizonte de 5 meses e utilizando variáveis representativas da oferta e da demanda. Embora existam pesquisas que buscam prever o preço do arroz e de outras commodities agrícolas utilizando diferentes modelos de aprendizagem de máquina, não foram encontrados estudos abordando especificamente a previsão com a mesma antecedência deste trabalho, nem utilizando variáveis representativas da oferta e da demanda. Portanto, este projeto preenche essa lacuna. Para a realização desta pesquisa, foram adotados diversos modelos de aprendizagem de máquina que foram aplicados com e sem a técnica de Eliminação Recursiva de Variáveis (RFE), utilizando subconjuntos de dados de treinamento e teste com diferentes períodos. Além disso, dois procedimentos de ajuste na base de dados foram realizados para prever com 5 meses de antecedência: um por meio de defasagem direta e outro utilizando variáveis independentes simuladas, como explicado no capítulo de Materiais e Métodos. Os resultados revelaram que foi possível desenvolver tais modelos, os quais apresentaram uma média de erro de aproximadamente 17%, notando-se erro mais elevado em períodos específicos, especialmente na segunda metade de 2020. O modelo de melhor desempenho na previsão com 5 meses de antecedência foi o Extreme Gradient Boosting com a técnica RFE no procedimento de defasagem direta, alcançando um MAPE de 10%.
id USP_23ef18ff46f0f4bb2be9fb6c29992565
oai_identifier_str oai:teses.usp.br:tde-13052024-163432
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demandaRice Price Prediction in Brazil using Machine Learning Models and Supply and Demand DataAprendizagem de máquinaArrozCommodityCommodityMachine learningPrevisão da preçoPrice forecastRiceO arroz é um cereal essencial consumido por cerca de 2,5 bilhões de pessoas no mundo, e o Brasil se destaca entre os dez maiores produtores. A produção brasileira é reconhecida por sua produtividade, tecnologia e fiscalização, se concentrando no Rio Grande do Sul que contribui com cerca de 70% da produção total. Assim como qualquer commodity agrícola, o preço do arroz está sujeito às leis de mercado, sendo afetado por diversos fatores, como condições climáticas e preços dos insumos, além da demanda, refletida pelo poder de compra da população. Essa oscilação dos preços pode ser prejudicial tanto para os consumidores quanto produtores, especialmente considerando o tempo de 5 meses entre o plantio e a colheita. Diante dessas questões, o objetivo principal deste trabalho é desenvolver modelos de aprendizagem de máquina capazes de prever o preço dessa commodity, considerando um horizonte de 5 meses e utilizando variáveis representativas da oferta e da demanda. Embora existam pesquisas que buscam prever o preço do arroz e de outras commodities agrícolas utilizando diferentes modelos de aprendizagem de máquina, não foram encontrados estudos abordando especificamente a previsão com a mesma antecedência deste trabalho, nem utilizando variáveis representativas da oferta e da demanda. Portanto, este projeto preenche essa lacuna. Para a realização desta pesquisa, foram adotados diversos modelos de aprendizagem de máquina que foram aplicados com e sem a técnica de Eliminação Recursiva de Variáveis (RFE), utilizando subconjuntos de dados de treinamento e teste com diferentes períodos. Além disso, dois procedimentos de ajuste na base de dados foram realizados para prever com 5 meses de antecedência: um por meio de defasagem direta e outro utilizando variáveis independentes simuladas, como explicado no capítulo de Materiais e Métodos. Os resultados revelaram que foi possível desenvolver tais modelos, os quais apresentaram uma média de erro de aproximadamente 17%, notando-se erro mais elevado em períodos específicos, especialmente na segunda metade de 2020. O modelo de melhor desempenho na previsão com 5 meses de antecedência foi o Extreme Gradient Boosting com a técnica RFE no procedimento de defasagem direta, alcançando um MAPE de 10%.Rice is an essential cereal consumed by around 2.5 billion people worldwide, and Brazil stands out among the top ten producers. Brazilian production is recognized for its productivity, technology, and monitoring, mainly concentrated in Rio Grande do Sul, contributing to about 70% of the total production. Like any agricultural commodity, the price of rice is subject to market forces, influenced by various factors such as weather conditions, input prices, and demand, reflected by the populations purchasing power. Price fluctuations can be detrimental to both consumers and producers, especially considering the 5-month period between planting and harvesting. Given these concerns, the main objective of this work is to develop machine learning models capable of predicting the price of this commodity, considering a 5-month horizon and using variables representing supply and demand. While there is existing research aiming to predict the price of rice and other agricultural commodities using different machine learning models, no studies were found specifically addressing forecasting with the same lead time as this work, nor using variables representing supply and demand. Therefore, this project fills this gap. For this research, various machine learning models were adopted, applied both with and without the Recursive Feature Elimination (RFE) technique, using subsets of training and test data with different periods. Additionally, two data adjustment procedures were performed to forecast 5 months in advance: one through direct lagging and another using simulated independent variables, as explained in the Materials and Methods chapter. The results revealed that it was possible to develop such models, which had an average error of approximately 17%, with higher errors noted in specific periods, especially in the second half of 2020. The best-performing model in the 5-month-ahead prediction was the Extreme Gradient Boosting with RFE technique in the direct lagging procedure, achieving a MAPE of 10%.Biblioteca Digitais de Teses e Dissertações da USPBoas, Paulino Ribeiro VillasMielke, Lucas Valle2024-03-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55137/tde-13052024-163432/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-05-13T19:43:02Zoai:teses.usp.br:tde-13052024-163432Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-05-13T19:43:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda
Rice Price Prediction in Brazil using Machine Learning Models and Supply and Demand Data
title Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda
spellingShingle Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda
Mielke, Lucas Valle
Aprendizagem de máquina
Arroz
Commodity
Commodity
Machine learning
Previsão da preço
Price forecast
Rice
title_short Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda
title_full Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda
title_fullStr Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda
title_full_unstemmed Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda
title_sort Previsão do preço do arroz no Brasil usando modelos de aprendizado de máquina e dados de oferta e demanda
author Mielke, Lucas Valle
author_facet Mielke, Lucas Valle
author_role author
dc.contributor.none.fl_str_mv Boas, Paulino Ribeiro Villas
dc.contributor.author.fl_str_mv Mielke, Lucas Valle
dc.subject.por.fl_str_mv Aprendizagem de máquina
Arroz
Commodity
Commodity
Machine learning
Previsão da preço
Price forecast
Rice
topic Aprendizagem de máquina
Arroz
Commodity
Commodity
Machine learning
Previsão da preço
Price forecast
Rice
description O arroz é um cereal essencial consumido por cerca de 2,5 bilhões de pessoas no mundo, e o Brasil se destaca entre os dez maiores produtores. A produção brasileira é reconhecida por sua produtividade, tecnologia e fiscalização, se concentrando no Rio Grande do Sul que contribui com cerca de 70% da produção total. Assim como qualquer commodity agrícola, o preço do arroz está sujeito às leis de mercado, sendo afetado por diversos fatores, como condições climáticas e preços dos insumos, além da demanda, refletida pelo poder de compra da população. Essa oscilação dos preços pode ser prejudicial tanto para os consumidores quanto produtores, especialmente considerando o tempo de 5 meses entre o plantio e a colheita. Diante dessas questões, o objetivo principal deste trabalho é desenvolver modelos de aprendizagem de máquina capazes de prever o preço dessa commodity, considerando um horizonte de 5 meses e utilizando variáveis representativas da oferta e da demanda. Embora existam pesquisas que buscam prever o preço do arroz e de outras commodities agrícolas utilizando diferentes modelos de aprendizagem de máquina, não foram encontrados estudos abordando especificamente a previsão com a mesma antecedência deste trabalho, nem utilizando variáveis representativas da oferta e da demanda. Portanto, este projeto preenche essa lacuna. Para a realização desta pesquisa, foram adotados diversos modelos de aprendizagem de máquina que foram aplicados com e sem a técnica de Eliminação Recursiva de Variáveis (RFE), utilizando subconjuntos de dados de treinamento e teste com diferentes períodos. Além disso, dois procedimentos de ajuste na base de dados foram realizados para prever com 5 meses de antecedência: um por meio de defasagem direta e outro utilizando variáveis independentes simuladas, como explicado no capítulo de Materiais e Métodos. Os resultados revelaram que foi possível desenvolver tais modelos, os quais apresentaram uma média de erro de aproximadamente 17%, notando-se erro mais elevado em períodos específicos, especialmente na segunda metade de 2020. O modelo de melhor desempenho na previsão com 5 meses de antecedência foi o Extreme Gradient Boosting com a técnica RFE no procedimento de defasagem direta, alcançando um MAPE de 10%.
publishDate 2024
dc.date.none.fl_str_mv 2024-03-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55137/tde-13052024-163432/
url https://www.teses.usp.br/teses/disponiveis/55/55137/tde-13052024-163432/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492007948910592