Aprendizado de Máquina aplicado à predição da produtividade da cultura da soja utilizando dados de clima e solo

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Guimarães, Edson da Silva
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55137/tde-09062020-123106/
Resumo: A previsão do rendimento das culturas durante o período de crescimento é útil para as práticas de planejamento e manejo agrícola, para companhias desenvolvedoras de sementes avaliar a performance de novas variedades, para a tomada de decisão dos produtores, para os serviços do governo que lidam com importação e exportação, para organizações internacionais responsáveis por monitorar a produção e o comércio mundial de alimentos, para os comerciantes de commodities, bem como para a elaboração de políticas alimentares. As abordagens comuns para a previsão de rendimento incluem o uso de pesquisas manuais caras ou dados de sensoriamento remoto. Técnicas de inteligência artificial e ciência de dados podem oferecer inúmeros benefícios tais como, permitir o desenvolvimento de modelos computacionais para tomada de decisões, ajudar a combater a escassez de alimentos e capacitar pequenos agricultores, gerenciamento de doenças e pragas nas culturas, investigação de nichos agrícolas, lidar com mudanças climáticas, dentre outros. Neste contexto onde envolve a comercialização, armazenamento e processamento de grãos, é comum deparar-se com cenários de incerteza, especialmente quando se deseja prever a produtividade da lavoura e avaliar riscos de perdas da produtividade. O objetivo deste trabalho consiste em desenvolver modelos de Machine Learning para realizar predições da produtividade da cultura da soja. Nesta análise foram avaliadas Redes Neurais Multilayer Perceptron, Random Forest e Extreme Gradient Boosting, posteriormente os modelos foram comparados entre si e com o modelo de estimativa de produtividade adotado pela FAO. Os dados referentes ao clima e características do solo foram adquiridos de estações meteorológicas no período entre 2010 e 2018 de 27 cidades, representando os três biomas do estado do Mato Grosso, enquanto que os dados da produtividade real foram coletados do sítio do IBGE. Os resultados foram avaliados através da métrica Mean Absolute Percentage Error (MAPE), que leva em consideração valores reais alimentados em modelos e valores ajustados a partir do modelo e calcula a diferença absoluta entre os dois como porcentagem do valor real, com base neste cálculo é possível obter a acurácia de cada modelo. O modelo baseado no Multilayer Perceptron apresentou acurácia de 95.20%, o modelo baseado em Random Forest apresentou acurácia de 95.03% e o modelo Extreme Gradient Boosting alcançou acurácia de 95.54% quando utilizados para fazer a predição do rendimento da soja para as 27 cidades no ano de 2018.
id USP_bb42551540d96d4a1bf312b3a9c2b92f
oai_identifier_str oai:teses.usp.br:tde-09062020-123106
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Aprendizado de Máquina aplicado à predição da produtividade da cultura da soja utilizando dados de clima e soloMachine Learning applied to soybean crop yield prediction using climate and soil dataBig dataBig dataCiências de dadosCrop yield predictionData scienceExtreme gradient boostingExtreme gradient boostingMultilayer perceptronMultiLayer perceptronNeural networkPrevisão da produtividadeRandom forestRandon forestRedes neuraisA previsão do rendimento das culturas durante o período de crescimento é útil para as práticas de planejamento e manejo agrícola, para companhias desenvolvedoras de sementes avaliar a performance de novas variedades, para a tomada de decisão dos produtores, para os serviços do governo que lidam com importação e exportação, para organizações internacionais responsáveis por monitorar a produção e o comércio mundial de alimentos, para os comerciantes de commodities, bem como para a elaboração de políticas alimentares. As abordagens comuns para a previsão de rendimento incluem o uso de pesquisas manuais caras ou dados de sensoriamento remoto. Técnicas de inteligência artificial e ciência de dados podem oferecer inúmeros benefícios tais como, permitir o desenvolvimento de modelos computacionais para tomada de decisões, ajudar a combater a escassez de alimentos e capacitar pequenos agricultores, gerenciamento de doenças e pragas nas culturas, investigação de nichos agrícolas, lidar com mudanças climáticas, dentre outros. Neste contexto onde envolve a comercialização, armazenamento e processamento de grãos, é comum deparar-se com cenários de incerteza, especialmente quando se deseja prever a produtividade da lavoura e avaliar riscos de perdas da produtividade. O objetivo deste trabalho consiste em desenvolver modelos de Machine Learning para realizar predições da produtividade da cultura da soja. Nesta análise foram avaliadas Redes Neurais Multilayer Perceptron, Random Forest e Extreme Gradient Boosting, posteriormente os modelos foram comparados entre si e com o modelo de estimativa de produtividade adotado pela FAO. Os dados referentes ao clima e características do solo foram adquiridos de estações meteorológicas no período entre 2010 e 2018 de 27 cidades, representando os três biomas do estado do Mato Grosso, enquanto que os dados da produtividade real foram coletados do sítio do IBGE. Os resultados foram avaliados através da métrica Mean Absolute Percentage Error (MAPE), que leva em consideração valores reais alimentados em modelos e valores ajustados a partir do modelo e calcula a diferença absoluta entre os dois como porcentagem do valor real, com base neste cálculo é possível obter a acurácia de cada modelo. O modelo baseado no Multilayer Perceptron apresentou acurácia de 95.20%, o modelo baseado em Random Forest apresentou acurácia de 95.03% e o modelo Extreme Gradient Boosting alcançou acurácia de 95.54% quando utilizados para fazer a predição do rendimento da soja para as 27 cidades no ano de 2018.Crop yield forecasting during the growing season is useful for agricultural planning and management practices, for seed companies to evaluate new variety performance, for farmers decisionmaking, for import and export government services, for international organizations responsible for monitoring world food production and trade, for commodity traders, and for food policymaking. Common approaches to yield prediction include the use of expensive manual surveys or accessible remote sensing data. Artificial intelligence and data science techniques can offer numerous benefits such as allowing the development of computational models for decision making, helping fight food scarcity and empower small farmers, managing crop diseases and pests, investigating agricultural niches, to cope With climate change, among others . In this context where it involves the marketing, storage and processing of grain, it is common to come across uncertainty scenarios, especially when one wants to predict crop yield and assess risks of yield losses. The objective of this work is to develop Machine Learning models based on Neural Networks and Decision Tree to make predictions of soybean crop yield. In this analysis were evaluated Multilayer Perceptron Neural Networks, Random Forest and Extreme Gradient Boosting, later the models were compared with each other and with the productivity estimate model adopted by FAO. climate and soil data were obtained from weather stations between 2010 and 2018 from 27 cities, representing the three biomes of the state of Mato Grosso, while real productivity data were collected from the IBGE site. The results were evaluated using the Mean Absolute Percentage Error (MAPE) metric, which takes into account real values fed into models and values adjusted from the model and calculates the absolute difference between the two as a percentage of the real value, based on which calculation is possible. get the accuracy of each model. The Multilayer Perceptron based model was 95.20% accurate, the Random Forest based model was 95.03% accurate, and the Extreme Gradient Boosting model was declared winer with 95.54% accurate when used to predict soybean yield for the 27 cities in the year 2018.Biblioteca Digitais de Teses e Dissertações da USPBoas, Paulino Ribeiro VillasGuimarães, Edson da Silva2020-02-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55137/tde-09062020-123106/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-06-09T18:38:02Zoai:teses.usp.br:tde-09062020-123106Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-06-09T18:38:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Aprendizado de Máquina aplicado à predição da produtividade da cultura da soja utilizando dados de clima e solo
Machine Learning applied to soybean crop yield prediction using climate and soil data
title Aprendizado de Máquina aplicado à predição da produtividade da cultura da soja utilizando dados de clima e solo
spellingShingle Aprendizado de Máquina aplicado à predição da produtividade da cultura da soja utilizando dados de clima e solo
Guimarães, Edson da Silva
Big data
Big data
Ciências de dados
Crop yield prediction
Data science
Extreme gradient boosting
Extreme gradient boosting
Multilayer perceptron
MultiLayer perceptron
Neural network
Previsão da produtividade
Random forest
Randon forest
Redes neurais
title_short Aprendizado de Máquina aplicado à predição da produtividade da cultura da soja utilizando dados de clima e solo
title_full Aprendizado de Máquina aplicado à predição da produtividade da cultura da soja utilizando dados de clima e solo
title_fullStr Aprendizado de Máquina aplicado à predição da produtividade da cultura da soja utilizando dados de clima e solo
title_full_unstemmed Aprendizado de Máquina aplicado à predição da produtividade da cultura da soja utilizando dados de clima e solo
title_sort Aprendizado de Máquina aplicado à predição da produtividade da cultura da soja utilizando dados de clima e solo
author Guimarães, Edson da Silva
author_facet Guimarães, Edson da Silva
author_role author
dc.contributor.none.fl_str_mv Boas, Paulino Ribeiro Villas
dc.contributor.author.fl_str_mv Guimarães, Edson da Silva
dc.subject.por.fl_str_mv Big data
Big data
Ciências de dados
Crop yield prediction
Data science
Extreme gradient boosting
Extreme gradient boosting
Multilayer perceptron
MultiLayer perceptron
Neural network
Previsão da produtividade
Random forest
Randon forest
Redes neurais
topic Big data
Big data
Ciências de dados
Crop yield prediction
Data science
Extreme gradient boosting
Extreme gradient boosting
Multilayer perceptron
MultiLayer perceptron
Neural network
Previsão da produtividade
Random forest
Randon forest
Redes neurais
description A previsão do rendimento das culturas durante o período de crescimento é útil para as práticas de planejamento e manejo agrícola, para companhias desenvolvedoras de sementes avaliar a performance de novas variedades, para a tomada de decisão dos produtores, para os serviços do governo que lidam com importação e exportação, para organizações internacionais responsáveis por monitorar a produção e o comércio mundial de alimentos, para os comerciantes de commodities, bem como para a elaboração de políticas alimentares. As abordagens comuns para a previsão de rendimento incluem o uso de pesquisas manuais caras ou dados de sensoriamento remoto. Técnicas de inteligência artificial e ciência de dados podem oferecer inúmeros benefícios tais como, permitir o desenvolvimento de modelos computacionais para tomada de decisões, ajudar a combater a escassez de alimentos e capacitar pequenos agricultores, gerenciamento de doenças e pragas nas culturas, investigação de nichos agrícolas, lidar com mudanças climáticas, dentre outros. Neste contexto onde envolve a comercialização, armazenamento e processamento de grãos, é comum deparar-se com cenários de incerteza, especialmente quando se deseja prever a produtividade da lavoura e avaliar riscos de perdas da produtividade. O objetivo deste trabalho consiste em desenvolver modelos de Machine Learning para realizar predições da produtividade da cultura da soja. Nesta análise foram avaliadas Redes Neurais Multilayer Perceptron, Random Forest e Extreme Gradient Boosting, posteriormente os modelos foram comparados entre si e com o modelo de estimativa de produtividade adotado pela FAO. Os dados referentes ao clima e características do solo foram adquiridos de estações meteorológicas no período entre 2010 e 2018 de 27 cidades, representando os três biomas do estado do Mato Grosso, enquanto que os dados da produtividade real foram coletados do sítio do IBGE. Os resultados foram avaliados através da métrica Mean Absolute Percentage Error (MAPE), que leva em consideração valores reais alimentados em modelos e valores ajustados a partir do modelo e calcula a diferença absoluta entre os dois como porcentagem do valor real, com base neste cálculo é possível obter a acurácia de cada modelo. O modelo baseado no Multilayer Perceptron apresentou acurácia de 95.20%, o modelo baseado em Random Forest apresentou acurácia de 95.03% e o modelo Extreme Gradient Boosting alcançou acurácia de 95.54% quando utilizados para fazer a predição do rendimento da soja para as 27 cidades no ano de 2018.
publishDate 2020
dc.date.none.fl_str_mv 2020-02-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55137/tde-09062020-123106/
url https://www.teses.usp.br/teses/disponiveis/55/55137/tde-09062020-123106/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815258004599078912