Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Pereira, Felipe Gonçalves
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.unb.br/handle/10482/50957
Resumo: Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2024.
id UNB_0bdc2feed5750542b8c1cf0b19a784db
oai_identifier_str oai:repositorio.unb.br:10482/50957
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretationPrevisão de inflação no Brasil com métodos de aprendizado de máquina : integrando método de encolhimento para seleção de variáveis com interpretação por meio do valor de ShapleyInflação - previsãoInflaçãoAprendizagem de máquinaSeleção de variáveisInteligência Artificial Explicável (XAI)Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2024.Esta dissertação busca identificar o modelo de apredizagem de máquina (ML) não linear mais eficaz na previsão do Índice de Preços ao Consumidor (IPCA) mensal usando um método de seleção prévio de variáveis baseado em modelo de encolhimento para escolher os preditores mais significantes. Além disso, o estudo visou analisar os resultados da previsão usando um método de inteligência artificial explicável (XAI) indepedente de modelo chamado Shapely Value, que pode fornecer informações sobre as previsões do modelo de ML não linear. Foi utilizado um conjunto de dados abrangendo o período de agosto de 2010 a janeiro de 2024, com 156 preditores. A partir dessa base de dados, foi realizada a seleção dos preditores mais significativos através de um loop que aplica a eliminação recursiva de variáveis (Recursive Feature Elimination - RFE) utilizando o modelo ElasticNet em cada mês do período de treinamento. Ao todo, foram realizadas 156 execuções do algoritmo de RFE, isolando os 30 preditores mais frequentes, aplicados aos modelos não lineares de ML. Os resultados das previsões evidenciaram o Gradient Boosting como o modelo mais eficaz, apresentando os melhores indicadores de acurácia e significância no teste de hipótese. A incorporação do Shapley Value aprimorou significativamente a interpretabilidade do modelo vencedor, oferencendo insights sobre as contribuições individuais de variáveis e mitigando a natureza de "caixa preta" dos modelos de ML. Os resultados evidenciaram a importância dos proxies para a variável-alvo nas previsões com contribuições significativas quando comparados com outros indicadores econômicos utilizados.This dissertation seeks to identify the most effective non-linear machine learning (ML) model for forecasting the monthly Brazilian Consumer Price Index (IPCA). It employs a prior feature selection (variable selection) method based on a shrinkage model to choose the most significant predictors. Additionally, the study aims to analyze prediction results using a model-agnostic explainable artificial intelligence (XAI) method called Shapley Value, which provides insights into non-linear model predictions. A dataset covering the period from August 2010 to January 2024 was utilized, containing 156 predictors. From this database, the most significant predictors were selected through a recursive feature elimination (RFE) process using the ElasticNet model for each month of the training period. In total, 156 executions of the RFE algorithm were performed, isolating the 30 most frequent predictors to be applied to non-linear ML models. The prediction results indicated that Gradient Boosting was the most effective model, demonstrating the best accuracy and significance indicators in hypothesis testing. The incorporation of Shapley Value significantly enhanced the interpretability of the winning model, providing insights into the contributions of individual variables and mitigating the “black box” nature of ML models. The results highlighted the importance of proxies for the target variable in predictions, with significant contributions compared to other economic indicators used.Instituto de Ciências Exatas (IE)Departamento de Ciência da Computação (IE CIC)Programa de Pós-Graduação em Computação Aplicada, Mestrado ProfissionalSouza, João Gabriel de MoraesPereira, Felipe Gonçalves2024-11-19T16:12:53Z2024-11-19T16:12:53Z2024-11-182024-05-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPEREIRA, Felipe Gonçalves. Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation. 2024. 109 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2024.http://repositorio.unb.br/handle/10482/50957A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-11-19T16:12:53Zoai:repositorio.unb.br:10482/50957Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-11-19T16:12:53Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation
Previsão de inflação no Brasil com métodos de aprendizado de máquina : integrando método de encolhimento para seleção de variáveis com interpretação por meio do valor de Shapley
title Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation
spellingShingle Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation
Pereira, Felipe Gonçalves
Inflação - previsão
Inflação
Aprendizagem de máquina
Seleção de variáveis
Inteligência Artificial Explicável (XAI)
title_short Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation
title_full Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation
title_fullStr Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation
title_full_unstemmed Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation
title_sort Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation
author Pereira, Felipe Gonçalves
author_facet Pereira, Felipe Gonçalves
author_role author
dc.contributor.none.fl_str_mv Souza, João Gabriel de Moraes
dc.contributor.author.fl_str_mv Pereira, Felipe Gonçalves
dc.subject.por.fl_str_mv Inflação - previsão
Inflação
Aprendizagem de máquina
Seleção de variáveis
Inteligência Artificial Explicável (XAI)
topic Inflação - previsão
Inflação
Aprendizagem de máquina
Seleção de variáveis
Inteligência Artificial Explicável (XAI)
description Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2024.
publishDate 2024
dc.date.none.fl_str_mv 2024-11-19T16:12:53Z
2024-11-19T16:12:53Z
2024-11-18
2024-05-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PEREIRA, Felipe Gonçalves. Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation. 2024. 109 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2024.
http://repositorio.unb.br/handle/10482/50957
identifier_str_mv PEREIRA, Felipe Gonçalves. Forecasting inflation in Brazil with machine learning methods : integrating shrinkage method for variable selection with Shapley value interpretation. 2024. 109 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2024.
url http://repositorio.unb.br/handle/10482/50957
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1839083959615488000