Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Reis, Adriana Letícia dos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55137/tde-14032025-133533/
Resumo: A previsão da rotatividade de clientes B2B representa um desafio significativo para as empresas. Principalmente nos modelos de negócio que não são baseados em assinaturas. Fatores como, ausência de contratos formais de fidelização, menor quantidade de clientes em comparação ao B2C e tomada de decisão influenciada por variáveis difíceis de serem mensuradas, como orçamento disponível, custos e stakeholders, tornam a predição churn crucial para as organizações. Além disso, na literatura, a previsão de evasão de clientes B2B em negócios não contratuais permanece pouco explorada. Neste contexto, este trabalho visa contribuir para a literatura de duas formas. A primeira abordagem é por meio da aplicação prática de algoritmos de aprendizado de máquina supervisionado para classificar quais os clientes B2B apresentam maior probabilidade de deixar a empresa. Os modelos preditivos foram treinados e testados em um conjunto de dados reais de compras de clientes B2B de uma empresa do varejo de produtos químicos para o agronegócio. Para isso, foram aplicadas as técnicas de classificação Regressão Logística, Random Forests e XGBoost. A segunda abordagem e o objetivo principal deste estudo é analisar a estabilidade preditiva destes modelos ao longo de um ano (análise out of time) e não somente o momento em que os algoritmos foram treinados e testados. Além disso, foi assumido que neste período não haveria novos treinamentos dos modelos. A avaliação temporal foi realizada por meio das métricas Acurácia, Sensibilidade, Precisão, F1 Score e AUC-ROC. Os classificadores Random Forests e Regressão Logística foram os que apresentaram maior estabilidade nos quatro trimestres observados. Dessa análise foi aplicada a validação cruzada entre estes dois modelos com o objetivo de selecionar apenas um único classificador. Como última etapa do experimento, foi realizado o teste t, assim sendo possível avaliar qual o modelo manteve a capacidade preditiva ao longo do tempo - um ano.
id USP_f67d732402e45214edaa8f617c9e60f5
oai_identifier_str oai:teses.usp.br:tde-14032025-133533
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não ContratuaisAnalysis of the Stability of Machine Learning Techniques over an Out-Of-Time period after training in Churn Management in Non-Contractual BusinessesAnálise out-of-timeChurnChurnLogistic regressionRandom forestRandom forestsRegressão logísticaStability over an out-of-timeXGBoostXGBoostA previsão da rotatividade de clientes B2B representa um desafio significativo para as empresas. Principalmente nos modelos de negócio que não são baseados em assinaturas. Fatores como, ausência de contratos formais de fidelização, menor quantidade de clientes em comparação ao B2C e tomada de decisão influenciada por variáveis difíceis de serem mensuradas, como orçamento disponível, custos e stakeholders, tornam a predição churn crucial para as organizações. Além disso, na literatura, a previsão de evasão de clientes B2B em negócios não contratuais permanece pouco explorada. Neste contexto, este trabalho visa contribuir para a literatura de duas formas. A primeira abordagem é por meio da aplicação prática de algoritmos de aprendizado de máquina supervisionado para classificar quais os clientes B2B apresentam maior probabilidade de deixar a empresa. Os modelos preditivos foram treinados e testados em um conjunto de dados reais de compras de clientes B2B de uma empresa do varejo de produtos químicos para o agronegócio. Para isso, foram aplicadas as técnicas de classificação Regressão Logística, Random Forests e XGBoost. A segunda abordagem e o objetivo principal deste estudo é analisar a estabilidade preditiva destes modelos ao longo de um ano (análise out of time) e não somente o momento em que os algoritmos foram treinados e testados. Além disso, foi assumido que neste período não haveria novos treinamentos dos modelos. A avaliação temporal foi realizada por meio das métricas Acurácia, Sensibilidade, Precisão, F1 Score e AUC-ROC. Os classificadores Random Forests e Regressão Logística foram os que apresentaram maior estabilidade nos quatro trimestres observados. Dessa análise foi aplicada a validação cruzada entre estes dois modelos com o objetivo de selecionar apenas um único classificador. Como última etapa do experimento, foi realizado o teste t, assim sendo possível avaliar qual o modelo manteve a capacidade preditiva ao longo do tempo - um ano.The B2B customer churn forecasting presents a significant challenge for companies, particularly in non-subscription-based business models. Factors like the lack of formal loyalty agreements, a reduced customer base in comparison to B2C, and decision-making impacted by difficult-tomeasure variables such as budget, expenses, and stakeholders, play a critical role in the accurate forecasting of churn for organizations. Furthermore, in literature, predicting B2B customer attrition in non-contractual businesses remains underexplored. In this context, this study aims to contribute to the literature in two ways. The first approach involves practical application on classifier supervised machine learning algorithms to identify which B2B customers are most likely to leave the company. Predictive models were trained and tested on a real customer purchases B2B dataset from a retail company specializing in chemicals for agribusiness products. Classification techniques such as Logistic Regression, Random Forests, and XGBoost were employed. The second approach and the main objective of this study is to analyze the predictive stability of these models over a year (out-of-time analysis), beyond the initial training and testing period. Additionally, it was assumed that no retraining of the models occurred during this time period. Temporal evaluation was conducted using the Accuracy, Recall, Precision, F1 Score, and AUC-ROC metrics. Random Forests and Logistic Regression classifiers exhibited the highest stability over the four observed quarters. To select a unique model, cross-validation was applied. Finally, a t-test was conducted to assess indicating which model maintaining its predictive capability over time - a year.Biblioteca Digitais de Teses e Dissertações da USPRomero, Roseli Aparecida FrancelinReis, Adriana Letícia dos2024-12-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55137/tde-14032025-133533/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-03-18T15:36:02Zoai:teses.usp.br:tde-14032025-133533Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-03-18T15:36:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais
Analysis of the Stability of Machine Learning Techniques over an Out-Of-Time period after training in Churn Management in Non-Contractual Businesses
title Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais
spellingShingle Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais
Reis, Adriana Letícia dos
Análise out-of-time
Churn
Churn
Logistic regression
Random forest
Random forests
Regressão logística
Stability over an out-of-time
XGBoost
XGBoost
title_short Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais
title_full Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais
title_fullStr Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais
title_full_unstemmed Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais
title_sort Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais
author Reis, Adriana Letícia dos
author_facet Reis, Adriana Letícia dos
author_role author
dc.contributor.none.fl_str_mv Romero, Roseli Aparecida Francelin
dc.contributor.author.fl_str_mv Reis, Adriana Letícia dos
dc.subject.por.fl_str_mv Análise out-of-time
Churn
Churn
Logistic regression
Random forest
Random forests
Regressão logística
Stability over an out-of-time
XGBoost
XGBoost
topic Análise out-of-time
Churn
Churn
Logistic regression
Random forest
Random forests
Regressão logística
Stability over an out-of-time
XGBoost
XGBoost
description A previsão da rotatividade de clientes B2B representa um desafio significativo para as empresas. Principalmente nos modelos de negócio que não são baseados em assinaturas. Fatores como, ausência de contratos formais de fidelização, menor quantidade de clientes em comparação ao B2C e tomada de decisão influenciada por variáveis difíceis de serem mensuradas, como orçamento disponível, custos e stakeholders, tornam a predição churn crucial para as organizações. Além disso, na literatura, a previsão de evasão de clientes B2B em negócios não contratuais permanece pouco explorada. Neste contexto, este trabalho visa contribuir para a literatura de duas formas. A primeira abordagem é por meio da aplicação prática de algoritmos de aprendizado de máquina supervisionado para classificar quais os clientes B2B apresentam maior probabilidade de deixar a empresa. Os modelos preditivos foram treinados e testados em um conjunto de dados reais de compras de clientes B2B de uma empresa do varejo de produtos químicos para o agronegócio. Para isso, foram aplicadas as técnicas de classificação Regressão Logística, Random Forests e XGBoost. A segunda abordagem e o objetivo principal deste estudo é analisar a estabilidade preditiva destes modelos ao longo de um ano (análise out of time) e não somente o momento em que os algoritmos foram treinados e testados. Além disso, foi assumido que neste período não haveria novos treinamentos dos modelos. A avaliação temporal foi realizada por meio das métricas Acurácia, Sensibilidade, Precisão, F1 Score e AUC-ROC. Os classificadores Random Forests e Regressão Logística foram os que apresentaram maior estabilidade nos quatro trimestres observados. Dessa análise foi aplicada a validação cruzada entre estes dois modelos com o objetivo de selecionar apenas um único classificador. Como última etapa do experimento, foi realizado o teste t, assim sendo possível avaliar qual o modelo manteve a capacidade preditiva ao longo do tempo - um ano.
publishDate 2024
dc.date.none.fl_str_mv 2024-12-17
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55137/tde-14032025-133533/
url https://www.teses.usp.br/teses/disponiveis/55/55137/tde-14032025-133533/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1839839146048225280