Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/55/55137/tde-14032025-133533/ |
Resumo: | A previsão da rotatividade de clientes B2B representa um desafio significativo para as empresas. Principalmente nos modelos de negócio que não são baseados em assinaturas. Fatores como, ausência de contratos formais de fidelização, menor quantidade de clientes em comparação ao B2C e tomada de decisão influenciada por variáveis difíceis de serem mensuradas, como orçamento disponível, custos e stakeholders, tornam a predição churn crucial para as organizações. Além disso, na literatura, a previsão de evasão de clientes B2B em negócios não contratuais permanece pouco explorada. Neste contexto, este trabalho visa contribuir para a literatura de duas formas. A primeira abordagem é por meio da aplicação prática de algoritmos de aprendizado de máquina supervisionado para classificar quais os clientes B2B apresentam maior probabilidade de deixar a empresa. Os modelos preditivos foram treinados e testados em um conjunto de dados reais de compras de clientes B2B de uma empresa do varejo de produtos químicos para o agronegócio. Para isso, foram aplicadas as técnicas de classificação Regressão Logística, Random Forests e XGBoost. A segunda abordagem e o objetivo principal deste estudo é analisar a estabilidade preditiva destes modelos ao longo de um ano (análise out of time) e não somente o momento em que os algoritmos foram treinados e testados. Além disso, foi assumido que neste período não haveria novos treinamentos dos modelos. A avaliação temporal foi realizada por meio das métricas Acurácia, Sensibilidade, Precisão, F1 Score e AUC-ROC. Os classificadores Random Forests e Regressão Logística foram os que apresentaram maior estabilidade nos quatro trimestres observados. Dessa análise foi aplicada a validação cruzada entre estes dois modelos com o objetivo de selecionar apenas um único classificador. Como última etapa do experimento, foi realizado o teste t, assim sendo possível avaliar qual o modelo manteve a capacidade preditiva ao longo do tempo - um ano. |
| id |
USP_f67d732402e45214edaa8f617c9e60f5 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-14032025-133533 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não ContratuaisAnalysis of the Stability of Machine Learning Techniques over an Out-Of-Time period after training in Churn Management in Non-Contractual BusinessesAnálise out-of-timeChurnChurnLogistic regressionRandom forestRandom forestsRegressão logísticaStability over an out-of-timeXGBoostXGBoostA previsão da rotatividade de clientes B2B representa um desafio significativo para as empresas. Principalmente nos modelos de negócio que não são baseados em assinaturas. Fatores como, ausência de contratos formais de fidelização, menor quantidade de clientes em comparação ao B2C e tomada de decisão influenciada por variáveis difíceis de serem mensuradas, como orçamento disponível, custos e stakeholders, tornam a predição churn crucial para as organizações. Além disso, na literatura, a previsão de evasão de clientes B2B em negócios não contratuais permanece pouco explorada. Neste contexto, este trabalho visa contribuir para a literatura de duas formas. A primeira abordagem é por meio da aplicação prática de algoritmos de aprendizado de máquina supervisionado para classificar quais os clientes B2B apresentam maior probabilidade de deixar a empresa. Os modelos preditivos foram treinados e testados em um conjunto de dados reais de compras de clientes B2B de uma empresa do varejo de produtos químicos para o agronegócio. Para isso, foram aplicadas as técnicas de classificação Regressão Logística, Random Forests e XGBoost. A segunda abordagem e o objetivo principal deste estudo é analisar a estabilidade preditiva destes modelos ao longo de um ano (análise out of time) e não somente o momento em que os algoritmos foram treinados e testados. Além disso, foi assumido que neste período não haveria novos treinamentos dos modelos. A avaliação temporal foi realizada por meio das métricas Acurácia, Sensibilidade, Precisão, F1 Score e AUC-ROC. Os classificadores Random Forests e Regressão Logística foram os que apresentaram maior estabilidade nos quatro trimestres observados. Dessa análise foi aplicada a validação cruzada entre estes dois modelos com o objetivo de selecionar apenas um único classificador. Como última etapa do experimento, foi realizado o teste t, assim sendo possível avaliar qual o modelo manteve a capacidade preditiva ao longo do tempo - um ano.The B2B customer churn forecasting presents a significant challenge for companies, particularly in non-subscription-based business models. Factors like the lack of formal loyalty agreements, a reduced customer base in comparison to B2C, and decision-making impacted by difficult-tomeasure variables such as budget, expenses, and stakeholders, play a critical role in the accurate forecasting of churn for organizations. Furthermore, in literature, predicting B2B customer attrition in non-contractual businesses remains underexplored. In this context, this study aims to contribute to the literature in two ways. The first approach involves practical application on classifier supervised machine learning algorithms to identify which B2B customers are most likely to leave the company. Predictive models were trained and tested on a real customer purchases B2B dataset from a retail company specializing in chemicals for agribusiness products. Classification techniques such as Logistic Regression, Random Forests, and XGBoost were employed. The second approach and the main objective of this study is to analyze the predictive stability of these models over a year (out-of-time analysis), beyond the initial training and testing period. Additionally, it was assumed that no retraining of the models occurred during this time period. Temporal evaluation was conducted using the Accuracy, Recall, Precision, F1 Score, and AUC-ROC metrics. Random Forests and Logistic Regression classifiers exhibited the highest stability over the four observed quarters. To select a unique model, cross-validation was applied. Finally, a t-test was conducted to assess indicating which model maintaining its predictive capability over time - a year.Biblioteca Digitais de Teses e Dissertações da USPRomero, Roseli Aparecida FrancelinReis, Adriana Letícia dos2024-12-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55137/tde-14032025-133533/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-03-18T15:36:02Zoai:teses.usp.br:tde-14032025-133533Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-03-18T15:36:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais Analysis of the Stability of Machine Learning Techniques over an Out-Of-Time period after training in Churn Management in Non-Contractual Businesses |
| title |
Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais |
| spellingShingle |
Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais Reis, Adriana Letícia dos Análise out-of-time Churn Churn Logistic regression Random forest Random forests Regressão logística Stability over an out-of-time XGBoost XGBoost |
| title_short |
Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais |
| title_full |
Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais |
| title_fullStr |
Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais |
| title_full_unstemmed |
Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais |
| title_sort |
Análise ao Longo do Tempo da Estabilidade de Técnicas de Aprendizado de Máquina no Gerenciamento de Churn em Negócios Não Contratuais |
| author |
Reis, Adriana Letícia dos |
| author_facet |
Reis, Adriana Letícia dos |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Romero, Roseli Aparecida Francelin |
| dc.contributor.author.fl_str_mv |
Reis, Adriana Letícia dos |
| dc.subject.por.fl_str_mv |
Análise out-of-time Churn Churn Logistic regression Random forest Random forests Regressão logística Stability over an out-of-time XGBoost XGBoost |
| topic |
Análise out-of-time Churn Churn Logistic regression Random forest Random forests Regressão logística Stability over an out-of-time XGBoost XGBoost |
| description |
A previsão da rotatividade de clientes B2B representa um desafio significativo para as empresas. Principalmente nos modelos de negócio que não são baseados em assinaturas. Fatores como, ausência de contratos formais de fidelização, menor quantidade de clientes em comparação ao B2C e tomada de decisão influenciada por variáveis difíceis de serem mensuradas, como orçamento disponível, custos e stakeholders, tornam a predição churn crucial para as organizações. Além disso, na literatura, a previsão de evasão de clientes B2B em negócios não contratuais permanece pouco explorada. Neste contexto, este trabalho visa contribuir para a literatura de duas formas. A primeira abordagem é por meio da aplicação prática de algoritmos de aprendizado de máquina supervisionado para classificar quais os clientes B2B apresentam maior probabilidade de deixar a empresa. Os modelos preditivos foram treinados e testados em um conjunto de dados reais de compras de clientes B2B de uma empresa do varejo de produtos químicos para o agronegócio. Para isso, foram aplicadas as técnicas de classificação Regressão Logística, Random Forests e XGBoost. A segunda abordagem e o objetivo principal deste estudo é analisar a estabilidade preditiva destes modelos ao longo de um ano (análise out of time) e não somente o momento em que os algoritmos foram treinados e testados. Além disso, foi assumido que neste período não haveria novos treinamentos dos modelos. A avaliação temporal foi realizada por meio das métricas Acurácia, Sensibilidade, Precisão, F1 Score e AUC-ROC. Os classificadores Random Forests e Regressão Logística foram os que apresentaram maior estabilidade nos quatro trimestres observados. Dessa análise foi aplicada a validação cruzada entre estes dois modelos com o objetivo de selecionar apenas um único classificador. Como última etapa do experimento, foi realizado o teste t, assim sendo possível avaliar qual o modelo manteve a capacidade preditiva ao longo do tempo - um ano. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-12-17 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55137/tde-14032025-133533/ |
| url |
https://www.teses.usp.br/teses/disponiveis/55/55137/tde-14032025-133533/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1839839146048225280 |