[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: THAIS TUYANE DE AZEVEDO
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: MAXWELL
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=2
http://doi.org/10.17771/PUCRio.acad.35235
Resumo: [pt] O objetivo deste estudo foi explorar o problema de churn em seguros de vida, no sentido de prever se o cliente irá cancelar o produto nos próximos 6 meses. Atualmente, métodos de machine learning vêm se popularizando para este tipo de análise, tornando-se uma alternativa ao tradicional método de modelagem da probabilidade de cancelamento através da regressão logística. Em geral, um dos desafios encontrados neste tipo de modelagem é que a proporção de clientes que cancelam o serviço é relativamente pequena. Para isso, este estudo recorreu a técnicas de balanceamento para tratar a base naturalmente desbalanceada – técnicas de undersampling, oversampling e diferentes combinações destas duas foram utilizadas e comparadas entre si. As bases foram utilizadas para treinar modelos de Bagging, Random Forest e Boosting, e seus resultados foram comparados entre si e também aos resultados obtidos através do modelo de Regressão Logística. Observamos que a técnica SMOTE-modificado para balanceamento da base, aplicada ao modelo de Bagging, foi a combinação que apresentou melhores resultados dentre as combinações exploradas.
id PUC_RIO-1_7f68d3dd1fc3d9be848e531465a0e40a
oai_identifier_str oai:MAXWELL.puc-rio.br:35235
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str
spelling [en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE [pt] MÉTODOS DE MACHINE LEARNING APLICADOS À MODELAGEM PREDITIVA DE CANCELAMENTOS DE CLIENTES PARA SEGUROS DE VIDA [pt] APRENDIZADO DE MAQUINA[pt] SMOTE[pt] OVER SAMPLING[pt] UNDER SAMPLING[pt] DADO DESBALANCEADO[pt] RANDOM FOREST[pt] BAGGING[pt] PROPENSAO A CANCELAMENTO[pt] BOOSTING[pt] SEGURO DE VIDA[pt] ARVORE DE DECISAO[en] MACHINE LEARNING[en] SMOTE[en] OVER SAMPLING[en] UNDER SAMPLING[en] UNBALANCED DATA[en] RANDOM FOREST[en] BAGGING[en] CANCELLATION PROPENSITY[en] BOOSTING[en] LIFE INSURANCE[en] DECISION TREE[pt] O objetivo deste estudo foi explorar o problema de churn em seguros de vida, no sentido de prever se o cliente irá cancelar o produto nos próximos 6 meses. Atualmente, métodos de machine learning vêm se popularizando para este tipo de análise, tornando-se uma alternativa ao tradicional método de modelagem da probabilidade de cancelamento através da regressão logística. Em geral, um dos desafios encontrados neste tipo de modelagem é que a proporção de clientes que cancelam o serviço é relativamente pequena. Para isso, este estudo recorreu a técnicas de balanceamento para tratar a base naturalmente desbalanceada – técnicas de undersampling, oversampling e diferentes combinações destas duas foram utilizadas e comparadas entre si. As bases foram utilizadas para treinar modelos de Bagging, Random Forest e Boosting, e seus resultados foram comparados entre si e também aos resultados obtidos através do modelo de Regressão Logística. Observamos que a técnica SMOTE-modificado para balanceamento da base, aplicada ao modelo de Bagging, foi a combinação que apresentou melhores resultados dentre as combinações exploradas.[en] The purpose of this study is to explore the churn problem in life insurance, in the sense of predicting if the client will cancel the product in the next 6 months. Currently, machine learning methods are becoming popular in this type of analysis, turning it into an alternative to the traditional method of modeling the probability of cancellation through logistics regression. In general, one of the challenges found in this type of modelling is that the proportion of clients who cancelled the service is relatively small. For this, the study resorted to balancing techniques to treat the naturally unbalanced base – under-sampling and over-sampling techniques and different combinations of these two were used and compared among each other. The bases were used to train models of Bagging, Random Forest and Boosting, and its results were compared among each other and to the results obtained through the Logistics Regression model. We observed that the modified SMOTE technique to balance the base, applied to the Bagging model, was the combination that presented the best results among the explored combinations. MAXWELLDIOGO ABRY GUILLENDIOGO ABRY GUILLENDIOGO ABRY GUILLENDIOGO ABRY GUILLENDIOGO ABRY GUILLENDIOGO ABRY GUILLENDIOGO ABRY GUILLENTHAIS TUYANE DE AZEVEDO2018-09-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=2http://doi.org/10.17771/PUCRio.acad.35235porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2018-09-27T00:00:00Zoai:MAXWELL.puc-rio.br:35235Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342018-09-27T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.none.fl_str_mv [en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE
[pt] MÉTODOS DE MACHINE LEARNING APLICADOS À MODELAGEM PREDITIVA DE CANCELAMENTOS DE CLIENTES PARA SEGUROS DE VIDA
title [en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE
spellingShingle [en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE
THAIS TUYANE DE AZEVEDO
[pt] APRENDIZADO DE MAQUINA
[pt] SMOTE
[pt] OVER SAMPLING
[pt] UNDER SAMPLING
[pt] DADO DESBALANCEADO
[pt] RANDOM FOREST
[pt] BAGGING
[pt] PROPENSAO A CANCELAMENTO
[pt] BOOSTING
[pt] SEGURO DE VIDA
[pt] ARVORE DE DECISAO
[en] MACHINE LEARNING
[en] SMOTE
[en] OVER SAMPLING
[en] UNDER SAMPLING
[en] UNBALANCED DATA
[en] RANDOM FOREST
[en] BAGGING
[en] CANCELLATION PROPENSITY
[en] BOOSTING
[en] LIFE INSURANCE
[en] DECISION TREE
title_short [en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE
title_full [en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE
title_fullStr [en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE
title_full_unstemmed [en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE
title_sort [en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE
author THAIS TUYANE DE AZEVEDO
author_facet THAIS TUYANE DE AZEVEDO
author_role author
dc.contributor.none.fl_str_mv DIOGO ABRY GUILLEN
DIOGO ABRY GUILLEN
DIOGO ABRY GUILLEN
DIOGO ABRY GUILLEN
DIOGO ABRY GUILLEN
DIOGO ABRY GUILLEN
DIOGO ABRY GUILLEN
dc.contributor.author.fl_str_mv THAIS TUYANE DE AZEVEDO
dc.subject.por.fl_str_mv [pt] APRENDIZADO DE MAQUINA
[pt] SMOTE
[pt] OVER SAMPLING
[pt] UNDER SAMPLING
[pt] DADO DESBALANCEADO
[pt] RANDOM FOREST
[pt] BAGGING
[pt] PROPENSAO A CANCELAMENTO
[pt] BOOSTING
[pt] SEGURO DE VIDA
[pt] ARVORE DE DECISAO
[en] MACHINE LEARNING
[en] SMOTE
[en] OVER SAMPLING
[en] UNDER SAMPLING
[en] UNBALANCED DATA
[en] RANDOM FOREST
[en] BAGGING
[en] CANCELLATION PROPENSITY
[en] BOOSTING
[en] LIFE INSURANCE
[en] DECISION TREE
topic [pt] APRENDIZADO DE MAQUINA
[pt] SMOTE
[pt] OVER SAMPLING
[pt] UNDER SAMPLING
[pt] DADO DESBALANCEADO
[pt] RANDOM FOREST
[pt] BAGGING
[pt] PROPENSAO A CANCELAMENTO
[pt] BOOSTING
[pt] SEGURO DE VIDA
[pt] ARVORE DE DECISAO
[en] MACHINE LEARNING
[en] SMOTE
[en] OVER SAMPLING
[en] UNDER SAMPLING
[en] UNBALANCED DATA
[en] RANDOM FOREST
[en] BAGGING
[en] CANCELLATION PROPENSITY
[en] BOOSTING
[en] LIFE INSURANCE
[en] DECISION TREE
description [pt] O objetivo deste estudo foi explorar o problema de churn em seguros de vida, no sentido de prever se o cliente irá cancelar o produto nos próximos 6 meses. Atualmente, métodos de machine learning vêm se popularizando para este tipo de análise, tornando-se uma alternativa ao tradicional método de modelagem da probabilidade de cancelamento através da regressão logística. Em geral, um dos desafios encontrados neste tipo de modelagem é que a proporção de clientes que cancelam o serviço é relativamente pequena. Para isso, este estudo recorreu a técnicas de balanceamento para tratar a base naturalmente desbalanceada – técnicas de undersampling, oversampling e diferentes combinações destas duas foram utilizadas e comparadas entre si. As bases foram utilizadas para treinar modelos de Bagging, Random Forest e Boosting, e seus resultados foram comparados entre si e também aos resultados obtidos através do modelo de Regressão Logística. Observamos que a técnica SMOTE-modificado para balanceamento da base, aplicada ao modelo de Bagging, foi a combinação que apresentou melhores resultados dentre as combinações exploradas.
publishDate 2018
dc.date.none.fl_str_mv 2018-09-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=2
http://doi.org/10.17771/PUCRio.acad.35235
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=2
http://doi.org/10.17771/PUCRio.acad.35235
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv MAXWELL
publisher.none.fl_str_mv MAXWELL
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1856395936908967936