[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE
| Ano de defesa: | 2018 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
MAXWELL
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=2 http://doi.org/10.17771/PUCRio.acad.35235 |
Resumo: | [pt] O objetivo deste estudo foi explorar o problema de churn em seguros de vida, no sentido de prever se o cliente irá cancelar o produto nos próximos 6 meses. Atualmente, métodos de machine learning vêm se popularizando para este tipo de análise, tornando-se uma alternativa ao tradicional método de modelagem da probabilidade de cancelamento através da regressão logística. Em geral, um dos desafios encontrados neste tipo de modelagem é que a proporção de clientes que cancelam o serviço é relativamente pequena. Para isso, este estudo recorreu a técnicas de balanceamento para tratar a base naturalmente desbalanceada – técnicas de undersampling, oversampling e diferentes combinações destas duas foram utilizadas e comparadas entre si. As bases foram utilizadas para treinar modelos de Bagging, Random Forest e Boosting, e seus resultados foram comparados entre si e também aos resultados obtidos através do modelo de Regressão Logística. Observamos que a técnica SMOTE-modificado para balanceamento da base, aplicada ao modelo de Bagging, foi a combinação que apresentou melhores resultados dentre as combinações exploradas. |
| id |
PUC_RIO-1_7f68d3dd1fc3d9be848e531465a0e40a |
|---|---|
| oai_identifier_str |
oai:MAXWELL.puc-rio.br:35235 |
| network_acronym_str |
PUC_RIO-1 |
| network_name_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| repository_id_str |
|
| spelling |
[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE [pt] MÉTODOS DE MACHINE LEARNING APLICADOS À MODELAGEM PREDITIVA DE CANCELAMENTOS DE CLIENTES PARA SEGUROS DE VIDA [pt] APRENDIZADO DE MAQUINA[pt] SMOTE[pt] OVER SAMPLING[pt] UNDER SAMPLING[pt] DADO DESBALANCEADO[pt] RANDOM FOREST[pt] BAGGING[pt] PROPENSAO A CANCELAMENTO[pt] BOOSTING[pt] SEGURO DE VIDA[pt] ARVORE DE DECISAO[en] MACHINE LEARNING[en] SMOTE[en] OVER SAMPLING[en] UNDER SAMPLING[en] UNBALANCED DATA[en] RANDOM FOREST[en] BAGGING[en] CANCELLATION PROPENSITY[en] BOOSTING[en] LIFE INSURANCE[en] DECISION TREE[pt] O objetivo deste estudo foi explorar o problema de churn em seguros de vida, no sentido de prever se o cliente irá cancelar o produto nos próximos 6 meses. Atualmente, métodos de machine learning vêm se popularizando para este tipo de análise, tornando-se uma alternativa ao tradicional método de modelagem da probabilidade de cancelamento através da regressão logística. Em geral, um dos desafios encontrados neste tipo de modelagem é que a proporção de clientes que cancelam o serviço é relativamente pequena. Para isso, este estudo recorreu a técnicas de balanceamento para tratar a base naturalmente desbalanceada – técnicas de undersampling, oversampling e diferentes combinações destas duas foram utilizadas e comparadas entre si. As bases foram utilizadas para treinar modelos de Bagging, Random Forest e Boosting, e seus resultados foram comparados entre si e também aos resultados obtidos através do modelo de Regressão Logística. Observamos que a técnica SMOTE-modificado para balanceamento da base, aplicada ao modelo de Bagging, foi a combinação que apresentou melhores resultados dentre as combinações exploradas.[en] The purpose of this study is to explore the churn problem in life insurance, in the sense of predicting if the client will cancel the product in the next 6 months. Currently, machine learning methods are becoming popular in this type of analysis, turning it into an alternative to the traditional method of modeling the probability of cancellation through logistics regression. In general, one of the challenges found in this type of modelling is that the proportion of clients who cancelled the service is relatively small. For this, the study resorted to balancing techniques to treat the naturally unbalanced base – under-sampling and over-sampling techniques and different combinations of these two were used and compared among each other. The bases were used to train models of Bagging, Random Forest and Boosting, and its results were compared among each other and to the results obtained through the Logistics Regression model. We observed that the modified SMOTE technique to balance the base, applied to the Bagging model, was the combination that presented the best results among the explored combinations. MAXWELLDIOGO ABRY GUILLENDIOGO ABRY GUILLENDIOGO ABRY GUILLENDIOGO ABRY GUILLENDIOGO ABRY GUILLENDIOGO ABRY GUILLENDIOGO ABRY GUILLENTHAIS TUYANE DE AZEVEDO2018-09-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=2http://doi.org/10.17771/PUCRio.acad.35235porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2018-09-27T00:00:00Zoai:MAXWELL.puc-rio.br:35235Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342018-09-27T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false |
| dc.title.none.fl_str_mv |
[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE [pt] MÉTODOS DE MACHINE LEARNING APLICADOS À MODELAGEM PREDITIVA DE CANCELAMENTOS DE CLIENTES PARA SEGUROS DE VIDA |
| title |
[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE |
| spellingShingle |
[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE THAIS TUYANE DE AZEVEDO [pt] APRENDIZADO DE MAQUINA [pt] SMOTE [pt] OVER SAMPLING [pt] UNDER SAMPLING [pt] DADO DESBALANCEADO [pt] RANDOM FOREST [pt] BAGGING [pt] PROPENSAO A CANCELAMENTO [pt] BOOSTING [pt] SEGURO DE VIDA [pt] ARVORE DE DECISAO [en] MACHINE LEARNING [en] SMOTE [en] OVER SAMPLING [en] UNDER SAMPLING [en] UNBALANCED DATA [en] RANDOM FOREST [en] BAGGING [en] CANCELLATION PROPENSITY [en] BOOSTING [en] LIFE INSURANCE [en] DECISION TREE |
| title_short |
[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE |
| title_full |
[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE |
| title_fullStr |
[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE |
| title_full_unstemmed |
[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE |
| title_sort |
[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE |
| author |
THAIS TUYANE DE AZEVEDO |
| author_facet |
THAIS TUYANE DE AZEVEDO |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
DIOGO ABRY GUILLEN DIOGO ABRY GUILLEN DIOGO ABRY GUILLEN DIOGO ABRY GUILLEN DIOGO ABRY GUILLEN DIOGO ABRY GUILLEN DIOGO ABRY GUILLEN |
| dc.contributor.author.fl_str_mv |
THAIS TUYANE DE AZEVEDO |
| dc.subject.por.fl_str_mv |
[pt] APRENDIZADO DE MAQUINA [pt] SMOTE [pt] OVER SAMPLING [pt] UNDER SAMPLING [pt] DADO DESBALANCEADO [pt] RANDOM FOREST [pt] BAGGING [pt] PROPENSAO A CANCELAMENTO [pt] BOOSTING [pt] SEGURO DE VIDA [pt] ARVORE DE DECISAO [en] MACHINE LEARNING [en] SMOTE [en] OVER SAMPLING [en] UNDER SAMPLING [en] UNBALANCED DATA [en] RANDOM FOREST [en] BAGGING [en] CANCELLATION PROPENSITY [en] BOOSTING [en] LIFE INSURANCE [en] DECISION TREE |
| topic |
[pt] APRENDIZADO DE MAQUINA [pt] SMOTE [pt] OVER SAMPLING [pt] UNDER SAMPLING [pt] DADO DESBALANCEADO [pt] RANDOM FOREST [pt] BAGGING [pt] PROPENSAO A CANCELAMENTO [pt] BOOSTING [pt] SEGURO DE VIDA [pt] ARVORE DE DECISAO [en] MACHINE LEARNING [en] SMOTE [en] OVER SAMPLING [en] UNDER SAMPLING [en] UNBALANCED DATA [en] RANDOM FOREST [en] BAGGING [en] CANCELLATION PROPENSITY [en] BOOSTING [en] LIFE INSURANCE [en] DECISION TREE |
| description |
[pt] O objetivo deste estudo foi explorar o problema de churn em seguros de vida, no sentido de prever se o cliente irá cancelar o produto nos próximos 6 meses. Atualmente, métodos de machine learning vêm se popularizando para este tipo de análise, tornando-se uma alternativa ao tradicional método de modelagem da probabilidade de cancelamento através da regressão logística. Em geral, um dos desafios encontrados neste tipo de modelagem é que a proporção de clientes que cancelam o serviço é relativamente pequena. Para isso, este estudo recorreu a técnicas de balanceamento para tratar a base naturalmente desbalanceada – técnicas de undersampling, oversampling e diferentes combinações destas duas foram utilizadas e comparadas entre si. As bases foram utilizadas para treinar modelos de Bagging, Random Forest e Boosting, e seus resultados foram comparados entre si e também aos resultados obtidos através do modelo de Regressão Logística. Observamos que a técnica SMOTE-modificado para balanceamento da base, aplicada ao modelo de Bagging, foi a combinação que apresentou melhores resultados dentre as combinações exploradas. |
| publishDate |
2018 |
| dc.date.none.fl_str_mv |
2018-09-26 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=2 http://doi.org/10.17771/PUCRio.acad.35235 |
| url |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235&idi=2 http://doi.org/10.17771/PUCRio.acad.35235 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
MAXWELL |
| publisher.none.fl_str_mv |
MAXWELL |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO |
| instname_str |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
| instacron_str |
PUC_RIO |
| institution |
PUC_RIO |
| reponame_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| collection |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| repository.name.fl_str_mv |
Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
| repository.mail.fl_str_mv |
|
| _version_ |
1856395936908967936 |