Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Santos, Gustavo Medeiros Ferreira dos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.unb.br/handle/10482/43307
Resumo: Dissertação (mestrado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Economia, Programa de Pós-Graduação em Ciências Econômicas, 2021.
id UNB_ee11b365c14d40c74a2a01bd7f6fbd70
oai_identifier_str oai:repositorio.unb.br:10482/43307
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced datasetFalência bancáriaDados desbalanceadosAprendizagem de máquinaModelos de classificaçãoDissertação (mestrado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Economia, Programa de Pós-Graduação em Ciências Econômicas, 2021.A previsão de falência bancária não é uma tarefa trivial. Não consiste apenas em escolher o melhor modelo, mas também a melhor forma de tratar o conjunto de dados altamente desequilibrado. Dados desequilibrados referem-se a um problema em que o número de observações pertencentes a uma classe é consideravelmente maior do que o das outras classes. É um desafio relativamente novo nos campos industrial e acadêmico porque muitas técnicas de aprendizado de máquina não têm um bom desempenho. Este trabalho tem como objetivo comparar os resultados de diferentes métodos de balanceamento, ou seja, Random UnderSampling, Random OverSampling e Synthetic Minority Oversampling Techniqueem um problema de classificação de bancos saudáveis e inadimplentes usando um painel de dados filtrado. O painel de dados consiste em vinte anos de instituições financeiras brasileiras e principais características econômicas que vão de 2000 a 2019. Com configurações de validação e classificação adequadas, são treinados modelos Logit com diferentes regularizações e modelos ensemble, como Random Forest e Gradient Boost em todas as três base de dados balanceados de forma diferente. A principal contribuição deste trabalho é a utilização de um filtro em dados em painel como primeiro passo para reduzir o problema de desequilíbrioConselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq).Bank failure prediction is not an easy task. It consists not just in chosing the best model but also the best way to treat the highly imbalanced dataset. Imbalanced data refers to a problem where the number of observations belonging to one class is considerably higher than the other classes. It is a relatively new challenge in both industrial and academic fields because many machine learning techniques do not have a good performance. This work aims to compare the results of different balancing methods namely Random UnderSampling, Random OverSampling and Synthetic Minority Oversampling Technique on a healthy and default banks classification problem using a filtered panel data. The panel data consists in twenty years of Brazilian financial institutions and major economic features ranging from 2000 to 2019. With a proper validation and classification settings it is trained Logit models with different regularizations and ensemble models such as Random Forest and Gradient Boost on all three different balanced datasets. The major contribution of this work uses a filter in panel data as first step to reduce imbalance problemFaculdade de Economia, Administração, Contabilidade e Gestão de Políticas Públicas (FACE)Departamento de Economia (FACE ECO)Programa de Pós-Graduação em EconomiaCajueiro, Daniel OliveiraSantos, Gustavo Medeiros Ferreira dos2022-04-04T18:55:38Z2022-04-04T18:55:38Z2022-03-042021-12-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSANTOS, Gustavo Medeiros Ferreira dos. Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset. 2021. 39 f., il. Dissertação (Mestrado em Economia) — Universidade de Brasília, Brasília, 2021.https://repositorio.unb.br/handle/10482/43307engA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2025-03-19T16:09:58Zoai:repositorio.unb.br:10482/43307Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2025-03-19T16:09:58Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset
title Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset
spellingShingle Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset
Santos, Gustavo Medeiros Ferreira dos
Falência bancária
Dados desbalanceados
Aprendizagem de máquina
Modelos de classificação
title_short Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset
title_full Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset
title_fullStr Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset
title_full_unstemmed Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset
title_sort Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset
author Santos, Gustavo Medeiros Ferreira dos
author_facet Santos, Gustavo Medeiros Ferreira dos
author_role author
dc.contributor.none.fl_str_mv Cajueiro, Daniel Oliveira
dc.contributor.author.fl_str_mv Santos, Gustavo Medeiros Ferreira dos
dc.subject.por.fl_str_mv Falência bancária
Dados desbalanceados
Aprendizagem de máquina
Modelos de classificação
topic Falência bancária
Dados desbalanceados
Aprendizagem de máquina
Modelos de classificação
description Dissertação (mestrado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Economia, Programa de Pós-Graduação em Ciências Econômicas, 2021.
publishDate 2021
dc.date.none.fl_str_mv 2021-12-17
2022-04-04T18:55:38Z
2022-04-04T18:55:38Z
2022-03-04
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SANTOS, Gustavo Medeiros Ferreira dos. Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset. 2021. 39 f., il. Dissertação (Mestrado em Economia) — Universidade de Brasília, Brasília, 2021.
https://repositorio.unb.br/handle/10482/43307
identifier_str_mv SANTOS, Gustavo Medeiros Ferreira dos. Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset. 2021. 39 f., il. Dissertação (Mestrado em Economia) — Universidade de Brasília, Brasília, 2021.
url https://repositorio.unb.br/handle/10482/43307
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1839083790308212736