Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://tede2.pucrs.br/tede2/handle/tede/11662 |
Resumo: | The increasing sophistication of money laundering activities demands approaches that unite effective anomaly detection with interpretability. To address this challenge, we propose a dual-stage architecture integrating a Self-Adversarial Variational Autoencoder with transformer blocks for unsupervised anomaly detection, paired with an Explainable Boosting Machine for supervised classification. This approach addresses fundamental limitations in financial fraud detection, such as the scarcity of labeled data and extreme class imbalance. In evaluations on proprietary financial transaction data, the framework achieved a Receiver Operating Characteristic Area Under the Curve of 0.9508 and a Precision-Recall Area Under the Curve of 0.5417. When applied to the public credit card fraud dataset, the model attained a ROC AUC of 0.964, outperforming established methods in the literature such as Deep Autoencoder (0.882) and Autoencoder with Clustering (0.961), despite not using labeled data during training. The Explainable Boosting Machine component enabled clear identification of factors driving risk classifications, while the Self-Adversarial Variational Autoencoder component proved effective in detecting anomalous patterns across different financial contexts. The results demonstrate the potential of this integrated solution, which combines advanced detection capabilities with the transparency necessary for practical applications in the financial sector |
| id |
P_RS_18175ca5ccf80154a3a0c7fcb6cc8bd7 |
|---|---|
| oai_identifier_str |
oai:tede2.pucrs.br:tede/11662 |
| network_acronym_str |
P_RS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| repository_id_str |
|
| spelling |
Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detectionAprendizado profundo não supervisionado para modelagem supervisionada interpretável : uma abordagem em duas fases para detecção de anomalias financeirasFinancial Anomaly DetectionSelf-Adversarial Variational AutoencodersExplainable Boosting MachinesDeep LearningInterpretable AIDetecção de Anomalias FinanceirasAutoencoders Variacionais Auto- AdversariaisMáquinas de Impulso ExplicáveisInteligência Artificial ExplicávelAprendizado Profundo.CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOThe increasing sophistication of money laundering activities demands approaches that unite effective anomaly detection with interpretability. To address this challenge, we propose a dual-stage architecture integrating a Self-Adversarial Variational Autoencoder with transformer blocks for unsupervised anomaly detection, paired with an Explainable Boosting Machine for supervised classification. This approach addresses fundamental limitations in financial fraud detection, such as the scarcity of labeled data and extreme class imbalance. In evaluations on proprietary financial transaction data, the framework achieved a Receiver Operating Characteristic Area Under the Curve of 0.9508 and a Precision-Recall Area Under the Curve of 0.5417. When applied to the public credit card fraud dataset, the model attained a ROC AUC of 0.964, outperforming established methods in the literature such as Deep Autoencoder (0.882) and Autoencoder with Clustering (0.961), despite not using labeled data during training. The Explainable Boosting Machine component enabled clear identification of factors driving risk classifications, while the Self-Adversarial Variational Autoencoder component proved effective in detecting anomalous patterns across different financial contexts. The results demonstrate the potential of this integrated solution, which combines advanced detection capabilities with the transparency necessary for practical applications in the financial sectorA sofisticação crescente das atividades de lavagem de dinheiro demanda abordagens que aliem detecção eficaz de anomalias com interpretabilidade. Para enfrentar este desafio, propusemos uma arquitetura dual integrando um Autoencoder Variacional Auto- Adversarial com blocos transformadores para detecção não supervisionada de anomalias, associado a uma Máquina de Explainable Boosting para classificação supervisionada. Essa abordagem endereça limitações fundamentais na detecção de fraudes financeiras, como a escassez de dados rotulados e o desequilíbrio extremo de classes. Em avaliações realizadas com dados proprietários de transações financeiras, o framework alcançou uma Área Sob a Curva ROC de 0,9508 e uma Área Sob a Curva Precisão-Revocação de 0,5417. Quando aplicado ao conjunto de dados público de fraude em cartões de crédito, o modelo obteve uma Área Sob a Curva ROC de 0,964, superando métodos estabelecidos na literatura como Deep Autoencoder (0,882) e Autoencoder com Clustering (0,961), mesmo sem utilizar dados rotulados durante o treinamento. O componente Máquina de Explainable Boosting viabilizou a identificação clara dos fatores determinantes nas classificações de risco, enquanto o Autoencoder Variacional Auto-Adversarial demonstrou eficácia na detecção de padrões anômalos em diferentes contextos financeiros. Os resultados evidenciam o potencial desta solução integrada, que alia capacidade avançada de detecção à transparência necessária para aplicações práticas no setor financeiro.Pontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoRuiz, Duncan Dubugras Alcobahttp://lattes.cnpq.br/8250832800932125Freire, Marcos Brum2025-06-03T18:31:29Z2024-12-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://tede2.pucrs.br/tede2/handle/tede/11662enginfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2025-06-03T23:00:28Zoai:tede2.pucrs.br:tede/11662Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2025-06-03T23:00:28Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
| dc.title.none.fl_str_mv |
Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection Aprendizado profundo não supervisionado para modelagem supervisionada interpretável : uma abordagem em duas fases para detecção de anomalias financeiras |
| title |
Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection |
| spellingShingle |
Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection Freire, Marcos Brum Financial Anomaly Detection Self-Adversarial Variational Autoencoders Explainable Boosting Machines Deep Learning Interpretable AI Detecção de Anomalias Financeiras Autoencoders Variacionais Auto- Adversariais Máquinas de Impulso Explicáveis Inteligência Artificial Explicável Aprendizado Profundo. CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| title_short |
Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection |
| title_full |
Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection |
| title_fullStr |
Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection |
| title_full_unstemmed |
Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection |
| title_sort |
Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection |
| author |
Freire, Marcos Brum |
| author_facet |
Freire, Marcos Brum |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Ruiz, Duncan Dubugras Alcoba http://lattes.cnpq.br/8250832800932125 |
| dc.contributor.author.fl_str_mv |
Freire, Marcos Brum |
| dc.subject.por.fl_str_mv |
Financial Anomaly Detection Self-Adversarial Variational Autoencoders Explainable Boosting Machines Deep Learning Interpretable AI Detecção de Anomalias Financeiras Autoencoders Variacionais Auto- Adversariais Máquinas de Impulso Explicáveis Inteligência Artificial Explicável Aprendizado Profundo. CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| topic |
Financial Anomaly Detection Self-Adversarial Variational Autoencoders Explainable Boosting Machines Deep Learning Interpretable AI Detecção de Anomalias Financeiras Autoencoders Variacionais Auto- Adversariais Máquinas de Impulso Explicáveis Inteligência Artificial Explicável Aprendizado Profundo. CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| description |
The increasing sophistication of money laundering activities demands approaches that unite effective anomaly detection with interpretability. To address this challenge, we propose a dual-stage architecture integrating a Self-Adversarial Variational Autoencoder with transformer blocks for unsupervised anomaly detection, paired with an Explainable Boosting Machine for supervised classification. This approach addresses fundamental limitations in financial fraud detection, such as the scarcity of labeled data and extreme class imbalance. In evaluations on proprietary financial transaction data, the framework achieved a Receiver Operating Characteristic Area Under the Curve of 0.9508 and a Precision-Recall Area Under the Curve of 0.5417. When applied to the public credit card fraud dataset, the model attained a ROC AUC of 0.964, outperforming established methods in the literature such as Deep Autoencoder (0.882) and Autoencoder with Clustering (0.961), despite not using labeled data during training. The Explainable Boosting Machine component enabled clear identification of factors driving risk classifications, while the Self-Adversarial Variational Autoencoder component proved effective in detecting anomalous patterns across different financial contexts. The results demonstrate the potential of this integrated solution, which combines advanced detection capabilities with the transparency necessary for practical applications in the financial sector |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-12-10 2025-06-03T18:31:29Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://tede2.pucrs.br/tede2/handle/tede/11662 |
| url |
https://tede2.pucrs.br/tede2/handle/tede/11662 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação |
| publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
| instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
| instacron_str |
PUC_RS |
| institution |
PUC_RS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
| repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
| _version_ |
1850041319419805696 |