Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Freire, Marcos Brum
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede2.pucrs.br/tede2/handle/tede/11662
Resumo: The increasing sophistication of money laundering activities demands approaches that unite effective anomaly detection with interpretability. To address this challenge, we propose a dual-stage architecture integrating a Self-Adversarial Variational Autoencoder with transformer blocks for unsupervised anomaly detection, paired with an Explainable Boosting Machine for supervised classification. This approach addresses fundamental limitations in financial fraud detection, such as the scarcity of labeled data and extreme class imbalance. In evaluations on proprietary financial transaction data, the framework achieved a Receiver Operating Characteristic Area Under the Curve of 0.9508 and a Precision-Recall Area Under the Curve of 0.5417. When applied to the public credit card fraud dataset, the model attained a ROC AUC of 0.964, outperforming established methods in the literature such as Deep Autoencoder (0.882) and Autoencoder with Clustering (0.961), despite not using labeled data during training. The Explainable Boosting Machine component enabled clear identification of factors driving risk classifications, while the Self-Adversarial Variational Autoencoder component proved effective in detecting anomalous patterns across different financial contexts. The results demonstrate the potential of this integrated solution, which combines advanced detection capabilities with the transparency necessary for practical applications in the financial sector
id P_RS_18175ca5ccf80154a3a0c7fcb6cc8bd7
oai_identifier_str oai:tede2.pucrs.br:tede/11662
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detectionAprendizado profundo não supervisionado para modelagem supervisionada interpretável : uma abordagem em duas fases para detecção de anomalias financeirasFinancial Anomaly DetectionSelf-Adversarial Variational AutoencodersExplainable Boosting MachinesDeep LearningInterpretable AIDetecção de Anomalias FinanceirasAutoencoders Variacionais Auto- AdversariaisMáquinas de Impulso ExplicáveisInteligência Artificial ExplicávelAprendizado Profundo.CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOThe increasing sophistication of money laundering activities demands approaches that unite effective anomaly detection with interpretability. To address this challenge, we propose a dual-stage architecture integrating a Self-Adversarial Variational Autoencoder with transformer blocks for unsupervised anomaly detection, paired with an Explainable Boosting Machine for supervised classification. This approach addresses fundamental limitations in financial fraud detection, such as the scarcity of labeled data and extreme class imbalance. In evaluations on proprietary financial transaction data, the framework achieved a Receiver Operating Characteristic Area Under the Curve of 0.9508 and a Precision-Recall Area Under the Curve of 0.5417. When applied to the public credit card fraud dataset, the model attained a ROC AUC of 0.964, outperforming established methods in the literature such as Deep Autoencoder (0.882) and Autoencoder with Clustering (0.961), despite not using labeled data during training. The Explainable Boosting Machine component enabled clear identification of factors driving risk classifications, while the Self-Adversarial Variational Autoencoder component proved effective in detecting anomalous patterns across different financial contexts. The results demonstrate the potential of this integrated solution, which combines advanced detection capabilities with the transparency necessary for practical applications in the financial sectorA sofisticação crescente das atividades de lavagem de dinheiro demanda abordagens que aliem detecção eficaz de anomalias com interpretabilidade. Para enfrentar este desafio, propusemos uma arquitetura dual integrando um Autoencoder Variacional Auto- Adversarial com blocos transformadores para detecção não supervisionada de anomalias, associado a uma Máquina de Explainable Boosting para classificação supervisionada. Essa abordagem endereça limitações fundamentais na detecção de fraudes financeiras, como a escassez de dados rotulados e o desequilíbrio extremo de classes. Em avaliações realizadas com dados proprietários de transações financeiras, o framework alcançou uma Área Sob a Curva ROC de 0,9508 e uma Área Sob a Curva Precisão-Revocação de 0,5417. Quando aplicado ao conjunto de dados público de fraude em cartões de crédito, o modelo obteve uma Área Sob a Curva ROC de 0,964, superando métodos estabelecidos na literatura como Deep Autoencoder (0,882) e Autoencoder com Clustering (0,961), mesmo sem utilizar dados rotulados durante o treinamento. O componente Máquina de Explainable Boosting viabilizou a identificação clara dos fatores determinantes nas classificações de risco, enquanto o Autoencoder Variacional Auto-Adversarial demonstrou eficácia na detecção de padrões anômalos em diferentes contextos financeiros. Os resultados evidenciam o potencial desta solução integrada, que alia capacidade avançada de detecção à transparência necessária para aplicações práticas no setor financeiro.Pontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoRuiz, Duncan Dubugras Alcobahttp://lattes.cnpq.br/8250832800932125Freire, Marcos Brum2025-06-03T18:31:29Z2024-12-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://tede2.pucrs.br/tede2/handle/tede/11662enginfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2025-06-03T23:00:28Zoai:tede2.pucrs.br:tede/11662Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2025-06-03T23:00:28Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
Aprendizado profundo não supervisionado para modelagem supervisionada interpretável : uma abordagem em duas fases para detecção de anomalias financeiras
title Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
spellingShingle Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
Freire, Marcos Brum
Financial Anomaly Detection
Self-Adversarial Variational Autoencoders
Explainable Boosting Machines
Deep Learning
Interpretable AI
Detecção de Anomalias Financeiras
Autoencoders Variacionais Auto- Adversariais
Máquinas de Impulso Explicáveis
Inteligência Artificial Explicável
Aprendizado Profundo.
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
title_full Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
title_fullStr Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
title_full_unstemmed Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
title_sort Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
author Freire, Marcos Brum
author_facet Freire, Marcos Brum
author_role author
dc.contributor.none.fl_str_mv Ruiz, Duncan Dubugras Alcoba
http://lattes.cnpq.br/8250832800932125
dc.contributor.author.fl_str_mv Freire, Marcos Brum
dc.subject.por.fl_str_mv Financial Anomaly Detection
Self-Adversarial Variational Autoencoders
Explainable Boosting Machines
Deep Learning
Interpretable AI
Detecção de Anomalias Financeiras
Autoencoders Variacionais Auto- Adversariais
Máquinas de Impulso Explicáveis
Inteligência Artificial Explicável
Aprendizado Profundo.
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
topic Financial Anomaly Detection
Self-Adversarial Variational Autoencoders
Explainable Boosting Machines
Deep Learning
Interpretable AI
Detecção de Anomalias Financeiras
Autoencoders Variacionais Auto- Adversariais
Máquinas de Impulso Explicáveis
Inteligência Artificial Explicável
Aprendizado Profundo.
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description The increasing sophistication of money laundering activities demands approaches that unite effective anomaly detection with interpretability. To address this challenge, we propose a dual-stage architecture integrating a Self-Adversarial Variational Autoencoder with transformer blocks for unsupervised anomaly detection, paired with an Explainable Boosting Machine for supervised classification. This approach addresses fundamental limitations in financial fraud detection, such as the scarcity of labeled data and extreme class imbalance. In evaluations on proprietary financial transaction data, the framework achieved a Receiver Operating Characteristic Area Under the Curve of 0.9508 and a Precision-Recall Area Under the Curve of 0.5417. When applied to the public credit card fraud dataset, the model attained a ROC AUC of 0.964, outperforming established methods in the literature such as Deep Autoencoder (0.882) and Autoencoder with Clustering (0.961), despite not using labeled data during training. The Explainable Boosting Machine component enabled clear identification of factors driving risk classifications, while the Self-Adversarial Variational Autoencoder component proved effective in detecting anomalous patterns across different financial contexts. The results demonstrate the potential of this integrated solution, which combines advanced detection capabilities with the transparency necessary for practical applications in the financial sector
publishDate 2024
dc.date.none.fl_str_mv 2024-12-10
2025-06-03T18:31:29Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://tede2.pucrs.br/tede2/handle/tede/11662
url https://tede2.pucrs.br/tede2/handle/tede/11662
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1850041319419805696