Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection

Freire, Marcos Brum

Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection

Detalhes bibliográficos
Ano de defesa:	2024
Autor(a) principal:	Freire, Marcos Brum
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	eng
Instituição de defesa:	Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Financial Anomaly Detection Self-Adversarial Variational Autoencoders Explainable Boosting Machines Deep Learning Interpretable AI Detecção de Anomalias Financeiras Autoencoders Variacionais Auto- Adversariais Máquinas de Impulso Explicáveis Inteligência Artificial Explicável Aprendizado Profundo. CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
Link de acesso:	https://tede2.pucrs.br/tede2/handle/tede/11662
Resumo:	The increasing sophistication of money laundering activities demands approaches that unite effective anomaly detection with interpretability. To address this challenge, we propose a dual-stage architecture integrating a Self-Adversarial Variational Autoencoder with transformer blocks for unsupervised anomaly detection, paired with an Explainable Boosting Machine for supervised classification. This approach addresses fundamental limitations in financial fraud detection, such as the scarcity of labeled data and extreme class imbalance. In evaluations on proprietary financial transaction data, the framework achieved a Receiver Operating Characteristic Area Under the Curve of 0.9508 and a Precision-Recall Area Under the Curve of 0.5417. When applied to the public credit card fraud dataset, the model attained a ROC AUC of 0.964, outperforming established methods in the literature such as Deep Autoencoder (0.882) and Autoencoder with Clustering (0.961), despite not using labeled data during training. The Explainable Boosting Machine component enabled clear identification of factors driving risk classifications, while the Self-Adversarial Variational Autoencoder component proved effective in detecting anomalous patterns across different financial contexts. The results demonstrate the potential of this integrated solution, which combines advanced detection capabilities with the transparency necessary for practical applications in the financial sector

Metadados do item

id	P_RS_18175ca5ccf80154a3a0c7fcb6cc8bd7
oai_identifier_str	oai:tede2.pucrs.br:tede/11662
network_acronym_str	P_RS
network_name_str	Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling	Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detectionAprendizado profundo não supervisionado para modelagem supervisionada interpretável : uma abordagem em duas fases para detecção de anomalias financeirasFinancial Anomaly DetectionSelf-Adversarial Variational AutoencodersExplainable Boosting MachinesDeep LearningInterpretable AIDetecção de Anomalias FinanceirasAutoencoders Variacionais Auto- AdversariaisMáquinas de Impulso ExplicáveisInteligência Artificial ExplicávelAprendizado Profundo.CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOThe increasing sophistication of money laundering activities demands approaches that unite effective anomaly detection with interpretability. To address this challenge, we propose a dual-stage architecture integrating a Self-Adversarial Variational Autoencoder with transformer blocks for unsupervised anomaly detection, paired with an Explainable Boosting Machine for supervised classification. This approach addresses fundamental limitations in financial fraud detection, such as the scarcity of labeled data and extreme class imbalance. In evaluations on proprietary financial transaction data, the framework achieved a Receiver Operating Characteristic Area Under the Curve of 0.9508 and a Precision-Recall Area Under the Curve of 0.5417. When applied to the public credit card fraud dataset, the model attained a ROC AUC of 0.964, outperforming established methods in the literature such as Deep Autoencoder (0.882) and Autoencoder with Clustering (0.961), despite not using labeled data during training. The Explainable Boosting Machine component enabled clear identification of factors driving risk classifications, while the Self-Adversarial Variational Autoencoder component proved effective in detecting anomalous patterns across different financial contexts. The results demonstrate the potential of this integrated solution, which combines advanced detection capabilities with the transparency necessary for practical applications in the financial sectorA sofisticação crescente das atividades de lavagem de dinheiro demanda abordagens que aliem detecção eficaz de anomalias com interpretabilidade. Para enfrentar este desafio, propusemos uma arquitetura dual integrando um Autoencoder Variacional Auto- Adversarial com blocos transformadores para detecção não supervisionada de anomalias, associado a uma Máquina de Explainable Boosting para classificação supervisionada. Essa abordagem endereça limitações fundamentais na detecção de fraudes financeiras, como a escassez de dados rotulados e o desequilíbrio extremo de classes. Em avaliações realizadas com dados proprietários de transações financeiras, o framework alcançou uma Área Sob a Curva ROC de 0,9508 e uma Área Sob a Curva Precisão-Revocação de 0,5417. Quando aplicado ao conjunto de dados público de fraude em cartões de crédito, o modelo obteve uma Área Sob a Curva ROC de 0,964, superando métodos estabelecidos na literatura como Deep Autoencoder (0,882) e Autoencoder com Clustering (0,961), mesmo sem utilizar dados rotulados durante o treinamento. O componente Máquina de Explainable Boosting viabilizou a identificação clara dos fatores determinantes nas classificações de risco, enquanto o Autoencoder Variacional Auto-Adversarial demonstrou eficácia na detecção de padrões anômalos em diferentes contextos financeiros. Os resultados evidenciam o potencial desta solução integrada, que alia capacidade avançada de detecção à transparência necessária para aplicações práticas no setor financeiro.Pontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoRuiz, Duncan Dubugras Alcobahttp://lattes.cnpq.br/8250832800932125Freire, Marcos Brum2025-06-03T18:31:29Z2024-12-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://tede2.pucrs.br/tede2/handle/tede/11662enginfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2025-06-03T23:00:28Zoai:tede2.pucrs.br:tede/11662Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br\|\|opendoar:2025-06-03T23:00:28Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv	Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection Aprendizado profundo não supervisionado para modelagem supervisionada interpretável : uma abordagem em duas fases para detecção de anomalias financeiras
title	Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
spellingShingle	Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection Freire, Marcos Brum Financial Anomaly Detection Self-Adversarial Variational Autoencoders Explainable Boosting Machines Deep Learning Interpretable AI Detecção de Anomalias Financeiras Autoencoders Variacionais Auto- Adversariais Máquinas de Impulso Explicáveis Inteligência Artificial Explicável Aprendizado Profundo. CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short	Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
title_full	Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
title_fullStr	Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
title_full_unstemmed	Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
title_sort	Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection
author	Freire, Marcos Brum
author_facet	Freire, Marcos Brum
author_role	author
dc.contributor.none.fl_str_mv	Ruiz, Duncan Dubugras Alcoba http://lattes.cnpq.br/8250832800932125
dc.contributor.author.fl_str_mv	Freire, Marcos Brum
dc.subject.por.fl_str_mv	Financial Anomaly Detection Self-Adversarial Variational Autoencoders Explainable Boosting Machines Deep Learning Interpretable AI Detecção de Anomalias Financeiras Autoencoders Variacionais Auto- Adversariais Máquinas de Impulso Explicáveis Inteligência Artificial Explicável Aprendizado Profundo. CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
topic	Financial Anomaly Detection Self-Adversarial Variational Autoencoders Explainable Boosting Machines Deep Learning Interpretable AI Detecção de Anomalias Financeiras Autoencoders Variacionais Auto- Adversariais Máquinas de Impulso Explicáveis Inteligência Artificial Explicável Aprendizado Profundo. CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description	The increasing sophistication of money laundering activities demands approaches that unite effective anomaly detection with interpretability. To address this challenge, we propose a dual-stage architecture integrating a Self-Adversarial Variational Autoencoder with transformer blocks for unsupervised anomaly detection, paired with an Explainable Boosting Machine for supervised classification. This approach addresses fundamental limitations in financial fraud detection, such as the scarcity of labeled data and extreme class imbalance. In evaluations on proprietary financial transaction data, the framework achieved a Receiver Operating Characteristic Area Under the Curve of 0.9508 and a Precision-Recall Area Under the Curve of 0.5417. When applied to the public credit card fraud dataset, the model attained a ROC AUC of 0.964, outperforming established methods in the literature such as Deep Autoencoder (0.882) and Autoencoder with Clustering (0.961), despite not using labeled data during training. The Explainable Boosting Machine component enabled clear identification of factors driving risk classifications, while the Self-Adversarial Variational Autoencoder component proved effective in detecting anomalous patterns across different financial contexts. The results demonstrate the potential of this integrated solution, which combines advanced detection capabilities with the transparency necessary for practical applications in the financial sector
publishDate	2024
dc.date.none.fl_str_mv	2024-12-10 2025-06-03T18:31:29Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://tede2.pucrs.br/tede2/handle/tede/11662
url	https://tede2.pucrs.br/tede2/handle/tede/11662
dc.language.iso.fl_str_mv	eng
language	eng
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
publisher.none.fl_str_mv	Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS
instname_str	Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str	PUC_RS
institution	PUC_RS
reponame_str	Biblioteca Digital de Teses e Dissertações da PUC_RS
collection	Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv	biblioteca.central@pucrs.br\|\|
_version_	1850041319419805696

Unsupervised deep learning to supervised interpretability : a dual-stage approach for financial anomaly detection

Registros relacionados