Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Silva, Ítalo Della Garza S lattes
Orientador(a): Correia, Luiz Henrique Andrade
Banca de defesa: Correia, Luiz Henrique Andrade, Maziero, Erick Galani, Moreira, Mayron César de Oliveira, Macedo, Daniel Fernandes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Lavras
Programa de Pós-Graduação: Programa de Pós-graduação em Ciência da Computação
Departamento: Departamento de Ciência da Computação
País: brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufla.br/handle/1/56843
Resumo: Crimes financeiros existem em todos os países do mundo, e um dos mais recorrentes é a Lavagem de Dinheiro. Esta é capaz de causar enormes prejuízos, tanto financeiros quanto relacionados à reputação, às empresas e agências governamentais envolvidas no processo. Atualmente, tais organizações utilizam algoritmos envolvendo técnicas de Inteligência Artificial para detectar transações financeiras suspeitas de Lavagem de Dinheiro. No entanto, tais métodos geram várias transações suspeitas, sendo frequentemente necessária uma posterior avaliação humana para a confirmação da suspeição, aumentando os custos financeiros e o tempo gasto. A literatura tem apresentado métodos alternativos mais robustos para resolver esses problemas, frequentemente envolvendo técnicas de Machine Learning. Nesse cenário, uma vez que é possível representar transações financeiras por meio de grafos, métodos envolvendo Redes Neurais de Grafos (GNN) têm se mostrado uma solução promissora para a detecção de transações suspeitas de Lavagem de Dinheiro. É possível representar transações tanto como vértices quanto como arestas através de grafos, impactando na escolha do modelo de GNN para o processo de detecção. Este trabalho avalia as conhecidas arquiteturas de Rede Convolucional de Grafos (GCN) e Skip-GCN, assim como a recente Rede Neural de Nós e Arestas (NENN), para a solução do problema de detecção automatizada de Lavagem de Dinheiro, testando-as em transações financeiras geradas pelo simulador AMLSim. Foram geradas quatro bases de dados para testar a influência do desbalanceamento de classe sobre a qualidade da detecção: AMLSim 1/3, AMLSim 1/5, AMLSim 1/10, e AMLSim 1/20, com taxas de desbalanceamento de 3, 5, 10, e 20, respectivamente. Inicialmente, os modelos de GNN foram testados sobre todos os conjuntos de dados, com a classificação feita tanto por Softmax quanto por XGBoost. Em seguida, foi realizada uma otimização de hiperparâmetros nos modelos sobre a base de dados AMLSim 1/20, visando melhorar os resultados para a taxa de desbalanceamento mais alta. Foi também avaliado o aumento de precisão através da classificação feita pela combinação Softmax + XGBoost disposta em cascata de forma que o classificador seguinte confirmasse se a detecção de suspeição por parte do anterior. Nos resultados iniciais, embora os modelos GCN e Skip-GCN tenham se saído melhor no geral, a combinação NENN + XGBoost atingiu resultados melhores para o conjunto AMLSim 1/20, com uma macro-F1 de 86,69%, indicando a influência positiva da representação das transações como arestas do grafo. Após a otimização de hiperparâmetros, todos os modelos melhoraram seus resultados, sendo que a combinação com a F1 mais alta (88,77%) passou a ser Skip-GCN + Softmax. Com o uso da combinação de classificadores Softmax + XGBoost, o modelo Skip-GCN obteve a melhor F1 (88,90%).
id UFLA_f0800dbd8dfc83fb05ca37d57ef3747c
oai_identifier_str oai:repositorio.ufla.br:1/56843
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling 2023-05-19T16:33:33Z2023-05-19T16:33:33Z2023-05-182023-04-14SILVA, I. D. G. Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro. 2023. 63 p. Dissertação (Mestrado em Ciência da Computação)–Universidade Federal de Lavras, Lavras, 2023.https://repositorio.ufla.br/handle/1/56843Crimes financeiros existem em todos os países do mundo, e um dos mais recorrentes é a Lavagem de Dinheiro. Esta é capaz de causar enormes prejuízos, tanto financeiros quanto relacionados à reputação, às empresas e agências governamentais envolvidas no processo. Atualmente, tais organizações utilizam algoritmos envolvendo técnicas de Inteligência Artificial para detectar transações financeiras suspeitas de Lavagem de Dinheiro. No entanto, tais métodos geram várias transações suspeitas, sendo frequentemente necessária uma posterior avaliação humana para a confirmação da suspeição, aumentando os custos financeiros e o tempo gasto. A literatura tem apresentado métodos alternativos mais robustos para resolver esses problemas, frequentemente envolvendo técnicas de Machine Learning. Nesse cenário, uma vez que é possível representar transações financeiras por meio de grafos, métodos envolvendo Redes Neurais de Grafos (GNN) têm se mostrado uma solução promissora para a detecção de transações suspeitas de Lavagem de Dinheiro. É possível representar transações tanto como vértices quanto como arestas através de grafos, impactando na escolha do modelo de GNN para o processo de detecção. Este trabalho avalia as conhecidas arquiteturas de Rede Convolucional de Grafos (GCN) e Skip-GCN, assim como a recente Rede Neural de Nós e Arestas (NENN), para a solução do problema de detecção automatizada de Lavagem de Dinheiro, testando-as em transações financeiras geradas pelo simulador AMLSim. Foram geradas quatro bases de dados para testar a influência do desbalanceamento de classe sobre a qualidade da detecção: AMLSim 1/3, AMLSim 1/5, AMLSim 1/10, e AMLSim 1/20, com taxas de desbalanceamento de 3, 5, 10, e 20, respectivamente. Inicialmente, os modelos de GNN foram testados sobre todos os conjuntos de dados, com a classificação feita tanto por Softmax quanto por XGBoost. Em seguida, foi realizada uma otimização de hiperparâmetros nos modelos sobre a base de dados AMLSim 1/20, visando melhorar os resultados para a taxa de desbalanceamento mais alta. Foi também avaliado o aumento de precisão através da classificação feita pela combinação Softmax + XGBoost disposta em cascata de forma que o classificador seguinte confirmasse se a detecção de suspeição por parte do anterior. Nos resultados iniciais, embora os modelos GCN e Skip-GCN tenham se saído melhor no geral, a combinação NENN + XGBoost atingiu resultados melhores para o conjunto AMLSim 1/20, com uma macro-F1 de 86,69%, indicando a influência positiva da representação das transações como arestas do grafo. Após a otimização de hiperparâmetros, todos os modelos melhoraram seus resultados, sendo que a combinação com a F1 mais alta (88,77%) passou a ser Skip-GCN + Softmax. Com o uso da combinação de classificadores Softmax + XGBoost, o modelo Skip-GCN obteve a melhor F1 (88,90%).Financial crimes exist in all world countries, and one of the most recurrent ones is Money Laundering. It is capable of causing enormous damage, both financial and reputational, to the companies and government agencies involved in the process. Currently, such organizations use algorithms involving Artificial Intelligence techniques to detect suspicious Money Laundering financial transactions. However, such methods generate many suspicious transactions, often requiring a posterior human evaluation to confirm the suspicion, increasing financial costs and time spent. The literature has presented more robust alternative methods to solve these problems, often involving Machine Learning techniques. In this scenario, since it is possible to represent financial transactions through graphs, methods involving Graph Neural Networks (GNN) have proven to be a promising solution for detecting suspicious Money Laundering transactions. It is possible to represent transactions both as vertices and edges through graphs, impacting the choice of the GNN model for the detection process. This study evaluates the well-known Convolutional Graph Network (GCN) and Skip-GCN, as well as the recent Node and Edge Neural Network (NENN), for the Money Laundering automated detection problem solution, testing them in financial transactions generated by the AMLSim simulator. Four databases were generated to test the influence of class imbalance on detection quality: AMLSim 1/3, AMLSim 1/5, AMLSim 1/10, and AMLSim 1/20, with imbalance rates of 3, 5, 10, and 20, respectively. Initially, the GNN models were tested on all datasets, with the classification done by Softmax and XGBoost. Then, a hyperparameter optimization was performed on the models on the AMLSim 1/20 database, aiming to improve the results for the highest imbalance rate. The precision increase through classification performed by Softmax + XGBoost combination arranged in cascade was also evaluated so that the next classifier confirms the detection of suspicion by the previous one. In the initial results, although the GCN and Skip-GCN models performed better overall, the combination NENN + XGBoost achieved better results for the AMLSim 1/20 set, with a macro-F1 of 86.69%, indicating the positive influence of the representation of transactions as edges of the graph. After hyperparameter optimization, all models improved their results, and the combination with the highest F1 (88.77%) became Skip-GCN + Softmax. Using the combination of Softmax + XGBoost classifiers, the Skip-GCN model obtained the best F1 (88.90%).Universidade Federal de LavrasPrograma de Pós-graduação em Ciência da ComputaçãoUFLAbrasilDepartamento de Ciência da ComputaçãoAttribution 4.0 Internationalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessSistemas de ComputaçãoAprendizagem profundaCrimes financeirosAprendizagem de máquinaDeep learningFinancial crimesMachine learningRedes neurais de grafos aplicadas à detecção de lavagem de dinheiroGraph neural networks applied to money laundering detectioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCorreia, Luiz Henrique AndradeMaziero, Erick GalaniCorreia, Luiz Henrique AndradeMaziero, Erick GalaniMoreira, Mayron César de OliveiraMacedo, Daniel Fernandeshttp://lattes.cnpq.br/0708943693323054Silva, Ítalo Della Garza Sporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLAORIGINALDISSERTAÇÃO_Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro.pdfDISSERTAÇÃO_Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro.pdfapplication/pdf618104https://repositorio.ufla.br/bitstreams/5df04807-7b37-4276-917d-d9462b8089fb/download922831637904768bde025c0b246b916dMD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8907https://repositorio.ufla.br/bitstreams/2084cbe1-fe62-49c1-b89e-c020a7d12e1f/downloadc07b6daef3dbee864bf87e6aa836cde2MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-8956https://repositorio.ufla.br/bitstreams/f8d9dc21-860e-4e13-8702-15698f85b4d9/download5ea4a165b7202cbf475be400d2e16893MD53falseAnonymousREADTEXTDISSERTAÇÃO_Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro.pdf.txtDISSERTAÇÃO_Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro.pdf.txtExtracted texttext/plain103352https://repositorio.ufla.br/bitstreams/8946a5c6-ae24-4aa0-aaed-806de0de565b/downloadad4d4217bc23bbacb9015d61c7e62f0eMD54falseAnonymousREADTHUMBNAILDISSERTAÇÃO_Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro.pdf.jpgDISSERTAÇÃO_Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro.pdf.jpgGenerated Thumbnailimage/jpeg2995https://repositorio.ufla.br/bitstreams/8da7e57b-4c26-486e-b115-e0dc62e7ada7/download5c68636d5147d573a97c792c81917addMD55falseAnonymousREAD1/568432025-08-07 09:00:35.076http://creativecommons.org/licenses/by/4.0/Attribution 4.0 Internationalopen.accessoai:repositorio.ufla.br:1/56843https://repositorio.ufla.brRepositório InstitucionalPUBhttps://repositorio.ufla.br/server/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2025-08-07T12:00:35Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)falseREVDTEFSQcOHw4NPIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCk8gcmVmZXJpZG8gYXV0b3I6CgphKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBzZXUgdHJhYmFsaG8gb3JpZ2luYWwsIGUgcXVlIGRldMOpbSBvIGRpcmVpdG8gZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIERlY2xhcmEgdGFtYsOpbSBxdWUgYSBlbnRyZWdhIGRvIGRvY3VtZW50byBuw6NvIGluZnJpbmdlLCB0YW50byBxdWFudG8gbGhlIMOpIHBvc3PDrXZlbCBzYWJlciwgb3MgZGlyZWl0b3MgZGUgcXVhbHF1ZXIgb3V0cmEgcGVzc29hIG91ICBlbnRpZGFkZS4KCmIpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcyBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgTGF2cmFzIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbwpubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLiBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbyBwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIExhdnJhcywgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgo=
dc.title.pt_BR.fl_str_mv Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro
dc.title.alternative.pt_BR.fl_str_mv Graph neural networks applied to money laundering detection
title Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro
spellingShingle Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro
Silva, Ítalo Della Garza S
Sistemas de Computação
Aprendizagem profunda
Crimes financeiros
Aprendizagem de máquina
Deep learning
Financial crimes
Machine learning
title_short Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro
title_full Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro
title_fullStr Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro
title_full_unstemmed Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro
title_sort Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro
author Silva, Ítalo Della Garza S
author_facet Silva, Ítalo Della Garza S
author_role author
dc.contributor.advisor1.fl_str_mv Correia, Luiz Henrique Andrade
dc.contributor.advisor-co1.fl_str_mv Maziero, Erick Galani
dc.contributor.referee1.fl_str_mv Correia, Luiz Henrique Andrade
dc.contributor.referee2.fl_str_mv Maziero, Erick Galani
dc.contributor.referee3.fl_str_mv Moreira, Mayron César de Oliveira
dc.contributor.referee4.fl_str_mv Macedo, Daniel Fernandes
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0708943693323054
dc.contributor.author.fl_str_mv Silva, Ítalo Della Garza S
contributor_str_mv Correia, Luiz Henrique Andrade
Maziero, Erick Galani
Correia, Luiz Henrique Andrade
Maziero, Erick Galani
Moreira, Mayron César de Oliveira
Macedo, Daniel Fernandes
dc.subject.cnpq.fl_str_mv Sistemas de Computação
topic Sistemas de Computação
Aprendizagem profunda
Crimes financeiros
Aprendizagem de máquina
Deep learning
Financial crimes
Machine learning
dc.subject.por.fl_str_mv Aprendizagem profunda
Crimes financeiros
Aprendizagem de máquina
Deep learning
Financial crimes
Machine learning
description Crimes financeiros existem em todos os países do mundo, e um dos mais recorrentes é a Lavagem de Dinheiro. Esta é capaz de causar enormes prejuízos, tanto financeiros quanto relacionados à reputação, às empresas e agências governamentais envolvidas no processo. Atualmente, tais organizações utilizam algoritmos envolvendo técnicas de Inteligência Artificial para detectar transações financeiras suspeitas de Lavagem de Dinheiro. No entanto, tais métodos geram várias transações suspeitas, sendo frequentemente necessária uma posterior avaliação humana para a confirmação da suspeição, aumentando os custos financeiros e o tempo gasto. A literatura tem apresentado métodos alternativos mais robustos para resolver esses problemas, frequentemente envolvendo técnicas de Machine Learning. Nesse cenário, uma vez que é possível representar transações financeiras por meio de grafos, métodos envolvendo Redes Neurais de Grafos (GNN) têm se mostrado uma solução promissora para a detecção de transações suspeitas de Lavagem de Dinheiro. É possível representar transações tanto como vértices quanto como arestas através de grafos, impactando na escolha do modelo de GNN para o processo de detecção. Este trabalho avalia as conhecidas arquiteturas de Rede Convolucional de Grafos (GCN) e Skip-GCN, assim como a recente Rede Neural de Nós e Arestas (NENN), para a solução do problema de detecção automatizada de Lavagem de Dinheiro, testando-as em transações financeiras geradas pelo simulador AMLSim. Foram geradas quatro bases de dados para testar a influência do desbalanceamento de classe sobre a qualidade da detecção: AMLSim 1/3, AMLSim 1/5, AMLSim 1/10, e AMLSim 1/20, com taxas de desbalanceamento de 3, 5, 10, e 20, respectivamente. Inicialmente, os modelos de GNN foram testados sobre todos os conjuntos de dados, com a classificação feita tanto por Softmax quanto por XGBoost. Em seguida, foi realizada uma otimização de hiperparâmetros nos modelos sobre a base de dados AMLSim 1/20, visando melhorar os resultados para a taxa de desbalanceamento mais alta. Foi também avaliado o aumento de precisão através da classificação feita pela combinação Softmax + XGBoost disposta em cascata de forma que o classificador seguinte confirmasse se a detecção de suspeição por parte do anterior. Nos resultados iniciais, embora os modelos GCN e Skip-GCN tenham se saído melhor no geral, a combinação NENN + XGBoost atingiu resultados melhores para o conjunto AMLSim 1/20, com uma macro-F1 de 86,69%, indicando a influência positiva da representação das transações como arestas do grafo. Após a otimização de hiperparâmetros, todos os modelos melhoraram seus resultados, sendo que a combinação com a F1 mais alta (88,77%) passou a ser Skip-GCN + Softmax. Com o uso da combinação de classificadores Softmax + XGBoost, o modelo Skip-GCN obteve a melhor F1 (88,90%).
publishDate 2023
dc.date.submitted.none.fl_str_mv 2023-04-14
dc.date.accessioned.fl_str_mv 2023-05-19T16:33:33Z
dc.date.available.fl_str_mv 2023-05-19T16:33:33Z
dc.date.issued.fl_str_mv 2023-05-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, I. D. G. Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro. 2023. 63 p. Dissertação (Mestrado em Ciência da Computação)–Universidade Federal de Lavras, Lavras, 2023.
dc.identifier.uri.fl_str_mv https://repositorio.ufla.br/handle/1/56843
identifier_str_mv SILVA, I. D. G. Redes neurais de grafos aplicadas à detecção de lavagem de dinheiro. 2023. 63 p. Dissertação (Mestrado em Ciência da Computação)–Universidade Federal de Lavras, Lavras, 2023.
url https://repositorio.ufla.br/handle/1/56843
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution 4.0 International
http://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 4.0 International
http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Lavras
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFLA
dc.publisher.country.fl_str_mv brasil
dc.publisher.department.fl_str_mv Departamento de Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Lavras
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
bitstream.url.fl_str_mv https://repositorio.ufla.br/bitstreams/5df04807-7b37-4276-917d-d9462b8089fb/download
https://repositorio.ufla.br/bitstreams/2084cbe1-fe62-49c1-b89e-c020a7d12e1f/download
https://repositorio.ufla.br/bitstreams/f8d9dc21-860e-4e13-8702-15698f85b4d9/download
https://repositorio.ufla.br/bitstreams/8946a5c6-ae24-4aa0-aaed-806de0de565b/download
https://repositorio.ufla.br/bitstreams/8da7e57b-4c26-486e-b115-e0dc62e7ada7/download
bitstream.checksum.fl_str_mv 922831637904768bde025c0b246b916d
c07b6daef3dbee864bf87e6aa836cde2
5ea4a165b7202cbf475be400d2e16893
ad4d4217bc23bbacb9015d61c7e62f0e
5c68636d5147d573a97c792c81917add
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1854947704992432128