Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Nunes, Fabio Mangueira da Cruz
Orientador(a): Rodrigues Júnior, Methanias Colaço
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Pós-Graduação em Ciência da Computação
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://ri.ufs.br/jspui/handle/riufs/11607
Resumo: Context: Since 2007, through the National Anti-Corruption and Money Laundering Strategy (ENCCLA), the first LABLDs have been created, which are present now in all the regions of the federation and are responsible for policies to develop methods and advanced technologies to support the bodies of criminal prosecution. The need for innovation in this crime combat scene imposes partnerships, support, research and scientific method. The objective of this work was to evaluate the effectiveness of the Expectation-Maximization (EM) and K-Means algorithms on real financial transaction databases investigated by Sergipe's LABLDs, comparing the evidences found with the results obtained by mapping the state-of-the-art published in the literature. Method: Initially, a Survey was conducted with the premise of characterizing the use of techniques of storage, integration, Data Mining and Data Analytics by LABLDs and other investigative units throughout Brazil. Then, a systematic mapping was performed as a way to identify and systematize the main approaches, techniques and algorithms used in computer science to combat LD. Finally, a controlled in vivo experiment was designed and executed to compare the EM and K-Means algorithms. Results: It was found that approximately 97% of survey respondents did not directly use any data mining algorithm and that 30.99% evaluated their own knowledge about the subject as bad or very bad. Related to the state of the art, it has been identified that the main approaches used against LD are supervised classifiers and clusters. With the execution of the experimental process, it was evidenced that the algorithm EM surpasses the K-means algorithm, reaching a maximum average accuracy of 98.25%. Conclusions: This thesis exposed a hard reality within the main investigation and control bodies of our country. After analyzing the state of the art, it was evidenced that there are opportunities to explore solutions against LD, especially in the areas of Machine Learning and Deep Learning. Finally, the EM algorithm presented as a superior alternative to K-means for the implementation of a predictor module of suspicious transactions, confirming the results of the literature, however, in a real and specific investigation environment.
id UFS-2_a08a9a96364f3c18f4d9dc109ca9461e
oai_identifier_str oai:ufs.br:riufs/11607
network_acronym_str UFS-2
network_name_str Repositório Institucional da UFS
repository_id_str
spelling Nunes, Fabio Mangueira da CruzRodrigues Júnior, Methanias Colaço2019-07-31T19:45:35Z2019-07-31T19:45:35Z2019-01-31NUNES, Fabio Mangueira da Cruz. Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro. 2019. 92 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2019.http://ri.ufs.br/jspui/handle/riufs/11607Context: Since 2007, through the National Anti-Corruption and Money Laundering Strategy (ENCCLA), the first LABLDs have been created, which are present now in all the regions of the federation and are responsible for policies to develop methods and advanced technologies to support the bodies of criminal prosecution. The need for innovation in this crime combat scene imposes partnerships, support, research and scientific method. The objective of this work was to evaluate the effectiveness of the Expectation-Maximization (EM) and K-Means algorithms on real financial transaction databases investigated by Sergipe's LABLDs, comparing the evidences found with the results obtained by mapping the state-of-the-art published in the literature. Method: Initially, a Survey was conducted with the premise of characterizing the use of techniques of storage, integration, Data Mining and Data Analytics by LABLDs and other investigative units throughout Brazil. Then, a systematic mapping was performed as a way to identify and systematize the main approaches, techniques and algorithms used in computer science to combat LD. Finally, a controlled in vivo experiment was designed and executed to compare the EM and K-Means algorithms. Results: It was found that approximately 97% of survey respondents did not directly use any data mining algorithm and that 30.99% evaluated their own knowledge about the subject as bad or very bad. Related to the state of the art, it has been identified that the main approaches used against LD are supervised classifiers and clusters. With the execution of the experimental process, it was evidenced that the algorithm EM surpasses the K-means algorithm, reaching a maximum average accuracy of 98.25%. Conclusions: This thesis exposed a hard reality within the main investigation and control bodies of our country. After analyzing the state of the art, it was evidenced that there are opportunities to explore solutions against LD, especially in the areas of Machine Learning and Deep Learning. Finally, the EM algorithm presented as a superior alternative to K-means for the implementation of a predictor module of suspicious transactions, confirming the results of the literature, however, in a real and specific investigation environment.Contexto: Desde 2007, por meio da Estratégia Nacional de Combate à Corrupção e à Lavagem de Dinheiro (ENCCLA), iniciou-se a criação dos primeiros Laboratórios de Tecnologia contra Lavagem de Dinheiro (LABLDs), os quais, hoje, estão presentes em todas as regiões da federação e são responsáveis por políticas de desenvolvimento de métodos e tecnologias de ponta para dar suporte aos órgãos de persecução penal. A necessidade de inovação neste cenário de combate ao crime impõe parcerias, apoio, pesquisas e método científicos. Objetivo: Este trabalho teve por proposito avaliar a eficácia dos algoritmos EM (Expectation–Maximization) e K-Means sobre bases de dados reais de transações financeiras investigadas pelos LABLDs de Sergipe, comparando as evidências encontradas com os resultados obtidos pelo mapeamento do estado da arte publicado na literatura. Método: Inicialmente, foi realizado um Survey com a premissa de caracterizar a utilização de técnicas de armazenamento, integração, Data Mining e Data Analytics pelos LABLDs e demais unidades investigativas em todo o Brasil. Em seguida, foi executado um mapeamento sistemático como forma de identificar e sistematizar as principais abordagens, técnicas e algoritmos usados na computação, para lutar contra a LD. Por fim, foi planejado e executado um experimento controlado, in vivo, para comparar os algoritmos EM e K-Means. Resultados: Constatou-se que aproximadamente 97% dos respondentes do survey não utilizavam diretamente algum algoritmo de mineração de dados e que 30,99% avaliavam o próprio conhecimento sobre o assunto como ruim ou péssimo. Para o estado da arte, foi identificado que as abordagens principais utilizadas contra LD são classificadores supervisionados e clusters. Com a execução do processo experimental, foi evidenciado que o algoritmo EM supera o algoritmo K-means, alcançando uma acurácia média máxima de 98,25%. Conclusões: Esta dissertação expôs a realidade dentro dos principais órgãos de investigação e controle do nosso país. Após ser analisado o estado da arte, evidenciou-se que há oportunidades para explorar soluções contra LD, principalmente nas áreas de Aprendizado de Máquina e Aprendizado Profundo. Finalmente, o algoritmo EM se apresentou como uma alternativa superior ao K-means, para a implementação de um módulo preditor de transações suspeitas, confirmando os resultados da literatura, todavia, em um ambiente real e específico de investigação.São Cristóvão, SEporComputaçãoLavagem de dinheiroMineração de dados (Computação)Algoritmos computacionaisMoney launderingData miningData analyticsK-MeansExpectation–Maximization (EM)CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAnálise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiroinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPós-Graduação em Ciência da ComputaçãoUFSreponame:Repositório Institucional da UFSinstname:Universidade Federal de Sergipe (UFS)instacron:UFSinfo:eu-repo/semantics/openAccessLICENSElicense.txtlicense.txttext/plain; charset=utf-81475https://ri.ufs.br/jspui/bitstream/riufs/11607/1/license.txt098cbbf65c2c15e1fb2e49c5d306a44cMD51ORIGINALFABIO_MANGUEIRA_CRUZ_NUNES.pdfFABIO_MANGUEIRA_CRUZ_NUNES.pdfapplication/pdf2404501https://ri.ufs.br/jspui/bitstream/riufs/11607/2/FABIO_MANGUEIRA_CRUZ_NUNES.pdf636d97c97e36adfe6b0342030113c92cMD52TEXTFABIO_MANGUEIRA_CRUZ_NUNES.pdf.txtFABIO_MANGUEIRA_CRUZ_NUNES.pdf.txtExtracted texttext/plain160742https://ri.ufs.br/jspui/bitstream/riufs/11607/3/FABIO_MANGUEIRA_CRUZ_NUNES.pdf.txtae959c788f3451f1e7f9ef832bdbf61eMD53THUMBNAILFABIO_MANGUEIRA_CRUZ_NUNES.pdf.jpgFABIO_MANGUEIRA_CRUZ_NUNES.pdf.jpgGenerated Thumbnailimage/jpeg1466https://ri.ufs.br/jspui/bitstream/riufs/11607/4/FABIO_MANGUEIRA_CRUZ_NUNES.pdf.jpg4981efd56b7c28543c5bf9f5e3263effMD54riufs/116072019-07-31 16:45:35.931oai:ufs.br:riufs/11607TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvcihlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyIHNldSB0cmFiYWxobyBubyBmb3JtYXRvIGVsZXRyw7RuaWNvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFNlcmdpcGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIHNldSB0cmFiYWxobyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGUgc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0bywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgbsOjbyBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gbyB0cmFiYWxobyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvLgoKQSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHRyYWJhbGhvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuIAo=Repositório InstitucionalPUBhttps://ri.ufs.br/oai/requestrepositorio@academico.ufs.bropendoar:2019-07-31T19:45:35Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)false
dc.title.pt_BR.fl_str_mv Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro
title Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro
spellingShingle Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro
Nunes, Fabio Mangueira da Cruz
Computação
Lavagem de dinheiro
Mineração de dados (Computação)
Algoritmos computacionais
Money laundering
Data mining
Data analytics
K-Means
Expectation–Maximization (EM)
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro
title_full Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro
title_fullStr Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro
title_full_unstemmed Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro
title_sort Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro
author Nunes, Fabio Mangueira da Cruz
author_facet Nunes, Fabio Mangueira da Cruz
author_role author
dc.contributor.author.fl_str_mv Nunes, Fabio Mangueira da Cruz
dc.contributor.advisor1.fl_str_mv Rodrigues Júnior, Methanias Colaço
contributor_str_mv Rodrigues Júnior, Methanias Colaço
dc.subject.por.fl_str_mv Computação
Lavagem de dinheiro
Mineração de dados (Computação)
Algoritmos computacionais
Money laundering
Data mining
Data analytics
K-Means
Expectation–Maximization (EM)
topic Computação
Lavagem de dinheiro
Mineração de dados (Computação)
Algoritmos computacionais
Money laundering
Data mining
Data analytics
K-Means
Expectation–Maximization (EM)
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Context: Since 2007, through the National Anti-Corruption and Money Laundering Strategy (ENCCLA), the first LABLDs have been created, which are present now in all the regions of the federation and are responsible for policies to develop methods and advanced technologies to support the bodies of criminal prosecution. The need for innovation in this crime combat scene imposes partnerships, support, research and scientific method. The objective of this work was to evaluate the effectiveness of the Expectation-Maximization (EM) and K-Means algorithms on real financial transaction databases investigated by Sergipe's LABLDs, comparing the evidences found with the results obtained by mapping the state-of-the-art published in the literature. Method: Initially, a Survey was conducted with the premise of characterizing the use of techniques of storage, integration, Data Mining and Data Analytics by LABLDs and other investigative units throughout Brazil. Then, a systematic mapping was performed as a way to identify and systematize the main approaches, techniques and algorithms used in computer science to combat LD. Finally, a controlled in vivo experiment was designed and executed to compare the EM and K-Means algorithms. Results: It was found that approximately 97% of survey respondents did not directly use any data mining algorithm and that 30.99% evaluated their own knowledge about the subject as bad or very bad. Related to the state of the art, it has been identified that the main approaches used against LD are supervised classifiers and clusters. With the execution of the experimental process, it was evidenced that the algorithm EM surpasses the K-means algorithm, reaching a maximum average accuracy of 98.25%. Conclusions: This thesis exposed a hard reality within the main investigation and control bodies of our country. After analyzing the state of the art, it was evidenced that there are opportunities to explore solutions against LD, especially in the areas of Machine Learning and Deep Learning. Finally, the EM algorithm presented as a superior alternative to K-means for the implementation of a predictor module of suspicious transactions, confirming the results of the literature, however, in a real and specific investigation environment.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-07-31T19:45:35Z
dc.date.available.fl_str_mv 2019-07-31T19:45:35Z
dc.date.issued.fl_str_mv 2019-01-31
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv NUNES, Fabio Mangueira da Cruz. Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro. 2019. 92 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2019.
dc.identifier.uri.fl_str_mv http://ri.ufs.br/jspui/handle/riufs/11607
identifier_str_mv NUNES, Fabio Mangueira da Cruz. Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro. 2019. 92 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2019.
url http://ri.ufs.br/jspui/handle/riufs/11607
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.program.fl_str_mv Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFS
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFS
instname:Universidade Federal de Sergipe (UFS)
instacron:UFS
instname_str Universidade Federal de Sergipe (UFS)
instacron_str UFS
institution UFS
reponame_str Repositório Institucional da UFS
collection Repositório Institucional da UFS
bitstream.url.fl_str_mv https://ri.ufs.br/jspui/bitstream/riufs/11607/1/license.txt
https://ri.ufs.br/jspui/bitstream/riufs/11607/2/FABIO_MANGUEIRA_CRUZ_NUNES.pdf
https://ri.ufs.br/jspui/bitstream/riufs/11607/3/FABIO_MANGUEIRA_CRUZ_NUNES.pdf.txt
https://ri.ufs.br/jspui/bitstream/riufs/11607/4/FABIO_MANGUEIRA_CRUZ_NUNES.pdf.jpg
bitstream.checksum.fl_str_mv 098cbbf65c2c15e1fb2e49c5d306a44c
636d97c97e36adfe6b0342030113c92c
ae959c788f3451f1e7f9ef832bdbf61e
4981efd56b7c28543c5bf9f5e3263eff
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)
repository.mail.fl_str_mv repositorio@academico.ufs.br
_version_ 1793351066376470528