Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro
Ano de defesa: | 2019 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Pós-Graduação em Ciência da Computação
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://ri.ufs.br/jspui/handle/riufs/11607 |
Resumo: | Context: Since 2007, through the National Anti-Corruption and Money Laundering Strategy (ENCCLA), the first LABLDs have been created, which are present now in all the regions of the federation and are responsible for policies to develop methods and advanced technologies to support the bodies of criminal prosecution. The need for innovation in this crime combat scene imposes partnerships, support, research and scientific method. The objective of this work was to evaluate the effectiveness of the Expectation-Maximization (EM) and K-Means algorithms on real financial transaction databases investigated by Sergipe's LABLDs, comparing the evidences found with the results obtained by mapping the state-of-the-art published in the literature. Method: Initially, a Survey was conducted with the premise of characterizing the use of techniques of storage, integration, Data Mining and Data Analytics by LABLDs and other investigative units throughout Brazil. Then, a systematic mapping was performed as a way to identify and systematize the main approaches, techniques and algorithms used in computer science to combat LD. Finally, a controlled in vivo experiment was designed and executed to compare the EM and K-Means algorithms. Results: It was found that approximately 97% of survey respondents did not directly use any data mining algorithm and that 30.99% evaluated their own knowledge about the subject as bad or very bad. Related to the state of the art, it has been identified that the main approaches used against LD are supervised classifiers and clusters. With the execution of the experimental process, it was evidenced that the algorithm EM surpasses the K-means algorithm, reaching a maximum average accuracy of 98.25%. Conclusions: This thesis exposed a hard reality within the main investigation and control bodies of our country. After analyzing the state of the art, it was evidenced that there are opportunities to explore solutions against LD, especially in the areas of Machine Learning and Deep Learning. Finally, the EM algorithm presented as a superior alternative to K-means for the implementation of a predictor module of suspicious transactions, confirming the results of the literature, however, in a real and specific investigation environment. |
id |
UFS-2_a08a9a96364f3c18f4d9dc109ca9461e |
---|---|
oai_identifier_str |
oai:ufs.br:riufs/11607 |
network_acronym_str |
UFS-2 |
network_name_str |
Repositório Institucional da UFS |
repository_id_str |
|
spelling |
Nunes, Fabio Mangueira da CruzRodrigues Júnior, Methanias Colaço2019-07-31T19:45:35Z2019-07-31T19:45:35Z2019-01-31NUNES, Fabio Mangueira da Cruz. Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro. 2019. 92 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2019.http://ri.ufs.br/jspui/handle/riufs/11607Context: Since 2007, through the National Anti-Corruption and Money Laundering Strategy (ENCCLA), the first LABLDs have been created, which are present now in all the regions of the federation and are responsible for policies to develop methods and advanced technologies to support the bodies of criminal prosecution. The need for innovation in this crime combat scene imposes partnerships, support, research and scientific method. The objective of this work was to evaluate the effectiveness of the Expectation-Maximization (EM) and K-Means algorithms on real financial transaction databases investigated by Sergipe's LABLDs, comparing the evidences found with the results obtained by mapping the state-of-the-art published in the literature. Method: Initially, a Survey was conducted with the premise of characterizing the use of techniques of storage, integration, Data Mining and Data Analytics by LABLDs and other investigative units throughout Brazil. Then, a systematic mapping was performed as a way to identify and systematize the main approaches, techniques and algorithms used in computer science to combat LD. Finally, a controlled in vivo experiment was designed and executed to compare the EM and K-Means algorithms. Results: It was found that approximately 97% of survey respondents did not directly use any data mining algorithm and that 30.99% evaluated their own knowledge about the subject as bad or very bad. Related to the state of the art, it has been identified that the main approaches used against LD are supervised classifiers and clusters. With the execution of the experimental process, it was evidenced that the algorithm EM surpasses the K-means algorithm, reaching a maximum average accuracy of 98.25%. Conclusions: This thesis exposed a hard reality within the main investigation and control bodies of our country. After analyzing the state of the art, it was evidenced that there are opportunities to explore solutions against LD, especially in the areas of Machine Learning and Deep Learning. Finally, the EM algorithm presented as a superior alternative to K-means for the implementation of a predictor module of suspicious transactions, confirming the results of the literature, however, in a real and specific investigation environment.Contexto: Desde 2007, por meio da Estratégia Nacional de Combate à Corrupção e à Lavagem de Dinheiro (ENCCLA), iniciou-se a criação dos primeiros Laboratórios de Tecnologia contra Lavagem de Dinheiro (LABLDs), os quais, hoje, estão presentes em todas as regiões da federação e são responsáveis por políticas de desenvolvimento de métodos e tecnologias de ponta para dar suporte aos órgãos de persecução penal. A necessidade de inovação neste cenário de combate ao crime impõe parcerias, apoio, pesquisas e método científicos. Objetivo: Este trabalho teve por proposito avaliar a eficácia dos algoritmos EM (Expectation–Maximization) e K-Means sobre bases de dados reais de transações financeiras investigadas pelos LABLDs de Sergipe, comparando as evidências encontradas com os resultados obtidos pelo mapeamento do estado da arte publicado na literatura. Método: Inicialmente, foi realizado um Survey com a premissa de caracterizar a utilização de técnicas de armazenamento, integração, Data Mining e Data Analytics pelos LABLDs e demais unidades investigativas em todo o Brasil. Em seguida, foi executado um mapeamento sistemático como forma de identificar e sistematizar as principais abordagens, técnicas e algoritmos usados na computação, para lutar contra a LD. Por fim, foi planejado e executado um experimento controlado, in vivo, para comparar os algoritmos EM e K-Means. Resultados: Constatou-se que aproximadamente 97% dos respondentes do survey não utilizavam diretamente algum algoritmo de mineração de dados e que 30,99% avaliavam o próprio conhecimento sobre o assunto como ruim ou péssimo. Para o estado da arte, foi identificado que as abordagens principais utilizadas contra LD são classificadores supervisionados e clusters. Com a execução do processo experimental, foi evidenciado que o algoritmo EM supera o algoritmo K-means, alcançando uma acurácia média máxima de 98,25%. Conclusões: Esta dissertação expôs a realidade dentro dos principais órgãos de investigação e controle do nosso país. Após ser analisado o estado da arte, evidenciou-se que há oportunidades para explorar soluções contra LD, principalmente nas áreas de Aprendizado de Máquina e Aprendizado Profundo. Finalmente, o algoritmo EM se apresentou como uma alternativa superior ao K-means, para a implementação de um módulo preditor de transações suspeitas, confirmando os resultados da literatura, todavia, em um ambiente real e específico de investigação.São Cristóvão, SEporComputaçãoLavagem de dinheiroMineração de dados (Computação)Algoritmos computacionaisMoney launderingData miningData analyticsK-MeansExpectation–Maximization (EM)CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAnálise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiroinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPós-Graduação em Ciência da ComputaçãoUFSreponame:Repositório Institucional da UFSinstname:Universidade Federal de Sergipe (UFS)instacron:UFSinfo:eu-repo/semantics/openAccessLICENSElicense.txtlicense.txttext/plain; charset=utf-81475https://ri.ufs.br/jspui/bitstream/riufs/11607/1/license.txt098cbbf65c2c15e1fb2e49c5d306a44cMD51ORIGINALFABIO_MANGUEIRA_CRUZ_NUNES.pdfFABIO_MANGUEIRA_CRUZ_NUNES.pdfapplication/pdf2404501https://ri.ufs.br/jspui/bitstream/riufs/11607/2/FABIO_MANGUEIRA_CRUZ_NUNES.pdf636d97c97e36adfe6b0342030113c92cMD52TEXTFABIO_MANGUEIRA_CRUZ_NUNES.pdf.txtFABIO_MANGUEIRA_CRUZ_NUNES.pdf.txtExtracted texttext/plain160742https://ri.ufs.br/jspui/bitstream/riufs/11607/3/FABIO_MANGUEIRA_CRUZ_NUNES.pdf.txtae959c788f3451f1e7f9ef832bdbf61eMD53THUMBNAILFABIO_MANGUEIRA_CRUZ_NUNES.pdf.jpgFABIO_MANGUEIRA_CRUZ_NUNES.pdf.jpgGenerated Thumbnailimage/jpeg1466https://ri.ufs.br/jspui/bitstream/riufs/11607/4/FABIO_MANGUEIRA_CRUZ_NUNES.pdf.jpg4981efd56b7c28543c5bf9f5e3263effMD54riufs/116072019-07-31 16:45:35.931oai:ufs.br:riufs/11607TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvcihlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyIHNldSB0cmFiYWxobyBubyBmb3JtYXRvIGVsZXRyw7RuaWNvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFNlcmdpcGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIHNldSB0cmFiYWxobyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGUgc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0bywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgbsOjbyBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gbyB0cmFiYWxobyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvLgoKQSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHRyYWJhbGhvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuIAo=Repositório InstitucionalPUBhttps://ri.ufs.br/oai/requestrepositorio@academico.ufs.bropendoar:2019-07-31T19:45:35Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)false |
dc.title.pt_BR.fl_str_mv |
Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro |
title |
Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro |
spellingShingle |
Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro Nunes, Fabio Mangueira da Cruz Computação Lavagem de dinheiro Mineração de dados (Computação) Algoritmos computacionais Money laundering Data mining Data analytics K-Means Expectation–Maximization (EM) CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro |
title_full |
Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro |
title_fullStr |
Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro |
title_full_unstemmed |
Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro |
title_sort |
Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro |
author |
Nunes, Fabio Mangueira da Cruz |
author_facet |
Nunes, Fabio Mangueira da Cruz |
author_role |
author |
dc.contributor.author.fl_str_mv |
Nunes, Fabio Mangueira da Cruz |
dc.contributor.advisor1.fl_str_mv |
Rodrigues Júnior, Methanias Colaço |
contributor_str_mv |
Rodrigues Júnior, Methanias Colaço |
dc.subject.por.fl_str_mv |
Computação Lavagem de dinheiro Mineração de dados (Computação) Algoritmos computacionais Money laundering Data mining Data analytics K-Means Expectation–Maximization (EM) |
topic |
Computação Lavagem de dinheiro Mineração de dados (Computação) Algoritmos computacionais Money laundering Data mining Data analytics K-Means Expectation–Maximization (EM) CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Context: Since 2007, through the National Anti-Corruption and Money Laundering Strategy (ENCCLA), the first LABLDs have been created, which are present now in all the regions of the federation and are responsible for policies to develop methods and advanced technologies to support the bodies of criminal prosecution. The need for innovation in this crime combat scene imposes partnerships, support, research and scientific method. The objective of this work was to evaluate the effectiveness of the Expectation-Maximization (EM) and K-Means algorithms on real financial transaction databases investigated by Sergipe's LABLDs, comparing the evidences found with the results obtained by mapping the state-of-the-art published in the literature. Method: Initially, a Survey was conducted with the premise of characterizing the use of techniques of storage, integration, Data Mining and Data Analytics by LABLDs and other investigative units throughout Brazil. Then, a systematic mapping was performed as a way to identify and systematize the main approaches, techniques and algorithms used in computer science to combat LD. Finally, a controlled in vivo experiment was designed and executed to compare the EM and K-Means algorithms. Results: It was found that approximately 97% of survey respondents did not directly use any data mining algorithm and that 30.99% evaluated their own knowledge about the subject as bad or very bad. Related to the state of the art, it has been identified that the main approaches used against LD are supervised classifiers and clusters. With the execution of the experimental process, it was evidenced that the algorithm EM surpasses the K-means algorithm, reaching a maximum average accuracy of 98.25%. Conclusions: This thesis exposed a hard reality within the main investigation and control bodies of our country. After analyzing the state of the art, it was evidenced that there are opportunities to explore solutions against LD, especially in the areas of Machine Learning and Deep Learning. Finally, the EM algorithm presented as a superior alternative to K-means for the implementation of a predictor module of suspicious transactions, confirming the results of the literature, however, in a real and specific investigation environment. |
publishDate |
2019 |
dc.date.accessioned.fl_str_mv |
2019-07-31T19:45:35Z |
dc.date.available.fl_str_mv |
2019-07-31T19:45:35Z |
dc.date.issued.fl_str_mv |
2019-01-31 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
NUNES, Fabio Mangueira da Cruz. Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro. 2019. 92 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2019. |
dc.identifier.uri.fl_str_mv |
http://ri.ufs.br/jspui/handle/riufs/11607 |
identifier_str_mv |
NUNES, Fabio Mangueira da Cruz. Análise exploratória e comparativa da aplicação de agrupamento para combate à lavagem de dinheiro. 2019. 92 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2019. |
url |
http://ri.ufs.br/jspui/handle/riufs/11607 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.program.fl_str_mv |
Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UFS |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFS instname:Universidade Federal de Sergipe (UFS) instacron:UFS |
instname_str |
Universidade Federal de Sergipe (UFS) |
instacron_str |
UFS |
institution |
UFS |
reponame_str |
Repositório Institucional da UFS |
collection |
Repositório Institucional da UFS |
bitstream.url.fl_str_mv |
https://ri.ufs.br/jspui/bitstream/riufs/11607/1/license.txt https://ri.ufs.br/jspui/bitstream/riufs/11607/2/FABIO_MANGUEIRA_CRUZ_NUNES.pdf https://ri.ufs.br/jspui/bitstream/riufs/11607/3/FABIO_MANGUEIRA_CRUZ_NUNES.pdf.txt https://ri.ufs.br/jspui/bitstream/riufs/11607/4/FABIO_MANGUEIRA_CRUZ_NUNES.pdf.jpg |
bitstream.checksum.fl_str_mv |
098cbbf65c2c15e1fb2e49c5d306a44c 636d97c97e36adfe6b0342030113c92c ae959c788f3451f1e7f9ef832bdbf61e 4981efd56b7c28543c5bf9f5e3263eff |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS) |
repository.mail.fl_str_mv |
repositorio@academico.ufs.br |
_version_ |
1793351066376470528 |