Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Santana, Jairo Brandão de
Orientador(a): Araújo, Gustavo Medeiros de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://repositorio.ufsc.br/handle/123456789/219522
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2020.
id UFSC_0b5e1e2fc3c4f35c8688da95a25bfb32
oai_identifier_str oai:repositorio.ufsc.br:123456789/219522
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str
spelling Universidade Federal de Santa CatarinaSantana, Jairo Brandão deAraújo, Gustavo Medeiros deRamos, Vinicius Faria Culmant2021-01-14T18:11:33Z2021-01-14T18:11:33Z2020370597https://repositorio.ufsc.br/handle/123456789/219522Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2020.Uma das competências da Polícia Federal é analisar os Relatórios de Inteligência Financeira (RIF), gerados pelo Conselho de Controle de Atividades Financeiras (COAF). Essa análise verifica a existência de algum indício de crime de lavagem de dinheiro e, se for o caso, inicia uma investigação. Essa análise é realizada de forma manual, o agente deve ler o RIF e catalogar em uma planilha todos os envolvidos e operações financeiras realizadas. Esse processo é custoso, pois o RIF pode ter dezenas de páginas. Além disso, vários relatórios são gerados mensalmente, o que agrava a demora no processamento dos RIFs. Esse projeto vem propor uma avaliação das tecnologias atuais de Mineração de Texto, mais especificamente o Reconhecimento de Entidades Nomeadas (REN) em português. A aplicação de Reconhecimento de Entidades Nomeadas ao RIF visa automatizar o processo de extração de informações do texto, submetendo o documento a um sistema computacional que faça sua leitura detalhada e retorne as informações contidas no relatório, como entidades, operações, valores, datas e vínculos entre as entidades. Dessa forma, pretende-se tornar mais ágil a análise dos RIFs. Após a leitura automatizada do texto contido no RIF, as informações extraídas podem ser armazenadas em uma de base dados e disponibilizadas de forma estruturada. Essa etapa automatizada irá facilitar a etapa seguinte de análise de vínculo, na qual consiste em detectar vínculos por meio de uma ferramenta de diagramação e análise de redes. Além disso, a organização e armazenamento dessas informações, também permitiria o cruzamento dos vínculos de diversos RIFs e manter o seu histórico.Abstract: One of the responsibilities of the Federal Police to analyze the Financial Intelligence Reports(RIF), generated by the Council for Financial Activities Control (COAF). This analysis checksfor evidence of a money laundering crime and, if applicable, initiates an investigation. Thisanalysis is performed manually, the agent must read the RIF and catalog in a spreadsheet allthose involved and financial operations carried out. This process is costly because the RIF mayhave dozens of pages. In addition, several reports are generated on a monthly basis, whichaggravates the delay in processing RIFs. This project proposes an assessment of current textmining technologies, more specifically the Recognition of Named Entities (REN) inPortuguese. The application of Recognition of Named Entities to the RIF aims to automate theprocess of extracting information from the text, submitting the document to a computer systemthat reads it in detail and returns the information contained in the report, such as entities,operations, values, dates and links between entities. Thus, it is intended to make the analysis ofRIFs more agile. After the automated reading of the text contained in the RIF, the extractedinformation can be stored in a database and made available in a structured way. This automatedstep will facilitate the next step of link analysis, which consists of detecting links using adiagramming and network analysis tool. In addition, the organization and storage of thisinformation would also allow the crossing of the links of several RIFs and maintain theirhistory.106 p.| il.porCiência da informaçãoLavagem de dinheiroLingüísticaFinançasAprendizado do computadorInformação estratégicaInteligência artificialDesenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeirainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPCIN0241-D.pdfPCIN0241-D.pdfapplication/pdf2797208https://repositorio.ufsc.br/bitstream/123456789/219522/-1/PCIN0241-D.pdf723c504a8344538440ad4c8a3ed1d17fMD5-1123456789/2195222021-01-14 15:11:33.988oai:repositorio.ufsc.br:123456789/219522Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestsandra.sobrera@ufsc.bropendoar:23732021-01-14T18:11:33Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira
title Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira
spellingShingle Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira
Santana, Jairo Brandão de
Ciência da informação
Lavagem de dinheiro
Lingüística
Finanças
Aprendizado do computador
Informação estratégica
Inteligência artificial
title_short Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira
title_full Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira
title_fullStr Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira
title_full_unstemmed Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira
title_sort Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira
author Santana, Jairo Brandão de
author_facet Santana, Jairo Brandão de
author_role author
dc.contributor.none.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Santana, Jairo Brandão de
dc.contributor.advisor1.fl_str_mv Araújo, Gustavo Medeiros de
dc.contributor.advisor-co1.fl_str_mv Ramos, Vinicius Faria Culmant
contributor_str_mv Araújo, Gustavo Medeiros de
Ramos, Vinicius Faria Culmant
dc.subject.classification.none.fl_str_mv Ciência da informação
Lavagem de dinheiro
Lingüística
Finanças
Aprendizado do computador
Informação estratégica
Inteligência artificial
topic Ciência da informação
Lavagem de dinheiro
Lingüística
Finanças
Aprendizado do computador
Informação estratégica
Inteligência artificial
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2020.
publishDate 2020
dc.date.issued.fl_str_mv 2020
dc.date.accessioned.fl_str_mv 2021-01-14T18:11:33Z
dc.date.available.fl_str_mv 2021-01-14T18:11:33Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/219522
dc.identifier.other.none.fl_str_mv 370597
identifier_str_mv 370597
url https://repositorio.ufsc.br/handle/123456789/219522
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 106 p.| il.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/219522/-1/PCIN0241-D.pdf
bitstream.checksum.fl_str_mv 723c504a8344538440ad4c8a3ed1d17f
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv sandra.sobrera@ufsc.br
_version_ 1851759282305892352