Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Link de acesso: | https://repositorio.ufsc.br/handle/123456789/219522 |
Resumo: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2020. |
| id |
UFSC_0b5e1e2fc3c4f35c8688da95a25bfb32 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufsc.br:123456789/219522 |
| network_acronym_str |
UFSC |
| network_name_str |
Repositório Institucional da UFSC |
| repository_id_str |
|
| spelling |
Universidade Federal de Santa CatarinaSantana, Jairo Brandão deAraújo, Gustavo Medeiros deRamos, Vinicius Faria Culmant2021-01-14T18:11:33Z2021-01-14T18:11:33Z2020370597https://repositorio.ufsc.br/handle/123456789/219522Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2020.Uma das competências da Polícia Federal é analisar os Relatórios de Inteligência Financeira (RIF), gerados pelo Conselho de Controle de Atividades Financeiras (COAF). Essa análise verifica a existência de algum indício de crime de lavagem de dinheiro e, se for o caso, inicia uma investigação. Essa análise é realizada de forma manual, o agente deve ler o RIF e catalogar em uma planilha todos os envolvidos e operações financeiras realizadas. Esse processo é custoso, pois o RIF pode ter dezenas de páginas. Além disso, vários relatórios são gerados mensalmente, o que agrava a demora no processamento dos RIFs. Esse projeto vem propor uma avaliação das tecnologias atuais de Mineração de Texto, mais especificamente o Reconhecimento de Entidades Nomeadas (REN) em português. A aplicação de Reconhecimento de Entidades Nomeadas ao RIF visa automatizar o processo de extração de informações do texto, submetendo o documento a um sistema computacional que faça sua leitura detalhada e retorne as informações contidas no relatório, como entidades, operações, valores, datas e vínculos entre as entidades. Dessa forma, pretende-se tornar mais ágil a análise dos RIFs. Após a leitura automatizada do texto contido no RIF, as informações extraídas podem ser armazenadas em uma de base dados e disponibilizadas de forma estruturada. Essa etapa automatizada irá facilitar a etapa seguinte de análise de vínculo, na qual consiste em detectar vínculos por meio de uma ferramenta de diagramação e análise de redes. Além disso, a organização e armazenamento dessas informações, também permitiria o cruzamento dos vínculos de diversos RIFs e manter o seu histórico.Abstract: One of the responsibilities of the Federal Police to analyze the Financial Intelligence Reports(RIF), generated by the Council for Financial Activities Control (COAF). This analysis checksfor evidence of a money laundering crime and, if applicable, initiates an investigation. Thisanalysis is performed manually, the agent must read the RIF and catalog in a spreadsheet allthose involved and financial operations carried out. This process is costly because the RIF mayhave dozens of pages. In addition, several reports are generated on a monthly basis, whichaggravates the delay in processing RIFs. This project proposes an assessment of current textmining technologies, more specifically the Recognition of Named Entities (REN) inPortuguese. The application of Recognition of Named Entities to the RIF aims to automate theprocess of extracting information from the text, submitting the document to a computer systemthat reads it in detail and returns the information contained in the report, such as entities,operations, values, dates and links between entities. Thus, it is intended to make the analysis ofRIFs more agile. After the automated reading of the text contained in the RIF, the extractedinformation can be stored in a database and made available in a structured way. This automatedstep will facilitate the next step of link analysis, which consists of detecting links using adiagramming and network analysis tool. In addition, the organization and storage of thisinformation would also allow the crossing of the links of several RIFs and maintain theirhistory.106 p.| il.porCiência da informaçãoLavagem de dinheiroLingüísticaFinançasAprendizado do computadorInformação estratégicaInteligência artificialDesenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeirainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPCIN0241-D.pdfPCIN0241-D.pdfapplication/pdf2797208https://repositorio.ufsc.br/bitstream/123456789/219522/-1/PCIN0241-D.pdf723c504a8344538440ad4c8a3ed1d17fMD5-1123456789/2195222021-01-14 15:11:33.988oai:repositorio.ufsc.br:123456789/219522Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestsandra.sobrera@ufsc.bropendoar:23732021-01-14T18:11:33Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
| dc.title.none.fl_str_mv |
Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira |
| title |
Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira |
| spellingShingle |
Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira Santana, Jairo Brandão de Ciência da informação Lavagem de dinheiro Lingüística Finanças Aprendizado do computador Informação estratégica Inteligência artificial |
| title_short |
Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira |
| title_full |
Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira |
| title_fullStr |
Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira |
| title_full_unstemmed |
Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira |
| title_sort |
Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira |
| author |
Santana, Jairo Brandão de |
| author_facet |
Santana, Jairo Brandão de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Universidade Federal de Santa Catarina |
| dc.contributor.author.fl_str_mv |
Santana, Jairo Brandão de |
| dc.contributor.advisor1.fl_str_mv |
Araújo, Gustavo Medeiros de |
| dc.contributor.advisor-co1.fl_str_mv |
Ramos, Vinicius Faria Culmant |
| contributor_str_mv |
Araújo, Gustavo Medeiros de Ramos, Vinicius Faria Culmant |
| dc.subject.classification.none.fl_str_mv |
Ciência da informação Lavagem de dinheiro Lingüística Finanças Aprendizado do computador Informação estratégica Inteligência artificial |
| topic |
Ciência da informação Lavagem de dinheiro Lingüística Finanças Aprendizado do computador Informação estratégica Inteligência artificial |
| description |
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2020. |
| publishDate |
2020 |
| dc.date.issued.fl_str_mv |
2020 |
| dc.date.accessioned.fl_str_mv |
2021-01-14T18:11:33Z |
| dc.date.available.fl_str_mv |
2021-01-14T18:11:33Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/handle/123456789/219522 |
| dc.identifier.other.none.fl_str_mv |
370597 |
| identifier_str_mv |
370597 |
| url |
https://repositorio.ufsc.br/handle/123456789/219522 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
106 p.| il. |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
| instname_str |
Universidade Federal de Santa Catarina (UFSC) |
| instacron_str |
UFSC |
| institution |
UFSC |
| reponame_str |
Repositório Institucional da UFSC |
| collection |
Repositório Institucional da UFSC |
| bitstream.url.fl_str_mv |
https://repositorio.ufsc.br/bitstream/123456789/219522/-1/PCIN0241-D.pdf |
| bitstream.checksum.fl_str_mv |
723c504a8344538440ad4c8a3ed1d17f |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
| repository.mail.fl_str_mv |
sandra.sobrera@ufsc.br |
| _version_ |
1851759282305892352 |