Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Silva, Eric Hans Messias da
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.unb.br/handle/10482/47830
Resumo: Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2023.
id UNB_b9ea3e18ff8a7f7d42dccf9676c73a6b
oai_identifier_str oai:repositorio.unb.br:10482/47830
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuaisProcessamento de linguagem natural (Computação)SumarizaçãoAprendizagem de máquinaDocumentos jurídicosDissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2023.O Tribunal de Contas da União tem seu trabalho organizado por processos e, ao longo do ciclo de vida deles, cada processo chega geralmente a conter de dezenas a centenas de peças processuais. Cada peça atinge facilmente algumas dezenas de páginas. A quantidade de processos e documentos só tende a crescer ao longo do tempo, o que gera uma quantidade enorme de material para leitura e com conteúdo bem rico, mas de difícil consumo, pois é necessário um tempo considerável para a leitura de cada processo. Os processos costumam ser lidos para verificar se possuem conteúdo relevante para alguma fiscalização ou instrução processual em curso. Além do custo alto para ler um processo, parte desse conteúdo é descartado pelo auditor por não estar atrelado ao seu trabalho corrente, o que gera um desperdício de tempo nesta atividade. Para melhorar a eficiência deste processo, é proposto neste trabalho o desenvolvimento de uma solução de sumarização automática de texto usando aprendizado de máquina aplicado ao processamento de linguagem natural. Essa solução utiliza a abordagem de sumarização híbrida (extrativa combinada com abstrativa) aplicada a documentos longos e com conteúdo jurídico. A solução foi disponibilizada como uma aplicação Web com microsserviço para melhor integração com aplicações que compõem o processo de trabalho do auditor. Os resumos gerados pelos modelos foram avaliados principalmente por métricas que foquem mais na semântica do texto gerado e, em decorrência disso, têm uma melhor aderência ao conteúdo desejado.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).The Brazilian Federal Court of Accounts organizes its work by processes and, throughout their life cycle, each of them usually contains from tens to hundreds of legal documents. Each document easily reaches a few dozen pages. The number of processes and documents only tends to grow over time, which generates a huge amount of material for reading and with a very rich content, but difficult to consume, as it takes considerable time to read each process. The processes are usually read to verify if they have relevant content for any fiscalization or procedural instruction in progress. In addition to the high cost of reading a process, part of this content is discarded by the auditor because it is not linked to their current work, which generates a waste of time in this activity. To improve the efficiency of this process, we proposed in this work the development of an automatic text summarization solution using machine learning applied to natural language processing. This solution uses the hybrid summarization approach (extractive combined with abstractive) applied to long documents with legal content. The solution was made available as a Web application with microservice for better integration with applications that make up the auditor’s work process. The summaries generated by the models were evaluated mainly by metrics that focus more on the semantics of the generated text and, as a result, have better adherence to the desired content.Instituto de Ciências Exatas (IE)Departamento de Ciência da Computação (IE CIC)Programa de Pós-Graduação em Computação Aplicada, Mestrado ProfissionalLadeira, MarceloSilva, Eric Hans Messias da2024-02-21T21:36:22Z2024-02-21T21:36:22Z2024-02-212023-07-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Eric Hans Messias da. Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais. 2023. xiv, 87, 5 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2023.http://repositorio.unb.br/handle/10482/47830porA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2025-02-27T17:30:21Zoai:repositorio.unb.br:10482/47830Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2025-02-27T17:30:21Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais
title Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais
spellingShingle Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais
Silva, Eric Hans Messias da
Processamento de linguagem natural (Computação)
Sumarização
Aprendizagem de máquina
Documentos jurídicos
title_short Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais
title_full Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais
title_fullStr Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais
title_full_unstemmed Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais
title_sort Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais
author Silva, Eric Hans Messias da
author_facet Silva, Eric Hans Messias da
author_role author
dc.contributor.none.fl_str_mv Ladeira, Marcelo
dc.contributor.author.fl_str_mv Silva, Eric Hans Messias da
dc.subject.por.fl_str_mv Processamento de linguagem natural (Computação)
Sumarização
Aprendizagem de máquina
Documentos jurídicos
topic Processamento de linguagem natural (Computação)
Sumarização
Aprendizagem de máquina
Documentos jurídicos
description Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2023.
publishDate 2023
dc.date.none.fl_str_mv 2023-07-13
2024-02-21T21:36:22Z
2024-02-21T21:36:22Z
2024-02-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Eric Hans Messias da. Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais. 2023. xiv, 87, 5 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2023.
http://repositorio.unb.br/handle/10482/47830
identifier_str_mv SILVA, Eric Hans Messias da. Sumarização abstrativa de documentos longos utilizados em fiscalizações e instruções processuais. 2023. xiv, 87, 5 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2023.
url http://repositorio.unb.br/handle/10482/47830
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1839083767129440256