Inferência de similaridade de sentenças judiciais na Justiça do Trabalho
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.unb.br/handle/10482/43690 |
Resumo: | Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Brasília, 2021. |
| id |
UNB_6467cc2a8bc2170bbf3c7b8c8342b11a |
|---|---|
| oai_identifier_str |
oai:repositorio.unb.br:10482/43690 |
| network_acronym_str |
UNB |
| network_name_str |
Repositório Institucional da UnB |
| repository_id_str |
|
| spelling |
Inferência de similaridade de sentenças judiciais na Justiça do TrabalhoRecuperação de informaçãoSimilaridade de documentosDocumentos jurídicosDissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Brasília, 2021.Esse trabalho propõe um aperfeiçoamento da funcionalidade de minutar e analisar sentenças do sistema Processo Judicial Eletrônico (PJe) da Justiça do Trabalho permitindo ao magistrado uma pesquisa mais refinada de sentenças similares demonstrando, inclusive, o percentual de similaridade das sentenças encontradas com o processo em questão. Para viabilizar a pesquisa são utilizadas técnicas de mineração de texto para identificar similaridades de sentenças na Justiça do Trabalho. Inicialmente, a performance de modelos induzidos via técnica sintáticas e modelos induzidos via técnicas semânticas é avaliada. Para avaliação são considerados três algoritmos: LDA, Doc2Vec e BM25. Os algoritmos são treinados e avaliados com as sentenças do Tribunal Regional do Trabalho da 10ª Região. Baseado nas métricas de P@K e nDCG, o algoritmo BM25 apresentou o melhor desempenho se comparado aos outros algoritmos de análise sintática e, também, de análise semântica. Para a avaliação, foram escolhidos cinco temas do Direito do Trabalho e para cada tema foram elaboradas duas queries de pesquisa. As queries foram submetidas aos modelos e posteriormente as primeiras 25 sentenças de maior similaridade encontradas foram avaliadas por especialista de negócio levando em consideração a sua relevância. Nesse experimento o BM25 teve 0.8019 como média para índice nDCG, um resultado quase 20% superior ao segundo colocado (LDA250). Após a avaliação, o modelo que usa o BM25 foi integrado a funcionalidade de minutar e analisar sentenças do Processo Judicial Eletrônico (PJe) permitindo aos usuários identificarem de forma fácil quais são as sentenças similares do caso em questão. A solução proposta é uma alternativa de pesquisa durante a elaboração de uma nova sentença permitindo o reaproveitamento de algum texto já desenvolvido em um caso similar anterior, se assim o magistrado desejar.This work proposes an improvement in the functionality of drafting and analyzing sentences of the Electronic Judicial Process (PJe) system of the Labor Court, allowing the magistrate a more refined search for similar sentences, even demonstrating the percentage of similarity of the sentences found with the process in question . To make the research feasible, text mining techniques are used to identify similarities of sentences in the Labor Court. Initially, the performance of models induced via syntactic techniques and models induced via semantic techniques is evaluated. Three algorithms are considered for evaluation: LDA, Doc2Vec and BM25. The algorithms are trained and evaluated with the judgments of the Regional Labor Court of the 10th Region. Based on P@K and nDCG metrics, the BM25 algorithm showed the best performance when compared to other parsing and semantic analysis algorithms. For the evaluation, five themes were chosen and for each theme two research queries were elaborated. The queries were submitted to the models and the first 25 sentences with the greatest similarity found were evaluated by a business expert taking into account their relevance. In this experiment, the BM25 had 0.8019 as an average for the nDCG index, a result 20% higher than the second place (LDA250). After the evaluation, the model that uses the BM25 was integrated with the functionality to draft and analyze sentences of the Electronic Judicial Process (PJe) allowing users to easily identify which are the similar sentences in the case in question. The proposed solution is a research alternative during the elaboration of a new sentence, allowing the reuse of some text already developed in a previous similar case, if desired by the magistrate.Instituto de Ciências Exatas (IE)Departamento de Ciência da Computação (IE CIC)Programa de Pós-Graduação em Computação Aplicada, Mestrado ProfissionalLadeira, MarceloBispo, Guilherme Dantas2022-05-12T17:54:49Z2022-05-12T17:54:49Z2022-05-122021-12-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfBISPO, Guilherme Dantas. Inferência de similaridade de sentenças judiciais na Justiça do Trabalho. 2021. xiii, 57 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2021.https://repositorio.unb.br/handle/10482/43690porA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2025-03-19T16:09:58Zoai:repositorio.unb.br:10482/43690Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2025-03-19T16:09:58Repositório Institucional da UnB - Universidade de Brasília (UnB)false |
| dc.title.none.fl_str_mv |
Inferência de similaridade de sentenças judiciais na Justiça do Trabalho |
| title |
Inferência de similaridade de sentenças judiciais na Justiça do Trabalho |
| spellingShingle |
Inferência de similaridade de sentenças judiciais na Justiça do Trabalho Bispo, Guilherme Dantas Recuperação de informação Similaridade de documentos Documentos jurídicos |
| title_short |
Inferência de similaridade de sentenças judiciais na Justiça do Trabalho |
| title_full |
Inferência de similaridade de sentenças judiciais na Justiça do Trabalho |
| title_fullStr |
Inferência de similaridade de sentenças judiciais na Justiça do Trabalho |
| title_full_unstemmed |
Inferência de similaridade de sentenças judiciais na Justiça do Trabalho |
| title_sort |
Inferência de similaridade de sentenças judiciais na Justiça do Trabalho |
| author |
Bispo, Guilherme Dantas |
| author_facet |
Bispo, Guilherme Dantas |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Ladeira, Marcelo |
| dc.contributor.author.fl_str_mv |
Bispo, Guilherme Dantas |
| dc.subject.por.fl_str_mv |
Recuperação de informação Similaridade de documentos Documentos jurídicos |
| topic |
Recuperação de informação Similaridade de documentos Documentos jurídicos |
| description |
Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Brasília, 2021. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021-12-15 2022-05-12T17:54:49Z 2022-05-12T17:54:49Z 2022-05-12 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
BISPO, Guilherme Dantas. Inferência de similaridade de sentenças judiciais na Justiça do Trabalho. 2021. xiii, 57 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2021. https://repositorio.unb.br/handle/10482/43690 |
| identifier_str_mv |
BISPO, Guilherme Dantas. Inferência de similaridade de sentenças judiciais na Justiça do Trabalho. 2021. xiii, 57 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2021. |
| url |
https://repositorio.unb.br/handle/10482/43690 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
| instname_str |
Universidade de Brasília (UnB) |
| instacron_str |
UNB |
| institution |
UNB |
| reponame_str |
Repositório Institucional da UnB |
| collection |
Repositório Institucional da UnB |
| repository.name.fl_str_mv |
Repositório Institucional da UnB - Universidade de Brasília (UnB) |
| repository.mail.fl_str_mv |
repositorio@unb.br |
| _version_ |
1839083777619394560 |