Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Goiás
|
| Programa de Pós-Graduação: |
Programa de Pós-graduação em Ciência da Computação (INF)
|
| Departamento: |
Instituto de Informática - INF (RMG)
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | http://repositorio.bc.ufg.br/tede/handle/tede/13908 |
Resumo: | The complexity of language used in legal documents, such as technical terms and legal jargon, hinders access to and understanding of the Brazilian justice system for laypeo ple. This work presents text simplification approaches and assesses the state-of-the-art by considering large language models with readability scoring as a parameter for simplification. Due to limited resources for text simplification in Portuguese, especially within the legal domain, the application of a methodology based on text modification using readability scoring enables experiments that leverage the knowledge acquired during the training of these large language models, while also allowing for automatic evaluation without the need for labeled data. This study evaluates the simplification capabilities of large language models by using eleven models as case studies. Additionally, a real corpus was developed, based on legal rulings from the Brazilian justice system. |
| id |
UFG-2_4b75d2ed45704dac72836335ca418ca6 |
|---|---|
| oai_identifier_str |
oai:repositorio.bc.ufg.br:tede/13908 |
| network_acronym_str |
UFG-2 |
| network_name_str |
Repositório Institucional da UFG |
| repository_id_str |
|
| spelling |
Camilo Junior, Celso Gonçalveshttp://lattes.cnpq.br/6776569904919279Camilo Júnior, Celso GonçalvesOliveira, Sávio Salvarino Teles deNaves, Eduardo Lázaro Martinshttp://lattes.cnpq.br/0777856410199750Paula, Antônio Flávio Castro Torres de2025-03-07T20:51:30Z2025-03-07T20:51:30Z2024-11-29PAULA, A. F. C. T. Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo. 2025. 52 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.http://repositorio.bc.ufg.br/tede/handle/tede/13908The complexity of language used in legal documents, such as technical terms and legal jargon, hinders access to and understanding of the Brazilian justice system for laypeo ple. This work presents text simplification approaches and assesses the state-of-the-art by considering large language models with readability scoring as a parameter for simplification. Due to limited resources for text simplification in Portuguese, especially within the legal domain, the application of a methodology based on text modification using readability scoring enables experiments that leverage the knowledge acquired during the training of these large language models, while also allowing for automatic evaluation without the need for labeled data. This study evaluates the simplification capabilities of large language models by using eleven models as case studies. Additionally, a real corpus was developed, based on legal rulings from the Brazilian justice system.A complexidade existente na linguagem utilizada em documentos jurídicos, tais como termos técnicos, jargões jurídicos, dificulta o acesso e entendimento de pessoas leigas à justiça brasileira. Este trabalho relata abordagens de simplificação de texto, e avalia o estado da arte considerando a utilização de modelos de linguagem grande, considerando uma pontuação de legibilidade como parâmetro para simplificação. Devido à limitação de recursos para simplificação de texto para o idioma português, e principalmente para o domínio jurídico, a aplicação de uma metodologia baseada na tarefa de modificação de texto por pontuação de legibilidade permite experimentos que utilizam o conhecimento adquirido durante o treinamento desses grandes modelos de linguagem, enquanto também permite a avaliação de forma automática, sem a necessidade de rotulação de dados. Este trabalho, avalia a capacidade de simplificação de modelos de linguagem grande, utilizando onze modelos como exemplos de estudo. Além disso, foi desenvolvido um corpus real, considerando documentos de decisões jurídicas da justiça brasileira.porUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RMG)http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessSimplificação Automática de TextoProcessamento de Linguagem NaturalModelos de linguagem grande (LLMs)Domínio JurídicoLíngua PortuguesaJustiça BrasileiraAutomatic Text SimplificationNatural Language ProcessingLarge Language Models (LLMs)Legal DomainPortuguese LanguageBrazilian JusticeCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOAvaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvoEvaluation of Large Language Models in the Text Simplification of Legal Rulings Using Readability Scores as a Targetinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/29412e14-bca6-4b3e-b074-2161a157211e/download8a4605be74aa9ea9d79846c1fba20a33MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/9c03b1cf-f614-4254-8832-07397136c609/download4460e5956bc1d1639be9ae6146a50347MD52ORIGINALDissertação - Antônio Flávio Castro Torres de Paula - 2025.pdfDissertação - Antônio Flávio Castro Torres de Paula - 2025.pdfapplication/pdf664617http://repositorio.bc.ufg.br/tede/bitstreams/5f04d28b-47e4-4a7c-8f8c-dca592317ce0/download3342e54f1a7eff1865fa8c8f0eb6afc7MD53tede/139082025-03-07 17:51:30.812http://creativecommons.org/licenses/by-nc-nd/4.0/Acesso Abertoopen.accessoai:repositorio.bc.ufg.br:tede/13908http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttps://repositorio.bc.ufg.br/tedeserver/oai/requestgrt.bc@ufg.bropendoar:oai:repositorio.bc.ufg.br:tede/12342025-03-07T20:51:30Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| dc.title.none.fl_str_mv |
Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo |
| dc.title.alternative.eng.fl_str_mv |
Evaluation of Large Language Models in the Text Simplification of Legal Rulings Using Readability Scores as a Target |
| title |
Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo |
| spellingShingle |
Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo Paula, Antônio Flávio Castro Torres de Simplificação Automática de Texto Processamento de Linguagem Natural Modelos de linguagem grande (LLMs) Domínio Jurídico Língua Portuguesa Justiça Brasileira Automatic Text Simplification Natural Language Processing Large Language Models (LLMs) Legal Domain Portuguese Language Brazilian Justice CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| title_short |
Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo |
| title_full |
Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo |
| title_fullStr |
Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo |
| title_full_unstemmed |
Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo |
| title_sort |
Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo |
| author |
Paula, Antônio Flávio Castro Torres de |
| author_facet |
Paula, Antônio Flávio Castro Torres de |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Camilo Junior, Celso Gonçalves |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6776569904919279 |
| dc.contributor.referee1.fl_str_mv |
Camilo Júnior, Celso Gonçalves |
| dc.contributor.referee2.fl_str_mv |
Oliveira, Sávio Salvarino Teles de |
| dc.contributor.referee3.fl_str_mv |
Naves, Eduardo Lázaro Martins |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/0777856410199750 |
| dc.contributor.author.fl_str_mv |
Paula, Antônio Flávio Castro Torres de |
| contributor_str_mv |
Camilo Junior, Celso Gonçalves Camilo Júnior, Celso Gonçalves Oliveira, Sávio Salvarino Teles de Naves, Eduardo Lázaro Martins |
| dc.subject.por.fl_str_mv |
Simplificação Automática de Texto Processamento de Linguagem Natural Modelos de linguagem grande (LLMs) Domínio Jurídico Língua Portuguesa Justiça Brasileira |
| topic |
Simplificação Automática de Texto Processamento de Linguagem Natural Modelos de linguagem grande (LLMs) Domínio Jurídico Língua Portuguesa Justiça Brasileira Automatic Text Simplification Natural Language Processing Large Language Models (LLMs) Legal Domain Portuguese Language Brazilian Justice CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Automatic Text Simplification Natural Language Processing Large Language Models (LLMs) Legal Domain Portuguese Language Brazilian Justice |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| description |
The complexity of language used in legal documents, such as technical terms and legal jargon, hinders access to and understanding of the Brazilian justice system for laypeo ple. This work presents text simplification approaches and assesses the state-of-the-art by considering large language models with readability scoring as a parameter for simplification. Due to limited resources for text simplification in Portuguese, especially within the legal domain, the application of a methodology based on text modification using readability scoring enables experiments that leverage the knowledge acquired during the training of these large language models, while also allowing for automatic evaluation without the need for labeled data. This study evaluates the simplification capabilities of large language models by using eleven models as case studies. Additionally, a real corpus was developed, based on legal rulings from the Brazilian justice system. |
| publishDate |
2024 |
| dc.date.issued.fl_str_mv |
2024-11-29 |
| dc.date.accessioned.fl_str_mv |
2025-03-07T20:51:30Z |
| dc.date.available.fl_str_mv |
2025-03-07T20:51:30Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
PAULA, A. F. C. T. Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo. 2025. 52 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024. |
| dc.identifier.uri.fl_str_mv |
http://repositorio.bc.ufg.br/tede/handle/tede/13908 |
| identifier_str_mv |
PAULA, A. F. C. T. Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo. 2025. 52 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024. |
| url |
http://repositorio.bc.ufg.br/tede/handle/tede/13908 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Goiás |
| dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Ciência da Computação (INF) |
| dc.publisher.initials.fl_str_mv |
UFG |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Instituto de Informática - INF (RMG) |
| publisher.none.fl_str_mv |
Universidade Federal de Goiás |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFG instname:Universidade Federal de Goiás (UFG) instacron:UFG |
| instname_str |
Universidade Federal de Goiás (UFG) |
| instacron_str |
UFG |
| institution |
UFG |
| reponame_str |
Repositório Institucional da UFG |
| collection |
Repositório Institucional da UFG |
| bitstream.url.fl_str_mv |
http://repositorio.bc.ufg.br/tede/bitstreams/29412e14-bca6-4b3e-b074-2161a157211e/download http://repositorio.bc.ufg.br/tede/bitstreams/9c03b1cf-f614-4254-8832-07397136c609/download http://repositorio.bc.ufg.br/tede/bitstreams/5f04d28b-47e4-4a7c-8f8c-dca592317ce0/download |
| bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 4460e5956bc1d1639be9ae6146a50347 3342e54f1a7eff1865fa8c8f0eb6afc7 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFG - Universidade Federal de Goiás (UFG) |
| repository.mail.fl_str_mv |
grt.bc@ufg.br |
| _version_ |
1861293798596804608 |