Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Paula, Antônio Flávio Castro Torres de lattes
Orientador(a): Camilo Junior, Celso Gonçalves lattes
Banca de defesa: Camilo Júnior, Celso Gonçalves, Oliveira, Sávio Salvarino Teles de, Naves, Eduardo Lázaro Martins
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Goiás
Programa de Pós-Graduação: Programa de Pós-graduação em Ciência da Computação (INF)
Departamento: Instituto de Informática - INF (RMG)
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.bc.ufg.br/tede/handle/tede/13908
Resumo: The complexity of language used in legal documents, such as technical terms and legal jargon, hinders access to and understanding of the Brazilian justice system for laypeo ple. This work presents text simplification approaches and assesses the state-of-the-art by considering large language models with readability scoring as a parameter for simplification. Due to limited resources for text simplification in Portuguese, especially within the legal domain, the application of a methodology based on text modification using readability scoring enables experiments that leverage the knowledge acquired during the training of these large language models, while also allowing for automatic evaluation without the need for labeled data. This study evaluates the simplification capabilities of large language models by using eleven models as case studies. Additionally, a real corpus was developed, based on legal rulings from the Brazilian justice system.
id UFG-2_4b75d2ed45704dac72836335ca418ca6
oai_identifier_str oai:repositorio.bc.ufg.br:tede/13908
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling Camilo Junior, Celso Gonçalveshttp://lattes.cnpq.br/6776569904919279Camilo Júnior, Celso GonçalvesOliveira, Sávio Salvarino Teles deNaves, Eduardo Lázaro Martinshttp://lattes.cnpq.br/0777856410199750Paula, Antônio Flávio Castro Torres de2025-03-07T20:51:30Z2025-03-07T20:51:30Z2024-11-29PAULA, A. F. C. T. Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo. 2025. 52 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.http://repositorio.bc.ufg.br/tede/handle/tede/13908The complexity of language used in legal documents, such as technical terms and legal jargon, hinders access to and understanding of the Brazilian justice system for laypeo ple. This work presents text simplification approaches and assesses the state-of-the-art by considering large language models with readability scoring as a parameter for simplification. Due to limited resources for text simplification in Portuguese, especially within the legal domain, the application of a methodology based on text modification using readability scoring enables experiments that leverage the knowledge acquired during the training of these large language models, while also allowing for automatic evaluation without the need for labeled data. This study evaluates the simplification capabilities of large language models by using eleven models as case studies. Additionally, a real corpus was developed, based on legal rulings from the Brazilian justice system.A complexidade existente na linguagem utilizada em documentos jurídicos, tais como termos técnicos, jargões jurídicos, dificulta o acesso e entendimento de pessoas leigas à justiça brasileira. Este trabalho relata abordagens de simplificação de texto, e avalia o estado da arte considerando a utilização de modelos de linguagem grande, considerando uma pontuação de legibilidade como parâmetro para simplificação. Devido à limitação de recursos para simplificação de texto para o idioma português, e principalmente para o domínio jurídico, a aplicação de uma metodologia baseada na tarefa de modificação de texto por pontuação de legibilidade permite experimentos que utilizam o conhecimento adquirido durante o treinamento desses grandes modelos de linguagem, enquanto também permite a avaliação de forma automática, sem a necessidade de rotulação de dados. Este trabalho, avalia a capacidade de simplificação de modelos de linguagem grande, utilizando onze modelos como exemplos de estudo. Além disso, foi desenvolvido um corpus real, considerando documentos de decisões jurídicas da justiça brasileira.porUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RMG)http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessSimplificação Automática de TextoProcessamento de Linguagem NaturalModelos de linguagem grande (LLMs)Domínio JurídicoLíngua PortuguesaJustiça BrasileiraAutomatic Text SimplificationNatural Language ProcessingLarge Language Models (LLMs)Legal DomainPortuguese LanguageBrazilian JusticeCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOAvaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvoEvaluation of Large Language Models in the Text Simplification of Legal Rulings Using Readability Scores as a Targetinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/29412e14-bca6-4b3e-b074-2161a157211e/download8a4605be74aa9ea9d79846c1fba20a33MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/9c03b1cf-f614-4254-8832-07397136c609/download4460e5956bc1d1639be9ae6146a50347MD52ORIGINALDissertação - Antônio Flávio Castro Torres de Paula - 2025.pdfDissertação - Antônio Flávio Castro Torres de Paula - 2025.pdfapplication/pdf664617http://repositorio.bc.ufg.br/tede/bitstreams/5f04d28b-47e4-4a7c-8f8c-dca592317ce0/download3342e54f1a7eff1865fa8c8f0eb6afc7MD53tede/139082025-03-07 17:51:30.812http://creativecommons.org/licenses/by-nc-nd/4.0/Acesso Abertoopen.accessoai:repositorio.bc.ufg.br:tede/13908http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttps://repositorio.bc.ufg.br/tedeserver/oai/requestgrt.bc@ufg.bropendoar:oai:repositorio.bc.ufg.br:tede/12342025-03-07T20:51:30Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
dc.title.none.fl_str_mv Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo
dc.title.alternative.eng.fl_str_mv Evaluation of Large Language Models in the Text Simplification of Legal Rulings Using Readability Scores as a Target
title Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo
spellingShingle Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo
Paula, Antônio Flávio Castro Torres de
Simplificação Automática de Texto
Processamento de Linguagem Natural
Modelos de linguagem grande (LLMs)
Domínio Jurídico
Língua Portuguesa
Justiça Brasileira
Automatic Text Simplification
Natural Language Processing
Large Language Models (LLMs)
Legal Domain
Portuguese Language
Brazilian Justice
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo
title_full Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo
title_fullStr Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo
title_full_unstemmed Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo
title_sort Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo
author Paula, Antônio Flávio Castro Torres de
author_facet Paula, Antônio Flávio Castro Torres de
author_role author
dc.contributor.advisor1.fl_str_mv Camilo Junior, Celso Gonçalves
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6776569904919279
dc.contributor.referee1.fl_str_mv Camilo Júnior, Celso Gonçalves
dc.contributor.referee2.fl_str_mv Oliveira, Sávio Salvarino Teles de
dc.contributor.referee3.fl_str_mv Naves, Eduardo Lázaro Martins
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0777856410199750
dc.contributor.author.fl_str_mv Paula, Antônio Flávio Castro Torres de
contributor_str_mv Camilo Junior, Celso Gonçalves
Camilo Júnior, Celso Gonçalves
Oliveira, Sávio Salvarino Teles de
Naves, Eduardo Lázaro Martins
dc.subject.por.fl_str_mv Simplificação Automática de Texto
Processamento de Linguagem Natural
Modelos de linguagem grande (LLMs)
Domínio Jurídico
Língua Portuguesa
Justiça Brasileira
topic Simplificação Automática de Texto
Processamento de Linguagem Natural
Modelos de linguagem grande (LLMs)
Domínio Jurídico
Língua Portuguesa
Justiça Brasileira
Automatic Text Simplification
Natural Language Processing
Large Language Models (LLMs)
Legal Domain
Portuguese Language
Brazilian Justice
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Automatic Text Simplification
Natural Language Processing
Large Language Models (LLMs)
Legal Domain
Portuguese Language
Brazilian Justice
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description The complexity of language used in legal documents, such as technical terms and legal jargon, hinders access to and understanding of the Brazilian justice system for laypeo ple. This work presents text simplification approaches and assesses the state-of-the-art by considering large language models with readability scoring as a parameter for simplification. Due to limited resources for text simplification in Portuguese, especially within the legal domain, the application of a methodology based on text modification using readability scoring enables experiments that leverage the knowledge acquired during the training of these large language models, while also allowing for automatic evaluation without the need for labeled data. This study evaluates the simplification capabilities of large language models by using eleven models as case studies. Additionally, a real corpus was developed, based on legal rulings from the Brazilian justice system.
publishDate 2024
dc.date.issued.fl_str_mv 2024-11-29
dc.date.accessioned.fl_str_mv 2025-03-07T20:51:30Z
dc.date.available.fl_str_mv 2025-03-07T20:51:30Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PAULA, A. F. C. T. Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo. 2025. 52 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tede/13908
identifier_str_mv PAULA, A. F. C. T. Avaliação de grandes modelos de linguagem na simplificação de texto de decisões jurídicas utilizando pontuações de legibilidade como alvo. 2025. 52 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.
url http://repositorio.bc.ufg.br/tede/handle/tede/13908
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação (INF)
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Informática - INF (RMG)
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/29412e14-bca6-4b3e-b074-2161a157211e/download
http://repositorio.bc.ufg.br/tede/bitstreams/9c03b1cf-f614-4254-8832-07397136c609/download
http://repositorio.bc.ufg.br/tede/bitstreams/5f04d28b-47e4-4a7c-8f8c-dca592317ce0/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
4460e5956bc1d1639be9ae6146a50347
3342e54f1a7eff1865fa8c8f0eb6afc7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv grt.bc@ufg.br
_version_ 1861293798596804608