Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Presa, João Paulo Cavalcante lattes
Orientador(a): Camilo Junior, Celso Gonçalves lattes
Banca de defesa: Camilo Júnior, Celso Gonçalves, Oliveira, Sávio Salvarino Teles de, Silva , Nádia Felix Felipe da, Leite, Karla Tereza Figueiredo
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
dARK ID: ark:/38995/001300000gchh
Idioma: por
Instituição de defesa: Universidade Federal de Goiás
Programa de Pós-Graduação: Programa de Pós-graduação em Ciência da Computação (INF)
Departamento: Instituto de Informática - INF (RMG)
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.bc.ufg.br/tede/handle/tede/13871
Resumo: Tax law is essential for regulating relationships between the State and taxpayers, being crucial for tax collection and maintaining public functions. The complexity and constant evolution of tax laws make their interpretation an ongoing challenge for legal professionals. Although Natural Language Processing (NLP) has become a promising technology in the legal field, its application in brazilian tax law, especially for legal entities, remains a relatively unexplored area. This work evaluates the use of Large Language Models (LLMs) in Brazilian tax law covering federal tax aspects, analyzing their ability to process questions and generate answers in Portuguese for legal entities’ queries. For this purpose, we built an original dataset composed of real questions and answers provided by experts, allowing us to evaluate the ability of both proprietary and open-source LLMs to generate legally valid answers. The research uses quantitative and qualitative metrics to measure the accuracy and relevance of generated answers, capturing aspects of legal reasoning and semantic coherence. As contributions, this work presents a dataset specific to the tax law domain, a detailed evaluation of different LLMs’ performance in legal reasoning tasks, and an evaluation approach that combines quantitative and qualitative metrics, thus advancing the application of artificial intelligence in the analysis of tax laws and regulations.
id UFG-2_9f3ddf61114a9748facccbc2f6abcfe3
oai_identifier_str oai:repositorio.bc.ufg.br:tede/13871
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling Camilo Junior, Celso Gonçalveshttp://lattes.cnpq.br/6776569904919279Oliveira, Sávio Salvarino Teles dehttp://lattes.cnpq.br/1905829499839846Camilo Júnior, Celso GonçalvesOliveira, Sávio Salvarino Teles deSilva , Nádia Felix Felipe daLeite, Karla Tereza Figueiredohttps://lattes.cnpq.br/5092666506514753Presa, João Paulo Cavalcante2025-02-18T15:26:05Z2025-02-18T15:26:05Z2024-11-22PRESA, J. P. C. o. Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário. 2024. 76 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.http://repositorio.bc.ufg.br/tede/handle/tede/13871ark:/38995/001300000gchhTax law is essential for regulating relationships between the State and taxpayers, being crucial for tax collection and maintaining public functions. The complexity and constant evolution of tax laws make their interpretation an ongoing challenge for legal professionals. Although Natural Language Processing (NLP) has become a promising technology in the legal field, its application in brazilian tax law, especially for legal entities, remains a relatively unexplored area. This work evaluates the use of Large Language Models (LLMs) in Brazilian tax law covering federal tax aspects, analyzing their ability to process questions and generate answers in Portuguese for legal entities’ queries. For this purpose, we built an original dataset composed of real questions and answers provided by experts, allowing us to evaluate the ability of both proprietary and open-source LLMs to generate legally valid answers. The research uses quantitative and qualitative metrics to measure the accuracy and relevance of generated answers, capturing aspects of legal reasoning and semantic coherence. As contributions, this work presents a dataset specific to the tax law domain, a detailed evaluation of different LLMs’ performance in legal reasoning tasks, and an evaluation approach that combines quantitative and qualitative metrics, thus advancing the application of artificial intelligence in the analysis of tax laws and regulations.O direito tributário é fundamental para a regulação das relações entre Estado e contribuintes, sendo essencial para a arrecadação de tributos e manutenção das funções públicas. A complexidade e constante evolução das legislações tributárias tornam sua interpretação um desafio contínuo para os operadores do direito. Embora o Processamento de Linguagem Natural (PLN) tenha se consolidado como uma tecnologia promissora no campo jurídico, sua aplicação no contexto do direito tributário brasileiro, especialmente para entidades jurídicas, permanece uma área relativamente inexplorada. Este trabalho avalia o uso de Grandes Modelos de Linguagem (LLMs) no direito tributário brasileiro da União, analisando sua capacidade de processar perguntas e gerar respostas em português para consultas de pessoas jurídicas. Para isso, foi construído um conjunto de dados original composto por perguntas reais e respostas fornecidas por especialistas, permitindo avaliar a capacidade dos LLMs, tanto proprietário quanto de código aberto, de gerar respostas juridicamente válidas. A pesquisa utiliza métricas quantitativas e qualitativas para medir a acurácia e relevância das respostas geradas, capturando aspectos do raciocínio jurídico e da coerência semântica. Como contribuições, o trabalho apresenta um conjunto de dados específico para o domínio do direito tributário, uma avaliação detalhada do desempenho de diferentes LLMs na tarefa de raciocínio jurídico e uma abordagem de avaliação que integra métricas quantitativas e qualitativas, promovendo assim o avanço da aplicação da inteligência artificial na análise de leis e regulamentos tributários.porUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RMG)Attribution-NonCommercial-NoDerivatives 4.0 Internationalinfo:eu-repo/semantics/openAccessDireito TributárioRaciocínio JurídicoGrandes Modelos de Linguagem (LLM)Processamento de Linguagem NaturalTax LawLegal ReasoningLarge Language Models (LLMs)Natural Language ProcessingCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOAvaliação de Grandes Modelos de Linguagem para Raciocínio em Direito TributárioEvaluating Large Language Models for Tax Law Reasoninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGORIGINALDissertação - João Paulo Cavalcante Presa - 2024.pdfDissertação - João Paulo Cavalcante Presa - 2024.pdfapplication/pdf647056http://repositorio.bc.ufg.br/tede/bitstreams/2713668f-a6ad-46ea-949a-659e418fb988/downloade898c098a715ffc8b30769baba1a12d2MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/3baaf77e-d224-46b6-8615-1bfe0d68cc89/download8a4605be74aa9ea9d79846c1fba20a33MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/32da327d-6f2a-4587-b65c-97b8b253dd80/download4460e5956bc1d1639be9ae6146a50347MD53tede/138712025-02-18 12:26:15.298http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accessoai:repositorio.bc.ufg.br:tede/13871http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttps://repositorio.bc.ufg.br/tedeserver/oai/requestgrt.bc@ufg.bropendoar:oai:repositorio.bc.ufg.br:tede/12342025-02-18T15:26:15Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
dc.title.none.fl_str_mv Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário
dc.title.alternative.eng.fl_str_mv Evaluating Large Language Models for Tax Law Reasoning
title Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário
spellingShingle Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário
Presa, João Paulo Cavalcante
Direito Tributário
Raciocínio Jurídico
Grandes Modelos de Linguagem (LLM)
Processamento de Linguagem Natural
Tax Law
Legal Reasoning
Large Language Models (LLMs)
Natural Language Processing
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
title_short Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário
title_full Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário
title_fullStr Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário
title_full_unstemmed Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário
title_sort Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário
author Presa, João Paulo Cavalcante
author_facet Presa, João Paulo Cavalcante
author_role author
dc.contributor.advisor1.fl_str_mv Camilo Junior, Celso Gonçalves
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6776569904919279
dc.contributor.advisor-co1.fl_str_mv Oliveira, Sávio Salvarino Teles de
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/1905829499839846
dc.contributor.referee1.fl_str_mv Camilo Júnior, Celso Gonçalves
dc.contributor.referee2.fl_str_mv Oliveira, Sávio Salvarino Teles de
dc.contributor.referee3.fl_str_mv Silva , Nádia Felix Felipe da
dc.contributor.referee4.fl_str_mv Leite, Karla Tereza Figueiredo
dc.contributor.authorLattes.fl_str_mv https://lattes.cnpq.br/5092666506514753
dc.contributor.author.fl_str_mv Presa, João Paulo Cavalcante
contributor_str_mv Camilo Junior, Celso Gonçalves
Oliveira, Sávio Salvarino Teles de
Camilo Júnior, Celso Gonçalves
Oliveira, Sávio Salvarino Teles de
Silva , Nádia Felix Felipe da
Leite, Karla Tereza Figueiredo
dc.subject.por.fl_str_mv Direito Tributário
Raciocínio Jurídico
Grandes Modelos de Linguagem (LLM)
Processamento de Linguagem Natural
topic Direito Tributário
Raciocínio Jurídico
Grandes Modelos de Linguagem (LLM)
Processamento de Linguagem Natural
Tax Law
Legal Reasoning
Large Language Models (LLMs)
Natural Language Processing
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
dc.subject.eng.fl_str_mv Tax Law
Legal Reasoning
Large Language Models (LLMs)
Natural Language Processing
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
description Tax law is essential for regulating relationships between the State and taxpayers, being crucial for tax collection and maintaining public functions. The complexity and constant evolution of tax laws make their interpretation an ongoing challenge for legal professionals. Although Natural Language Processing (NLP) has become a promising technology in the legal field, its application in brazilian tax law, especially for legal entities, remains a relatively unexplored area. This work evaluates the use of Large Language Models (LLMs) in Brazilian tax law covering federal tax aspects, analyzing their ability to process questions and generate answers in Portuguese for legal entities’ queries. For this purpose, we built an original dataset composed of real questions and answers provided by experts, allowing us to evaluate the ability of both proprietary and open-source LLMs to generate legally valid answers. The research uses quantitative and qualitative metrics to measure the accuracy and relevance of generated answers, capturing aspects of legal reasoning and semantic coherence. As contributions, this work presents a dataset specific to the tax law domain, a detailed evaluation of different LLMs’ performance in legal reasoning tasks, and an evaluation approach that combines quantitative and qualitative metrics, thus advancing the application of artificial intelligence in the analysis of tax laws and regulations.
publishDate 2024
dc.date.issued.fl_str_mv 2024-11-22
dc.date.accessioned.fl_str_mv 2025-02-18T15:26:05Z
dc.date.available.fl_str_mv 2025-02-18T15:26:05Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PRESA, J. P. C. o. Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário. 2024. 76 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tede/13871
dc.identifier.dark.fl_str_mv ark:/38995/001300000gchh
identifier_str_mv PRESA, J. P. C. o. Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário. 2024. 76 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.
ark:/38995/001300000gchh
url http://repositorio.bc.ufg.br/tede/handle/tede/13871
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação (INF)
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Informática - INF (RMG)
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/2713668f-a6ad-46ea-949a-659e418fb988/download
http://repositorio.bc.ufg.br/tede/bitstreams/3baaf77e-d224-46b6-8615-1bfe0d68cc89/download
http://repositorio.bc.ufg.br/tede/bitstreams/32da327d-6f2a-4587-b65c-97b8b253dd80/download
bitstream.checksum.fl_str_mv e898c098a715ffc8b30769baba1a12d2
8a4605be74aa9ea9d79846c1fba20a33
4460e5956bc1d1639be9ae6146a50347
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv grt.bc@ufg.br
_version_ 1846536705627127808