Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , , |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| dARK ID: | ark:/38995/001300000gchh |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Goiás
|
| Programa de Pós-Graduação: |
Programa de Pós-graduação em Ciência da Computação (INF)
|
| Departamento: |
Instituto de Informática - INF (RMG)
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | http://repositorio.bc.ufg.br/tede/handle/tede/13871 |
Resumo: | Tax law is essential for regulating relationships between the State and taxpayers, being crucial for tax collection and maintaining public functions. The complexity and constant evolution of tax laws make their interpretation an ongoing challenge for legal professionals. Although Natural Language Processing (NLP) has become a promising technology in the legal field, its application in brazilian tax law, especially for legal entities, remains a relatively unexplored area. This work evaluates the use of Large Language Models (LLMs) in Brazilian tax law covering federal tax aspects, analyzing their ability to process questions and generate answers in Portuguese for legal entities’ queries. For this purpose, we built an original dataset composed of real questions and answers provided by experts, allowing us to evaluate the ability of both proprietary and open-source LLMs to generate legally valid answers. The research uses quantitative and qualitative metrics to measure the accuracy and relevance of generated answers, capturing aspects of legal reasoning and semantic coherence. As contributions, this work presents a dataset specific to the tax law domain, a detailed evaluation of different LLMs’ performance in legal reasoning tasks, and an evaluation approach that combines quantitative and qualitative metrics, thus advancing the application of artificial intelligence in the analysis of tax laws and regulations. |
| id |
UFG-2_9f3ddf61114a9748facccbc2f6abcfe3 |
|---|---|
| oai_identifier_str |
oai:repositorio.bc.ufg.br:tede/13871 |
| network_acronym_str |
UFG-2 |
| network_name_str |
Repositório Institucional da UFG |
| repository_id_str |
|
| spelling |
Camilo Junior, Celso Gonçalveshttp://lattes.cnpq.br/6776569904919279Oliveira, Sávio Salvarino Teles dehttp://lattes.cnpq.br/1905829499839846Camilo Júnior, Celso GonçalvesOliveira, Sávio Salvarino Teles deSilva , Nádia Felix Felipe daLeite, Karla Tereza Figueiredohttps://lattes.cnpq.br/5092666506514753Presa, João Paulo Cavalcante2025-02-18T15:26:05Z2025-02-18T15:26:05Z2024-11-22PRESA, J. P. C. o. Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário. 2024. 76 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024.http://repositorio.bc.ufg.br/tede/handle/tede/13871ark:/38995/001300000gchhTax law is essential for regulating relationships between the State and taxpayers, being crucial for tax collection and maintaining public functions. The complexity and constant evolution of tax laws make their interpretation an ongoing challenge for legal professionals. Although Natural Language Processing (NLP) has become a promising technology in the legal field, its application in brazilian tax law, especially for legal entities, remains a relatively unexplored area. This work evaluates the use of Large Language Models (LLMs) in Brazilian tax law covering federal tax aspects, analyzing their ability to process questions and generate answers in Portuguese for legal entities’ queries. For this purpose, we built an original dataset composed of real questions and answers provided by experts, allowing us to evaluate the ability of both proprietary and open-source LLMs to generate legally valid answers. The research uses quantitative and qualitative metrics to measure the accuracy and relevance of generated answers, capturing aspects of legal reasoning and semantic coherence. As contributions, this work presents a dataset specific to the tax law domain, a detailed evaluation of different LLMs’ performance in legal reasoning tasks, and an evaluation approach that combines quantitative and qualitative metrics, thus advancing the application of artificial intelligence in the analysis of tax laws and regulations.O direito tributário é fundamental para a regulação das relações entre Estado e contribuintes, sendo essencial para a arrecadação de tributos e manutenção das funções públicas. A complexidade e constante evolução das legislações tributárias tornam sua interpretação um desafio contínuo para os operadores do direito. Embora o Processamento de Linguagem Natural (PLN) tenha se consolidado como uma tecnologia promissora no campo jurídico, sua aplicação no contexto do direito tributário brasileiro, especialmente para entidades jurídicas, permanece uma área relativamente inexplorada. Este trabalho avalia o uso de Grandes Modelos de Linguagem (LLMs) no direito tributário brasileiro da União, analisando sua capacidade de processar perguntas e gerar respostas em português para consultas de pessoas jurídicas. Para isso, foi construído um conjunto de dados original composto por perguntas reais e respostas fornecidas por especialistas, permitindo avaliar a capacidade dos LLMs, tanto proprietário quanto de código aberto, de gerar respostas juridicamente válidas. A pesquisa utiliza métricas quantitativas e qualitativas para medir a acurácia e relevância das respostas geradas, capturando aspectos do raciocínio jurídico e da coerência semântica. Como contribuições, o trabalho apresenta um conjunto de dados específico para o domínio do direito tributário, uma avaliação detalhada do desempenho de diferentes LLMs na tarefa de raciocínio jurídico e uma abordagem de avaliação que integra métricas quantitativas e qualitativas, promovendo assim o avanço da aplicação da inteligência artificial na análise de leis e regulamentos tributários.porUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RMG)Attribution-NonCommercial-NoDerivatives 4.0 Internationalinfo:eu-repo/semantics/openAccessDireito TributárioRaciocínio JurídicoGrandes Modelos de Linguagem (LLM)Processamento de Linguagem NaturalTax LawLegal ReasoningLarge Language Models (LLMs)Natural Language ProcessingCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOAvaliação de Grandes Modelos de Linguagem para Raciocínio em Direito TributárioEvaluating Large Language Models for Tax Law Reasoninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGORIGINALDissertação - João Paulo Cavalcante Presa - 2024.pdfDissertação - João Paulo Cavalcante Presa - 2024.pdfapplication/pdf647056http://repositorio.bc.ufg.br/tede/bitstreams/2713668f-a6ad-46ea-949a-659e418fb988/downloade898c098a715ffc8b30769baba1a12d2MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/3baaf77e-d224-46b6-8615-1bfe0d68cc89/download8a4605be74aa9ea9d79846c1fba20a33MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/32da327d-6f2a-4587-b65c-97b8b253dd80/download4460e5956bc1d1639be9ae6146a50347MD53tede/138712025-02-18 12:26:15.298http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accessoai:repositorio.bc.ufg.br:tede/13871http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttps://repositorio.bc.ufg.br/tedeserver/oai/requestgrt.bc@ufg.bropendoar:oai:repositorio.bc.ufg.br:tede/12342025-02-18T15:26:15Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| dc.title.none.fl_str_mv |
Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário |
| dc.title.alternative.eng.fl_str_mv |
Evaluating Large Language Models for Tax Law Reasoning |
| title |
Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário |
| spellingShingle |
Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário Presa, João Paulo Cavalcante Direito Tributário Raciocínio Jurídico Grandes Modelos de Linguagem (LLM) Processamento de Linguagem Natural Tax Law Legal Reasoning Large Language Models (LLMs) Natural Language Processing CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
| title_short |
Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário |
| title_full |
Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário |
| title_fullStr |
Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário |
| title_full_unstemmed |
Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário |
| title_sort |
Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário |
| author |
Presa, João Paulo Cavalcante |
| author_facet |
Presa, João Paulo Cavalcante |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Camilo Junior, Celso Gonçalves |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6776569904919279 |
| dc.contributor.advisor-co1.fl_str_mv |
Oliveira, Sávio Salvarino Teles de |
| dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/1905829499839846 |
| dc.contributor.referee1.fl_str_mv |
Camilo Júnior, Celso Gonçalves |
| dc.contributor.referee2.fl_str_mv |
Oliveira, Sávio Salvarino Teles de |
| dc.contributor.referee3.fl_str_mv |
Silva , Nádia Felix Felipe da |
| dc.contributor.referee4.fl_str_mv |
Leite, Karla Tereza Figueiredo |
| dc.contributor.authorLattes.fl_str_mv |
https://lattes.cnpq.br/5092666506514753 |
| dc.contributor.author.fl_str_mv |
Presa, João Paulo Cavalcante |
| contributor_str_mv |
Camilo Junior, Celso Gonçalves Oliveira, Sávio Salvarino Teles de Camilo Júnior, Celso Gonçalves Oliveira, Sávio Salvarino Teles de Silva , Nádia Felix Felipe da Leite, Karla Tereza Figueiredo |
| dc.subject.por.fl_str_mv |
Direito Tributário Raciocínio Jurídico Grandes Modelos de Linguagem (LLM) Processamento de Linguagem Natural |
| topic |
Direito Tributário Raciocínio Jurídico Grandes Modelos de Linguagem (LLM) Processamento de Linguagem Natural Tax Law Legal Reasoning Large Language Models (LLMs) Natural Language Processing CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Tax Law Legal Reasoning Large Language Models (LLMs) Natural Language Processing |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
| description |
Tax law is essential for regulating relationships between the State and taxpayers, being crucial for tax collection and maintaining public functions. The complexity and constant evolution of tax laws make their interpretation an ongoing challenge for legal professionals. Although Natural Language Processing (NLP) has become a promising technology in the legal field, its application in brazilian tax law, especially for legal entities, remains a relatively unexplored area. This work evaluates the use of Large Language Models (LLMs) in Brazilian tax law covering federal tax aspects, analyzing their ability to process questions and generate answers in Portuguese for legal entities’ queries. For this purpose, we built an original dataset composed of real questions and answers provided by experts, allowing us to evaluate the ability of both proprietary and open-source LLMs to generate legally valid answers. The research uses quantitative and qualitative metrics to measure the accuracy and relevance of generated answers, capturing aspects of legal reasoning and semantic coherence. As contributions, this work presents a dataset specific to the tax law domain, a detailed evaluation of different LLMs’ performance in legal reasoning tasks, and an evaluation approach that combines quantitative and qualitative metrics, thus advancing the application of artificial intelligence in the analysis of tax laws and regulations. |
| publishDate |
2024 |
| dc.date.issued.fl_str_mv |
2024-11-22 |
| dc.date.accessioned.fl_str_mv |
2025-02-18T15:26:05Z |
| dc.date.available.fl_str_mv |
2025-02-18T15:26:05Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
PRESA, J. P. C. o. Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário. 2024. 76 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024. |
| dc.identifier.uri.fl_str_mv |
http://repositorio.bc.ufg.br/tede/handle/tede/13871 |
| dc.identifier.dark.fl_str_mv |
ark:/38995/001300000gchh |
| identifier_str_mv |
PRESA, J. P. C. o. Avaliação de Grandes Modelos de Linguagem para Raciocínio em Direito Tributário. 2024. 76 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2024. ark:/38995/001300000gchh |
| url |
http://repositorio.bc.ufg.br/tede/handle/tede/13871 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Goiás |
| dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Ciência da Computação (INF) |
| dc.publisher.initials.fl_str_mv |
UFG |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Instituto de Informática - INF (RMG) |
| publisher.none.fl_str_mv |
Universidade Federal de Goiás |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFG instname:Universidade Federal de Goiás (UFG) instacron:UFG |
| instname_str |
Universidade Federal de Goiás (UFG) |
| instacron_str |
UFG |
| institution |
UFG |
| reponame_str |
Repositório Institucional da UFG |
| collection |
Repositório Institucional da UFG |
| bitstream.url.fl_str_mv |
http://repositorio.bc.ufg.br/tede/bitstreams/2713668f-a6ad-46ea-949a-659e418fb988/download http://repositorio.bc.ufg.br/tede/bitstreams/3baaf77e-d224-46b6-8615-1bfe0d68cc89/download http://repositorio.bc.ufg.br/tede/bitstreams/32da327d-6f2a-4587-b65c-97b8b253dd80/download |
| bitstream.checksum.fl_str_mv |
e898c098a715ffc8b30769baba1a12d2 8a4605be74aa9ea9d79846c1fba20a33 4460e5956bc1d1639be9ae6146a50347 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFG - Universidade Federal de Goiás (UFG) |
| repository.mail.fl_str_mv |
grt.bc@ufg.br |
| _version_ |
1846536705627127808 |