Um estudo da representação de documentos jurídicos em espaços métricos

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Machado, Gustavo Menezes
Orientador(a): Montalvão Filho, Jugurta Rosa
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Pós-Graduação em Ciência da Computação
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://ri.ufs.br/jspui/handle/riufs/14553
Resumo: Dozens of decisions are made daily from interpretations of the laws made by courts across the country. This set of similar decisions on the same subject is known as jurisprudence and serves as the basis for future judgments and arguments. In legal texts written in Brazilian Portuguese, in addition to words being guided by different esthetic rules, there is also the use of frequent references to legal elements, which makes the analysis of legal texts written in Brazilian Portuguese a stimulating problem. This work explores a metric space associated with contexts and the sharing of symbols between contexts of legal documents, that is, the search for spaces suitable for the representation of texts as court lawsuits, where each process - or part of it - is represented as a point, and the distances between these points represents probabilistic measures. For such representation, the Multidimensional Scaling (MDS) was used, which is a technique of dimensionality reduction where the relations of distances between the points in the projected space approximate the proximity measurements of the objects of the original space. The case law of the Sergipe State Court of Justice was used, in addition to a controlled set of words used in the legal area, provided by the Federal Supreme Court. The experiments showed that the proposed method obtained a better classification in 43.5% of the cases, while Doc2Vec was superior in only 35.7% of the cases, evidencing the existence of a more adequate metric space for the representation of legal texts written in Brazilian Portuguese than a space purely based on co-occurrence of symbols, as found by Doc2Vec.
id UFS-2_9cedb7d45d4daee4628fb125547ae5f3
oai_identifier_str oai:ufs.br:riufs/14553
network_acronym_str UFS-2
network_name_str Repositório Institucional da UFS
repository_id_str
spelling Machado, Gustavo MenezesMontalvão Filho, Jugurta Rosa2021-09-01T20:32:19Z2021-09-01T20:32:19Z2019-08-20MACHADO, Gustavo Menezes. Um estudo da representação de documentos jurídicos em espaços métricos. 2019. 74 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Sergipe, São Cristóvão, SE, 2019.https://ri.ufs.br/jspui/handle/riufs/14553Dozens of decisions are made daily from interpretations of the laws made by courts across the country. This set of similar decisions on the same subject is known as jurisprudence and serves as the basis for future judgments and arguments. In legal texts written in Brazilian Portuguese, in addition to words being guided by different esthetic rules, there is also the use of frequent references to legal elements, which makes the analysis of legal texts written in Brazilian Portuguese a stimulating problem. This work explores a metric space associated with contexts and the sharing of symbols between contexts of legal documents, that is, the search for spaces suitable for the representation of texts as court lawsuits, where each process - or part of it - is represented as a point, and the distances between these points represents probabilistic measures. For such representation, the Multidimensional Scaling (MDS) was used, which is a technique of dimensionality reduction where the relations of distances between the points in the projected space approximate the proximity measurements of the objects of the original space. The case law of the Sergipe State Court of Justice was used, in addition to a controlled set of words used in the legal area, provided by the Federal Supreme Court. The experiments showed that the proposed method obtained a better classification in 43.5% of the cases, while Doc2Vec was superior in only 35.7% of the cases, evidencing the existence of a more adequate metric space for the representation of legal texts written in Brazilian Portuguese than a space purely based on co-occurrence of symbols, as found by Doc2Vec.Diariamente são elaboradas dezenas de decisões a partir de interpretações das leis realizadas por tribunais de todo o país. Este conjunto de decisões similares sobre uma mesma matéria é conhecido como jurisprudência, e serve como base para julgamentos e argumentações futuras. Nos textos jurídicos escritos em português brasileiro, além das palavras serem guiadas por regras estéticas diferentes, há também o uso de referências frequentes a elementos jurídicos, o que torna a análise de textos jurídicos escritos em português brasileiro um problema estimulante. Neste trabalho, é explorado um espaço métrico associado a contextos e ao compartilhamento de símbolos entre contextos de documentos jurídicos, ou seja, trata-se da busca por um espaço adequado à representação de textos como processos judiciais, onde cada processo - ou parte dele - é representado como um ponto, e as distâncias entre esses pontos representam medidas probabilísticas. Para tal representação, foi utilizado o Multidimensional Scaling (MDS), que é uma técnica de redução de dimensionalidade onde as relações de distâncias entre os pontos no espaço projetado se aproximam das medidas de proximidade dos objetos do espaço original. A base de jurisprudência do Tribunal de Justiça do Estado de Sergipe foi utilizada, além de um conjunto controlado de palavras utilizadas na área jurídica, disponibilizado pelo Supremo Tribunal Federal. Os experimentos realizados evidenciaram que o método proposto conseguiu uma melhor classificação em 43,5% dos casos, enquanto Doc2Vec foi superior em apenas 35,7% das vezes, evidenciando a existência de um espaço métrico mais adequado à representação de textos jurídicos escritos em português brasileiro, que um espaço puramente baseado em co-ocorrência de símbolos, como o que é encontrado pelo Doc2Vec.São Cristóvão, SEporComputaçãoJurisprudênciaMultidimensional scalingJulgamentosJurisprudênciaJulgamentosTextos jurídicosMultidimensional Scaling (MDS)Doc2VecJurisprudenceJudgmentsJudicial documentsCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUm estudo da representação de documentos jurídicos em espaços métricosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPós-Graduação em Ciência da ComputaçãoUniversidade Federal de Sergipereponame:Repositório Institucional da UFSinstname:Universidade Federal de Sergipe (UFS)instacron:UFSinfo:eu-repo/semantics/openAccessLICENSElicense.txtlicense.txttext/plain; charset=utf-81475https://ri.ufs.br/jspui/bitstream/riufs/14553/1/license.txt098cbbf65c2c15e1fb2e49c5d306a44cMD51ORIGINALGUSTAVO_MENEZES_MACHADO.pdfGUSTAVO_MENEZES_MACHADO.pdfapplication/pdf1705536https://ri.ufs.br/jspui/bitstream/riufs/14553/2/GUSTAVO_MENEZES_MACHADO.pdf3d43cb661a235285760172b3eeb348b9MD52THUMBNAILGUSTAVO_MENEZES_MACHADO.pdf.jpgGUSTAVO_MENEZES_MACHADO.pdf.jpgGenerated Thumbnailimage/jpeg1428https://ri.ufs.br/jspui/bitstream/riufs/14553/3/GUSTAVO_MENEZES_MACHADO.pdf.jpg62d6270a35c056cadaeec4d6a65a2ce7MD53riufs/145532021-09-01 17:32:19.937oai:ufs.br:riufs/14553TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvcihlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyIHNldSB0cmFiYWxobyBubyBmb3JtYXRvIGVsZXRyw7RuaWNvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFNlcmdpcGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIHNldSB0cmFiYWxobyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGUgc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0bywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgbsOjbyBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gbyB0cmFiYWxobyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvLgoKQSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHRyYWJhbGhvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuIAo=Repositório InstitucionalPUBhttps://ri.ufs.br/oai/requestrepositorio@academico.ufs.bropendoar:2021-09-01T20:32:19Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)false
dc.title.pt_BR.fl_str_mv Um estudo da representação de documentos jurídicos em espaços métricos
title Um estudo da representação de documentos jurídicos em espaços métricos
spellingShingle Um estudo da representação de documentos jurídicos em espaços métricos
Machado, Gustavo Menezes
Computação
Jurisprudência
Multidimensional scaling
Julgamentos
Jurisprudência
Julgamentos
Textos jurídicos
Multidimensional Scaling (MDS)
Doc2Vec
Jurisprudence
Judgments
Judicial documents
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Um estudo da representação de documentos jurídicos em espaços métricos
title_full Um estudo da representação de documentos jurídicos em espaços métricos
title_fullStr Um estudo da representação de documentos jurídicos em espaços métricos
title_full_unstemmed Um estudo da representação de documentos jurídicos em espaços métricos
title_sort Um estudo da representação de documentos jurídicos em espaços métricos
author Machado, Gustavo Menezes
author_facet Machado, Gustavo Menezes
author_role author
dc.contributor.author.fl_str_mv Machado, Gustavo Menezes
dc.contributor.advisor1.fl_str_mv Montalvão Filho, Jugurta Rosa
contributor_str_mv Montalvão Filho, Jugurta Rosa
dc.subject.por.fl_str_mv Computação
Jurisprudência
Multidimensional scaling
Julgamentos
Jurisprudência
Julgamentos
Textos jurídicos
topic Computação
Jurisprudência
Multidimensional scaling
Julgamentos
Jurisprudência
Julgamentos
Textos jurídicos
Multidimensional Scaling (MDS)
Doc2Vec
Jurisprudence
Judgments
Judicial documents
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Multidimensional Scaling (MDS)
Doc2Vec
Jurisprudence
Judgments
Judicial documents
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Dozens of decisions are made daily from interpretations of the laws made by courts across the country. This set of similar decisions on the same subject is known as jurisprudence and serves as the basis for future judgments and arguments. In legal texts written in Brazilian Portuguese, in addition to words being guided by different esthetic rules, there is also the use of frequent references to legal elements, which makes the analysis of legal texts written in Brazilian Portuguese a stimulating problem. This work explores a metric space associated with contexts and the sharing of symbols between contexts of legal documents, that is, the search for spaces suitable for the representation of texts as court lawsuits, where each process - or part of it - is represented as a point, and the distances between these points represents probabilistic measures. For such representation, the Multidimensional Scaling (MDS) was used, which is a technique of dimensionality reduction where the relations of distances between the points in the projected space approximate the proximity measurements of the objects of the original space. The case law of the Sergipe State Court of Justice was used, in addition to a controlled set of words used in the legal area, provided by the Federal Supreme Court. The experiments showed that the proposed method obtained a better classification in 43.5% of the cases, while Doc2Vec was superior in only 35.7% of the cases, evidencing the existence of a more adequate metric space for the representation of legal texts written in Brazilian Portuguese than a space purely based on co-occurrence of symbols, as found by Doc2Vec.
publishDate 2019
dc.date.issued.fl_str_mv 2019-08-20
dc.date.accessioned.fl_str_mv 2021-09-01T20:32:19Z
dc.date.available.fl_str_mv 2021-09-01T20:32:19Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MACHADO, Gustavo Menezes. Um estudo da representação de documentos jurídicos em espaços métricos. 2019. 74 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Sergipe, São Cristóvão, SE, 2019.
dc.identifier.uri.fl_str_mv https://ri.ufs.br/jspui/handle/riufs/14553
identifier_str_mv MACHADO, Gustavo Menezes. Um estudo da representação de documentos jurídicos em espaços métricos. 2019. 74 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Sergipe, São Cristóvão, SE, 2019.
url https://ri.ufs.br/jspui/handle/riufs/14553
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.program.fl_str_mv Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv Universidade Federal de Sergipe
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFS
instname:Universidade Federal de Sergipe (UFS)
instacron:UFS
instname_str Universidade Federal de Sergipe (UFS)
instacron_str UFS
institution UFS
reponame_str Repositório Institucional da UFS
collection Repositório Institucional da UFS
bitstream.url.fl_str_mv https://ri.ufs.br/jspui/bitstream/riufs/14553/1/license.txt
https://ri.ufs.br/jspui/bitstream/riufs/14553/2/GUSTAVO_MENEZES_MACHADO.pdf
https://ri.ufs.br/jspui/bitstream/riufs/14553/3/GUSTAVO_MENEZES_MACHADO.pdf.jpg
bitstream.checksum.fl_str_mv 098cbbf65c2c15e1fb2e49c5d306a44c
3d43cb661a235285760172b3eeb348b9
62d6270a35c056cadaeec4d6a65a2ce7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)
repository.mail.fl_str_mv repositorio@academico.ufs.br
_version_ 1793351088387129344