Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Oliveira, Robert Anderson Nogueira de
Orientador(a): Rodrigues Júnior, Methanias Colaço
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Pós-Graduação em Ciência da Computação
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://ri.ufs.br/jspui/handle/riufs/10780
Resumo: Stemming algorithms are commonly used during textual Preprocessing phase in order to reduce data dimensionality. However, this reduction presents different efficacy levels depending on the Domain that it’s applied to. Thus, for instance, there are reports in the literature that show the effect of radicalization when applied to dictionaries or textual bases of news. On the other hand, we have not found any studies analyzing the impact of radicalization on Brazilian judicial jurisprudence, composed of decisions handed down by the judiciary, a fundamental instrument for legal professionals to play their role. Thus, this work presents the results obtained through the analysis and experimental evaluation of the stemmers applied on real jurisprudential documents, originating from the Court of Justice of the State of Sergipe. The results showed that, among the analyzed algorithms, the RSLP possessed the greatest capacity of dimensionality reduction of the data. The RSLP-S and UniNE algorithms, the less aggressive stemmers, presented the best cost-benefit ratio, due to the fact that they reduced the dimensionality of the data and had similar efficacy or, in some cases, superior to the control group.
id UFS-2_a955574c4e6e8284605dc6f2b2e45105
oai_identifier_str oai:ufs.br:riufs/10780
network_acronym_str UFS-2
network_name_str Repositório Institucional da UFS
repository_id_str
spelling Oliveira, Robert Anderson Nogueira deRodrigues Júnior, Methanias Colaço2019-03-28T23:08:38Z2019-03-28T23:08:38Z2017-08-14OLIVEIRA, Robert Anderson Nogueira de. Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais. 2017. 77 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2017.http://ri.ufs.br/jspui/handle/riufs/10780Stemming algorithms are commonly used during textual Preprocessing phase in order to reduce data dimensionality. However, this reduction presents different efficacy levels depending on the Domain that it’s applied to. Thus, for instance, there are reports in the literature that show the effect of radicalization when applied to dictionaries or textual bases of news. On the other hand, we have not found any studies analyzing the impact of radicalization on Brazilian judicial jurisprudence, composed of decisions handed down by the judiciary, a fundamental instrument for legal professionals to play their role. Thus, this work presents the results obtained through the analysis and experimental evaluation of the stemmers applied on real jurisprudential documents, originating from the Court of Justice of the State of Sergipe. The results showed that, among the analyzed algorithms, the RSLP possessed the greatest capacity of dimensionality reduction of the data. The RSLP-S and UniNE algorithms, the less aggressive stemmers, presented the best cost-benefit ratio, due to the fact that they reduced the dimensionality of the data and had similar efficacy or, in some cases, superior to the control group.Os algoritmos de radicalização são normalmente utilizados na fase de pré-processamento textual, com o intuito de reduzir a dimensionalidade dos dados. No entanto, essa redução apresenta diferentes níveis de eficácia, a depender do domínio sobre o qual eles são aplicados. Desse modo, a título ilustrativo, há relatos na literatura que evidenciam o efeito da radicalização quando aplicada a dicionários ou bases textuais de notícias. Por outro lado, não foi encontrado qualquer estudo que analisasse o impacto da radicalização sobre a jurisprudência judicial brasileira, composta por decisões da magistratura, instrumento fundamental para que os profissionais do Direito possam exercer o seu papel. Assim, o presente trabalho apresenta os resultados obtidos por meio da análise e avaliação experimentais da radicalização aplicada sobre documentos jurisprudenciais verídicos, oriundos do Tribunal de Justiça do Estado de Sergipe. Os resultados mostraram que, dentre os algoritmos analisados, o RSLP possuiu a maior capacidade de redução de dimensionalidade dos dados. Outrossim, mediante avaliação extrínseca dos algoritmos de radicalização sobre a recuperação de documentos jurisprudenciais, os algoritmos RSLP-S e UniNE, radicalizadores menos agressivos, apresentaram o melhor relação custo-benefício, haja vista que reduziram a dimensionalidade dos dados e tiveram eficácia similar, ou até mesmo superior, à do grupo de controleSão Cristóvão, SEporEngenharia de software experimentalSoftwareTextos jurídicosRedução de dimensionalidadeJurisprudênciaExperimental software engineeringJudicial documentsDimensionality reductionJurisprudenceCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAnálise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPós-Graduação em Ciência da ComputaçãoUFSreponame:Repositório Institucional da UFSinstname:Universidade Federal de Sergipe (UFS)instacron:UFSinfo:eu-repo/semantics/openAccessTEXTROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.txtROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.txtExtracted texttext/plain118971https://ri.ufs.br/jspui/bitstream/riufs/10780/3/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.txt1601312c45eb55acc0248c7efddf90fdMD53THUMBNAILROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.jpgROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.jpgGenerated Thumbnailimage/jpeg1382https://ri.ufs.br/jspui/bitstream/riufs/10780/4/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.jpg5f0b1405f35e5eee7e04a643029ca5e6MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81475https://ri.ufs.br/jspui/bitstream/riufs/10780/1/license.txt098cbbf65c2c15e1fb2e49c5d306a44cMD51ORIGINALROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdfROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdfapplication/pdf5723427https://ri.ufs.br/jspui/bitstream/riufs/10780/2/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf0be252de0c45135c137d2df18fcc4fa8MD52riufs/107802019-03-28 20:08:38.414oai:ufs.br:riufs/10780TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvcihlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyIHNldSB0cmFiYWxobyBubyBmb3JtYXRvIGVsZXRyw7RuaWNvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFNlcmdpcGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIHNldSB0cmFiYWxobyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGUgc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0bywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgbsOjbyBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gbyB0cmFiYWxobyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvLgoKQSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHRyYWJhbGhvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuIAo=Repositório InstitucionalPUBhttps://ri.ufs.br/oai/requestrepositorio@academico.ufs.bropendoar:2019-03-28T23:08:38Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)false
dc.title.pt_BR.fl_str_mv Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais
title Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais
spellingShingle Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais
Oliveira, Robert Anderson Nogueira de
Engenharia de software experimental
Software
Textos jurídicos
Redução de dimensionalidade
Jurisprudência
Experimental software engineering
Judicial documents
Dimensionality reduction
Jurisprudence
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais
title_full Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais
title_fullStr Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais
title_full_unstemmed Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais
title_sort Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais
author Oliveira, Robert Anderson Nogueira de
author_facet Oliveira, Robert Anderson Nogueira de
author_role author
dc.contributor.author.fl_str_mv Oliveira, Robert Anderson Nogueira de
dc.contributor.advisor1.fl_str_mv Rodrigues Júnior, Methanias Colaço
contributor_str_mv Rodrigues Júnior, Methanias Colaço
dc.subject.por.fl_str_mv Engenharia de software experimental
Software
Textos jurídicos
Redução de dimensionalidade
Jurisprudência
topic Engenharia de software experimental
Software
Textos jurídicos
Redução de dimensionalidade
Jurisprudência
Experimental software engineering
Judicial documents
Dimensionality reduction
Jurisprudence
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Experimental software engineering
Judicial documents
Dimensionality reduction
Jurisprudence
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Stemming algorithms are commonly used during textual Preprocessing phase in order to reduce data dimensionality. However, this reduction presents different efficacy levels depending on the Domain that it’s applied to. Thus, for instance, there are reports in the literature that show the effect of radicalization when applied to dictionaries or textual bases of news. On the other hand, we have not found any studies analyzing the impact of radicalization on Brazilian judicial jurisprudence, composed of decisions handed down by the judiciary, a fundamental instrument for legal professionals to play their role. Thus, this work presents the results obtained through the analysis and experimental evaluation of the stemmers applied on real jurisprudential documents, originating from the Court of Justice of the State of Sergipe. The results showed that, among the analyzed algorithms, the RSLP possessed the greatest capacity of dimensionality reduction of the data. The RSLP-S and UniNE algorithms, the less aggressive stemmers, presented the best cost-benefit ratio, due to the fact that they reduced the dimensionality of the data and had similar efficacy or, in some cases, superior to the control group.
publishDate 2017
dc.date.issued.fl_str_mv 2017-08-14
dc.date.accessioned.fl_str_mv 2019-03-28T23:08:38Z
dc.date.available.fl_str_mv 2019-03-28T23:08:38Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv OLIVEIRA, Robert Anderson Nogueira de. Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais. 2017. 77 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2017.
dc.identifier.uri.fl_str_mv http://ri.ufs.br/jspui/handle/riufs/10780
identifier_str_mv OLIVEIRA, Robert Anderson Nogueira de. Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais. 2017. 77 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2017.
url http://ri.ufs.br/jspui/handle/riufs/10780
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.program.fl_str_mv Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFS
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFS
instname:Universidade Federal de Sergipe (UFS)
instacron:UFS
instname_str Universidade Federal de Sergipe (UFS)
instacron_str UFS
institution UFS
reponame_str Repositório Institucional da UFS
collection Repositório Institucional da UFS
bitstream.url.fl_str_mv https://ri.ufs.br/jspui/bitstream/riufs/10780/3/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.txt
https://ri.ufs.br/jspui/bitstream/riufs/10780/4/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.jpg
https://ri.ufs.br/jspui/bitstream/riufs/10780/1/license.txt
https://ri.ufs.br/jspui/bitstream/riufs/10780/2/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf
bitstream.checksum.fl_str_mv 1601312c45eb55acc0248c7efddf90fd
5f0b1405f35e5eee7e04a643029ca5e6
098cbbf65c2c15e1fb2e49c5d306a44c
0be252de0c45135c137d2df18fcc4fa8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)
repository.mail.fl_str_mv repositorio@academico.ufs.br
_version_ 1793351065937117184