Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais
Ano de defesa: | 2017 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Pós-Graduação em Ciência da Computação
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Palavras-chave em Inglês: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://ri.ufs.br/jspui/handle/riufs/10780 |
Resumo: | Stemming algorithms are commonly used during textual Preprocessing phase in order to reduce data dimensionality. However, this reduction presents different efficacy levels depending on the Domain that it’s applied to. Thus, for instance, there are reports in the literature that show the effect of radicalization when applied to dictionaries or textual bases of news. On the other hand, we have not found any studies analyzing the impact of radicalization on Brazilian judicial jurisprudence, composed of decisions handed down by the judiciary, a fundamental instrument for legal professionals to play their role. Thus, this work presents the results obtained through the analysis and experimental evaluation of the stemmers applied on real jurisprudential documents, originating from the Court of Justice of the State of Sergipe. The results showed that, among the analyzed algorithms, the RSLP possessed the greatest capacity of dimensionality reduction of the data. The RSLP-S and UniNE algorithms, the less aggressive stemmers, presented the best cost-benefit ratio, due to the fact that they reduced the dimensionality of the data and had similar efficacy or, in some cases, superior to the control group. |
id |
UFS-2_a955574c4e6e8284605dc6f2b2e45105 |
---|---|
oai_identifier_str |
oai:ufs.br:riufs/10780 |
network_acronym_str |
UFS-2 |
network_name_str |
Repositório Institucional da UFS |
repository_id_str |
|
spelling |
Oliveira, Robert Anderson Nogueira deRodrigues Júnior, Methanias Colaço2019-03-28T23:08:38Z2019-03-28T23:08:38Z2017-08-14OLIVEIRA, Robert Anderson Nogueira de. Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais. 2017. 77 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2017.http://ri.ufs.br/jspui/handle/riufs/10780Stemming algorithms are commonly used during textual Preprocessing phase in order to reduce data dimensionality. However, this reduction presents different efficacy levels depending on the Domain that it’s applied to. Thus, for instance, there are reports in the literature that show the effect of radicalization when applied to dictionaries or textual bases of news. On the other hand, we have not found any studies analyzing the impact of radicalization on Brazilian judicial jurisprudence, composed of decisions handed down by the judiciary, a fundamental instrument for legal professionals to play their role. Thus, this work presents the results obtained through the analysis and experimental evaluation of the stemmers applied on real jurisprudential documents, originating from the Court of Justice of the State of Sergipe. The results showed that, among the analyzed algorithms, the RSLP possessed the greatest capacity of dimensionality reduction of the data. The RSLP-S and UniNE algorithms, the less aggressive stemmers, presented the best cost-benefit ratio, due to the fact that they reduced the dimensionality of the data and had similar efficacy or, in some cases, superior to the control group.Os algoritmos de radicalização são normalmente utilizados na fase de pré-processamento textual, com o intuito de reduzir a dimensionalidade dos dados. No entanto, essa redução apresenta diferentes níveis de eficácia, a depender do domínio sobre o qual eles são aplicados. Desse modo, a título ilustrativo, há relatos na literatura que evidenciam o efeito da radicalização quando aplicada a dicionários ou bases textuais de notícias. Por outro lado, não foi encontrado qualquer estudo que analisasse o impacto da radicalização sobre a jurisprudência judicial brasileira, composta por decisões da magistratura, instrumento fundamental para que os profissionais do Direito possam exercer o seu papel. Assim, o presente trabalho apresenta os resultados obtidos por meio da análise e avaliação experimentais da radicalização aplicada sobre documentos jurisprudenciais verídicos, oriundos do Tribunal de Justiça do Estado de Sergipe. Os resultados mostraram que, dentre os algoritmos analisados, o RSLP possuiu a maior capacidade de redução de dimensionalidade dos dados. Outrossim, mediante avaliação extrínseca dos algoritmos de radicalização sobre a recuperação de documentos jurisprudenciais, os algoritmos RSLP-S e UniNE, radicalizadores menos agressivos, apresentaram o melhor relação custo-benefício, haja vista que reduziram a dimensionalidade dos dados e tiveram eficácia similar, ou até mesmo superior, à do grupo de controleSão Cristóvão, SEporEngenharia de software experimentalSoftwareTextos jurídicosRedução de dimensionalidadeJurisprudênciaExperimental software engineeringJudicial documentsDimensionality reductionJurisprudenceCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAnálise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPós-Graduação em Ciência da ComputaçãoUFSreponame:Repositório Institucional da UFSinstname:Universidade Federal de Sergipe (UFS)instacron:UFSinfo:eu-repo/semantics/openAccessTEXTROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.txtROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.txtExtracted texttext/plain118971https://ri.ufs.br/jspui/bitstream/riufs/10780/3/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.txt1601312c45eb55acc0248c7efddf90fdMD53THUMBNAILROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.jpgROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.jpgGenerated Thumbnailimage/jpeg1382https://ri.ufs.br/jspui/bitstream/riufs/10780/4/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.jpg5f0b1405f35e5eee7e04a643029ca5e6MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81475https://ri.ufs.br/jspui/bitstream/riufs/10780/1/license.txt098cbbf65c2c15e1fb2e49c5d306a44cMD51ORIGINALROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdfROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdfapplication/pdf5723427https://ri.ufs.br/jspui/bitstream/riufs/10780/2/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf0be252de0c45135c137d2df18fcc4fa8MD52riufs/107802019-03-28 20:08:38.414oai:ufs.br:riufs/10780TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvcihlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyIHNldSB0cmFiYWxobyBubyBmb3JtYXRvIGVsZXRyw7RuaWNvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFNlcmdpcGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIHNldSB0cmFiYWxobyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGUgc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0bywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgbsOjbyBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gbyB0cmFiYWxobyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvLgoKQSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHRyYWJhbGhvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuIAo=Repositório InstitucionalPUBhttps://ri.ufs.br/oai/requestrepositorio@academico.ufs.bropendoar:2019-03-28T23:08:38Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)false |
dc.title.pt_BR.fl_str_mv |
Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais |
title |
Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais |
spellingShingle |
Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais Oliveira, Robert Anderson Nogueira de Engenharia de software experimental Software Textos jurídicos Redução de dimensionalidade Jurisprudência Experimental software engineering Judicial documents Dimensionality reduction Jurisprudence CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais |
title_full |
Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais |
title_fullStr |
Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais |
title_full_unstemmed |
Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais |
title_sort |
Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais |
author |
Oliveira, Robert Anderson Nogueira de |
author_facet |
Oliveira, Robert Anderson Nogueira de |
author_role |
author |
dc.contributor.author.fl_str_mv |
Oliveira, Robert Anderson Nogueira de |
dc.contributor.advisor1.fl_str_mv |
Rodrigues Júnior, Methanias Colaço |
contributor_str_mv |
Rodrigues Júnior, Methanias Colaço |
dc.subject.por.fl_str_mv |
Engenharia de software experimental Software Textos jurídicos Redução de dimensionalidade Jurisprudência |
topic |
Engenharia de software experimental Software Textos jurídicos Redução de dimensionalidade Jurisprudência Experimental software engineering Judicial documents Dimensionality reduction Jurisprudence CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Experimental software engineering Judicial documents Dimensionality reduction Jurisprudence |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Stemming algorithms are commonly used during textual Preprocessing phase in order to reduce data dimensionality. However, this reduction presents different efficacy levels depending on the Domain that it’s applied to. Thus, for instance, there are reports in the literature that show the effect of radicalization when applied to dictionaries or textual bases of news. On the other hand, we have not found any studies analyzing the impact of radicalization on Brazilian judicial jurisprudence, composed of decisions handed down by the judiciary, a fundamental instrument for legal professionals to play their role. Thus, this work presents the results obtained through the analysis and experimental evaluation of the stemmers applied on real jurisprudential documents, originating from the Court of Justice of the State of Sergipe. The results showed that, among the analyzed algorithms, the RSLP possessed the greatest capacity of dimensionality reduction of the data. The RSLP-S and UniNE algorithms, the less aggressive stemmers, presented the best cost-benefit ratio, due to the fact that they reduced the dimensionality of the data and had similar efficacy or, in some cases, superior to the control group. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-08-14 |
dc.date.accessioned.fl_str_mv |
2019-03-28T23:08:38Z |
dc.date.available.fl_str_mv |
2019-03-28T23:08:38Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
OLIVEIRA, Robert Anderson Nogueira de. Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais. 2017. 77 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2017. |
dc.identifier.uri.fl_str_mv |
http://ri.ufs.br/jspui/handle/riufs/10780 |
identifier_str_mv |
OLIVEIRA, Robert Anderson Nogueira de. Análise e avaliação experimentais de técnicas para recuperação de documentos jurisprudenciais. 2017. 77 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2017. |
url |
http://ri.ufs.br/jspui/handle/riufs/10780 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.program.fl_str_mv |
Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UFS |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFS instname:Universidade Federal de Sergipe (UFS) instacron:UFS |
instname_str |
Universidade Federal de Sergipe (UFS) |
instacron_str |
UFS |
institution |
UFS |
reponame_str |
Repositório Institucional da UFS |
collection |
Repositório Institucional da UFS |
bitstream.url.fl_str_mv |
https://ri.ufs.br/jspui/bitstream/riufs/10780/3/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.txt https://ri.ufs.br/jspui/bitstream/riufs/10780/4/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf.jpg https://ri.ufs.br/jspui/bitstream/riufs/10780/1/license.txt https://ri.ufs.br/jspui/bitstream/riufs/10780/2/ROBERT_ANDERSON_NOGUEIRA_OLIVEIRA.pdf |
bitstream.checksum.fl_str_mv |
1601312c45eb55acc0248c7efddf90fd 5f0b1405f35e5eee7e04a643029ca5e6 098cbbf65c2c15e1fb2e49c5d306a44c 0be252de0c45135c137d2df18fcc4fa8 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS) |
repository.mail.fl_str_mv |
repositorio@academico.ufs.br |
_version_ |
1793351065937117184 |