Understanding contracts in natural language

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Pinheiro, Daniele Antunes lattes
Orientador(a): Meneguzzi, Felipe Rech lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Pontif?cia Universidade Cat?lica do Rio Grande do Sul
Programa de Pós-Graduação: Programa de P?s-Gradua??o em Ci?ncia da Computa??o
Departamento: Escola Polit?cnica
País: Brasil
Palavras-chave em Português:
PLN
Palavras-chave em Inglês:
NLP
Área do conhecimento CNPq:
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/8829
Resumo: Contratos s?o acordos entre pessoas ou organiza??es, chamados de partes. Geralmente s?o escritos em linguagem formal e s?o compostos por um conjuntos de regras que devem ser seguidas pelas partes envolvidas nele. No processamento de contratos, ? comum assumir uma etapa manual para extrair os componentes do contrato, o que ? uma tarefa que exige tempo e geralmente ? baseada em dom?nio espec?fico. Considerando um cen?rio onde todos os dias h? mais pessoas interessadas em processar o trabalho legal, uma ferramenta automatizada para extrair componentes contratuais ? extremamente ?til. Esta pesquisa definiu um m?todo para extrair e formalizar automaticamente esses componentes, resultando em uma estrutura sem?ntica ?til para outros projetos. Para avaliar nosso trabalho, n?s criamos um dataset com 15 contratos anotados e medimos a nossa acur?cia em diferentes tipos de extra??o. Nossa abordagem foi utilizada em dois tipos de processamento de contratos: uma nova avalia??o de equanimidade e na identifica??o de conflitos, com resultados competitivos em rela??o ao estado da arte.
id P_RS_2a1af85c4d95bb10e93ba81fc33fb364
oai_identifier_str oai:tede2.pucrs.br:tede/8829
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Meneguzzi, Felipe Rechhttp://lattes.cnpq.br/5973550650941724http://lattes.cnpq.br/4528265550915115Pinheiro, Daniele Antunes2019-08-05T14:21:24Z2019-03-20http://tede2.pucrs.br/tede2/handle/tede/8829Contratos s?o acordos entre pessoas ou organiza??es, chamados de partes. Geralmente s?o escritos em linguagem formal e s?o compostos por um conjuntos de regras que devem ser seguidas pelas partes envolvidas nele. No processamento de contratos, ? comum assumir uma etapa manual para extrair os componentes do contrato, o que ? uma tarefa que exige tempo e geralmente ? baseada em dom?nio espec?fico. Considerando um cen?rio onde todos os dias h? mais pessoas interessadas em processar o trabalho legal, uma ferramenta automatizada para extrair componentes contratuais ? extremamente ?til. Esta pesquisa definiu um m?todo para extrair e formalizar automaticamente esses componentes, resultando em uma estrutura sem?ntica ?til para outros projetos. Para avaliar nosso trabalho, n?s criamos um dataset com 15 contratos anotados e medimos a nossa acur?cia em diferentes tipos de extra??o. Nossa abordagem foi utilizada em dois tipos de processamento de contratos: uma nova avalia??o de equanimidade e na identifica??o de conflitos, com resultados competitivos em rela??o ao estado da arte.Contracts are agreements between people or organization, called parties. They are usually written in formal language and are composed of a set of rules to be followed by the parties involved in it. In the processing of contracts, it is common to assume a manual step to extract the contract components to work with, which is a task that demands time and usually is domain based. Considering a scenario where every day there are more people interested in processing legal work, an automated tool to extract contractual components is extremely useful. This research defines an approach to automatically extract and formalize these components resulting in a semantic structure useful for other projects. To evaluate our work, we created a dataset containing 15 annotated contracts and measure our accuracy over different types of extractions. Our approach was used in two contract processing tasks: a new evaluation of fairness and conflict identification, with competitive results with the state of the art.Submitted by PPG Ci?ncia da Computa??o (ppgcc@pucrs.br) on 2019-08-02T18:47:36Z No. of bitstreams: 1 DANIELE ANTUNES PINHEIRO_DIS.pdf: 809018 bytes, checksum: 5cbecaf799e11458bafa2e66a237be00 (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2019-08-05T13:39:43Z (GMT) No. of bitstreams: 1 DANIELE ANTUNES PINHEIRO_DIS.pdf: 809018 bytes, checksum: 5cbecaf799e11458bafa2e66a237be00 (MD5)Made available in DSpace on 2019-08-05T14:21:24Z (GMT). No. of bitstreams: 1 DANIELE ANTUNES PINHEIRO_DIS.pdf: 809018 bytes, checksum: 5cbecaf799e11458bafa2e66a237be00 (MD5) Previous issue date: 2019-03-20application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/176082/DANIELE%20ANTUNES%20PINHEIRO_DIS.pdf.jpgengPontif?cia Universidade Cat?lica do Rio Grande do SulPrograma de P?s-Gradua??o em Ci?ncia da Computa??oPUCRSBrasilEscola Polit?cnicaContractsNLPMachine LearningDeep LearningContratosAprendizado de M?quinasPLNCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOUnderstanding contracts in natural languageinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho n?o apresenta restri??o para publica??o-4570527706994352458500500-862078257083325301info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILDANIELE ANTUNES PINHEIRO_DIS.pdf.jpgDANIELE ANTUNES PINHEIRO_DIS.pdf.jpgimage/jpeg5447http://tede2.pucrs.br/tede2/bitstream/tede/8829/4/DANIELE+ANTUNES+PINHEIRO_DIS.pdf.jpg8425706b70270de907d3483e05d597e6MD54TEXTDANIELE ANTUNES PINHEIRO_DIS.pdf.txtDANIELE ANTUNES PINHEIRO_DIS.pdf.txttext/plain113820http://tede2.pucrs.br/tede2/bitstream/tede/8829/3/DANIELE+ANTUNES+PINHEIRO_DIS.pdf.txt87836333f04f8dcc5985d42513b22dc7MD53ORIGINALDANIELE ANTUNES PINHEIRO_DIS.pdfDANIELE ANTUNES PINHEIRO_DIS.pdfapplication/pdf809018http://tede2.pucrs.br/tede2/bitstream/tede/8829/2/DANIELE+ANTUNES+PINHEIRO_DIS.pdf5cbecaf799e11458bafa2e66a237be00MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590http://tede2.pucrs.br/tede2/bitstream/tede/8829/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/88292019-08-05 12:00:29.017oai:tede2.pucrs.br:tede/8829QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2019-08-05T15:00:29Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Understanding contracts in natural language
title Understanding contracts in natural language
spellingShingle Understanding contracts in natural language
Pinheiro, Daniele Antunes
Contracts
NLP
Machine Learning
Deep Learning
Contratos
Aprendizado de M?quinas
PLN
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Understanding contracts in natural language
title_full Understanding contracts in natural language
title_fullStr Understanding contracts in natural language
title_full_unstemmed Understanding contracts in natural language
title_sort Understanding contracts in natural language
author Pinheiro, Daniele Antunes
author_facet Pinheiro, Daniele Antunes
author_role author
dc.contributor.advisor1.fl_str_mv Meneguzzi, Felipe Rech
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5973550650941724
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4528265550915115
dc.contributor.author.fl_str_mv Pinheiro, Daniele Antunes
contributor_str_mv Meneguzzi, Felipe Rech
dc.subject.eng.fl_str_mv Contracts
NLP
Machine Learning
Deep Learning
topic Contracts
NLP
Machine Learning
Deep Learning
Contratos
Aprendizado de M?quinas
PLN
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
dc.subject.por.fl_str_mv Contratos
Aprendizado de M?quinas
PLN
dc.subject.cnpq.fl_str_mv CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description Contratos s?o acordos entre pessoas ou organiza??es, chamados de partes. Geralmente s?o escritos em linguagem formal e s?o compostos por um conjuntos de regras que devem ser seguidas pelas partes envolvidas nele. No processamento de contratos, ? comum assumir uma etapa manual para extrair os componentes do contrato, o que ? uma tarefa que exige tempo e geralmente ? baseada em dom?nio espec?fico. Considerando um cen?rio onde todos os dias h? mais pessoas interessadas em processar o trabalho legal, uma ferramenta automatizada para extrair componentes contratuais ? extremamente ?til. Esta pesquisa definiu um m?todo para extrair e formalizar automaticamente esses componentes, resultando em uma estrutura sem?ntica ?til para outros projetos. Para avaliar nosso trabalho, n?s criamos um dataset com 15 contratos anotados e medimos a nossa acur?cia em diferentes tipos de extra??o. Nossa abordagem foi utilizada em dois tipos de processamento de contratos: uma nova avalia??o de equanimidade e na identifica??o de conflitos, com resultados competitivos em rela??o ao estado da arte.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-08-05T14:21:24Z
dc.date.issued.fl_str_mv 2019-03-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/8829
url http://tede2.pucrs.br/tede2/handle/tede/8829
dc.language.iso.fl_str_mv eng
language eng
dc.relation.program.fl_str_mv -4570527706994352458
dc.relation.confidence.fl_str_mv 500
500
dc.relation.cnpq.fl_str_mv -862078257083325301
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontif?cia Universidade Cat?lica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de P?s-Gradua??o em Ci?ncia da Computa??o
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola Polit?cnica
publisher.none.fl_str_mv Pontif?cia Universidade Cat?lica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/8829/4/DANIELE+ANTUNES+PINHEIRO_DIS.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/8829/3/DANIELE+ANTUNES+PINHEIRO_DIS.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/8829/2/DANIELE+ANTUNES+PINHEIRO_DIS.pdf
http://tede2.pucrs.br/tede2/bitstream/tede/8829/1/license.txt
bitstream.checksum.fl_str_mv 8425706b70270de907d3483e05d597e6
87836333f04f8dcc5985d42513b22dc7
5cbecaf799e11458bafa2e66a237be00
220e11f2d3ba5354f917c7035aadef24
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1796793240717885440