Understanding contracts in natural language

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Pinheiro, Daniele Antunes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
NLP
PLN
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/8829
Resumo: Contracts are agreements between people or organization, called parties. They are usually written in formal language and are composed of a set of rules to be followed by the parties involved in it. In the processing of contracts, it is common to assume a manual step to extract the contract components to work with, which is a task that demands time and usually is domain based. Considering a scenario where every day there are more people interested in processing legal work, an automated tool to extract contractual components is extremely useful. This research defines an approach to automatically extract and formalize these components resulting in a semantic structure useful for other projects. To evaluate our work, we created a dataset containing 15 annotated contracts and measure our accuracy over different types of extractions. Our approach was used in two contract processing tasks: a new evaluation of fairness and conflict identification, with competitive results with the state of the art.
id P_RS_2a1af85c4d95bb10e93ba81fc33fb364
oai_identifier_str oai:tede2.pucrs.br:tede/8829
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Understanding contracts in natural languageContractsNLPMachine LearningDeep LearningContratosAprendizado de MáquinasPLNCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOContracts are agreements between people or organization, called parties. They are usually written in formal language and are composed of a set of rules to be followed by the parties involved in it. In the processing of contracts, it is common to assume a manual step to extract the contract components to work with, which is a task that demands time and usually is domain based. Considering a scenario where every day there are more people interested in processing legal work, an automated tool to extract contractual components is extremely useful. This research defines an approach to automatically extract and formalize these components resulting in a semantic structure useful for other projects. To evaluate our work, we created a dataset containing 15 annotated contracts and measure our accuracy over different types of extractions. Our approach was used in two contract processing tasks: a new evaluation of fairness and conflict identification, with competitive results with the state of the art.Contratos são acordos entre pessoas ou organizações, chamados de partes. Geralmente são escritos em linguagem formal e são compostos por um conjuntos de regras que devem ser seguidas pelas partes envolvidas nele. No processamento de contratos, é comum assumir uma etapa manual para extrair os componentes do contrato, o que é uma tarefa que exige tempo e geralmente é baseada em domínio específico. Considerando um cenário onde todos os dias há mais pessoas interessadas em processar o trabalho legal, uma ferramenta automatizada para extrair componentes contratuais é extremamente útil. Esta pesquisa definiu um método para extrair e formalizar automaticamente esses componentes, resultando em uma estrutura semântica útil para outros projetos. Para avaliar nosso trabalho, nós criamos um dataset com 15 contratos anotados e medimos a nossa acurácia em diferentes tipos de extração. Nossa abordagem foi utilizada em dois tipos de processamento de contratos: uma nova avaliação de equanimidade e na identificação de conflitos, com resultados competitivos em relação ao estado da arte.Pontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoMeneguzzi, Felipe Rechhttp://lattes.cnpq.br/5973550650941724Pinheiro, Daniele Antunes2019-08-05T14:21:24Z2019-03-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/8829enginfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2019-08-05T15:00:29Zoai:tede2.pucrs.br:tede/8829Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2019-08-05T15:00:29Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv Understanding contracts in natural language
title Understanding contracts in natural language
spellingShingle Understanding contracts in natural language
Pinheiro, Daniele Antunes
Contracts
NLP
Machine Learning
Deep Learning
Contratos
Aprendizado de Máquinas
PLN
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Understanding contracts in natural language
title_full Understanding contracts in natural language
title_fullStr Understanding contracts in natural language
title_full_unstemmed Understanding contracts in natural language
title_sort Understanding contracts in natural language
author Pinheiro, Daniele Antunes
author_facet Pinheiro, Daniele Antunes
author_role author
dc.contributor.none.fl_str_mv Meneguzzi, Felipe Rech
http://lattes.cnpq.br/5973550650941724
dc.contributor.author.fl_str_mv Pinheiro, Daniele Antunes
dc.subject.por.fl_str_mv Contracts
NLP
Machine Learning
Deep Learning
Contratos
Aprendizado de Máquinas
PLN
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
topic Contracts
NLP
Machine Learning
Deep Learning
Contratos
Aprendizado de Máquinas
PLN
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description Contracts are agreements between people or organization, called parties. They are usually written in formal language and are composed of a set of rules to be followed by the parties involved in it. In the processing of contracts, it is common to assume a manual step to extract the contract components to work with, which is a task that demands time and usually is domain based. Considering a scenario where every day there are more people interested in processing legal work, an automated tool to extract contractual components is extremely useful. This research defines an approach to automatically extract and formalize these components resulting in a semantic structure useful for other projects. To evaluate our work, we created a dataset containing 15 annotated contracts and measure our accuracy over different types of extractions. Our approach was used in two contract processing tasks: a new evaluation of fairness and conflict identification, with competitive results with the state of the art.
publishDate 2019
dc.date.none.fl_str_mv 2019-08-05T14:21:24Z
2019-03-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/8829
url http://tede2.pucrs.br/tede2/handle/tede/8829
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1850041296087941120