Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3141/tde-29012026-110358/ |
Resumo: | Os relacionamentos virtuais entre usuários e empresas são regidos por documentos como termos de uso e serviço (ToS) e políticas de privacidade (PP). Esses documentos são difíceis para os usuários entenderem, pois são extensos e contêm linguagem complexa. Além disso, eles impõem cláusulas aos usuários, desequilibrando este relacionamento. Estudos de ambos os tipos de documentos mostraram maneiras de detectar cláusulas que são potencialmente em não conformidade com a legislação europeia consumerista e de proteção de dados. No entanto, essas pesquisas focam amplamente na base legal europeia e em documentos escritos em inglês. Neste trabalho interdisciplinar, apresentamos duas guidelines de anotação que mapeiam a legislação brasileira consumerista e de proteção de dados em categorias atributáveis para o aprendizado de máquina (10 categorias para a parte consumerista e 27 categorias para a parte de proteção de dados), com 3 níveis de conformidade. Também, introduzimos dois corpora em português, um com cláusulas de ToS e outro com cláusulas de PP, anotados com base nas guidelines, construídos em parceria com especialistas jurídicos do Instituto Lawgorithm. Analisamos o desempenho de modelos classificadores treinados com nossos corpora em duas tarefas: detecção e categorização de cláusulas potencialmente em não conformidade. Obtivemos resultados semelhantes aos de estudos na literatura sobre legislação europeia para textos em inglês. Nossos achados trazem luz sobre caminhos promissores para desenvolver métodos capazes de avaliar a conformidade de ToS e PP, em português, em relação às legislações brasileiras. Ainda, revelam obstáculos e complexidades para processar os textos contidos nestes tipos de documentos. |
| id |
USP_93f471b1a420f3923607b7cf2c751e7e |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-29012026-110358 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.Automatic detection of non-compliant clauses in online consumer contracts for Portuguese language.Aprendizagem computacionalConsumer lawCorpusData protection lawDireito do consumidor (Brasil)Machine learningNatural language processingPrivacy policyProcessamento de linguagem naturalProteção de dados pessoais (Legislação)Terms of use and serviceOs relacionamentos virtuais entre usuários e empresas são regidos por documentos como termos de uso e serviço (ToS) e políticas de privacidade (PP). Esses documentos são difíceis para os usuários entenderem, pois são extensos e contêm linguagem complexa. Além disso, eles impõem cláusulas aos usuários, desequilibrando este relacionamento. Estudos de ambos os tipos de documentos mostraram maneiras de detectar cláusulas que são potencialmente em não conformidade com a legislação europeia consumerista e de proteção de dados. No entanto, essas pesquisas focam amplamente na base legal europeia e em documentos escritos em inglês. Neste trabalho interdisciplinar, apresentamos duas guidelines de anotação que mapeiam a legislação brasileira consumerista e de proteção de dados em categorias atributáveis para o aprendizado de máquina (10 categorias para a parte consumerista e 27 categorias para a parte de proteção de dados), com 3 níveis de conformidade. Também, introduzimos dois corpora em português, um com cláusulas de ToS e outro com cláusulas de PP, anotados com base nas guidelines, construídos em parceria com especialistas jurídicos do Instituto Lawgorithm. Analisamos o desempenho de modelos classificadores treinados com nossos corpora em duas tarefas: detecção e categorização de cláusulas potencialmente em não conformidade. Obtivemos resultados semelhantes aos de estudos na literatura sobre legislação europeia para textos em inglês. Nossos achados trazem luz sobre caminhos promissores para desenvolver métodos capazes de avaliar a conformidade de ToS e PP, em português, em relação às legislações brasileiras. Ainda, revelam obstáculos e complexidades para processar os textos contidos nestes tipos de documentos.Virtual relationships between users and companies are governed by documents such as online terms of use and service (ToS) and privacy policies (PP). These documents are difficult for users to understand, as they are extensive and contain complex language. Furthermore, they impose clauses on users, unbalancing the relationship. Studies of both types of documents have shown ways to detect clauses that are potentially non-compliant with European consumer and data protection legislation. However, such research largely focus on the European legal basis and on documents written in English. In this interdisciplinary work, we present two annotation guidelines that map Brazilian consumer and data protection legislation into categories that can be assigned to machine learning (10 categories for the consumer part and 27 categories for the data protection part), with 3 levels of compliance. We also introduce two corpora in Portuguese, one with ToS clauses and the other with PP clauses, annotated based on the guidelines, built in partnership with legal experts from Instituto Lawgorithm. We analyzed the performance of classifiers models trained with our corpora in two tasks: potentially non-compliant clauses detection and categorization. We obtained similar results to studies in the literature on European legislation for English texts. Our findings shed light on promising paths for developing methods capable of assessing the compliance of ToS and PP, in Portuguese, with Brazilian legislation. They also reveal obst´aculos and complexities in processing the texts contained in these types of documents.Biblioteca Digitais de Teses e Dissertações da USPSichman, Jaime SimãoTocchini, Matheus2025-11-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-29012026-110358/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2026-01-29T13:22:02Zoai:teses.usp.br:tde-29012026-110358Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-01-29T13:22:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa. Automatic detection of non-compliant clauses in online consumer contracts for Portuguese language. |
| title |
Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa. |
| spellingShingle |
Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa. Tocchini, Matheus Aprendizagem computacional Consumer law Corpus Data protection law Direito do consumidor (Brasil) Machine learning Natural language processing Privacy policy Processamento de linguagem natural Proteção de dados pessoais (Legislação) Terms of use and service |
| title_short |
Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa. |
| title_full |
Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa. |
| title_fullStr |
Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa. |
| title_full_unstemmed |
Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa. |
| title_sort |
Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa. |
| author |
Tocchini, Matheus |
| author_facet |
Tocchini, Matheus |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Sichman, Jaime Simão |
| dc.contributor.author.fl_str_mv |
Tocchini, Matheus |
| dc.subject.por.fl_str_mv |
Aprendizagem computacional Consumer law Corpus Data protection law Direito do consumidor (Brasil) Machine learning Natural language processing Privacy policy Processamento de linguagem natural Proteção de dados pessoais (Legislação) Terms of use and service |
| topic |
Aprendizagem computacional Consumer law Corpus Data protection law Direito do consumidor (Brasil) Machine learning Natural language processing Privacy policy Processamento de linguagem natural Proteção de dados pessoais (Legislação) Terms of use and service |
| description |
Os relacionamentos virtuais entre usuários e empresas são regidos por documentos como termos de uso e serviço (ToS) e políticas de privacidade (PP). Esses documentos são difíceis para os usuários entenderem, pois são extensos e contêm linguagem complexa. Além disso, eles impõem cláusulas aos usuários, desequilibrando este relacionamento. Estudos de ambos os tipos de documentos mostraram maneiras de detectar cláusulas que são potencialmente em não conformidade com a legislação europeia consumerista e de proteção de dados. No entanto, essas pesquisas focam amplamente na base legal europeia e em documentos escritos em inglês. Neste trabalho interdisciplinar, apresentamos duas guidelines de anotação que mapeiam a legislação brasileira consumerista e de proteção de dados em categorias atributáveis para o aprendizado de máquina (10 categorias para a parte consumerista e 27 categorias para a parte de proteção de dados), com 3 níveis de conformidade. Também, introduzimos dois corpora em português, um com cláusulas de ToS e outro com cláusulas de PP, anotados com base nas guidelines, construídos em parceria com especialistas jurídicos do Instituto Lawgorithm. Analisamos o desempenho de modelos classificadores treinados com nossos corpora em duas tarefas: detecção e categorização de cláusulas potencialmente em não conformidade. Obtivemos resultados semelhantes aos de estudos na literatura sobre legislação europeia para textos em inglês. Nossos achados trazem luz sobre caminhos promissores para desenvolver métodos capazes de avaliar a conformidade de ToS e PP, em português, em relação às legislações brasileiras. Ainda, revelam obstáculos e complexidades para processar os textos contidos nestes tipos de documentos. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-11-24 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-29012026-110358/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-29012026-110358/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492424125579264 |