Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Tocchini, Matheus
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-29012026-110358/
Resumo: Os relacionamentos virtuais entre usuários e empresas são regidos por documentos como termos de uso e serviço (ToS) e políticas de privacidade (PP). Esses documentos são difíceis para os usuários entenderem, pois são extensos e contêm linguagem complexa. Além disso, eles impõem cláusulas aos usuários, desequilibrando este relacionamento. Estudos de ambos os tipos de documentos mostraram maneiras de detectar cláusulas que são potencialmente em não conformidade com a legislação europeia consumerista e de proteção de dados. No entanto, essas pesquisas focam amplamente na base legal europeia e em documentos escritos em inglês. Neste trabalho interdisciplinar, apresentamos duas guidelines de anotação que mapeiam a legislação brasileira consumerista e de proteção de dados em categorias atributáveis para o aprendizado de máquina (10 categorias para a parte consumerista e 27 categorias para a parte de proteção de dados), com 3 níveis de conformidade. Também, introduzimos dois corpora em português, um com cláusulas de ToS e outro com cláusulas de PP, anotados com base nas guidelines, construídos em parceria com especialistas jurídicos do Instituto Lawgorithm. Analisamos o desempenho de modelos classificadores treinados com nossos corpora em duas tarefas: detecção e categorização de cláusulas potencialmente em não conformidade. Obtivemos resultados semelhantes aos de estudos na literatura sobre legislação europeia para textos em inglês. Nossos achados trazem luz sobre caminhos promissores para desenvolver métodos capazes de avaliar a conformidade de ToS e PP, em português, em relação às legislações brasileiras. Ainda, revelam obstáculos e complexidades para processar os textos contidos nestes tipos de documentos.
id USP_93f471b1a420f3923607b7cf2c751e7e
oai_identifier_str oai:teses.usp.br:tde-29012026-110358
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.Automatic detection of non-compliant clauses in online consumer contracts for Portuguese language.Aprendizagem computacionalConsumer lawCorpusData protection lawDireito do consumidor (Brasil)Machine learningNatural language processingPrivacy policyProcessamento de linguagem naturalProteção de dados pessoais (Legislação)Terms of use and serviceOs relacionamentos virtuais entre usuários e empresas são regidos por documentos como termos de uso e serviço (ToS) e políticas de privacidade (PP). Esses documentos são difíceis para os usuários entenderem, pois são extensos e contêm linguagem complexa. Além disso, eles impõem cláusulas aos usuários, desequilibrando este relacionamento. Estudos de ambos os tipos de documentos mostraram maneiras de detectar cláusulas que são potencialmente em não conformidade com a legislação europeia consumerista e de proteção de dados. No entanto, essas pesquisas focam amplamente na base legal europeia e em documentos escritos em inglês. Neste trabalho interdisciplinar, apresentamos duas guidelines de anotação que mapeiam a legislação brasileira consumerista e de proteção de dados em categorias atributáveis para o aprendizado de máquina (10 categorias para a parte consumerista e 27 categorias para a parte de proteção de dados), com 3 níveis de conformidade. Também, introduzimos dois corpora em português, um com cláusulas de ToS e outro com cláusulas de PP, anotados com base nas guidelines, construídos em parceria com especialistas jurídicos do Instituto Lawgorithm. Analisamos o desempenho de modelos classificadores treinados com nossos corpora em duas tarefas: detecção e categorização de cláusulas potencialmente em não conformidade. Obtivemos resultados semelhantes aos de estudos na literatura sobre legislação europeia para textos em inglês. Nossos achados trazem luz sobre caminhos promissores para desenvolver métodos capazes de avaliar a conformidade de ToS e PP, em português, em relação às legislações brasileiras. Ainda, revelam obstáculos e complexidades para processar os textos contidos nestes tipos de documentos.Virtual relationships between users and companies are governed by documents such as online terms of use and service (ToS) and privacy policies (PP). These documents are difficult for users to understand, as they are extensive and contain complex language. Furthermore, they impose clauses on users, unbalancing the relationship. Studies of both types of documents have shown ways to detect clauses that are potentially non-compliant with European consumer and data protection legislation. However, such research largely focus on the European legal basis and on documents written in English. In this interdisciplinary work, we present two annotation guidelines that map Brazilian consumer and data protection legislation into categories that can be assigned to machine learning (10 categories for the consumer part and 27 categories for the data protection part), with 3 levels of compliance. We also introduce two corpora in Portuguese, one with ToS clauses and the other with PP clauses, annotated based on the guidelines, built in partnership with legal experts from Instituto Lawgorithm. We analyzed the performance of classifiers models trained with our corpora in two tasks: potentially non-compliant clauses detection and categorization. We obtained similar results to studies in the literature on European legislation for English texts. Our findings shed light on promising paths for developing methods capable of assessing the compliance of ToS and PP, in Portuguese, with Brazilian legislation. They also reveal obst´aculos and complexities in processing the texts contained in these types of documents.Biblioteca Digitais de Teses e Dissertações da USPSichman, Jaime SimãoTocchini, Matheus2025-11-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-29012026-110358/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2026-01-29T13:22:02Zoai:teses.usp.br:tde-29012026-110358Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-01-29T13:22:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.
Automatic detection of non-compliant clauses in online consumer contracts for Portuguese language.
title Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.
spellingShingle Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.
Tocchini, Matheus
Aprendizagem computacional
Consumer law
Corpus
Data protection law
Direito do consumidor (Brasil)
Machine learning
Natural language processing
Privacy policy
Processamento de linguagem natural
Proteção de dados pessoais (Legislação)
Terms of use and service
title_short Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.
title_full Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.
title_fullStr Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.
title_full_unstemmed Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.
title_sort Detecção automática de cláusulas em não conformidade em contratos de consumo online para a língua portuguesa.
author Tocchini, Matheus
author_facet Tocchini, Matheus
author_role author
dc.contributor.none.fl_str_mv Sichman, Jaime Simão
dc.contributor.author.fl_str_mv Tocchini, Matheus
dc.subject.por.fl_str_mv Aprendizagem computacional
Consumer law
Corpus
Data protection law
Direito do consumidor (Brasil)
Machine learning
Natural language processing
Privacy policy
Processamento de linguagem natural
Proteção de dados pessoais (Legislação)
Terms of use and service
topic Aprendizagem computacional
Consumer law
Corpus
Data protection law
Direito do consumidor (Brasil)
Machine learning
Natural language processing
Privacy policy
Processamento de linguagem natural
Proteção de dados pessoais (Legislação)
Terms of use and service
description Os relacionamentos virtuais entre usuários e empresas são regidos por documentos como termos de uso e serviço (ToS) e políticas de privacidade (PP). Esses documentos são difíceis para os usuários entenderem, pois são extensos e contêm linguagem complexa. Além disso, eles impõem cláusulas aos usuários, desequilibrando este relacionamento. Estudos de ambos os tipos de documentos mostraram maneiras de detectar cláusulas que são potencialmente em não conformidade com a legislação europeia consumerista e de proteção de dados. No entanto, essas pesquisas focam amplamente na base legal europeia e em documentos escritos em inglês. Neste trabalho interdisciplinar, apresentamos duas guidelines de anotação que mapeiam a legislação brasileira consumerista e de proteção de dados em categorias atributáveis para o aprendizado de máquina (10 categorias para a parte consumerista e 27 categorias para a parte de proteção de dados), com 3 níveis de conformidade. Também, introduzimos dois corpora em português, um com cláusulas de ToS e outro com cláusulas de PP, anotados com base nas guidelines, construídos em parceria com especialistas jurídicos do Instituto Lawgorithm. Analisamos o desempenho de modelos classificadores treinados com nossos corpora em duas tarefas: detecção e categorização de cláusulas potencialmente em não conformidade. Obtivemos resultados semelhantes aos de estudos na literatura sobre legislação europeia para textos em inglês. Nossos achados trazem luz sobre caminhos promissores para desenvolver métodos capazes de avaliar a conformidade de ToS e PP, em português, em relação às legislações brasileiras. Ainda, revelam obstáculos e complexidades para processar os textos contidos nestes tipos de documentos.
publishDate 2025
dc.date.none.fl_str_mv 2025-11-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3141/tde-29012026-110358/
url https://www.teses.usp.br/teses/disponiveis/3/3141/tde-29012026-110358/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492424125579264