Geração de consultas SPARQL a partir de linguagem natural

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Castro, Heber Gustavo Xavier de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo
Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16012026-101734/
Resumo: A Web Semântica tem como objetivo fornecer informações na web com significado bem definido, tornando-as compreensíveis não apenas para seres humanos, mas também para máquinas e sistemas computacionais. Como parte dos esforços de desenvolvimento da Web Semântica, foram criados os chamados Dados Abertos Ligados (DAL), que consistem em conjuntos de dados semanticamente anotados e interligados. Esses dados, quando armazenados em repositórios apropriados, permitem a realização de consultas complexas, inclusive de forma remota. No entanto, a recuperação de informações nesses repositórios exige o domínio da linguagem SPARQL, o que representa uma barreira para usuários não especialistas. Diversas abordagens têm sido propostas para permitir a geração automática de consultas SPARQL a partir de linguagem natural. Contudo, muitas delas apresentam limitações quanto à adaptação para o idioma português e à aplicabilidade em diferentes domínios de conhecimento. Este trabalho propõe uma arquitetura de software genérica para a geração de consultas SPARQL a partir de perguntas formuladas em linguagem natural na língua portuguesa, cuja implementação é adaptável a diferentes domínios de conhecimento. Neste contexto, foi desenvolvida a ferramenta de código aberto <i>Natural2SPARQL</i>, uma aplicação web que torna o processo de consulta a dados semânticos mais acessível e intuitivo. A solução foi validada por meio de um estudo de caso no domínio financeiro, utilizando dados da bolsa de valores brasileira (B3). A avaliação, conduzida em duas fases, testou a robustez técnica do sistema contra a variabilidade linguística de múltiplos agentes de IA - alcançando uma acurácia média de 93,3% - e sua aplicabilidade prática com usuários humanos. Os resultados demonstraram a eficácia da arquitetura, contribuindo de forma significativa para a democratização do acesso à Web Semântica.
id USP_a8300ec220f9389964f30ce82aaa6f82
oai_identifier_str oai:teses.usp.br:tde-16012026-101734
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Geração de consultas SPARQL a partir de linguagem naturalGenerating SPARQL queries from natural languageDados abertos ligadosProcessamento de linguagem naturalSPARQLWeb semânticaLinked open dataNatural language processingSemantic webSPARQLA Web Semântica tem como objetivo fornecer informações na web com significado bem definido, tornando-as compreensíveis não apenas para seres humanos, mas também para máquinas e sistemas computacionais. Como parte dos esforços de desenvolvimento da Web Semântica, foram criados os chamados Dados Abertos Ligados (DAL), que consistem em conjuntos de dados semanticamente anotados e interligados. Esses dados, quando armazenados em repositórios apropriados, permitem a realização de consultas complexas, inclusive de forma remota. No entanto, a recuperação de informações nesses repositórios exige o domínio da linguagem SPARQL, o que representa uma barreira para usuários não especialistas. Diversas abordagens têm sido propostas para permitir a geração automática de consultas SPARQL a partir de linguagem natural. Contudo, muitas delas apresentam limitações quanto à adaptação para o idioma português e à aplicabilidade em diferentes domínios de conhecimento. Este trabalho propõe uma arquitetura de software genérica para a geração de consultas SPARQL a partir de perguntas formuladas em linguagem natural na língua portuguesa, cuja implementação é adaptável a diferentes domínios de conhecimento. Neste contexto, foi desenvolvida a ferramenta de código aberto <i>Natural2SPARQL</i>, uma aplicação web que torna o processo de consulta a dados semânticos mais acessível e intuitivo. A solução foi validada por meio de um estudo de caso no domínio financeiro, utilizando dados da bolsa de valores brasileira (B3). A avaliação, conduzida em duas fases, testou a robustez técnica do sistema contra a variabilidade linguística de múltiplos agentes de IA - alcançando uma acurácia média de 93,3% - e sua aplicabilidade prática com usuários humanos. Os resultados demonstraram a eficácia da arquitetura, contribuindo de forma significativa para a democratização do acesso à Web Semântica.The Semantic Web aims to provide information on the web with well-defined meaning, making it understandable not only to humans but also to machines and computational systems. As part of the efforts to develop the Semantic Web, the so-called Linked Open Data (LOD) was created, consisting of semantically annotated and interconnected datasets. When stored in appropriate repositories, this data enables the execution of complex queries, including remote access. However, retrieving information from these repositories requires knowledge of the SPARQL query language, which poses a barrier for non-expert users. Several approaches have been proposed to enable the automatic generation of SPARQL queries from natural language. However, many of them present limitations regarding adaptation to the Portuguese language and applicability across different knowledge domains. This work proposes a generic and domain-independent approach for generating SPARQL queries from questions formulated in natural language in Portuguese. In this context, the open-source tool Natural2SPARQL, a web application, was developed to render the process of querying semantic data more accessible and intuitive. The approach was validated via a case study in the financial domain, utilizing data from the Brazilian stock exchange (B3). A two-phase evaluation tested the system\'s technical robustness against the linguistic variability of multiple AI agents, achieving an average accuracy of 93.3%, and assessed its practical applicability with human users. The results demonstrated the effectiveness of the architecture, thereby contributing significantly to the democratization of access to the Semantic Web.Biblioteca Digitais de Teses e Dissertacoes da USPUniversidade de São PauloFaculdade de Filosofia, Ciências e Letras de Ribeirão PretoFarias, Clever Ricardo Guareis deCastro, Heber Gustavo Xavier de2025-11-182026-04-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/59/59143/tde-16012026-101734/doi:10.11606/D.59.2025.tde-16012026-101734Liberar o conteúdo para acesso público.info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2026-04-22T13:32:02Zoai:teses.usp.br:tde-16012026-101734Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-04-22T13:32:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Geração de consultas SPARQL a partir de linguagem natural
Generating SPARQL queries from natural language
title Geração de consultas SPARQL a partir de linguagem natural
spellingShingle Geração de consultas SPARQL a partir de linguagem natural
Castro, Heber Gustavo Xavier de
Dados abertos ligados
Processamento de linguagem natural
SPARQL
Web semântica
Linked open data
Natural language processing
Semantic web
SPARQL
title_short Geração de consultas SPARQL a partir de linguagem natural
title_full Geração de consultas SPARQL a partir de linguagem natural
title_fullStr Geração de consultas SPARQL a partir de linguagem natural
title_full_unstemmed Geração de consultas SPARQL a partir de linguagem natural
title_sort Geração de consultas SPARQL a partir de linguagem natural
author Castro, Heber Gustavo Xavier de
author_facet Castro, Heber Gustavo Xavier de
author_role author
dc.contributor.none.fl_str_mv Farias, Clever Ricardo Guareis de
dc.contributor.author.fl_str_mv Castro, Heber Gustavo Xavier de
dc.subject.por.fl_str_mv Dados abertos ligados
Processamento de linguagem natural
SPARQL
Web semântica
Linked open data
Natural language processing
Semantic web
SPARQL
topic Dados abertos ligados
Processamento de linguagem natural
SPARQL
Web semântica
Linked open data
Natural language processing
Semantic web
SPARQL
description A Web Semântica tem como objetivo fornecer informações na web com significado bem definido, tornando-as compreensíveis não apenas para seres humanos, mas também para máquinas e sistemas computacionais. Como parte dos esforços de desenvolvimento da Web Semântica, foram criados os chamados Dados Abertos Ligados (DAL), que consistem em conjuntos de dados semanticamente anotados e interligados. Esses dados, quando armazenados em repositórios apropriados, permitem a realização de consultas complexas, inclusive de forma remota. No entanto, a recuperação de informações nesses repositórios exige o domínio da linguagem SPARQL, o que representa uma barreira para usuários não especialistas. Diversas abordagens têm sido propostas para permitir a geração automática de consultas SPARQL a partir de linguagem natural. Contudo, muitas delas apresentam limitações quanto à adaptação para o idioma português e à aplicabilidade em diferentes domínios de conhecimento. Este trabalho propõe uma arquitetura de software genérica para a geração de consultas SPARQL a partir de perguntas formuladas em linguagem natural na língua portuguesa, cuja implementação é adaptável a diferentes domínios de conhecimento. Neste contexto, foi desenvolvida a ferramenta de código aberto <i>Natural2SPARQL</i>, uma aplicação web que torna o processo de consulta a dados semânticos mais acessível e intuitivo. A solução foi validada por meio de um estudo de caso no domínio financeiro, utilizando dados da bolsa de valores brasileira (B3). A avaliação, conduzida em duas fases, testou a robustez técnica do sistema contra a variabilidade linguística de múltiplos agentes de IA - alcançando uma acurácia média de 93,3% - e sua aplicabilidade prática com usuários humanos. Os resultados demonstraram a eficácia da arquitetura, contribuindo de forma significativa para a democratização do acesso à Web Semântica.
publishDate 2025
dc.date.none.fl_str_mv 2025-11-18
2026-04-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16012026-101734/
doi:10.11606/D.59.2025.tde-16012026-101734
url https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16012026-101734/
identifier_str_mv doi:10.11606/D.59.2025.tde-16012026-101734
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo
Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo
Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492703562694656