Geração de consultas SPARQL a partir de linguagem natural
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16012026-101734/ |
Resumo: | A Web Semântica tem como objetivo fornecer informações na web com significado bem definido, tornando-as compreensíveis não apenas para seres humanos, mas também para máquinas e sistemas computacionais. Como parte dos esforços de desenvolvimento da Web Semântica, foram criados os chamados Dados Abertos Ligados (DAL), que consistem em conjuntos de dados semanticamente anotados e interligados. Esses dados, quando armazenados em repositórios apropriados, permitem a realização de consultas complexas, inclusive de forma remota. No entanto, a recuperação de informações nesses repositórios exige o domínio da linguagem SPARQL, o que representa uma barreira para usuários não especialistas. Diversas abordagens têm sido propostas para permitir a geração automática de consultas SPARQL a partir de linguagem natural. Contudo, muitas delas apresentam limitações quanto à adaptação para o idioma português e à aplicabilidade em diferentes domínios de conhecimento. Este trabalho propõe uma arquitetura de software genérica para a geração de consultas SPARQL a partir de perguntas formuladas em linguagem natural na língua portuguesa, cuja implementação é adaptável a diferentes domínios de conhecimento. Neste contexto, foi desenvolvida a ferramenta de código aberto <i>Natural2SPARQL</i>, uma aplicação web que torna o processo de consulta a dados semânticos mais acessível e intuitivo. A solução foi validada por meio de um estudo de caso no domínio financeiro, utilizando dados da bolsa de valores brasileira (B3). A avaliação, conduzida em duas fases, testou a robustez técnica do sistema contra a variabilidade linguística de múltiplos agentes de IA - alcançando uma acurácia média de 93,3% - e sua aplicabilidade prática com usuários humanos. Os resultados demonstraram a eficácia da arquitetura, contribuindo de forma significativa para a democratização do acesso à Web Semântica. |
| id |
USP_a8300ec220f9389964f30ce82aaa6f82 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-16012026-101734 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Geração de consultas SPARQL a partir de linguagem naturalGenerating SPARQL queries from natural languageDados abertos ligadosProcessamento de linguagem naturalSPARQLWeb semânticaLinked open dataNatural language processingSemantic webSPARQLA Web Semântica tem como objetivo fornecer informações na web com significado bem definido, tornando-as compreensíveis não apenas para seres humanos, mas também para máquinas e sistemas computacionais. Como parte dos esforços de desenvolvimento da Web Semântica, foram criados os chamados Dados Abertos Ligados (DAL), que consistem em conjuntos de dados semanticamente anotados e interligados. Esses dados, quando armazenados em repositórios apropriados, permitem a realização de consultas complexas, inclusive de forma remota. No entanto, a recuperação de informações nesses repositórios exige o domínio da linguagem SPARQL, o que representa uma barreira para usuários não especialistas. Diversas abordagens têm sido propostas para permitir a geração automática de consultas SPARQL a partir de linguagem natural. Contudo, muitas delas apresentam limitações quanto à adaptação para o idioma português e à aplicabilidade em diferentes domínios de conhecimento. Este trabalho propõe uma arquitetura de software genérica para a geração de consultas SPARQL a partir de perguntas formuladas em linguagem natural na língua portuguesa, cuja implementação é adaptável a diferentes domínios de conhecimento. Neste contexto, foi desenvolvida a ferramenta de código aberto <i>Natural2SPARQL</i>, uma aplicação web que torna o processo de consulta a dados semânticos mais acessível e intuitivo. A solução foi validada por meio de um estudo de caso no domínio financeiro, utilizando dados da bolsa de valores brasileira (B3). A avaliação, conduzida em duas fases, testou a robustez técnica do sistema contra a variabilidade linguística de múltiplos agentes de IA - alcançando uma acurácia média de 93,3% - e sua aplicabilidade prática com usuários humanos. Os resultados demonstraram a eficácia da arquitetura, contribuindo de forma significativa para a democratização do acesso à Web Semântica.The Semantic Web aims to provide information on the web with well-defined meaning, making it understandable not only to humans but also to machines and computational systems. As part of the efforts to develop the Semantic Web, the so-called Linked Open Data (LOD) was created, consisting of semantically annotated and interconnected datasets. When stored in appropriate repositories, this data enables the execution of complex queries, including remote access. However, retrieving information from these repositories requires knowledge of the SPARQL query language, which poses a barrier for non-expert users. Several approaches have been proposed to enable the automatic generation of SPARQL queries from natural language. However, many of them present limitations regarding adaptation to the Portuguese language and applicability across different knowledge domains. This work proposes a generic and domain-independent approach for generating SPARQL queries from questions formulated in natural language in Portuguese. In this context, the open-source tool Natural2SPARQL, a web application, was developed to render the process of querying semantic data more accessible and intuitive. The approach was validated via a case study in the financial domain, utilizing data from the Brazilian stock exchange (B3). A two-phase evaluation tested the system\'s technical robustness against the linguistic variability of multiple AI agents, achieving an average accuracy of 93.3%, and assessed its practical applicability with human users. The results demonstrated the effectiveness of the architecture, thereby contributing significantly to the democratization of access to the Semantic Web.Biblioteca Digitais de Teses e Dissertacoes da USPUniversidade de São PauloFaculdade de Filosofia, Ciências e Letras de Ribeirão PretoFarias, Clever Ricardo Guareis deCastro, Heber Gustavo Xavier de2025-11-182026-04-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/59/59143/tde-16012026-101734/doi:10.11606/D.59.2025.tde-16012026-101734Liberar o conteúdo para acesso público.info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2026-04-22T13:32:02Zoai:teses.usp.br:tde-16012026-101734Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-04-22T13:32:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Geração de consultas SPARQL a partir de linguagem natural Generating SPARQL queries from natural language |
| title |
Geração de consultas SPARQL a partir de linguagem natural |
| spellingShingle |
Geração de consultas SPARQL a partir de linguagem natural Castro, Heber Gustavo Xavier de Dados abertos ligados Processamento de linguagem natural SPARQL Web semântica Linked open data Natural language processing Semantic web SPARQL |
| title_short |
Geração de consultas SPARQL a partir de linguagem natural |
| title_full |
Geração de consultas SPARQL a partir de linguagem natural |
| title_fullStr |
Geração de consultas SPARQL a partir de linguagem natural |
| title_full_unstemmed |
Geração de consultas SPARQL a partir de linguagem natural |
| title_sort |
Geração de consultas SPARQL a partir de linguagem natural |
| author |
Castro, Heber Gustavo Xavier de |
| author_facet |
Castro, Heber Gustavo Xavier de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Farias, Clever Ricardo Guareis de |
| dc.contributor.author.fl_str_mv |
Castro, Heber Gustavo Xavier de |
| dc.subject.por.fl_str_mv |
Dados abertos ligados Processamento de linguagem natural SPARQL Web semântica Linked open data Natural language processing Semantic web SPARQL |
| topic |
Dados abertos ligados Processamento de linguagem natural SPARQL Web semântica Linked open data Natural language processing Semantic web SPARQL |
| description |
A Web Semântica tem como objetivo fornecer informações na web com significado bem definido, tornando-as compreensíveis não apenas para seres humanos, mas também para máquinas e sistemas computacionais. Como parte dos esforços de desenvolvimento da Web Semântica, foram criados os chamados Dados Abertos Ligados (DAL), que consistem em conjuntos de dados semanticamente anotados e interligados. Esses dados, quando armazenados em repositórios apropriados, permitem a realização de consultas complexas, inclusive de forma remota. No entanto, a recuperação de informações nesses repositórios exige o domínio da linguagem SPARQL, o que representa uma barreira para usuários não especialistas. Diversas abordagens têm sido propostas para permitir a geração automática de consultas SPARQL a partir de linguagem natural. Contudo, muitas delas apresentam limitações quanto à adaptação para o idioma português e à aplicabilidade em diferentes domínios de conhecimento. Este trabalho propõe uma arquitetura de software genérica para a geração de consultas SPARQL a partir de perguntas formuladas em linguagem natural na língua portuguesa, cuja implementação é adaptável a diferentes domínios de conhecimento. Neste contexto, foi desenvolvida a ferramenta de código aberto <i>Natural2SPARQL</i>, uma aplicação web que torna o processo de consulta a dados semânticos mais acessível e intuitivo. A solução foi validada por meio de um estudo de caso no domínio financeiro, utilizando dados da bolsa de valores brasileira (B3). A avaliação, conduzida em duas fases, testou a robustez técnica do sistema contra a variabilidade linguística de múltiplos agentes de IA - alcançando uma acurácia média de 93,3% - e sua aplicabilidade prática com usuários humanos. Os resultados demonstraram a eficácia da arquitetura, contribuindo de forma significativa para a democratização do acesso à Web Semântica. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-11-18 2026-04-22 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16012026-101734/ doi:10.11606/D.59.2025.tde-16012026-101734 |
| url |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16012026-101734/ |
| identifier_str_mv |
doi:10.11606/D.59.2025.tde-16012026-101734 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertacoes da USP Universidade de São Paulo Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertacoes da USP Universidade de São Paulo Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492703562694656 |