FasterSparql: an architecture for query mediation over loosely coupled federations of knowledge graphs

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Huf, Alexis Armin
Orientador(a): Siqueira, Frank
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://repositorio.ufsc.br/handle/123456789/264679
Resumo: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2025.
id UFSC_f7fca0d8dfbf214a784d0a7780c0920e
oai_identifier_str oai:repositorio.ufsc.br:123456789/264679
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str
spelling Universidade Federal de Santa CatarinaHuf, Alexis ArminSiqueira, Frank2025-04-28T23:24:34Z2025-04-28T23:24:34Z2025391311https://repositorio.ufsc.br/handle/123456789/264679Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2025.Integração de dados, que consiste em fornecer uma visão unificada para dados de múltiplas fontes, como Web APIs e bases de dados, é um problema comum e tópico de extensa literatura. No contexto de Linked Data, mediatores de consultas federadas computam o resultado de uma consulta direcionada à união de todos os dados em diversas fontes para evitar a materialização da união dos dados em um repositório único. Embora tal abordagem facilite a integração de dados, o tempo de resposta e o consumo de recursos por parte de mediadores do estado da arte pode ser demasiadamente elevado, dependendo da consulta e dos dados envolvidos. Após análise da literatura, duas limitações foram identificadas no estado da arte de mediação de consultas: (i) a arquitetura de software dos motores de execução nos mediadores adota uma representação excessivamente granular dos resultados intermediários; (ii) o protocolo SPARQL sobre HTTP atua como um gargalo, inibindo a concorrência entre mediador e fontes de dados. O presente trabalho propõe uma arquitetura de mediador e uma extensão para o protocolo SPARQL, resolvendo os problemas apontados e focando na forma como consultas são executadas ao invés de como as consultas são decompostas. O mediador foi implementado em Java e foi avaliado utilizando o benchmark LargeRDFBench. Na comparação com o mediador, cujo motor de execução é o mais eficiente, o protótipo consegue completar 7 consultas adicionais dentre 32 no benchmark e, executando os mesmos planos, é mais de 5 vezes mais rápido na média de várias configurações do mediador e da federação. A extensão WebSockets torna a execução mais de 2 vezes mais rápida do que utilizando SPARQL sobre HTTP, em federações utilizando a fonte menos eficiente. Considerando uma federação com as fontes mais eficientes, o ganho proporcionado pela extensão WebSockets em relação ao SPARQL sobre HTTP supera as 23 vezes, evidenciando a capacidade da extensão proposta em permitir que ganhos de eficiência das fontes sejam observáveis também no cenário de mediação.Abstract: Data integration, or providing a unified view for data that originates from multiple sources, such as Web APIs and databases, is a common problem in practice and the subject of extensive research literature. In the context of linked data, federated query mediators can take a single query and transparently compute results for it over a union of all data without requiring its materialization as a single repository. While this approach eases integration, response time and resource consumption by state of the art mediators can be excessive, depending on the query and the data. Upon analysis, two limitations were identified with current mediators: (i) the software architecture of execution engines within mediators adopts an excessively granular representation of intermediate results; (ii) the SPARQL protocol, over HTTP, acts as a bottleneck inhibiting concurrency between mediator and data sources. This work proposes a mediator architecture and an extension to the SPARQL protocol that tackle the aforementioned issues by focusing on how queries are executed rather than on how they are decomposed. The mediator was implemented in Java and was evaluated using the LargeRDFBench benchmark. In comparison to the most efficient execution engine in the literature, using the same execution plan and join operator, the prototype is over 5 times faster and completes 7 additional queries out of the 32 benchmark queries, in various federation and mediator configurations. The WebSockets extension provides an average speedup of 2 times when mediating over the slowest triple store. When mediating over the fastest triple store, the achieved speedup is over 20 times, demonstrating that the extension is not only more efficient, but that it also allows mediators to benefit from efficiency advances in triple stores.201 p.| il., gráfs.engComputaçãoWeb semânticaServiços da WebIntegração de dados (Computação)FasterSparql: an architecture for query mediation over loosely coupled federations of knowledge graphsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPGCC1292-T.pdfPGCC1292-T.pdfapplication/pdf15227936https://repositorio.ufsc.br/bitstream/123456789/264679/-1/PGCC1292-T.pdfc63c6c6e3a0f5bcf5cc7cef034677987MD5-1123456789/2646792025-04-28 20:24:34.813oai:repositorio.ufsc.br:123456789/264679Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestsandra.sobrera@ufsc.bropendoar:23732025-04-28T23:24:34Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv FasterSparql: an architecture for query mediation over loosely coupled federations of knowledge graphs
title FasterSparql: an architecture for query mediation over loosely coupled federations of knowledge graphs
spellingShingle FasterSparql: an architecture for query mediation over loosely coupled federations of knowledge graphs
Huf, Alexis Armin
Computação
Web semântica
Serviços da Web
Integração de dados (Computação)
title_short FasterSparql: an architecture for query mediation over loosely coupled federations of knowledge graphs
title_full FasterSparql: an architecture for query mediation over loosely coupled federations of knowledge graphs
title_fullStr FasterSparql: an architecture for query mediation over loosely coupled federations of knowledge graphs
title_full_unstemmed FasterSparql: an architecture for query mediation over loosely coupled federations of knowledge graphs
title_sort FasterSparql: an architecture for query mediation over loosely coupled federations of knowledge graphs
author Huf, Alexis Armin
author_facet Huf, Alexis Armin
author_role author
dc.contributor.none.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Huf, Alexis Armin
dc.contributor.advisor1.fl_str_mv Siqueira, Frank
contributor_str_mv Siqueira, Frank
dc.subject.classification.none.fl_str_mv Computação
Web semântica
Serviços da Web
Integração de dados (Computação)
topic Computação
Web semântica
Serviços da Web
Integração de dados (Computação)
description Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2025.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-04-28T23:24:34Z
dc.date.available.fl_str_mv 2025-04-28T23:24:34Z
dc.date.issued.fl_str_mv 2025
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/264679
dc.identifier.other.none.fl_str_mv 391311
identifier_str_mv 391311
url https://repositorio.ufsc.br/handle/123456789/264679
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 201 p.| il., gráfs.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/264679/-1/PGCC1292-T.pdf
bitstream.checksum.fl_str_mv c63c6c6e3a0f5bcf5cc7cef034677987
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv sandra.sobrera@ufsc.br
_version_ 1851759097536315392