A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Santos, Fred de Castro
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
RDF
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/24970
Resumo: The World Wide Web is an always increasing collection of information. This information is spread among different documents, which are made available by using the HTTP. Even though this information is accessible to users in the form of news articles, audio broadcasts, images and videos, software agents often cannot classify it. The lack of semantic information about these documents in a machine-readable format usually makes the analysis inaccurate. A significant number of entities have adopted Linked Data as a way to add semantic information to their data, not just publishing it on the Web. The result is a global data collection, called the Web of Data, which forms a global graph, consisting of RDF [22] statements from numerous sources, covering all sorts of topics. To find specific information in this graph, queries are performed starting at a subject and analyzing their predicates in the RDF statements. These predicates are the connections between the subject and object, and a set of traces forms an information path. The use of HTTP as a standardized data access mechanism and RDF as a standard data model simplifies the data access, but accessing heterogeneous data on distinct locations may have an increased time complexity and current query languages have a reduced query expressiveness, which motivates us to research alternatives in how this data is queried. This reduced expressiveness happens because most query languages belong to the class of Regular Languages. The main goal of this work is to use LR(1) context-free grammar processing techniques to search for context-free paths over RDF graph databases, providing, as result, a tool which allows better expressiveness, efficiency and scalability in such queries than what is proposed today. To achieve that, we implemented an algorithm based on the LR(1) parsing technique that uses the GSS [30] structure instead of a stack, and give means for the user to input queries with an LR(1) context-free grammar. Also, we analyze our algorithm’s complexity and make some experiments, comparing our solution to other proposals present in the literature and show that ours can have better performance in given scenarios.
id UFRN_ae9cacb06e2078b2c8d459d7a05e9351
oai_identifier_str oai:repositorio.ufrn.br:123456789/24970
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databasesBancos de Dados em GrafoExpressividade de linguagens de consultaRDFLinguagens LR(1)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOThe World Wide Web is an always increasing collection of information. This information is spread among different documents, which are made available by using the HTTP. Even though this information is accessible to users in the form of news articles, audio broadcasts, images and videos, software agents often cannot classify it. The lack of semantic information about these documents in a machine-readable format usually makes the analysis inaccurate. A significant number of entities have adopted Linked Data as a way to add semantic information to their data, not just publishing it on the Web. The result is a global data collection, called the Web of Data, which forms a global graph, consisting of RDF [22] statements from numerous sources, covering all sorts of topics. To find specific information in this graph, queries are performed starting at a subject and analyzing their predicates in the RDF statements. These predicates are the connections between the subject and object, and a set of traces forms an information path. The use of HTTP as a standardized data access mechanism and RDF as a standard data model simplifies the data access, but accessing heterogeneous data on distinct locations may have an increased time complexity and current query languages have a reduced query expressiveness, which motivates us to research alternatives in how this data is queried. This reduced expressiveness happens because most query languages belong to the class of Regular Languages. The main goal of this work is to use LR(1) context-free grammar processing techniques to search for context-free paths over RDF graph databases, providing, as result, a tool which allows better expressiveness, efficiency and scalability in such queries than what is proposed today. To achieve that, we implemented an algorithm based on the LR(1) parsing technique that uses the GSS [30] structure instead of a stack, and give means for the user to input queries with an LR(1) context-free grammar. Also, we analyze our algorithm’s complexity and make some experiments, comparing our solution to other proposals present in the literature and show that ours can have better performance in given scenarios.A World Wide Web é uma coleção de informações sempre crescente. Esta informação é distribuída entre documentos diferentes, disponibilizados através do HTTP. Mesmo que essa informação seja acessível aos usuários na forma de artigos de notícias, transmissões de áudio, imagens e vídeos, os agentes de software geralmente não podem classificá-la. A falta de informações semânticas sobre esses documentos em um formato legível por máquina geralmente faz com que a análise seja imprecisa. Um número significativo de entidades adotaram Linked Data como uma forma de adicionar informações semânticas aos seus dados, e não apenas publicá-lo na Web. O resultado é uma coleção global de dados, chamada Web of Data, que forma um grafo global, composto por declarações no formato RDF [22] de diversas fontes, cobrindo todos os tipos de tópicos. Para encontrar informações específicas nesses grafos, as consultas são realizadas começando em um sujeito e analisando seus predicados nas instruções RDF. Esses predicados são as conexões entre o sujeito e o objeto, e um conjunto de trilhas forma um caminho de informação. O uso de HTTP como mecanismo padrão de acesso a dados e RDF como modelo de dados padrão simplifica o acesso a dados, o que nos motiva a pesquisar alternativas na forma como esses dados são buscados. Uma vez que a maioria das linguagens de consulta de banco de dados de grafo estão na classe de Linguagens Regulares, nós propomos seguir um caminho diferente e tentar usar uma classe de gramática menos restritiva, chamada Gramática Livre de Contexto Determinística, para aumentar a expressividade das consultas no banco de dados em grafo. Mais especificamente, aplicando o método de análise LR(1) para encontrar caminhos em um banco de dados de grafo RDF. O principal objetivo deste trabalho é prover meios para se permitir a utilização de técnicas de reconhecimento de gramáticas livres de contexto LR(1) para fazer consultas por caminhos formados pelas etiquetas das arestas em um banco de dados RDF. Fornecendo, como um resultado, uma ferramenta que se permita atingir melhor expressividade, eficiência e escalabilidade nestas consultas do que o que existe atualmente. Para atingir este objetivo, nós implementamos um algoritmo baseado nas técnicas de reconhecimento LR(1), usando o GSS [30] ao invés de uma pilha, e permitimos ao usuário fazer consultas com uma gramática livre de contexto (LR1). Também analisamos a complexidade do nosso algoritmo e executamos alguns experimentos, comparando nossa solução com as outras propostas na literatura, mostrando que a nossa pode ter melhor desempenho em alguns cenários.BrasilUFRNPROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃOCosta, Umberto Souza daMusicante, Martin AlejandroOliveira, Marcel Vinicius MedeirosBigonha, Mariza Andrade da SilvaMedeiros, Sérgio Queiroz deSantos, Fred de Castro2018-04-04T12:11:32Z2018-04-04T12:11:32Z2018-02-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSANTOS, Fred de Castro. A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases. 2018. 85f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2018.https://repositorio.ufrn.br/jspui/handle/123456789/24970porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRN2019-01-30T20:38:36Zoai:repositorio.ufrn.br:123456789/24970Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2019-01-30T20:38:36Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.none.fl_str_mv A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
title A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
spellingShingle A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
Santos, Fred de Castro
Bancos de Dados em Grafo
Expressividade de linguagens de consulta
RDF
Linguagens LR(1)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
title_full A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
title_fullStr A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
title_full_unstemmed A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
title_sort A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
author Santos, Fred de Castro
author_facet Santos, Fred de Castro
author_role author
dc.contributor.none.fl_str_mv Costa, Umberto Souza da


Musicante, Martin Alejandro

Oliveira, Marcel Vinicius Medeiros

Bigonha, Mariza Andrade da Silva

Medeiros, Sérgio Queiroz de

dc.contributor.author.fl_str_mv Santos, Fred de Castro
dc.subject.por.fl_str_mv Bancos de Dados em Grafo
Expressividade de linguagens de consulta
RDF
Linguagens LR(1)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
topic Bancos de Dados em Grafo
Expressividade de linguagens de consulta
RDF
Linguagens LR(1)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description The World Wide Web is an always increasing collection of information. This information is spread among different documents, which are made available by using the HTTP. Even though this information is accessible to users in the form of news articles, audio broadcasts, images and videos, software agents often cannot classify it. The lack of semantic information about these documents in a machine-readable format usually makes the analysis inaccurate. A significant number of entities have adopted Linked Data as a way to add semantic information to their data, not just publishing it on the Web. The result is a global data collection, called the Web of Data, which forms a global graph, consisting of RDF [22] statements from numerous sources, covering all sorts of topics. To find specific information in this graph, queries are performed starting at a subject and analyzing their predicates in the RDF statements. These predicates are the connections between the subject and object, and a set of traces forms an information path. The use of HTTP as a standardized data access mechanism and RDF as a standard data model simplifies the data access, but accessing heterogeneous data on distinct locations may have an increased time complexity and current query languages have a reduced query expressiveness, which motivates us to research alternatives in how this data is queried. This reduced expressiveness happens because most query languages belong to the class of Regular Languages. The main goal of this work is to use LR(1) context-free grammar processing techniques to search for context-free paths over RDF graph databases, providing, as result, a tool which allows better expressiveness, efficiency and scalability in such queries than what is proposed today. To achieve that, we implemented an algorithm based on the LR(1) parsing technique that uses the GSS [30] structure instead of a stack, and give means for the user to input queries with an LR(1) context-free grammar. Also, we analyze our algorithm’s complexity and make some experiments, comparing our solution to other proposals present in the literature and show that ours can have better performance in given scenarios.
publishDate 2018
dc.date.none.fl_str_mv 2018-04-04T12:11:32Z
2018-04-04T12:11:32Z
2018-02-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SANTOS, Fred de Castro. A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases. 2018. 85f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2018.
https://repositorio.ufrn.br/jspui/handle/123456789/24970
identifier_str_mv SANTOS, Fred de Castro. A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases. 2018. 85f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2018.
url https://repositorio.ufrn.br/jspui/handle/123456789/24970
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO
publisher.none.fl_str_mv Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv repositorio@bczm.ufrn.br
_version_ 1855758900369817600