Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Silva, Laís Bethânia Brito
Orientador(a): Ciferri, Ricardo Rodrigues lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação - PPGCC
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/ufscar/16139
Resumo: The new era of data economics, based on data sets with enormous volume, wide variety of formats, and rapid speed in data production and utilization, has brought the need for new data management structures and methods. Then come Not Only SQL (NoSQL) databases, which provide a new way of storing and retrieving data with features that go beyond relational database management systems. NoSQL databases are divided into four major models: key -value, column-oriented, document-oriented and graph-oriented. They are able to scalably handle the storage and processing of gigantic volumes of data with a flexible format, where manipulations are not exclusively performed through the SQL language. These data sets, many of which, modeled as large graphs, to - a challenge for industry and academia, which has been increasingly committed to research and innovation in the area. Thus, there is a natural increase in demand for performance analysis systems for Graph Oriented NoSQL Databases. This implies the need for new benchmarks capable of testing these new technologies and that guide users to identify tools that best adapt to their applications. Many studies approach the proposal of benchmarks for an analysis of Graph Oriented NoSQL Database systems. However, no study studies the comparison of such benchmarks. Thus, this Master's research work aimed to carry out a comparative analysis of benchmarks for performance evaluation of Graph Oriented NoSQL Databases, with specific emphasis on the property graph model, and thus highlight as main differences between these, in addition to identifying strengths and limitations of each benchmark. Thus, it becomes possible to identify the most appropriate benchmark to analyze the performance of Property Graph-Oriented NoSQL Database systems according to a set of requirements of a specific domain. Application. Among the several existing benchmarks, it was investigated to compare the LDBC SNB, XGDBench, HPC-SGAB, TGDB and Cyclone benchmarks. In general terms, the LDBC-SNB benchmark stood out in relation to the other benchmarks, especially when it comes to query types and performance measures, and because of its tester support for several graph-oriented NoSQL DBMS's.
id SCAR_3b11c311b5b775b13706d81edcd0054d
oai_identifier_str oai:repositorio.ufscar.br:ufscar/16139
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Silva, Laís Bethânia BritoCiferri, Ricardo Rodrigueshttp://lattes.cnpq.br/8382221522817502http://lattes.cnpq.br/23315546593022262022-05-17T13:28:28Z2022-05-17T13:28:28Z2021-07-06SILVA, Laís Bethânia Brito. Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16139.https://repositorio.ufscar.br/handle/ufscar/16139The new era of data economics, based on data sets with enormous volume, wide variety of formats, and rapid speed in data production and utilization, has brought the need for new data management structures and methods. Then come Not Only SQL (NoSQL) databases, which provide a new way of storing and retrieving data with features that go beyond relational database management systems. NoSQL databases are divided into four major models: key -value, column-oriented, document-oriented and graph-oriented. They are able to scalably handle the storage and processing of gigantic volumes of data with a flexible format, where manipulations are not exclusively performed through the SQL language. These data sets, many of which, modeled as large graphs, to - a challenge for industry and academia, which has been increasingly committed to research and innovation in the area. Thus, there is a natural increase in demand for performance analysis systems for Graph Oriented NoSQL Databases. This implies the need for new benchmarks capable of testing these new technologies and that guide users to identify tools that best adapt to their applications. Many studies approach the proposal of benchmarks for an analysis of Graph Oriented NoSQL Database systems. However, no study studies the comparison of such benchmarks. Thus, this Master's research work aimed to carry out a comparative analysis of benchmarks for performance evaluation of Graph Oriented NoSQL Databases, with specific emphasis on the property graph model, and thus highlight as main differences between these, in addition to identifying strengths and limitations of each benchmark. Thus, it becomes possible to identify the most appropriate benchmark to analyze the performance of Property Graph-Oriented NoSQL Database systems according to a set of requirements of a specific domain. Application. Among the several existing benchmarks, it was investigated to compare the LDBC SNB, XGDBench, HPC-SGAB, TGDB and Cyclone benchmarks. In general terms, the LDBC-SNB benchmark stood out in relation to the other benchmarks, especially when it comes to query types and performance measures, and because of its tester support for several graph-oriented NoSQL DBMS's.A nova era da economia de dados, baseada em conjuntos de dados com enorme volume, grande variedade de formatos e rápida velocidade na produção e utilização de dados, trouxe a necessidade de novas estruturas e métodos de gerenciamento de dados. Surgem então os bancos de dados Not Only SQL (NoSQL), que fornecem uma nova forma de armazenamento e recuperação dedados com capacidades que vão além dos sistemas gerenciadores de bancos de dados relacionais.Bancos de dados NoSQL são divididos em quatro grandes modelos: chave-valor, orientados à colunas, orientados a documentos e orientados a grafos. São capazes de lidar de forma escalável com o armazenamento e o processamento de gigantescos volumes de dados com formato flexível, onde as manipulações não são exclusivamente realizadas por meio da linguagem SQL. Esses conjuntos de dados, muitos dos quais, modelados como grandes grafos, tornaram-se um desafio para a indústria e a academia, que vem se empenhando cada vez mais em pesquisa e inovação na área. Assim, naturalmente ocorre o aumento da demanda por sistemas de análise de desempenho de Bancos de Dados NoSQL Orientados a Grafos. Isso implica na necessidade de novos benchmarks capazes de testar essas novas tecnologias e que orientemos usuários a identificar as ferramentas que melhor se adéquem às suas aplicações. Muitos estudos têm abordado a proposta de benchmarks para a análise dos sistemas de Bancos de Dados NoSQL Orientados a Grafos. Porém, nenhum estudo descreve a comparação detalhada desses benchmarks. Dessa forma, este trabalho de pesquisa de Mestrado teve por objetivo realizar uma análise comparativa de benchmarks para avaliação de desempenho de Bancos de Dados NoSQL Orientados a Grafos, com ênfase especificamente no modelo de grafos de propriedade, e assim destacar as principais diferenças entre esses, além de identificar pontos positivos e limitações de cada benchmark. Assim, torna-se possível identificar o benchmark mais adequado para analisar o desempenho de sistemas de Bancos de Dados NoSQL Orientados a Grafos de Propriedades em função de um conjunto de requisitos de um domínio específico de aplicação. Dentre os diversos benchmarks existentes, foi investigada a relevância dos benchmarks LDBC SNB, XGDBench, HPC, TGDB e Cyclone. Em termos gerais, o benchmark LDBC-SNB se sobressaiu em relação aos outros benchmarks, principalmente quando se trata dos tipos de consultas e medidas de desempenho e por prover suporte a diversos SGBD’s NoSQL orientados a grafos.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES/DS (01/08/2018 a 17/07/2020)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAnálise de desempenhoBanco de dadosNoSQLBanco de dados orientados a grafos de propriedadeAnálise comparativaBenchmarkPerformance analysisDatabasesNoSQLGraph databaseProperty graphComparative analysisCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAnálise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedadesBenchmarks benchmark analysis for property graph oriented NoSQL databaseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertcao_final_Lais_Silva.pdfDissertcao_final_Lais_Silva.pdfDissertaçãoapplication/pdf1933158https://repositorio.ufscar.br/bitstream/ufscar/16139/1/Dissertcao_final_Lais_Silva.pdf2fb6f640a7d18eb63b76bffbbdf72f6dMD51CA.pdfCA.pdfapplication/pdf372900https://repositorio.ufscar.br/bitstream/ufscar/16139/9/CA.pdf0973500022f5611efd18ddd55ae19fb2MD59CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstream/ufscar/16139/10/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD510TEXTDissertcao_final_Lais_Silva.pdf.txtDissertcao_final_Lais_Silva.pdf.txtExtracted texttext/plain188316https://repositorio.ufscar.br/bitstream/ufscar/16139/11/Dissertcao_final_Lais_Silva.pdf.txt6e4a3bba04321eaa1b5cb5db84c7073fMD511CA.pdf.txtCA.pdf.txtExtracted texttext/plain1https://repositorio.ufscar.br/bitstream/ufscar/16139/13/CA.pdf.txt68b329da9893e34099c7d8ad5cb9c940MD513THUMBNAILDissertcao_final_Lais_Silva.pdf.jpgDissertcao_final_Lais_Silva.pdf.jpgIM Thumbnailimage/jpeg9019https://repositorio.ufscar.br/bitstream/ufscar/16139/12/Dissertcao_final_Lais_Silva.pdf.jpgb2b93e566b9a52af13e30e63797442d7MD512CA.pdf.jpgCA.pdf.jpgIM Thumbnailimage/jpeg13059https://repositorio.ufscar.br/bitstream/ufscar/16139/14/CA.pdf.jpg42d9f35abeae25474bc18f479e9d0455MD514ufscar/161392022-05-18 03:39:04.396oai:repositorio.ufscar.br:ufscar/16139Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-05-25T13:02:50.131274Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades
dc.title.alternative.eng.fl_str_mv Benchmarks benchmark analysis for property graph oriented NoSQL database
title Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades
spellingShingle Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades
Silva, Laís Bethânia Brito
Análise de desempenho
Banco de dados
NoSQL
Banco de dados orientados a grafos de propriedade
Análise comparativa
Benchmark
Performance analysis
Databases
NoSQL
Graph database
Property graph
Comparative analysis
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades
title_full Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades
title_fullStr Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades
title_full_unstemmed Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades
title_sort Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades
author Silva, Laís Bethânia Brito
author_facet Silva, Laís Bethânia Brito
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/2331554659302226
dc.contributor.author.fl_str_mv Silva, Laís Bethânia Brito
dc.contributor.advisor1.fl_str_mv Ciferri, Ricardo Rodrigues
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8382221522817502
contributor_str_mv Ciferri, Ricardo Rodrigues
dc.subject.por.fl_str_mv Análise de desempenho
Banco de dados
NoSQL
Banco de dados orientados a grafos de propriedade
Análise comparativa
topic Análise de desempenho
Banco de dados
NoSQL
Banco de dados orientados a grafos de propriedade
Análise comparativa
Benchmark
Performance analysis
Databases
NoSQL
Graph database
Property graph
Comparative analysis
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.subject.eng.fl_str_mv Benchmark
Performance analysis
Databases
NoSQL
Graph database
Property graph
Comparative analysis
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description The new era of data economics, based on data sets with enormous volume, wide variety of formats, and rapid speed in data production and utilization, has brought the need for new data management structures and methods. Then come Not Only SQL (NoSQL) databases, which provide a new way of storing and retrieving data with features that go beyond relational database management systems. NoSQL databases are divided into four major models: key -value, column-oriented, document-oriented and graph-oriented. They are able to scalably handle the storage and processing of gigantic volumes of data with a flexible format, where manipulations are not exclusively performed through the SQL language. These data sets, many of which, modeled as large graphs, to - a challenge for industry and academia, which has been increasingly committed to research and innovation in the area. Thus, there is a natural increase in demand for performance analysis systems for Graph Oriented NoSQL Databases. This implies the need for new benchmarks capable of testing these new technologies and that guide users to identify tools that best adapt to their applications. Many studies approach the proposal of benchmarks for an analysis of Graph Oriented NoSQL Database systems. However, no study studies the comparison of such benchmarks. Thus, this Master's research work aimed to carry out a comparative analysis of benchmarks for performance evaluation of Graph Oriented NoSQL Databases, with specific emphasis on the property graph model, and thus highlight as main differences between these, in addition to identifying strengths and limitations of each benchmark. Thus, it becomes possible to identify the most appropriate benchmark to analyze the performance of Property Graph-Oriented NoSQL Database systems according to a set of requirements of a specific domain. Application. Among the several existing benchmarks, it was investigated to compare the LDBC SNB, XGDBench, HPC-SGAB, TGDB and Cyclone benchmarks. In general terms, the LDBC-SNB benchmark stood out in relation to the other benchmarks, especially when it comes to query types and performance measures, and because of its tester support for several graph-oriented NoSQL DBMS's.
publishDate 2021
dc.date.issued.fl_str_mv 2021-07-06
dc.date.accessioned.fl_str_mv 2022-05-17T13:28:28Z
dc.date.available.fl_str_mv 2022-05-17T13:28:28Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Laís Bethânia Brito. Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16139.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/16139
identifier_str_mv SILVA, Laís Bethânia Brito. Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16139.
url https://repositorio.ufscar.br/handle/ufscar/16139
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/16139/1/Dissertcao_final_Lais_Silva.pdf
https://repositorio.ufscar.br/bitstream/ufscar/16139/9/CA.pdf
https://repositorio.ufscar.br/bitstream/ufscar/16139/10/license_rdf
https://repositorio.ufscar.br/bitstream/ufscar/16139/11/Dissertcao_final_Lais_Silva.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/16139/13/CA.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/16139/12/Dissertcao_final_Lais_Silva.pdf.jpg
https://repositorio.ufscar.br/bitstream/ufscar/16139/14/CA.pdf.jpg
bitstream.checksum.fl_str_mv 2fb6f640a7d18eb63b76bffbbdf72f6d
0973500022f5611efd18ddd55ae19fb2
e39d27027a6cc9cb039ad269a5db8e34
6e4a3bba04321eaa1b5cb5db84c7073f
68b329da9893e34099c7d8ad5cb9c940
b2b93e566b9a52af13e30e63797442d7
42d9f35abeae25474bc18f479e9d0455
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1767351176578203648