Prov-Dominoes: an exploratory analysis approach for provenance data

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Alencar, Victor Bezerra
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal Fluminense (UFF)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
GPU
Link de acesso: https://www.repositorio.mar.mil.br/handle/ripcmb/845425
Resumo: Proveniência, o registro da história de uma informação, tem se tornado cada vez maisrelevante para a compreensão, auditoria e reprodução de tarefas computacionais. Os pro-cessos de análise de proveniência muitas vezes podem ser custosos para o usuário devidoao grande volume de dados, aos múltiplos relacionamentos e às informações implícitasem meio a esses dados. Algumas ferramentas existentes fornecem suporte à análise deproveniência com base em diagramas de vínculo entre nós, contando com recursos devisualização sobre arestas e vértices. Outras são ferramentas baseadas em fluxos de tra-balho, como VisTrails e Taverna. No entanto, nenhuma delas suporta a exploração dedados de proveniência implícitos, como as inferências das restrições do modelo de dadosPROV. Neste trabalho, apresentamos Prov-Dominoes, uma ferramenta projetada paraexplorar dados de proveniência interativamente. Prov-Dominoes promove as relações deproveniência entre entidades, atividades e agentes em elementos de primeira classe, repre-sentados por peças de dominó. Além disso, permite aos usuários combinar tais peças dedominó visual e interativamente, usando GPU. Prov-Dominoes foi avaliado em estudos decaso distintos a fim de observar sua relevância. Foi possível descobrir relações implícitasem um conjunto de dados de características de animais, identificar os parâmetros queinfluenciaram os resultados da execução de um fluxo de trabalho e destacar as atividadesessenciais em uma casa inteligente. Também avaliamos o desempenho de combinações se-quenciais executadas em Prov-Dominoes ao lidar com dados de proveniência com milharesde relações, contrastando suas execuções em GPU e CPU. Os resultados mostraram que,para um grande conjunto de dados, GPU superou CPU em duas ordens de magnitude.
id MB_96fb77a65f82422b04b0aa1d884f0ad2
oai_identifier_str oai:www.repositorio.mar.mil.br:ripcmb/845425
network_acronym_str MB
network_name_str Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
repository_id_str
spelling Prov-Dominoes: an exploratory analysis approach for provenance dataEngenharia e Sistemas de InformaçãoAnálise exploratória de dadosProveniênciaGPUEngenharia navalProveniência, o registro da história de uma informação, tem se tornado cada vez maisrelevante para a compreensão, auditoria e reprodução de tarefas computacionais. Os pro-cessos de análise de proveniência muitas vezes podem ser custosos para o usuário devidoao grande volume de dados, aos múltiplos relacionamentos e às informações implícitasem meio a esses dados. Algumas ferramentas existentes fornecem suporte à análise deproveniência com base em diagramas de vínculo entre nós, contando com recursos devisualização sobre arestas e vértices. Outras são ferramentas baseadas em fluxos de tra-balho, como VisTrails e Taverna. No entanto, nenhuma delas suporta a exploração dedados de proveniência implícitos, como as inferências das restrições do modelo de dadosPROV. Neste trabalho, apresentamos Prov-Dominoes, uma ferramenta projetada paraexplorar dados de proveniência interativamente. Prov-Dominoes promove as relações deproveniência entre entidades, atividades e agentes em elementos de primeira classe, repre-sentados por peças de dominó. Além disso, permite aos usuários combinar tais peças dedominó visual e interativamente, usando GPU. Prov-Dominoes foi avaliado em estudos decaso distintos a fim de observar sua relevância. Foi possível descobrir relações implícitasem um conjunto de dados de características de animais, identificar os parâmetros queinfluenciaram os resultados da execução de um fluxo de trabalho e destacar as atividadesessenciais em uma casa inteligente. Também avaliamos o desempenho de combinações se-quenciais executadas em Prov-Dominoes ao lidar com dados de proveniência com milharesde relações, contrastando suas execuções em GPU e CPU. Os resultados mostraram que,para um grande conjunto de dados, GPU superou CPU em duas ordens de magnitude.Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Computação da Universidade Federal Fluminense como requisito parcial para a obtenção do Grau de Mestre em Computação.Área de concentração: Engenharia de Sistemas e Informação (ESI).AbstractProvenance, the record of the history of a piece of information, has become increasinglyrelevant to understanding, auditing, and reproducing computational tasks. The prove-nance analysis processes can often be overwhelming to the user due to the large volume ofdata, the multiple relationships among data, and the implicit information buried into thedata. Some existing tools provide provenance analysis support based on node-link dia-grams, relying on visualization features over edges and vertices. Others are workflow-basedtools, such as VisTrails and Taverna. However, none of them support the exploration ofimplicit provenance data, such as the inferences of the PROV Data Model Constraints.In this work, we introduce Prov-Dominoes, a tool designed to explore provenance datainteractively. Prov-Dominoes promotes the provenance relationships among entities, ac-tivities, and agents into first-class elements, represented by domino tiles. Moreover, itallows users to combine and compose such domino tiles visually and interactively, us-ing GPU. We evaluated Prov-Dominoes over distinct case studies, helping us to observeProv-Dominoes in action. We were able to uncover implicit relationships in a dataset ofanimal characteristics, identify the parameters that influenced workflow execution results,and highlight essential activities in a smart home. We also evaluated the performance ofsequential combinations executed in Prov-Dominoes when dealing with provenance datawith thousands of relations, contrasting their executions in GPU and CPU. The resultsshowed that, for a large data set, GPU outperformed CPU by two orders of magnitude.Universidade Federal Fluminense (UFF)Murta, Leonardo Gresta PaulinoSilva Júnior, José Ricardo daMurta, Vanessa BraganholoAlencar, Victor Bezerra2022-08-26T19:18:39Z2022-08-26T19:18:39Z2020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.repositorio.mar.mil.br/handle/ripcmb/845425porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)instname:Marinha do Brasil (MB)instacron:MB2022-09-21T18:31:18Zoai:www.repositorio.mar.mil.br:ripcmb/845425Repositório InstitucionalPUBhttps://www.repositorio.mar.mil.br/oai/requestdphdm.repositorio@marinha.mil.bropendoar:2022-09-21T18:31:18Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB)false
dc.title.none.fl_str_mv Prov-Dominoes: an exploratory analysis approach for provenance data
title Prov-Dominoes: an exploratory analysis approach for provenance data
spellingShingle Prov-Dominoes: an exploratory analysis approach for provenance data
Alencar, Victor Bezerra
Engenharia e Sistemas de Informação
Análise exploratória de dados
Proveniência
GPU
Engenharia naval
title_short Prov-Dominoes: an exploratory analysis approach for provenance data
title_full Prov-Dominoes: an exploratory analysis approach for provenance data
title_fullStr Prov-Dominoes: an exploratory analysis approach for provenance data
title_full_unstemmed Prov-Dominoes: an exploratory analysis approach for provenance data
title_sort Prov-Dominoes: an exploratory analysis approach for provenance data
author Alencar, Victor Bezerra
author_facet Alencar, Victor Bezerra
author_role author
dc.contributor.none.fl_str_mv Murta, Leonardo Gresta Paulino
Silva Júnior, José Ricardo da
Murta, Vanessa Braganholo
dc.contributor.author.fl_str_mv Alencar, Victor Bezerra
dc.subject.por.fl_str_mv Engenharia e Sistemas de Informação
Análise exploratória de dados
Proveniência
GPU
Engenharia naval
topic Engenharia e Sistemas de Informação
Análise exploratória de dados
Proveniência
GPU
Engenharia naval
description Proveniência, o registro da história de uma informação, tem se tornado cada vez maisrelevante para a compreensão, auditoria e reprodução de tarefas computacionais. Os pro-cessos de análise de proveniência muitas vezes podem ser custosos para o usuário devidoao grande volume de dados, aos múltiplos relacionamentos e às informações implícitasem meio a esses dados. Algumas ferramentas existentes fornecem suporte à análise deproveniência com base em diagramas de vínculo entre nós, contando com recursos devisualização sobre arestas e vértices. Outras são ferramentas baseadas em fluxos de tra-balho, como VisTrails e Taverna. No entanto, nenhuma delas suporta a exploração dedados de proveniência implícitos, como as inferências das restrições do modelo de dadosPROV. Neste trabalho, apresentamos Prov-Dominoes, uma ferramenta projetada paraexplorar dados de proveniência interativamente. Prov-Dominoes promove as relações deproveniência entre entidades, atividades e agentes em elementos de primeira classe, repre-sentados por peças de dominó. Além disso, permite aos usuários combinar tais peças dedominó visual e interativamente, usando GPU. Prov-Dominoes foi avaliado em estudos decaso distintos a fim de observar sua relevância. Foi possível descobrir relações implícitasem um conjunto de dados de características de animais, identificar os parâmetros queinfluenciaram os resultados da execução de um fluxo de trabalho e destacar as atividadesessenciais em uma casa inteligente. Também avaliamos o desempenho de combinações se-quenciais executadas em Prov-Dominoes ao lidar com dados de proveniência com milharesde relações, contrastando suas execuções em GPU e CPU. Os resultados mostraram que,para um grande conjunto de dados, GPU superou CPU em duas ordens de magnitude.
publishDate 2020
dc.date.none.fl_str_mv 2020
2022-08-26T19:18:39Z
2022-08-26T19:18:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.repositorio.mar.mil.br/handle/ripcmb/845425
url https://www.repositorio.mar.mil.br/handle/ripcmb/845425
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal Fluminense (UFF)
publisher.none.fl_str_mv Universidade Federal Fluminense (UFF)
dc.source.none.fl_str_mv reponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
instname:Marinha do Brasil (MB)
instacron:MB
instname_str Marinha do Brasil (MB)
instacron_str MB
institution MB
reponame_str Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
collection Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
repository.name.fl_str_mv Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB)
repository.mail.fl_str_mv dphdm.repositorio@marinha.mil.br
_version_ 1855762806113042432