Prov-Dominoes: an exploratory analysis approach for provenance data
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal Fluminense (UFF)
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.repositorio.mar.mil.br/handle/ripcmb/845425 |
Resumo: | Proveniência, o registro da história de uma informação, tem se tornado cada vez maisrelevante para a compreensão, auditoria e reprodução de tarefas computacionais. Os pro-cessos de análise de proveniência muitas vezes podem ser custosos para o usuário devidoao grande volume de dados, aos múltiplos relacionamentos e às informações implícitasem meio a esses dados. Algumas ferramentas existentes fornecem suporte à análise deproveniência com base em diagramas de vínculo entre nós, contando com recursos devisualização sobre arestas e vértices. Outras são ferramentas baseadas em fluxos de tra-balho, como VisTrails e Taverna. No entanto, nenhuma delas suporta a exploração dedados de proveniência implícitos, como as inferências das restrições do modelo de dadosPROV. Neste trabalho, apresentamos Prov-Dominoes, uma ferramenta projetada paraexplorar dados de proveniência interativamente. Prov-Dominoes promove as relações deproveniência entre entidades, atividades e agentes em elementos de primeira classe, repre-sentados por peças de dominó. Além disso, permite aos usuários combinar tais peças dedominó visual e interativamente, usando GPU. Prov-Dominoes foi avaliado em estudos decaso distintos a fim de observar sua relevância. Foi possível descobrir relações implícitasem um conjunto de dados de características de animais, identificar os parâmetros queinfluenciaram os resultados da execução de um fluxo de trabalho e destacar as atividadesessenciais em uma casa inteligente. Também avaliamos o desempenho de combinações se-quenciais executadas em Prov-Dominoes ao lidar com dados de proveniência com milharesde relações, contrastando suas execuções em GPU e CPU. Os resultados mostraram que,para um grande conjunto de dados, GPU superou CPU em duas ordens de magnitude. |
| id |
MB_96fb77a65f82422b04b0aa1d884f0ad2 |
|---|---|
| oai_identifier_str |
oai:www.repositorio.mar.mil.br:ripcmb/845425 |
| network_acronym_str |
MB |
| network_name_str |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
| repository_id_str |
|
| spelling |
Prov-Dominoes: an exploratory analysis approach for provenance dataEngenharia e Sistemas de InformaçãoAnálise exploratória de dadosProveniênciaGPUEngenharia navalProveniência, o registro da história de uma informação, tem se tornado cada vez maisrelevante para a compreensão, auditoria e reprodução de tarefas computacionais. Os pro-cessos de análise de proveniência muitas vezes podem ser custosos para o usuário devidoao grande volume de dados, aos múltiplos relacionamentos e às informações implícitasem meio a esses dados. Algumas ferramentas existentes fornecem suporte à análise deproveniência com base em diagramas de vínculo entre nós, contando com recursos devisualização sobre arestas e vértices. Outras são ferramentas baseadas em fluxos de tra-balho, como VisTrails e Taverna. No entanto, nenhuma delas suporta a exploração dedados de proveniência implícitos, como as inferências das restrições do modelo de dadosPROV. Neste trabalho, apresentamos Prov-Dominoes, uma ferramenta projetada paraexplorar dados de proveniência interativamente. Prov-Dominoes promove as relações deproveniência entre entidades, atividades e agentes em elementos de primeira classe, repre-sentados por peças de dominó. Além disso, permite aos usuários combinar tais peças dedominó visual e interativamente, usando GPU. Prov-Dominoes foi avaliado em estudos decaso distintos a fim de observar sua relevância. Foi possível descobrir relações implícitasem um conjunto de dados de características de animais, identificar os parâmetros queinfluenciaram os resultados da execução de um fluxo de trabalho e destacar as atividadesessenciais em uma casa inteligente. Também avaliamos o desempenho de combinações se-quenciais executadas em Prov-Dominoes ao lidar com dados de proveniência com milharesde relações, contrastando suas execuções em GPU e CPU. Os resultados mostraram que,para um grande conjunto de dados, GPU superou CPU em duas ordens de magnitude.Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Computação da Universidade Federal Fluminense como requisito parcial para a obtenção do Grau de Mestre em Computação.Área de concentração: Engenharia de Sistemas e Informação (ESI).AbstractProvenance, the record of the history of a piece of information, has become increasinglyrelevant to understanding, auditing, and reproducing computational tasks. The prove-nance analysis processes can often be overwhelming to the user due to the large volume ofdata, the multiple relationships among data, and the implicit information buried into thedata. Some existing tools provide provenance analysis support based on node-link dia-grams, relying on visualization features over edges and vertices. Others are workflow-basedtools, such as VisTrails and Taverna. However, none of them support the exploration ofimplicit provenance data, such as the inferences of the PROV Data Model Constraints.In this work, we introduce Prov-Dominoes, a tool designed to explore provenance datainteractively. Prov-Dominoes promotes the provenance relationships among entities, ac-tivities, and agents into first-class elements, represented by domino tiles. Moreover, itallows users to combine and compose such domino tiles visually and interactively, us-ing GPU. We evaluated Prov-Dominoes over distinct case studies, helping us to observeProv-Dominoes in action. We were able to uncover implicit relationships in a dataset ofanimal characteristics, identify the parameters that influenced workflow execution results,and highlight essential activities in a smart home. We also evaluated the performance ofsequential combinations executed in Prov-Dominoes when dealing with provenance datawith thousands of relations, contrasting their executions in GPU and CPU. The resultsshowed that, for a large data set, GPU outperformed CPU by two orders of magnitude.Universidade Federal Fluminense (UFF)Murta, Leonardo Gresta PaulinoSilva Júnior, José Ricardo daMurta, Vanessa BraganholoAlencar, Victor Bezerra2022-08-26T19:18:39Z2022-08-26T19:18:39Z2020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.repositorio.mar.mil.br/handle/ripcmb/845425porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)instname:Marinha do Brasil (MB)instacron:MB2022-09-21T18:31:18Zoai:www.repositorio.mar.mil.br:ripcmb/845425Repositório InstitucionalPUBhttps://www.repositorio.mar.mil.br/oai/requestdphdm.repositorio@marinha.mil.bropendoar:2022-09-21T18:31:18Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB)false |
| dc.title.none.fl_str_mv |
Prov-Dominoes: an exploratory analysis approach for provenance data |
| title |
Prov-Dominoes: an exploratory analysis approach for provenance data |
| spellingShingle |
Prov-Dominoes: an exploratory analysis approach for provenance data Alencar, Victor Bezerra Engenharia e Sistemas de Informação Análise exploratória de dados Proveniência GPU Engenharia naval |
| title_short |
Prov-Dominoes: an exploratory analysis approach for provenance data |
| title_full |
Prov-Dominoes: an exploratory analysis approach for provenance data |
| title_fullStr |
Prov-Dominoes: an exploratory analysis approach for provenance data |
| title_full_unstemmed |
Prov-Dominoes: an exploratory analysis approach for provenance data |
| title_sort |
Prov-Dominoes: an exploratory analysis approach for provenance data |
| author |
Alencar, Victor Bezerra |
| author_facet |
Alencar, Victor Bezerra |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Murta, Leonardo Gresta Paulino Silva Júnior, José Ricardo da Murta, Vanessa Braganholo |
| dc.contributor.author.fl_str_mv |
Alencar, Victor Bezerra |
| dc.subject.por.fl_str_mv |
Engenharia e Sistemas de Informação Análise exploratória de dados Proveniência GPU Engenharia naval |
| topic |
Engenharia e Sistemas de Informação Análise exploratória de dados Proveniência GPU Engenharia naval |
| description |
Proveniência, o registro da história de uma informação, tem se tornado cada vez maisrelevante para a compreensão, auditoria e reprodução de tarefas computacionais. Os pro-cessos de análise de proveniência muitas vezes podem ser custosos para o usuário devidoao grande volume de dados, aos múltiplos relacionamentos e às informações implícitasem meio a esses dados. Algumas ferramentas existentes fornecem suporte à análise deproveniência com base em diagramas de vínculo entre nós, contando com recursos devisualização sobre arestas e vértices. Outras são ferramentas baseadas em fluxos de tra-balho, como VisTrails e Taverna. No entanto, nenhuma delas suporta a exploração dedados de proveniência implícitos, como as inferências das restrições do modelo de dadosPROV. Neste trabalho, apresentamos Prov-Dominoes, uma ferramenta projetada paraexplorar dados de proveniência interativamente. Prov-Dominoes promove as relações deproveniência entre entidades, atividades e agentes em elementos de primeira classe, repre-sentados por peças de dominó. Além disso, permite aos usuários combinar tais peças dedominó visual e interativamente, usando GPU. Prov-Dominoes foi avaliado em estudos decaso distintos a fim de observar sua relevância. Foi possível descobrir relações implícitasem um conjunto de dados de características de animais, identificar os parâmetros queinfluenciaram os resultados da execução de um fluxo de trabalho e destacar as atividadesessenciais em uma casa inteligente. Também avaliamos o desempenho de combinações se-quenciais executadas em Prov-Dominoes ao lidar com dados de proveniência com milharesde relações, contrastando suas execuções em GPU e CPU. Os resultados mostraram que,para um grande conjunto de dados, GPU superou CPU em duas ordens de magnitude. |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020 2022-08-26T19:18:39Z 2022-08-26T19:18:39Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.repositorio.mar.mil.br/handle/ripcmb/845425 |
| url |
https://www.repositorio.mar.mil.br/handle/ripcmb/845425 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal Fluminense (UFF) |
| publisher.none.fl_str_mv |
Universidade Federal Fluminense (UFF) |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) instname:Marinha do Brasil (MB) instacron:MB |
| instname_str |
Marinha do Brasil (MB) |
| instacron_str |
MB |
| institution |
MB |
| reponame_str |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
| collection |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
| repository.name.fl_str_mv |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB) |
| repository.mail.fl_str_mv |
dphdm.repositorio@marinha.mil.br |
| _version_ |
1855762806113042432 |