Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Oliveira, Polyane Wercelens de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.unb.br/handle/10482/37275
Resumo: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
id UNB_47755d12d3f085257c26ee17c964d31b
oai_identifier_str oai:repositorio.unb.br:10482/37275
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadasBioinformáticaBanco de dadosNoSQL (Not Only SQL)Nuvens federadasNuvens computacionaisDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.Workflows de Bioinformática prioritariamente visam tratar, processar e analisar dados oriundos de sequenciamento de DNA/RNA. A diversidade desses workflows é dependente da questão biológica que se pretende responder, e por isso podem ser bastante com- plexos. O uso de nuvem federada em workflows de Bioinformática, ao mesmo tempo que oferece flexibilidade para o usuário, pode aumentar o trabalho de configuração do ambiente quando comparado a um ambiente de nuvem computacional. Independentemente da questão biológica, e considerando o ambiente computacional como parte do experimento in silico, a documentação do workflow tem particularidades a serem preservadas com vistas à sua reprodutibilidade. Os modelos de proveniência de dados proveem uma estrutura de armazenamento e recuperação dos dados de proveniência, mantendo seus significados. A maneira com a qual os dados de proveniência são armazenados é outra característica, cujos aspectos tecnológicos influenciam o resultado final. Neste contexto, este trabalho propõe uma solução que permita o gerenciamento de dados de proveniência de workflows de Bioinformática em um ambiente de nuvem federada, armazenando os dados de proveniência de forma distribuída em esquemas de dados baseados no PROV- DM, utilizando sistemas de banco de dados NoSQL. Nos resultados, foram explorados aspectos relacionados à federação de nuvens, o que proporcionou menos dependência de um único provedor para os serviços hospedados. Em relação às bases de dados, este trabalho traz três opções de tecnologias de banco de dados para armazenar a proveniência de dados usando o modelo de dados PROV-DM, incluindo o esquema de dados específico de cada banco de dados, que pode ser usado de acordo com a preferência do pesquisador ou integrado aos sistemas de gerenciamento de workflows. Por fim, a solução proposta demonstrou ser adequada para o gerenciamento dos dados de proveniência para workflows de Bioinformática em nuvem federada.Bioinformatics workflows essentially aim to treat, process, and analyze data from DNA or RNA sequencing. The diversity of these workflows is dependent on the biological question to be answered, which therefore can be quite complex. The computational environment is part of the in silico experiment, and regardless of biological questions, the workflow’s documentation has particularities to be preserved to promote its reproducibility. Data provenance models address this problem providing a storage and query structure of data provenance while maintaining their meanings. Moreover, technological aspects can influence how data provenance is stored. Using federated cloud in Bioinformatics workflows can provide both flexibility for the user and increase the environment configuring work compared to a cloud computing environment. In this context, this work proposes a solution to data provenance management for Bioinformatics workflows using NoSQL database systems in a federated cloud environment, storing data provenance in distributed databases using data schemas based on PROV-DM. The results report aspects related to cloud federation providing less dependence on a single provider for the hosted services. Concerning the databases, this work draws three options of database technolo- gies to store data provenance using the PROV-DM data model. Specific database data schemas are provided and can be used according to the researcher’s preference and can be integrated into workflow management systems. Finally, it is proposed a suitable solution for the data provenance management for Bioinformatics workflows in a federated cloud.Holanda, Maristela Terto deAraújo, Aletéia Patrícia Favacho deOliveira, Polyane Wercelens de2020-04-01T12:15:01Z2020-04-01T12:15:01Z2020-04-012019-07-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfOLIVEIRA, Polyane Wercelens de. Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas. 2019. 84 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2019.https://repositorio.unb.br/handle/10482/37275A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-07-14T18:56:23Zoai:repositorio.unb.br:10482/37275Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-07-14T18:56:23Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
title Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
spellingShingle Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
Oliveira, Polyane Wercelens de
Bioinformática
Banco de dados
NoSQL (Not Only SQL)
Nuvens federadas
Nuvens computacionais
title_short Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
title_full Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
title_fullStr Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
title_full_unstemmed Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
title_sort Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
author Oliveira, Polyane Wercelens de
author_facet Oliveira, Polyane Wercelens de
author_role author
dc.contributor.none.fl_str_mv Holanda, Maristela Terto de
Araújo, Aletéia Patrícia Favacho de
dc.contributor.author.fl_str_mv Oliveira, Polyane Wercelens de
dc.subject.por.fl_str_mv Bioinformática
Banco de dados
NoSQL (Not Only SQL)
Nuvens federadas
Nuvens computacionais
topic Bioinformática
Banco de dados
NoSQL (Not Only SQL)
Nuvens federadas
Nuvens computacionais
description Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
publishDate 2019
dc.date.none.fl_str_mv 2019-07-03
2020-04-01T12:15:01Z
2020-04-01T12:15:01Z
2020-04-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv OLIVEIRA, Polyane Wercelens de. Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas. 2019. 84 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2019.
https://repositorio.unb.br/handle/10482/37275
identifier_str_mv OLIVEIRA, Polyane Wercelens de. Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas. 2019. 84 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2019.
url https://repositorio.unb.br/handle/10482/37275
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1839083740207251456