Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico

Huacarpuma, Ruben Cruz

Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico

Detalhes bibliográficos
Ano de defesa:	2012
Autor(a) principal:	Huacarpuma, Ruben Cruz
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Não Informado pela instituição
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Biologia computacional Banco de dados
Link de acesso:	http://repositorio.unb.br/handle/10482/11037
Resumo:	Dissertação (mestrado)—Universidade de Brasília, Instituto de CIências Exatas, Departamento de Ciência da Computação, 2012.

Metadados do item

id	UNB_d327d85dbb87e8ab91924fe7895e80e5
oai_identifier_str	oai:repositorio.unb.br:10482/11037
network_acronym_str	UNB
network_name_str	Repositório Institucional da UnB
repository_id_str
spelling	Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômicoBiologia computacionalBanco de dadosDissertação (mestrado)—Universidade de Brasília, Instituto de CIências Exatas, Departamento de Ciência da Computação, 2012.O rápido avanço nas técnicas de sequenciamento de alto desempenho de fragmentos de DNA/RNA criou novos desa os computacionais na área de bioinformática. Um desses desa os é administrar o enorme volume de dados gerados pelos sequenciadores automáticos, particularmente o armazenamento e a análise desses dados processados em larga escala. A existência de diferentes formatos de representação, terminologia, estrutura de arquivos e semânticas, faz muito complexa a representação e administração desses dados. Neste contexto, um modelo de dados para representar, organizar e garantir o acesso aos dados biológicos é essencial para suportar o trabalho dos pesquisadores do campo da biologia, quando fazendo uso de pipelines de sequenciamento de alto desempenho. Este trabalho propõe tanto um modelo de dados conceitual, como também seu respectivo esquema relacional, permitindo a representação e o gerenciamento de um pipeline de sequenciamento de alto desempenho para projetos transcritômicos no intuito de organizar e armazenar de maneira simples e e ciente os dados gerados em cada fase da análise do pipeline. Nesta dissertação, trabalhamos com pipelines de sequenciamento de alto desempenho com três fases: ltragem, mapeamento e análise. Para validar nosso modelo, apresentamos dois estudos de casos para identi car a expressão diferencial de genes usando dados de sequenciamento de alto desempenho transcritômico. Estes estudos de caso mostraram que introduzir o modelo de dados, e o esquema correspondente, tornou o pipeline mais e ciente, organizado, para dar suporte ao trabalho dos biólogos envolvidos em um projeto de transcritoma. _________________________________________________________________________________________ ABSTRACTThe rapid advances in high-throughput sequencing techniques of DNA/RNA fragments created new computational challenges in bioinformatics. One of these challenges is to manage the enormous volume of data generated by automatic sequencers, specially storage and analysis of these data processed on large scale. The existence of representation format, terminology, _le structure and semantics, becomes very complex representation and management of such data. In this context, a data model to represent, organize and provide access to biological data is essential to support the researchers works into biology_eld when using high-throughput sequencing. This work proposes a conceptual model as well as its database schema to representand manage a high-throughput transcriptome pipeline in order to organize and store in a simple and efficient way data generated in each pipeline phase. In this dissertation, we work with three phases high-throughput sequencing pipeline: _ltering, mapping and analysis. In order to validate our model, we present two case studies both having the objective of identifying deferentially expressed genes using high-throughput sequencing transcriptome data. These case studies showed that uses a data model, and its database schema, became the pipeline more efficient, organized, and support the biologists works involved in a transcriptome project.Holanda, Maristela Terto deHuacarpuma, Ruben Cruz2012-07-30T12:35:11Z2012-07-30T12:35:11Z2012-07-302012-03-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfHUACARPUMA, Ruben Cruz. Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico. 2012. xiii, 86 f, il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2012.http://repositorio.unb.br/handle/10482/11037info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-07-14T18:56:17Zoai:repositorio.unb.br:10482/11037Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-07-14T18:56:17Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv	Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico
title	Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico
spellingShingle	Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico Huacarpuma, Ruben Cruz Biologia computacional Banco de dados
title_short	Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico
title_full	Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico
title_fullStr	Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico
title_full_unstemmed	Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico
title_sort	Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico
author	Huacarpuma, Ruben Cruz
author_facet	Huacarpuma, Ruben Cruz
author_role	author
dc.contributor.none.fl_str_mv	Holanda, Maristela Terto de
dc.contributor.author.fl_str_mv	Huacarpuma, Ruben Cruz
dc.subject.por.fl_str_mv	Biologia computacional Banco de dados
topic	Biologia computacional Banco de dados
description	Dissertação (mestrado)—Universidade de Brasília, Instituto de CIências Exatas, Departamento de Ciência da Computação, 2012.
publishDate	2012
dc.date.none.fl_str_mv	2012-07-30T12:35:11Z 2012-07-30T12:35:11Z 2012-07-30 2012-03-01
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	HUACARPUMA, Ruben Cruz. Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico. 2012. xiii, 86 f, il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2012. http://repositorio.unb.br/handle/10482/11037
identifier_str_mv	HUACARPUMA, Ruben Cruz. Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico. 2012. xiii, 86 f, il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2012.
url	http://repositorio.unb.br/handle/10482/11037
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB
instname_str	Universidade de Brasília (UnB)
instacron_str	UNB
institution	UNB
reponame_str	Repositório Institucional da UnB
collection	Repositório Institucional da UnB
repository.name.fl_str_mv	Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv	repositorio@unb.br
_version_	1839083899794227200

Modelo de dados para um Pipeline de seqüenciamento de alto desempenho transcritômico

Registros relacionados