[en] AN APPROACH TO MODEL, STORE AND ACCESS BIOLOGICAL SEQUENCES

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: CRISTIAN TRISTAO
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: MAXWELL
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=21436&idi=1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=21436&idi=2
http://doi.org/10.17771/PUCRio.acad.21436
Resumo: [pt] As pesquisas na área da biologia molecular vêm produzindo um grande volume de dados e estes precisam ser bem organizados, estruturados e persistidos. Na sua grande maioria os dados biológicos são armazenados em arquivos no formato texto. Para grandes volumes de dados, o caminho natural seria utilizar SGBDs para gerenciá-los. Contudo, estes sistemas não possuem estruturas adequadas para representar e manipular dados específicos ao domínio. Por exemplo, sequências biológicas normalmente são tratadas como simples cadeias de caracteres (tipo texto/varchar) ou BLOB, e desta forma perde-se todo um conjunto de informações composicionais, posicionais e de conteúdo. Esta tese argumenta que a gerência de dados (estrutura, armazenamento e acesso de dados) se transformou em um dos principais problemas para o domínio de pesquisas da bioinformática. Desta maneira propõe-se um modelo conceitual biológico para representar informações do dogma central da biologia molecular, bem como um tipo abstrato de dado (ADT – do inglês Abstract Data Types) específico para a manipulação de sequências biológicas e seus derivados.
id PUC_RIO-1_7283358037ceda4cc80dbcdb37ecbae1
oai_identifier_str oai:MAXWELL.puc-rio.br:21436
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str
spelling [en] AN APPROACH TO MODEL, STORE AND ACCESS BIOLOGICAL SEQUENCES [pt] UMA ABORDAGEM PARA MODELAR, ARMAZENAR E ACESSAR SEQUÊNCIAS BIOLÓGICAS [pt] ESTRUTURA[pt] BASE DE DADOS[pt] MODELAGEM CONCEITUAL[en] STRUCTURE[en] BIG DATA[en] CONCEPTUAL MODELING[pt] As pesquisas na área da biologia molecular vêm produzindo um grande volume de dados e estes precisam ser bem organizados, estruturados e persistidos. Na sua grande maioria os dados biológicos são armazenados em arquivos no formato texto. Para grandes volumes de dados, o caminho natural seria utilizar SGBDs para gerenciá-los. Contudo, estes sistemas não possuem estruturas adequadas para representar e manipular dados específicos ao domínio. Por exemplo, sequências biológicas normalmente são tratadas como simples cadeias de caracteres (tipo texto/varchar) ou BLOB, e desta forma perde-se todo um conjunto de informações composicionais, posicionais e de conteúdo. Esta tese argumenta que a gerência de dados (estrutura, armazenamento e acesso de dados) se transformou em um dos principais problemas para o domínio de pesquisas da bioinformática. Desta maneira propõe-se um modelo conceitual biológico para representar informações do dogma central da biologia molecular, bem como um tipo abstrato de dado (ADT – do inglês Abstract Data Types) específico para a manipulação de sequências biológicas e seus derivados.[en] The researches in molecular biology have been producing a large amount of data and they need to be well organized, structured and persisted. Mostly biological data are stored on files in text format. For large volumes of data, the natural way would be to use DBMS to manage them. However, these systems do not have adequate structures to represent and manipulate data specific to the domain. For example, biological sequences are typically treated as simple strings (type text/varchar) or BLOB, and thus lost a whole set of compositional, positional and content information. This thesis argues that the management of data (structure, storage and data access) has become a major problem for researches in bioinformatics. Thus we propose a conceptual model for representing biological information of the central dogma of molecular biology, as well as an Abstract Data Types (ADT) specific for the manipulation of biological sequences and its derivatives. MAXWELLEDWARD HERMANN HAEUSLERCRISTIAN TRISTAO2013-04-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=21436&idi=1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=21436&idi=2http://doi.org/10.17771/PUCRio.acad.21436porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2019-08-22T00:00:00Zoai:MAXWELL.puc-rio.br:21436Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342019-08-22T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.none.fl_str_mv [en] AN APPROACH TO MODEL, STORE AND ACCESS BIOLOGICAL SEQUENCES
[pt] UMA ABORDAGEM PARA MODELAR, ARMAZENAR E ACESSAR SEQUÊNCIAS BIOLÓGICAS
title [en] AN APPROACH TO MODEL, STORE AND ACCESS BIOLOGICAL SEQUENCES
spellingShingle [en] AN APPROACH TO MODEL, STORE AND ACCESS BIOLOGICAL SEQUENCES
CRISTIAN TRISTAO
[pt] ESTRUTURA
[pt] BASE DE DADOS
[pt] MODELAGEM CONCEITUAL
[en] STRUCTURE
[en] BIG DATA
[en] CONCEPTUAL MODELING
title_short [en] AN APPROACH TO MODEL, STORE AND ACCESS BIOLOGICAL SEQUENCES
title_full [en] AN APPROACH TO MODEL, STORE AND ACCESS BIOLOGICAL SEQUENCES
title_fullStr [en] AN APPROACH TO MODEL, STORE AND ACCESS BIOLOGICAL SEQUENCES
title_full_unstemmed [en] AN APPROACH TO MODEL, STORE AND ACCESS BIOLOGICAL SEQUENCES
title_sort [en] AN APPROACH TO MODEL, STORE AND ACCESS BIOLOGICAL SEQUENCES
author CRISTIAN TRISTAO
author_facet CRISTIAN TRISTAO
author_role author
dc.contributor.none.fl_str_mv EDWARD HERMANN HAEUSLER
dc.contributor.author.fl_str_mv CRISTIAN TRISTAO
dc.subject.por.fl_str_mv [pt] ESTRUTURA
[pt] BASE DE DADOS
[pt] MODELAGEM CONCEITUAL
[en] STRUCTURE
[en] BIG DATA
[en] CONCEPTUAL MODELING
topic [pt] ESTRUTURA
[pt] BASE DE DADOS
[pt] MODELAGEM CONCEITUAL
[en] STRUCTURE
[en] BIG DATA
[en] CONCEPTUAL MODELING
description [pt] As pesquisas na área da biologia molecular vêm produzindo um grande volume de dados e estes precisam ser bem organizados, estruturados e persistidos. Na sua grande maioria os dados biológicos são armazenados em arquivos no formato texto. Para grandes volumes de dados, o caminho natural seria utilizar SGBDs para gerenciá-los. Contudo, estes sistemas não possuem estruturas adequadas para representar e manipular dados específicos ao domínio. Por exemplo, sequências biológicas normalmente são tratadas como simples cadeias de caracteres (tipo texto/varchar) ou BLOB, e desta forma perde-se todo um conjunto de informações composicionais, posicionais e de conteúdo. Esta tese argumenta que a gerência de dados (estrutura, armazenamento e acesso de dados) se transformou em um dos principais problemas para o domínio de pesquisas da bioinformática. Desta maneira propõe-se um modelo conceitual biológico para representar informações do dogma central da biologia molecular, bem como um tipo abstrato de dado (ADT – do inglês Abstract Data Types) específico para a manipulação de sequências biológicas e seus derivados.
publishDate 2013
dc.date.none.fl_str_mv 2013-04-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=21436&idi=1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=21436&idi=2
http://doi.org/10.17771/PUCRio.acad.21436
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=21436&idi=1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=21436&idi=2
http://doi.org/10.17771/PUCRio.acad.21436
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv MAXWELL
publisher.none.fl_str_mv MAXWELL
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1856395914775625728