Arcabouço probabilístico para análise de sequências de RNA

Ferreira, Rafael Mathias

Arcabouço probabilístico para análise de sequências de RNA

Detalhes bibliográficos
Ano de defesa:	2015
Autor(a) principal:	Ferreira, Rafael Mathias
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Biologia Molecular Cadeias De Markov Rna
Link de acesso:	https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113510/
Resumo:	RNA é um polímero formado por quatro tipos de ácidos nucleicos denotados por A, C, G e U que representam Adenina, Citosina, Guanina e Uracila respectivamente. Os nucleotídeos G-C e A-U se ligam formando pontes de hidrogênio e são ditos complementares, contudo, outros tipos de ligações podem ocorrer. RNAs são moléculas de fita única que dobram-se formando pareamentos entre bases complementares. A estrutura formada por esses pareamentos de bases complementares é chamada de estrutura secundária. Estudos recentes mostram que uma grande quantidade de RNAs não codificantes desempenham papéis importantes em uma variedade de processos biológicos, como silenciamento gênico, regulação da expressão gênica, processamento de RNA, modificação de RNA, controle da tradução e transcrição entre outros. Essas moléculas estão associadas também a diver- sos tipos de doenças como o câncer, doenças neurológicas como Alzheimer e Parkinson, doenças cardiovasculares e muitas outras. Dessa forma, torna-se importante descobrir novos RNAnc e suas respectivas estruturas secundárias, visto a estrita relação existente entre a estrutura secundária e a função biológica dessas moléculas. Neste trabalho desenvolvemos um arcabouço probabilístico utilizando modelo de Markov de estados ocultos sensível ao contexto para caracterização de sequên- cias e perfil de sequências com distância arbitrária entre símbolos, como as que encontramos em sequências de RNA e em alinhamentos de RNA. Nossa implementação foi desenvolvida como uma extensão do arcabouço probabilístico ToPS e conta com algoritmos de inferência otimizados a fim de obtermos tempos de execução eficientes. Comparamos nossa implementação com outras ferramentas que possuem o mesmo propósito e pudemos constatar que nosso arcabouço se mostra bastante competitivo além de de oferecer ao usuário maior liberdade na definição de modelos.

Metadados do item

id	USP_4f5457a82a7c3b3cf20a4d265e536c78
oai_identifier_str	oai:teses.usp.br:tde-20230727-113510
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling	Arcabouço probabilístico para análise de sequências de RNAProbabilístic Framework for RNA sequence analysisBiologia MolecularCadeias De MarkovRnaRNA é um polímero formado por quatro tipos de ácidos nucleicos denotados por A, C, G e U que representam Adenina, Citosina, Guanina e Uracila respectivamente. Os nucleotídeos G-C e A-U se ligam formando pontes de hidrogênio e são ditos complementares, contudo, outros tipos de ligações podem ocorrer. RNAs são moléculas de fita única que dobram-se formando pareamentos entre bases complementares. A estrutura formada por esses pareamentos de bases complementares é chamada de estrutura secundária. Estudos recentes mostram que uma grande quantidade de RNAs não codificantes desempenham papéis importantes em uma variedade de processos biológicos, como silenciamento gênico, regulação da expressão gênica, processamento de RNA, modificação de RNA, controle da tradução e transcrição entre outros. Essas moléculas estão associadas também a diver- sos tipos de doenças como o câncer, doenças neurológicas como Alzheimer e Parkinson, doenças cardiovasculares e muitas outras. Dessa forma, torna-se importante descobrir novos RNAnc e suas respectivas estruturas secundárias, visto a estrita relação existente entre a estrutura secundária e a função biológica dessas moléculas. Neste trabalho desenvolvemos um arcabouço probabilístico utilizando modelo de Markov de estados ocultos sensível ao contexto para caracterização de sequên- cias e perfil de sequências com distância arbitrária entre símbolos, como as que encontramos em sequências de RNA e em alinhamentos de RNA. Nossa implementação foi desenvolvida como uma extensão do arcabouço probabilístico ToPS e conta com algoritmos de inferência otimizados a fim de obtermos tempos de execução eficientes. Comparamos nossa implementação com outras ferramentas que possuem o mesmo propósito e pudemos constatar que nosso arcabouço se mostra bastante competitivo além de de oferecer ao usuário maior liberdade na definição de modelos.RNA is a four nucleotides polymer denoted by A, C, G, U which represent, respectively, Anenine, Cytosine, Guanine and Uracil. The bases A and U form hydrogen bonds, as well as the bases C and G, and these kinds of base paring are called canonical. Nevertheless, other kinds of base paring can be formed. RNAs are molecules of a single string that can fold into themselves by base pairing interactions. The structure resulted from those interactions is called RNA\2019s secondary structure. Recent studies have shown that non-coding RNAs act upon a variety of biological processes such as gene silencing, gene expression, transcription and translation control. They are also associated with various types of diseases such as cancer, neurological diseases - as alzheimer and parkinson -, cardiovascular diseases, among others. It is therefore of fundamental importance to find new non-coding RNAs and its respective secondary structure due to the close relationship between the secondary structure and the biological function of these molecules. In this work we developed a probabilistic framework using context sensitive hidden Makov models to characterize sequences and profile of sequences with arbitrary distance between symbols, such as those found in RNA sequences and RNA alignments. Our development was made as an extension of the probabilistic framework ToPS and includes optimized versions of the inference algorithms in order to achieve efficient runtimes. We compared our approach with other framworks with similar purposes and noticed that our framework proves itself quite competitive, in addition to offering increased freedom in model definition.Biblioteca Digitais de Teses e Dissertações da USPDurham, Alan MitchellFerreira, Rafael Mathias2015-11-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113510/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-07-27T19:56:04Zoai:teses.usp.br:tde-20230727-113510Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212023-07-27T19:56:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Arcabouço probabilístico para análise de sequências de RNA Probabilístic Framework for RNA sequence analysis
title	Arcabouço probabilístico para análise de sequências de RNA
spellingShingle	Arcabouço probabilístico para análise de sequências de RNA Ferreira, Rafael Mathias Biologia Molecular Cadeias De Markov Rna
title_short	Arcabouço probabilístico para análise de sequências de RNA
title_full	Arcabouço probabilístico para análise de sequências de RNA
title_fullStr	Arcabouço probabilístico para análise de sequências de RNA
title_full_unstemmed	Arcabouço probabilístico para análise de sequências de RNA
title_sort	Arcabouço probabilístico para análise de sequências de RNA
author	Ferreira, Rafael Mathias
author_facet	Ferreira, Rafael Mathias
author_role	author
dc.contributor.none.fl_str_mv	Durham, Alan Mitchell
dc.contributor.author.fl_str_mv	Ferreira, Rafael Mathias
dc.subject.por.fl_str_mv	Biologia Molecular Cadeias De Markov Rna
topic	Biologia Molecular Cadeias De Markov Rna
description	RNA é um polímero formado por quatro tipos de ácidos nucleicos denotados por A, C, G e U que representam Adenina, Citosina, Guanina e Uracila respectivamente. Os nucleotídeos G-C e A-U se ligam formando pontes de hidrogênio e são ditos complementares, contudo, outros tipos de ligações podem ocorrer. RNAs são moléculas de fita única que dobram-se formando pareamentos entre bases complementares. A estrutura formada por esses pareamentos de bases complementares é chamada de estrutura secundária. Estudos recentes mostram que uma grande quantidade de RNAs não codificantes desempenham papéis importantes em uma variedade de processos biológicos, como silenciamento gênico, regulação da expressão gênica, processamento de RNA, modificação de RNA, controle da tradução e transcrição entre outros. Essas moléculas estão associadas também a diver- sos tipos de doenças como o câncer, doenças neurológicas como Alzheimer e Parkinson, doenças cardiovasculares e muitas outras. Dessa forma, torna-se importante descobrir novos RNAnc e suas respectivas estruturas secundárias, visto a estrita relação existente entre a estrutura secundária e a função biológica dessas moléculas. Neste trabalho desenvolvemos um arcabouço probabilístico utilizando modelo de Markov de estados ocultos sensível ao contexto para caracterização de sequên- cias e perfil de sequências com distância arbitrária entre símbolos, como as que encontramos em sequências de RNA e em alinhamentos de RNA. Nossa implementação foi desenvolvida como uma extensão do arcabouço probabilístico ToPS e conta com algoritmos de inferência otimizados a fim de obtermos tempos de execução eficientes. Comparamos nossa implementação com outras ferramentas que possuem o mesmo propósito e pudemos constatar que nosso arcabouço se mostra bastante competitivo além de de oferecer ao usuário maior liberdade na definição de modelos.
publishDate	2015
dc.date.none.fl_str_mv	2015-11-17
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113510/
url	https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113510/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1865492578750693376

Arcabouço probabilístico para análise de sequências de RNA

Registros relacionados