Arcabouço probabilístico para análise de sequências de RNA
| Ano de defesa: | 2015 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113510/ |
Resumo: | RNA é um polímero formado por quatro tipos de ácidos nucleicos denotados por A, C, G e U que representam Adenina, Citosina, Guanina e Uracila respectivamente. Os nucleotídeos G-C e A-U se ligam formando pontes de hidrogênio e são ditos complementares, contudo, outros tipos de ligações podem ocorrer. RNAs são moléculas de fita única que dobram-se formando pareamentos entre bases complementares. A estrutura formada por esses pareamentos de bases complementares é chamada de estrutura secundária. Estudos recentes mostram que uma grande quantidade de RNAs não codificantes desempenham papéis importantes em uma variedade de processos biológicos, como silenciamento gênico, regulação da expressão gênica, processamento de RNA, modificação de RNA, controle da tradução e transcrição entre outros. Essas moléculas estão associadas também a diver- sos tipos de doenças como o câncer, doenças neurológicas como Alzheimer e Parkinson, doenças cardiovasculares e muitas outras. Dessa forma, torna-se importante descobrir novos RNAnc e suas respectivas estruturas secundárias, visto a estrita relação existente entre a estrutura secundária e a função biológica dessas moléculas. Neste trabalho desenvolvemos um arcabouço probabilístico utilizando modelo de Markov de estados ocultos sensível ao contexto para caracterização de sequên- cias e perfil de sequências com distância arbitrária entre símbolos, como as que encontramos em sequências de RNA e em alinhamentos de RNA. Nossa implementação foi desenvolvida como uma extensão do arcabouço probabilístico ToPS e conta com algoritmos de inferência otimizados a fim de obtermos tempos de execução eficientes. Comparamos nossa implementação com outras ferramentas que possuem o mesmo propósito e pudemos constatar que nosso arcabouço se mostra bastante competitivo além de de oferecer ao usuário maior liberdade na definição de modelos. |
| id |
USP_4f5457a82a7c3b3cf20a4d265e536c78 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-20230727-113510 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Arcabouço probabilístico para análise de sequências de RNAProbabilístic Framework for RNA sequence analysisBiologia MolecularCadeias De MarkovRnaRNA é um polímero formado por quatro tipos de ácidos nucleicos denotados por A, C, G e U que representam Adenina, Citosina, Guanina e Uracila respectivamente. Os nucleotídeos G-C e A-U se ligam formando pontes de hidrogênio e são ditos complementares, contudo, outros tipos de ligações podem ocorrer. RNAs são moléculas de fita única que dobram-se formando pareamentos entre bases complementares. A estrutura formada por esses pareamentos de bases complementares é chamada de estrutura secundária. Estudos recentes mostram que uma grande quantidade de RNAs não codificantes desempenham papéis importantes em uma variedade de processos biológicos, como silenciamento gênico, regulação da expressão gênica, processamento de RNA, modificação de RNA, controle da tradução e transcrição entre outros. Essas moléculas estão associadas também a diver- sos tipos de doenças como o câncer, doenças neurológicas como Alzheimer e Parkinson, doenças cardiovasculares e muitas outras. Dessa forma, torna-se importante descobrir novos RNAnc e suas respectivas estruturas secundárias, visto a estrita relação existente entre a estrutura secundária e a função biológica dessas moléculas. Neste trabalho desenvolvemos um arcabouço probabilístico utilizando modelo de Markov de estados ocultos sensível ao contexto para caracterização de sequên- cias e perfil de sequências com distância arbitrária entre símbolos, como as que encontramos em sequências de RNA e em alinhamentos de RNA. Nossa implementação foi desenvolvida como uma extensão do arcabouço probabilístico ToPS e conta com algoritmos de inferência otimizados a fim de obtermos tempos de execução eficientes. Comparamos nossa implementação com outras ferramentas que possuem o mesmo propósito e pudemos constatar que nosso arcabouço se mostra bastante competitivo além de de oferecer ao usuário maior liberdade na definição de modelos.RNA is a four nucleotides polymer denoted by A, C, G, U which represent, respectively, Anenine, Cytosine, Guanine and Uracil. The bases A and U form hydrogen bonds, as well as the bases C and G, and these kinds of base paring are called canonical. Nevertheless, other kinds of base paring can be formed. RNAs are molecules of a single string that can fold into themselves by base pairing interactions. The structure resulted from those interactions is called RNA\2019s secondary structure. Recent studies have shown that non-coding RNAs act upon a variety of biological processes such as gene silencing, gene expression, transcription and translation control. They are also associated with various types of diseases such as cancer, neurological diseases - as alzheimer and parkinson -, cardiovascular diseases, among others. It is therefore of fundamental importance to find new non-coding RNAs and its respective secondary structure due to the close relationship between the secondary structure and the biological function of these molecules. In this work we developed a probabilistic framework using context sensitive hidden Makov models to characterize sequences and profile of sequences with arbitrary distance between symbols, such as those found in RNA sequences and RNA alignments. Our development was made as an extension of the probabilistic framework ToPS and includes optimized versions of the inference algorithms in order to achieve efficient runtimes. We compared our approach with other framworks with similar purposes and noticed that our framework proves itself quite competitive, in addition to offering increased freedom in model definition.Biblioteca Digitais de Teses e Dissertações da USPDurham, Alan MitchellFerreira, Rafael Mathias2015-11-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113510/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-07-27T19:56:04Zoai:teses.usp.br:tde-20230727-113510Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-07-27T19:56:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Arcabouço probabilístico para análise de sequências de RNA Probabilístic Framework for RNA sequence analysis |
| title |
Arcabouço probabilístico para análise de sequências de RNA |
| spellingShingle |
Arcabouço probabilístico para análise de sequências de RNA Ferreira, Rafael Mathias Biologia Molecular Cadeias De Markov Rna |
| title_short |
Arcabouço probabilístico para análise de sequências de RNA |
| title_full |
Arcabouço probabilístico para análise de sequências de RNA |
| title_fullStr |
Arcabouço probabilístico para análise de sequências de RNA |
| title_full_unstemmed |
Arcabouço probabilístico para análise de sequências de RNA |
| title_sort |
Arcabouço probabilístico para análise de sequências de RNA |
| author |
Ferreira, Rafael Mathias |
| author_facet |
Ferreira, Rafael Mathias |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Durham, Alan Mitchell |
| dc.contributor.author.fl_str_mv |
Ferreira, Rafael Mathias |
| dc.subject.por.fl_str_mv |
Biologia Molecular Cadeias De Markov Rna |
| topic |
Biologia Molecular Cadeias De Markov Rna |
| description |
RNA é um polímero formado por quatro tipos de ácidos nucleicos denotados por A, C, G e U que representam Adenina, Citosina, Guanina e Uracila respectivamente. Os nucleotídeos G-C e A-U se ligam formando pontes de hidrogênio e são ditos complementares, contudo, outros tipos de ligações podem ocorrer. RNAs são moléculas de fita única que dobram-se formando pareamentos entre bases complementares. A estrutura formada por esses pareamentos de bases complementares é chamada de estrutura secundária. Estudos recentes mostram que uma grande quantidade de RNAs não codificantes desempenham papéis importantes em uma variedade de processos biológicos, como silenciamento gênico, regulação da expressão gênica, processamento de RNA, modificação de RNA, controle da tradução e transcrição entre outros. Essas moléculas estão associadas também a diver- sos tipos de doenças como o câncer, doenças neurológicas como Alzheimer e Parkinson, doenças cardiovasculares e muitas outras. Dessa forma, torna-se importante descobrir novos RNAnc e suas respectivas estruturas secundárias, visto a estrita relação existente entre a estrutura secundária e a função biológica dessas moléculas. Neste trabalho desenvolvemos um arcabouço probabilístico utilizando modelo de Markov de estados ocultos sensível ao contexto para caracterização de sequên- cias e perfil de sequências com distância arbitrária entre símbolos, como as que encontramos em sequências de RNA e em alinhamentos de RNA. Nossa implementação foi desenvolvida como uma extensão do arcabouço probabilístico ToPS e conta com algoritmos de inferência otimizados a fim de obtermos tempos de execução eficientes. Comparamos nossa implementação com outras ferramentas que possuem o mesmo propósito e pudemos constatar que nosso arcabouço se mostra bastante competitivo além de de oferecer ao usuário maior liberdade na definição de modelos. |
| publishDate |
2015 |
| dc.date.none.fl_str_mv |
2015-11-17 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113510/ |
| url |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113510/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492578750693376 |