Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Patrícia de Cássia Ruy
Orientador(a): Angela Kaysel Cruz
Banca de defesa: Daniella Castanheira Bartholomeu, João Carlos Setubal, Luiz Ricardo Orsini Tosi, Ricardo Zorzetto Nicoliello Vencio
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade de São Paulo
Programa de Pós-Graduação: Bioinformática
Departamento: Não Informado pela instituição
País: BR
Link de acesso: https://doi.org/10.11606/T.95.2018.tde-21112017-112651
Resumo: Análises de dados gerados em larga escala revelaram que os transcriptomas são mais extensos e complexos do que inferido previamente. Hoje é evidente que a maioria dos genomas de eucariotos são quase inteiramente transcritos e sob regulação atrelada a estágios de desenvolvimento. O controle da expressão gênica envolve RNAs não codificadores (ncRNAs) regulatórios, inclusive em processos pós-transcricionais. A regulação de expressão gênica em nível pós-transcricional é crucial em diferentes organismos, mas é particularmente central nos tripanossomatídeos. Os parasitos do gênero Leishmania (Ordem Kinetoplastidae, família Trypanosomatidae) provocam doenças infecto-parasitárias conhecidas como leishmanioses e em seu ciclo de vida apresenta-se sob três formas principais de desenvolvimento: promastigotas procíclicos, promastigotas metacíclicos e os amastigotas. Este trabalho teve como objetivo identificar e caracterizar computacionalmente ncRNAs putativos de Leishmania em diferentes estágios de desenvolvimento. A associação de abordagens em larga escala e ferramentas de bioinformática possibilitaram a identificação de 11.376 ncRNAs putativos em L. braziliensis e, em um estudo preliminar, de 37 ncRNAs putativos em L. donovani. Adicionalmente, o transcriptoma de L. braziliensis foi analisado comparativamente entre os três estágios de desenvolvimento do parasito. Em L. donovani, dos 37 ncRNAs putativos identificados, 34 estavam em UTRs (Untranslated Regions) e 3 em regiões intergênicas. Preditores de características específicas de ncRNAs foram utilizados e 32 ncRNAs putativos tiveram pelo menos uma predição positiva. Todos os candidatos estão conservados inteira ou parcialmente em pelo menos 3 espécies de Leishmania. Cinco ncRNAs de L. donovani foram confirmados por experimentos de Northern blotting. A análise do transcriptoma de L. braziliensis revelou uma diferença de expressão gênica entre os estágios de desenvolvimento que variou entre 52% e 71%, dependendo dos estágios comparados. Também foram definidos os limites das 5UTRs e 3UTRs de 81% e 38% das CDSs anotadas, respectivamente. Propusemos uma metodologia para identificação de ncRNAs putativos utilizando dados de sequenciamento de RNA-total. Essa metodologia identificou 11.376 ncRNAs putativos em L. braziliensis, sendo que todos os candidatos foram analisados por programas preditores de características específicas de ncRNAs e apresentaram pelo menos uma predição positiva, além de não possuírem semelhança com domínios proteicos conhecidos. A análise de conservação demonstrou que de 27% a 41% dos ncRNAs putativos identificados são conservados em outras espécies de Leishmania. Foram encontrados de 27% a 38% de ncRNAs putativos com regulação atrelada ao estágio de desenvolvimento, dependendo dos estágios comparados. Assim, além da identificação e descrição de ncRNAs em Leishmania foram encontrados candidatos com regulação atrelada ao desenvolvimento e padrões foram descortinados com o processo de análise proposto e executado. Portanto, esse trabalho contribui significativamente para ampliar a compreensão dos processos de regulação de expressão gênica em Leishmania e oferecerá à comunidade um conjunto grande e importante de informações sobre a organização genética do parasito, diferenças genéticas e regulatórias ao longo do desenvolvimento, além de informações do transcriptoma de forma global.
id USP_c5f5ad164c8dabcdc9c23e679f26219f
oai_identifier_str oai:teses.usp.br:tde-21112017-112651
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania In silico identification and analysis of Leishmania ncRNAs using RNA-seq data 2017-08-08Angela Kaysel CruzDaniella Castanheira BartholomeuJoão Carlos SetubalLuiz Ricardo Orsini TosiRicardo Zorzetto Nicoliello VencioPatrícia de Cássia RuyUniversidade de São PauloBioinformáticaUSPBR Bioinformática Bioinformatics Leishmania Leishmania NcRNA NcRNA Non-coding RNA RNA não codificador RNA-seq RNA-seq Transcriptoma Transcriptome Análises de dados gerados em larga escala revelaram que os transcriptomas são mais extensos e complexos do que inferido previamente. Hoje é evidente que a maioria dos genomas de eucariotos são quase inteiramente transcritos e sob regulação atrelada a estágios de desenvolvimento. O controle da expressão gênica envolve RNAs não codificadores (ncRNAs) regulatórios, inclusive em processos pós-transcricionais. A regulação de expressão gênica em nível pós-transcricional é crucial em diferentes organismos, mas é particularmente central nos tripanossomatídeos. Os parasitos do gênero Leishmania (Ordem Kinetoplastidae, família Trypanosomatidae) provocam doenças infecto-parasitárias conhecidas como leishmanioses e em seu ciclo de vida apresenta-se sob três formas principais de desenvolvimento: promastigotas procíclicos, promastigotas metacíclicos e os amastigotas. Este trabalho teve como objetivo identificar e caracterizar computacionalmente ncRNAs putativos de Leishmania em diferentes estágios de desenvolvimento. A associação de abordagens em larga escala e ferramentas de bioinformática possibilitaram a identificação de 11.376 ncRNAs putativos em L. braziliensis e, em um estudo preliminar, de 37 ncRNAs putativos em L. donovani. Adicionalmente, o transcriptoma de L. braziliensis foi analisado comparativamente entre os três estágios de desenvolvimento do parasito. Em L. donovani, dos 37 ncRNAs putativos identificados, 34 estavam em UTRs (Untranslated Regions) e 3 em regiões intergênicas. Preditores de características específicas de ncRNAs foram utilizados e 32 ncRNAs putativos tiveram pelo menos uma predição positiva. Todos os candidatos estão conservados inteira ou parcialmente em pelo menos 3 espécies de Leishmania. Cinco ncRNAs de L. donovani foram confirmados por experimentos de Northern blotting. A análise do transcriptoma de L. braziliensis revelou uma diferença de expressão gênica entre os estágios de desenvolvimento que variou entre 52% e 71%, dependendo dos estágios comparados. Também foram definidos os limites das 5UTRs e 3UTRs de 81% e 38% das CDSs anotadas, respectivamente. Propusemos uma metodologia para identificação de ncRNAs putativos utilizando dados de sequenciamento de RNA-total. Essa metodologia identificou 11.376 ncRNAs putativos em L. braziliensis, sendo que todos os candidatos foram analisados por programas preditores de características específicas de ncRNAs e apresentaram pelo menos uma predição positiva, além de não possuírem semelhança com domínios proteicos conhecidos. A análise de conservação demonstrou que de 27% a 41% dos ncRNAs putativos identificados são conservados em outras espécies de Leishmania. Foram encontrados de 27% a 38% de ncRNAs putativos com regulação atrelada ao estágio de desenvolvimento, dependendo dos estágios comparados. Assim, além da identificação e descrição de ncRNAs em Leishmania foram encontrados candidatos com regulação atrelada ao desenvolvimento e padrões foram descortinados com o processo de análise proposto e executado. Portanto, esse trabalho contribui significativamente para ampliar a compreensão dos processos de regulação de expressão gênica em Leishmania e oferecerá à comunidade um conjunto grande e importante de informações sobre a organização genética do parasito, diferenças genéticas e regulatórias ao longo do desenvolvimento, além de informações do transcriptoma de forma global. High-throughput data analyses indicated that transcriptomes are more extensive and complex than previously supposed. Currently, it is evident that most eukaryotic genomes are almost entirely transcribed and under regulation tied to developmental stages. Control of gene expression involves regulatory non-coding RNAs (ncRNAs), including post-transcriptional processes. Post-transcriptional regulation is particularly relevant for the regulation of gene expression in trypanosomatids, as compared to other organisms. Parasites of the genus Leishmania (Order Kinetoplastidae, family Trypanosomatidae) causes infectious-parasitic diseases known as leishmaniasis, and their life cycle comprises three development stages: procyclic promastigotes, metacyclic promastigotes and amastigotes. This study aimed to computationally identify and characterize Leishmania putative ncRNAs at different stages of development. Large-scale approaches combined with bioinformatics tools allowed the identification of 11,376 putative ncRNAs in L. braziliensis and, in a preliminary study, of 37 putative ncRNAs in L. donovani. In addition, the L. braziliensis the complete transcriptome was analyzed comparatively between the parasite development stages. In L. donovani, of the 37 putative ncRNAs identified, 34 were in UTRs (Untranslated Regions) and 3 in intergenic regions. Predictors of ncRNAs specific characteristics were used and 32 putative ncRNAs had at least one positive prediction. All candidates are conserved, partially or entirely, in at least three Leishmania species. Five L. donovani ncRNAs were confirmed by Northern blotting experiments. Analysis of the L. braziliensis transcriptome revealed differences in gene expression levels between developmental stages, ranging from 52% to 71%, depending on the compared stages. The boundaries of the 5\'UTRs and 3\'UTRs were also defined for 81% and 38% of the annotated CDSs, respectively. We developed a methodology for the identification of putative ncRNAs using total RNA sequencing data. This methodology allowed the identification of 11,376 putative ncRNAs in L. braziliensis, and all candidates were analyzed by predictive programs of ncRNAs specific characteristics and presented at least one positive prediction, in addition to bearing no similarity to known protein domains. The analysis showed that from 27% to 41% of the putative ncRNAs identified are conserved in other Leishmania species. We found 27% to 38% of putative ncRNAs with regulation associated to the developmental stage, depending on the compared stages. Consequently, besides identification and characterization of ncRNAs in Leishmania, candidates with developmental-related regulation were found and patterns were uncovered with the proposed and implemented analysis. Thus, this work contributes significantly to improve understanding of gene expression regulation processes in Leishmania and will offer to the community important information about the parasite genetics and regulatory differences along the development, besides of L. braziliensis transcriptome information. https://doi.org/10.11606/T.95.2018.tde-21112017-112651info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T19:49:29Zoai:teses.usp.br:tde-21112017-112651Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-04-23T16:00:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.pt.fl_str_mv Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
dc.title.alternative.en.fl_str_mv In silico identification and analysis of Leishmania ncRNAs using RNA-seq data
title Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
spellingShingle Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
Patrícia de Cássia Ruy
title_short Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
title_full Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
title_fullStr Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
title_full_unstemmed Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
title_sort Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
author Patrícia de Cássia Ruy
author_facet Patrícia de Cássia Ruy
author_role author
dc.contributor.advisor1.fl_str_mv Angela Kaysel Cruz
dc.contributor.referee1.fl_str_mv Daniella Castanheira Bartholomeu
dc.contributor.referee2.fl_str_mv João Carlos Setubal
dc.contributor.referee3.fl_str_mv Luiz Ricardo Orsini Tosi
dc.contributor.referee4.fl_str_mv Ricardo Zorzetto Nicoliello Vencio
dc.contributor.author.fl_str_mv Patrícia de Cássia Ruy
contributor_str_mv Angela Kaysel Cruz
Daniella Castanheira Bartholomeu
João Carlos Setubal
Luiz Ricardo Orsini Tosi
Ricardo Zorzetto Nicoliello Vencio
description Análises de dados gerados em larga escala revelaram que os transcriptomas são mais extensos e complexos do que inferido previamente. Hoje é evidente que a maioria dos genomas de eucariotos são quase inteiramente transcritos e sob regulação atrelada a estágios de desenvolvimento. O controle da expressão gênica envolve RNAs não codificadores (ncRNAs) regulatórios, inclusive em processos pós-transcricionais. A regulação de expressão gênica em nível pós-transcricional é crucial em diferentes organismos, mas é particularmente central nos tripanossomatídeos. Os parasitos do gênero Leishmania (Ordem Kinetoplastidae, família Trypanosomatidae) provocam doenças infecto-parasitárias conhecidas como leishmanioses e em seu ciclo de vida apresenta-se sob três formas principais de desenvolvimento: promastigotas procíclicos, promastigotas metacíclicos e os amastigotas. Este trabalho teve como objetivo identificar e caracterizar computacionalmente ncRNAs putativos de Leishmania em diferentes estágios de desenvolvimento. A associação de abordagens em larga escala e ferramentas de bioinformática possibilitaram a identificação de 11.376 ncRNAs putativos em L. braziliensis e, em um estudo preliminar, de 37 ncRNAs putativos em L. donovani. Adicionalmente, o transcriptoma de L. braziliensis foi analisado comparativamente entre os três estágios de desenvolvimento do parasito. Em L. donovani, dos 37 ncRNAs putativos identificados, 34 estavam em UTRs (Untranslated Regions) e 3 em regiões intergênicas. Preditores de características específicas de ncRNAs foram utilizados e 32 ncRNAs putativos tiveram pelo menos uma predição positiva. Todos os candidatos estão conservados inteira ou parcialmente em pelo menos 3 espécies de Leishmania. Cinco ncRNAs de L. donovani foram confirmados por experimentos de Northern blotting. A análise do transcriptoma de L. braziliensis revelou uma diferença de expressão gênica entre os estágios de desenvolvimento que variou entre 52% e 71%, dependendo dos estágios comparados. Também foram definidos os limites das 5UTRs e 3UTRs de 81% e 38% das CDSs anotadas, respectivamente. Propusemos uma metodologia para identificação de ncRNAs putativos utilizando dados de sequenciamento de RNA-total. Essa metodologia identificou 11.376 ncRNAs putativos em L. braziliensis, sendo que todos os candidatos foram analisados por programas preditores de características específicas de ncRNAs e apresentaram pelo menos uma predição positiva, além de não possuírem semelhança com domínios proteicos conhecidos. A análise de conservação demonstrou que de 27% a 41% dos ncRNAs putativos identificados são conservados em outras espécies de Leishmania. Foram encontrados de 27% a 38% de ncRNAs putativos com regulação atrelada ao estágio de desenvolvimento, dependendo dos estágios comparados. Assim, além da identificação e descrição de ncRNAs em Leishmania foram encontrados candidatos com regulação atrelada ao desenvolvimento e padrões foram descortinados com o processo de análise proposto e executado. Portanto, esse trabalho contribui significativamente para ampliar a compreensão dos processos de regulação de expressão gênica em Leishmania e oferecerá à comunidade um conjunto grande e importante de informações sobre a organização genética do parasito, diferenças genéticas e regulatórias ao longo do desenvolvimento, além de informações do transcriptoma de forma global.
publishDate 2017
dc.date.issued.fl_str_mv 2017-08-08
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.11606/T.95.2018.tde-21112017-112651
url https://doi.org/10.11606/T.95.2018.tde-21112017-112651
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade de São Paulo
dc.publisher.program.fl_str_mv Bioinformática
dc.publisher.initials.fl_str_mv USP
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade de São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1786377044886552576