Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Maciel, Talles Eduardo Ferreira
Orientador(a): Fietto, Juliana Lopes Rangel
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Viçosa
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Área do conhecimento CNPq:
Link de acesso: http://www.locus.ufv.br/handle/123456789/6490
Resumo: Os parasitos do gênero Leishmania, que causam um amplo espectro de desordens clínicas referidas comumente como leishmanioses, são um grande problema de saúde pública em vários países. A leishmaniose tegumentar americana está entre as endemias de maior importância em saúde pública no Brasil, devido a fatores como: ampla distribuição pelo território nacional, ocorrência de formas clínicas graves e limitações referentes tanto ao diagnóstico como ao tratamento, sendo a L. (V.) braziliensis uma das principais espécies de importância epidemiológica para a LTA no Brasil. Atualmente existem diversas tecnologias que permitem o sequenciamento do DNA em larga escala, sendo a plataforma 454/Roche utilizada neste trabalho. Assim, este trabalho utilizou ferramentas de bioinformática para montar e analisar o transcriptoma de L. (V.) braziliensis através do sequenciamento do transcriptoma de dois isolados (ET e NSL), que apresentam diferença significativa na virulência em modelo murino. Foram preparadas duas formas evolutivas para cada isolado: metacíclica (MET) e procíclica (PRO). Desta forma foram analisadas quatro bibliotecas. Após sequenciamento, os dados foram visualizados com o programa fastQC, tratados com FASTX- Tollkit e Prinseq-Lite e montados com programa Newbler. A montagem (Assembly) foi efetuada de duas maneiras distintas: primeiro efetuou-se a montagem com as reads de cada biblioteca e posteriormente, as reads das quatro bibliotecas foram alocados em arquivo único para realização de um novo assembly. As open reading frame (ORFs), que são regiões com potencial para codificar proteínas, foram preditas utilizando as sequências resultantes da montagem. A anotação foi efetuada através de duas abordagens: transferência de informações do genoma anotado automaticamente para as ORFs preditas e pela abordagem baseada em homologia de sequências através da ferramenta de anotação funcional Blast2GO. Após anotação, efetuou-se a análise da expressão gênica diferencial através de duas abordagens diferentes: a primeira, utilizou o método de Blind do pacote DESeq do R/Bioconductor e a segunda utilizou uma abordagem baseada em RPKM. Foram produzidas 3.095.724 reads, sendo 916.546, 589.554, 1.083.312 e 506.312 sequências para ET-MET (biblioteca 1), ET- PRO (biblioteca 2), NSL-MET (biblioteca 3) e NSL-PRO (biblioteca 4), respectivamente. Após o tratamento, utilizou-se para o restante das análises 2.899.230 sequências. Com o intuito de validar algumas das análises, foi utilizado neste trabalho um segundo conjunto de reads (Illumina) baixado do banco de dados SRA (Sequence Read Archive) indexado ao NCBI, sendo este composto por 52.014.768 de reads paired end. Após o tratamento, utilizou- se para o restante das análises 47.377.233 de reads. Os resultados das análises com as reads sequenciadas neste trabalho e com os contigs montados, tal como o mapeamento destes no genoma anotado de L. (V.) braziliensis, produziu novas informações ao orfeoma anotado automaticamente de L. (V.) braziliensis. Após montagem, obteve-se 14.362, 13.145, 14.899 e 11.434 contigs maiores que 100 pb para as bibliotecas 1, 2, 3 e 4, respectivamente. Obteve-se como resultado da montagem, considerando as reads de todas as bibliotecas, 14.017 contigs. As ORFs preditas à partir dos contigs que não mapearam no genoma anotado foram utilizados para busca de novos genes de L. (V.) braziliensis. Como resultado, foi possível encontrar seis novos genes, 117 possíveis ORFs sem hits no banco de dados nr e 85 ORFs que, por algum motivo, deixaram de fazer parte do genoma anotado. Foram encontrados, ao se comparar as reads obtidas neste trabalho com o genoma anotado, 6.293 sítios com identidades diferentes, que pode ser devido a divergência alélica entre os isolados analisados ou devido ao polimorfismos de nucleotídeo único (SNPs).
id UFV_cc612af6ef6929300c29a45676c29064
oai_identifier_str oai:locus.ufv.br:123456789/6490
network_acronym_str UFV
network_name_str LOCUS Repositório Institucional da UFV
repository_id_str
spelling Silva Júnior, AbelardoBressan, Gustavo CostaLamego, Márcia Rogéria de AlmeidaAfonso, Luís Carlos CroccoMaciel, Talles Eduardo Ferreirahttp://lattes.cnpq.br/3491513954357544Fietto, Juliana Lopes Rangel2015-11-03T13:28:34Z2015-11-03T13:28:34Z2014-02-10MACIEL, Talles Eduardo Ferreira. Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos. 2014. 92 f. Tese (Doutorado em Bioquímica Agrícola) - Universidade Federal de Viçosa, Viçosa. 2014.http://www.locus.ufv.br/handle/123456789/6490Os parasitos do gênero Leishmania, que causam um amplo espectro de desordens clínicas referidas comumente como leishmanioses, são um grande problema de saúde pública em vários países. A leishmaniose tegumentar americana está entre as endemias de maior importância em saúde pública no Brasil, devido a fatores como: ampla distribuição pelo território nacional, ocorrência de formas clínicas graves e limitações referentes tanto ao diagnóstico como ao tratamento, sendo a L. (V.) braziliensis uma das principais espécies de importância epidemiológica para a LTA no Brasil. Atualmente existem diversas tecnologias que permitem o sequenciamento do DNA em larga escala, sendo a plataforma 454/Roche utilizada neste trabalho. Assim, este trabalho utilizou ferramentas de bioinformática para montar e analisar o transcriptoma de L. (V.) braziliensis através do sequenciamento do transcriptoma de dois isolados (ET e NSL), que apresentam diferença significativa na virulência em modelo murino. Foram preparadas duas formas evolutivas para cada isolado: metacíclica (MET) e procíclica (PRO). Desta forma foram analisadas quatro bibliotecas. Após sequenciamento, os dados foram visualizados com o programa fastQC, tratados com FASTX- Tollkit e Prinseq-Lite e montados com programa Newbler. A montagem (Assembly) foi efetuada de duas maneiras distintas: primeiro efetuou-se a montagem com as reads de cada biblioteca e posteriormente, as reads das quatro bibliotecas foram alocados em arquivo único para realização de um novo assembly. As open reading frame (ORFs), que são regiões com potencial para codificar proteínas, foram preditas utilizando as sequências resultantes da montagem. A anotação foi efetuada através de duas abordagens: transferência de informações do genoma anotado automaticamente para as ORFs preditas e pela abordagem baseada em homologia de sequências através da ferramenta de anotação funcional Blast2GO. Após anotação, efetuou-se a análise da expressão gênica diferencial através de duas abordagens diferentes: a primeira, utilizou o método de Blind do pacote DESeq do R/Bioconductor e a segunda utilizou uma abordagem baseada em RPKM. Foram produzidas 3.095.724 reads, sendo 916.546, 589.554, 1.083.312 e 506.312 sequências para ET-MET (biblioteca 1), ET- PRO (biblioteca 2), NSL-MET (biblioteca 3) e NSL-PRO (biblioteca 4), respectivamente. Após o tratamento, utilizou-se para o restante das análises 2.899.230 sequências. Com o intuito de validar algumas das análises, foi utilizado neste trabalho um segundo conjunto de reads (Illumina) baixado do banco de dados SRA (Sequence Read Archive) indexado ao NCBI, sendo este composto por 52.014.768 de reads paired end. Após o tratamento, utilizou- se para o restante das análises 47.377.233 de reads. Os resultados das análises com as reads sequenciadas neste trabalho e com os contigs montados, tal como o mapeamento destes no genoma anotado de L. (V.) braziliensis, produziu novas informações ao orfeoma anotado automaticamente de L. (V.) braziliensis. Após montagem, obteve-se 14.362, 13.145, 14.899 e 11.434 contigs maiores que 100 pb para as bibliotecas 1, 2, 3 e 4, respectivamente. Obteve-se como resultado da montagem, considerando as reads de todas as bibliotecas, 14.017 contigs. As ORFs preditas à partir dos contigs que não mapearam no genoma anotado foram utilizados para busca de novos genes de L. (V.) braziliensis. Como resultado, foi possível encontrar seis novos genes, 117 possíveis ORFs sem hits no banco de dados nr e 85 ORFs que, por algum motivo, deixaram de fazer parte do genoma anotado. Foram encontrados, ao se comparar as reads obtidas neste trabalho com o genoma anotado, 6.293 sítios com identidades diferentes, que pode ser devido a divergência alélica entre os isolados analisados ou devido ao polimorfismos de nucleotídeo único (SNPs).Parasites of the genus Leishmania, which cause a broad spectrum of clinical disorders referred to commonly as leishmaniasis, are a major public health problem in many countries. American cutaneous leishmaniasis is among the endemic most important in public health in Brazil, due to factors such as: wide distribution throughout the country, the occurrence of severe clinical forms and limitations relating to both diagnosis and treatment, with L. (V.) braziliensis being one of the main species of epidemiological significance to the LTA in Brazil. Currently there are several technologies that allow the DNA sequencing in large scale, being the 454/Roche platform used in this work. Thus, this study used bioinformatics tools for assembly and analyze the transcriptome of L. (V.) braziliensis through transcriptome sequencing of two isolates (ET and NSL), which present significant difference in virulence in murine model. Were prepared two evolutionary forms for each isolate: metacyclic (MET) and procyclical (PRO). Thus, four libraries were analyzed. After sequencing, the data were visualized with fastQC program, treated with FASTX-Tollkit and Prinseq-Lite and assembly with Newbler v.2.5.3 program. The assembly was conducted of two distinct ways: first performed the assembly whit the reads from each sample and then, the reads of the four samples were placed in single file to perform a new assembly. The open reading frame (ORF), which are regions with potential to encode a protein were predicted using the resulting assembly. The annotation was carried out using two approaches: transfer of information of automatically annotated genomic to predicted ORFs and by approach based on sequence homology by functional annotation tool Blast2GO. After annotation, performed the analysis of differential gene expression by two different approaches: first, was used the Blind method of DESeq package the R/Bioconductor and the second was used an approach based on RPKM. 3.095.724 reads were produced, with 916.546, 589.554, 1.083.312 and 506.312 sequences for ET-MET (sample 1), ET-PRO (sample 2), NSL-MET (sample 3) and NSL- PRO (sample 4), respectively. After treatment, was used for the remaining analysis 2.899.230 sequence. In order to validate some of the analysis, was used in this study, a second set of reads (Illumina) downloaded from the database SRA (Archive Sequence Read) indexed to NCBI, this being composed of 52.014.768 of reads paired end. After treatment, was used for the remainder analysis 47.377.233 of reads. The results of the analysis with the reads sequenced this work and with the assembly contigs, such as mapping of these in annotated genome the L. (V.) braziliensis, produced new information to automatically annotated orfeoma of L. (V.) braziliensis. After assembly, we obtained 14.362, 13.145, 14.899 and 11.434 contigs larger than 100 bp for samples 1, 2, 3 and 4, respectively. It was obtained as a result of assembly, considering the reads from all samples, 14.017 contigs. The ORFs predicted from contigs not mapped the annotated genome were used to search for new genes of L. (V.) braziliensis. So, were found six new genes, 117 ORFs possible without hits in the nr database and 85 ORFs that, for some reason, no longer in the annotated genome. Were found, when comparing the reads obtained in this work with the annotated genome, 6.293 sites with different identities, which may be due to the allelic divergence between the isolates analyzed or due to single nucleotide polymorphisms (SNPs).Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de ViçosaLeishmania braziliensisBioinformáticaExpressão diferencialTranscriptomaBiologia MolecularBioquímicaTranscriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressosTranscriptome of L. (V.) braziliensis by RNA-Seq: assembly of transcriptomas, enrichment of orfeoma, expression analysis and annotation of differentially expressed genesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal de ViçosaDepartamento de Bioquímica e Biologia MolecularDoutor em Bioquímica AgrícolaViçosa - MG2014-02-10Doutoradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf2083437https://locus.ufv.br//bitstream/123456789/6490/1/texto%20completo.pdf8f479543c8dc090087a91955c71d8ba0MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/6490/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTtexto completo.pdf.txttexto completo.pdf.txtExtracted texttext/plain170422https://locus.ufv.br//bitstream/123456789/6490/3/texto%20completo.pdf.txt391030eaf694ce2db2d839db03446e4cMD53THUMBNAILtexto completo.pdf.jpgtexto completo.pdf.jpgIM Thumbnailimage/jpeg3728https://locus.ufv.br//bitstream/123456789/6490/4/texto%20completo.pdf.jpg19d24cfdf9ffd748d1f70934aa4c71b7MD54123456789/64902016-04-12 23:03:47.937oai:locus.ufv.br:123456789/6490Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452016-04-13T02:03:47LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.pt-BR.fl_str_mv Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos
dc.title.en.fl_str_mv Transcriptome of L. (V.) braziliensis by RNA-Seq: assembly of transcriptomas, enrichment of orfeoma, expression analysis and annotation of differentially expressed genes
title Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos
spellingShingle Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos
Maciel, Talles Eduardo Ferreira
Leishmania braziliensis
Bioinformática
Expressão diferencial
Transcriptoma
Biologia Molecular
Bioquímica
title_short Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos
title_full Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos
title_fullStr Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos
title_full_unstemmed Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos
title_sort Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos
author Maciel, Talles Eduardo Ferreira
author_facet Maciel, Talles Eduardo Ferreira
author_role author
dc.contributor.authorLattes.pt-BR.fl_str_mv http://lattes.cnpq.br/3491513954357544
dc.contributor.none.fl_str_mv Silva Júnior, Abelardo
Bressan, Gustavo Costa
Lamego, Márcia Rogéria de Almeida
Afonso, Luís Carlos Crocco
dc.contributor.author.fl_str_mv Maciel, Talles Eduardo Ferreira
dc.contributor.advisor1.fl_str_mv Fietto, Juliana Lopes Rangel
contributor_str_mv Fietto, Juliana Lopes Rangel
dc.subject.pt-BR.fl_str_mv Leishmania braziliensis
Bioinformática
Expressão diferencial
Transcriptoma
topic Leishmania braziliensis
Bioinformática
Expressão diferencial
Transcriptoma
Biologia Molecular
Bioquímica
dc.subject.cnpq.fl_str_mv Biologia Molecular
Bioquímica
description Os parasitos do gênero Leishmania, que causam um amplo espectro de desordens clínicas referidas comumente como leishmanioses, são um grande problema de saúde pública em vários países. A leishmaniose tegumentar americana está entre as endemias de maior importância em saúde pública no Brasil, devido a fatores como: ampla distribuição pelo território nacional, ocorrência de formas clínicas graves e limitações referentes tanto ao diagnóstico como ao tratamento, sendo a L. (V.) braziliensis uma das principais espécies de importância epidemiológica para a LTA no Brasil. Atualmente existem diversas tecnologias que permitem o sequenciamento do DNA em larga escala, sendo a plataforma 454/Roche utilizada neste trabalho. Assim, este trabalho utilizou ferramentas de bioinformática para montar e analisar o transcriptoma de L. (V.) braziliensis através do sequenciamento do transcriptoma de dois isolados (ET e NSL), que apresentam diferença significativa na virulência em modelo murino. Foram preparadas duas formas evolutivas para cada isolado: metacíclica (MET) e procíclica (PRO). Desta forma foram analisadas quatro bibliotecas. Após sequenciamento, os dados foram visualizados com o programa fastQC, tratados com FASTX- Tollkit e Prinseq-Lite e montados com programa Newbler. A montagem (Assembly) foi efetuada de duas maneiras distintas: primeiro efetuou-se a montagem com as reads de cada biblioteca e posteriormente, as reads das quatro bibliotecas foram alocados em arquivo único para realização de um novo assembly. As open reading frame (ORFs), que são regiões com potencial para codificar proteínas, foram preditas utilizando as sequências resultantes da montagem. A anotação foi efetuada através de duas abordagens: transferência de informações do genoma anotado automaticamente para as ORFs preditas e pela abordagem baseada em homologia de sequências através da ferramenta de anotação funcional Blast2GO. Após anotação, efetuou-se a análise da expressão gênica diferencial através de duas abordagens diferentes: a primeira, utilizou o método de Blind do pacote DESeq do R/Bioconductor e a segunda utilizou uma abordagem baseada em RPKM. Foram produzidas 3.095.724 reads, sendo 916.546, 589.554, 1.083.312 e 506.312 sequências para ET-MET (biblioteca 1), ET- PRO (biblioteca 2), NSL-MET (biblioteca 3) e NSL-PRO (biblioteca 4), respectivamente. Após o tratamento, utilizou-se para o restante das análises 2.899.230 sequências. Com o intuito de validar algumas das análises, foi utilizado neste trabalho um segundo conjunto de reads (Illumina) baixado do banco de dados SRA (Sequence Read Archive) indexado ao NCBI, sendo este composto por 52.014.768 de reads paired end. Após o tratamento, utilizou- se para o restante das análises 47.377.233 de reads. Os resultados das análises com as reads sequenciadas neste trabalho e com os contigs montados, tal como o mapeamento destes no genoma anotado de L. (V.) braziliensis, produziu novas informações ao orfeoma anotado automaticamente de L. (V.) braziliensis. Após montagem, obteve-se 14.362, 13.145, 14.899 e 11.434 contigs maiores que 100 pb para as bibliotecas 1, 2, 3 e 4, respectivamente. Obteve-se como resultado da montagem, considerando as reads de todas as bibliotecas, 14.017 contigs. As ORFs preditas à partir dos contigs que não mapearam no genoma anotado foram utilizados para busca de novos genes de L. (V.) braziliensis. Como resultado, foi possível encontrar seis novos genes, 117 possíveis ORFs sem hits no banco de dados nr e 85 ORFs que, por algum motivo, deixaram de fazer parte do genoma anotado. Foram encontrados, ao se comparar as reads obtidas neste trabalho com o genoma anotado, 6.293 sítios com identidades diferentes, que pode ser devido a divergência alélica entre os isolados analisados ou devido ao polimorfismos de nucleotídeo único (SNPs).
publishDate 2014
dc.date.issued.fl_str_mv 2014-02-10
dc.date.accessioned.fl_str_mv 2015-11-03T13:28:34Z
dc.date.available.fl_str_mv 2015-11-03T13:28:34Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MACIEL, Talles Eduardo Ferreira. Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos. 2014. 92 f. Tese (Doutorado em Bioquímica Agrícola) - Universidade Federal de Viçosa, Viçosa. 2014.
dc.identifier.uri.fl_str_mv http://www.locus.ufv.br/handle/123456789/6490
identifier_str_mv MACIEL, Talles Eduardo Ferreira. Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos. 2014. 92 f. Tese (Doutorado em Bioquímica Agrícola) - Universidade Federal de Viçosa, Viçosa. 2014.
url http://www.locus.ufv.br/handle/123456789/6490
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Viçosa
publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.source.none.fl_str_mv reponame:LOCUS Repositório Institucional da UFV
instname:Universidade Federal de Viçosa (UFV)
instacron:UFV
instname_str Universidade Federal de Viçosa (UFV)
instacron_str UFV
institution UFV
reponame_str LOCUS Repositório Institucional da UFV
collection LOCUS Repositório Institucional da UFV
bitstream.url.fl_str_mv https://locus.ufv.br//bitstream/123456789/6490/1/texto%20completo.pdf
https://locus.ufv.br//bitstream/123456789/6490/2/license.txt
https://locus.ufv.br//bitstream/123456789/6490/3/texto%20completo.pdf.txt
https://locus.ufv.br//bitstream/123456789/6490/4/texto%20completo.pdf.jpg
bitstream.checksum.fl_str_mv 8f479543c8dc090087a91955c71d8ba0
8a4605be74aa9ea9d79846c1fba20a33
391030eaf694ce2db2d839db03446e4c
19d24cfdf9ffd748d1f70934aa4c71b7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv fabiojreis@ufv.br
_version_ 1794528641591279616