Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Brito, Danilo Ribeiro de
Orientador(a): Ruas, Paulo Maurício [Orientador]
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.uel.br/handle/123456789/10075
Resumo: Resumo: O café encontra-se entre as principais commodities agrícolas do Brasil, o qual ocupa o posto de maior produtor e exportador de café no mundo Dentre as 124 espécies do gênero, Coffea arabica, Coffea canefora e Coffea eugenioides são as de maior destaque e as duas primeiras representam a maior parte da produção de café Com exceção do C arabica, todas as demais espécies do gênero são diplóides C arabica é um alotetraplóide, formado a partir de uma hibridação natural entre C canephora e C eugenioides O parental C eugenioides ainda foi pouco estudado, porém muitas características genéticas dos cafés Árabicas comerciais foram herdadas desta espécie Desta forma, é justifica-se aumentar o conhecimento sobre os genes funcionalmente ativos no transcriptoma de C eugenioides A tecnologia de sequenciamento de RNAs (RNA-Seq) tem sido muito utilizada em trabalhos de identificação e anotação funcional de genes para diversas espécies de plantas, assim como para verificar os níveis de atividade transcricional e identificação de genes diferencialmente expressos em determinadas condições e/ou tecidos específicos O presente projeto teve como objetivo realizar a montagem, anotação funcional dos transcritos de folhas e frutos de C eugenioides utilizando o seu genoma como referência para o alinhamento das sequências, e comparar os resultados obtidos com os disponíveis até o presente momento em bancos de dados públicos Foram utilizadas duas bibliotecas de RNA-Seq (folhas e frutos) de C eugenioides sequenciadas via plataforma Illumina Hiseq2 Primeiramente foi realizado o alinhamento das bibliotecas contra o genoma de referência utilizando o software HISAT2 Para montagem dos reads alinhado em transcritos foi utilizado o software StringTie e na sequência o software Kallisto para a quantificação dos transcritos O software DESeq2 foi utilizado para identificação de genes diferencialmente expressos em frutos e folhas Para anotação utilizamos o BlastX contra o banco de dados de sequências não redundantes (NCBI-nr) Foi realizada uma análise comparativa com a ferramenta BlastN contra o banco de dados de sequências expressas (EST) de C arabica e C canephora pré-existentes O resultado da montagem de transcritos identificou 16743 contigs únicos para C eugenioides, estas sequências apresentaram similaridade de 82,6% com ESTs de C arabica, 91,38% em CDS de C canephora, 94,87% com o RNA-Seq de C arabica e 98,7% com o RNA-Seq de C eugenioides Em relação ao trabalho original, foram identificados 322 novos transcritos, das quais 36 não foram descritos nas bases de dados da Coffea spp Além disso, foram identificados 923 genes diferencialmente expressos em folhas e frutos, sendo 414 mais expressos em folhas e 59 mais expressos em frutos Seis genes diferencialmente expressos em frutos tiveram sua atividade confirmada por RT-qPCR Três deles tiveram expressão exclusiva em frutos, apresentando potencial biotecnológico para a produção de compostos específicos ou para identificação e análise de promotores
id UEL_53e441a3b2936b4dbb7797abebb4f1bc
oai_identifier_str oai:repositorio.uel.br:123456789/10075
network_acronym_str UEL
network_name_str Repositório Institucional da UEL
repository_id_str
spelling Brito, Danilo Ribeiro deIvamoto, Suzana Tiemia9a8334e-c7e0-410a-9009-546153f81c79-1Souza, Rogério Fernandes de4264af37-6bf6-4e58-ae28-b44ed44e1fda-1Pereira, Luiz Filipe Protasio [Coorientador]9de8581b-fbc6-46b8-9620-7c33a639e41b-1616fffdc-64e1-4113-baa2-ce43bbf5b170bdb865bb-165b-4929-a2d3-f7a2684037cbRuas, Paulo Maurício [Orientador]Londrina2024-05-01T12:14:01Z2024-05-01T12:14:01Z2019.0022.02.2019https://repositorio.uel.br/handle/123456789/10075Resumo: O café encontra-se entre as principais commodities agrícolas do Brasil, o qual ocupa o posto de maior produtor e exportador de café no mundo Dentre as 124 espécies do gênero, Coffea arabica, Coffea canefora e Coffea eugenioides são as de maior destaque e as duas primeiras representam a maior parte da produção de café Com exceção do C arabica, todas as demais espécies do gênero são diplóides C arabica é um alotetraplóide, formado a partir de uma hibridação natural entre C canephora e C eugenioides O parental C eugenioides ainda foi pouco estudado, porém muitas características genéticas dos cafés Árabicas comerciais foram herdadas desta espécie Desta forma, é justifica-se aumentar o conhecimento sobre os genes funcionalmente ativos no transcriptoma de C eugenioides A tecnologia de sequenciamento de RNAs (RNA-Seq) tem sido muito utilizada em trabalhos de identificação e anotação funcional de genes para diversas espécies de plantas, assim como para verificar os níveis de atividade transcricional e identificação de genes diferencialmente expressos em determinadas condições e/ou tecidos específicos O presente projeto teve como objetivo realizar a montagem, anotação funcional dos transcritos de folhas e frutos de C eugenioides utilizando o seu genoma como referência para o alinhamento das sequências, e comparar os resultados obtidos com os disponíveis até o presente momento em bancos de dados públicos Foram utilizadas duas bibliotecas de RNA-Seq (folhas e frutos) de C eugenioides sequenciadas via plataforma Illumina Hiseq2 Primeiramente foi realizado o alinhamento das bibliotecas contra o genoma de referência utilizando o software HISAT2 Para montagem dos reads alinhado em transcritos foi utilizado o software StringTie e na sequência o software Kallisto para a quantificação dos transcritos O software DESeq2 foi utilizado para identificação de genes diferencialmente expressos em frutos e folhas Para anotação utilizamos o BlastX contra o banco de dados de sequências não redundantes (NCBI-nr) Foi realizada uma análise comparativa com a ferramenta BlastN contra o banco de dados de sequências expressas (EST) de C arabica e C canephora pré-existentes O resultado da montagem de transcritos identificou 16743 contigs únicos para C eugenioides, estas sequências apresentaram similaridade de 82,6% com ESTs de C arabica, 91,38% em CDS de C canephora, 94,87% com o RNA-Seq de C arabica e 98,7% com o RNA-Seq de C eugenioides Em relação ao trabalho original, foram identificados 322 novos transcritos, das quais 36 não foram descritos nas bases de dados da Coffea spp Além disso, foram identificados 923 genes diferencialmente expressos em folhas e frutos, sendo 414 mais expressos em folhas e 59 mais expressos em frutos Seis genes diferencialmente expressos em frutos tiveram sua atividade confirmada por RT-qPCR Três deles tiveram expressão exclusiva em frutos, apresentando potencial biotecnológico para a produção de compostos específicos ou para identificação e análise de promotoresDissertação (Mestrado em Genética e Biologia Molecular) - Universidade Estadual de Londrina, Centro de Ciências Biológicas, Programa de Pós-Graduação em Genética e Biologia MolecularAbstract: Coffee is one of the main agricultural commodities in Brazil, the largest producer and exporter of coffee worldwide Among 124 coffee species, Coffea arabica, Coffea canephora and Coffea eugenioides are the most important and the first two represent the major part of coffee production With the exception of C arabica, all other species of the genus are diploid C arabica is an alotetraploid, formed from a natural hybridization between C canephora and C eugenioides The parental C eugenioides is still poorly studied, but many genetic characteristics of commercial Arabica coffees are inherited from this species Thus, it is important to increase knowledge about the functionally active genes in the transcriptome of C eugenioides Sequencing of RNAs (RNA-Seq) has been widely used in the identification and functional annotation of genes for several plant species, as well as to verify the levels of transcriptional activity and identification of genes differentially expressed under certain conditions and / or specific tissues The present project had the objective of to assembe and perform functional annotation of the transcriptome genes of leaves and fruits of C eugenioides using its genome as a reference for sequences alignment Also to compare our results with the public data banks available Two sequential RNA-Seq (leaf and fruit) libraries of C eugenioides were used via the Illumina Hiseq2 platform First, the alignment of the libraries against the reference genome was performed using the HISAT2 software For assembly of the transcripts, the software StringTie was used and in sequence the Kallisto software for the quantification of the transcripts DESeq2 was used to identify genes differentially expressed in fruits and leaves For annotation we used BlastX against the non-redundant sequence database (NCBI-nr) A comparative analysis was performed with the BlastN tool against the preexisting C arabica and C canephora Expressed Sequence Database (EST) The result of the assembly of transcripts identified 16,743 unique contigs for the species, these sequences presented similarity of 826% with ESTs of C arabica, 9138% in CDS of C canephora, 9487% with RNA-Seq of C arabica and 987% with C eugenioides RNA-Seq In relation to the original work, 322 new transcripts were identified, 36 of which were not described in the Coffea spp databases In addition, 923 differentially expressed genes in leaves and fruits were identified, 414 being more expressed in leaves and 59 being more expressed in fruits Six differentially expressed genes in fruits had their activity confirmed by RT-qPCR Three of these had exclusive expression in fruits, presenting biotechnological potential for the production of specific compounds or for identification and analysis of promotersporCaféSequência de nucleotídeosGenesCoffeeNucleotide sequenceGenesMontagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisMestradoGenética e Biologia MolecularCentro de Ciências BiológicasPrograma de Pós-graduação em Genética e Biologia MolecularCentro Nacional de Pesquisa de Soja (Brasil)-1-1reponame:Repositório Institucional da UELinstname:Universidade Estadual de Londrina (UEL)instacron:UELinfo:eu-repo/semantics/openAccess28074vtls000229253SIMvtls000229253http://www.bibliotecadigital.uel.br/document/?code=vtls00022925364.00SIMhttp://www.bibliotecadigital.uel.br/document/?code=vtls0002292536942.pdf123456789/2402 - Mestrado - Genética e Biologia MolecularORIGINAL6942.pdfapplication/pdf1645298https://repositorio.uel.br/bitstreams/f38ec741-9cc5-44dc-91c7-8c315893c345/downloadfd568b3bd318beb8cd6a5708d0f8b1d9MD51LICENCElicence.txttext/plain263https://repositorio.uel.br/bitstreams/f815020d-bf98-44b3-bc04-9a50379bac65/download753f376dfdbc064b559839be95ac5523MD52TEXT6942.pdf.txt6942.pdf.txtExtracted texttext/plain190541https://repositorio.uel.br/bitstreams/2e61969d-06fb-4c35-9891-c8d72c992cec/downloade6c51da7e0aa9005d1abaa53da8abd64MD53THUMBNAIL6942.pdf.jpg6942.pdf.jpgGenerated Thumbnailimage/jpeg3739https://repositorio.uel.br/bitstreams/30c2070f-6541-472b-93b7-23c878778345/download9fed0986a6f17631e5a3dbb5432b35b3MD54123456789/100752024-07-12 01:20:06.312open.accessoai:repositorio.uel.br:123456789/10075https://repositorio.uel.brBiblioteca Digital de Teses e Dissertaçõeshttp://www.bibliotecadigital.uel.br/PUBhttp://www.bibliotecadigital.uel.br/OAI/oai2.phpbcuel@uel.br||opendoar:2024-07-12T04:20:06Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)false
dc.title.pt_BR.fl_str_mv Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
title Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
spellingShingle Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
Brito, Danilo Ribeiro de
Café
Sequência de nucleotídeos
Genes
Coffee
Nucleotide sequence
Genes
title_short Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
title_full Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
title_fullStr Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
title_full_unstemmed Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
title_sort Montagem do transcriptoma de Coffea eugenioides e identificação dos genes diferencialmente expressos em folhas e frutos
author Brito, Danilo Ribeiro de
author_facet Brito, Danilo Ribeiro de
author_role author
dc.contributor.banca.pt_BR.fl_str_mv Ivamoto, Suzana Tiemi
Souza, Rogério Fernandes de
dc.contributor.coadvisor.pt_BR.fl_str_mv Pereira, Luiz Filipe Protasio [Coorientador]
dc.contributor.author.fl_str_mv Brito, Danilo Ribeiro de
dc.contributor.authorID.fl_str_mv 616fffdc-64e1-4113-baa2-ce43bbf5b170
dc.contributor.advisor1ID.fl_str_mv bdb865bb-165b-4929-a2d3-f7a2684037cb
dc.contributor.advisor1.fl_str_mv Ruas, Paulo Maurício [Orientador]
contributor_str_mv Ruas, Paulo Maurício [Orientador]
dc.subject.por.fl_str_mv Café
Sequência de nucleotídeos
Genes
Coffee
Nucleotide sequence
Genes
topic Café
Sequência de nucleotídeos
Genes
Coffee
Nucleotide sequence
Genes
description Resumo: O café encontra-se entre as principais commodities agrícolas do Brasil, o qual ocupa o posto de maior produtor e exportador de café no mundo Dentre as 124 espécies do gênero, Coffea arabica, Coffea canefora e Coffea eugenioides são as de maior destaque e as duas primeiras representam a maior parte da produção de café Com exceção do C arabica, todas as demais espécies do gênero são diplóides C arabica é um alotetraplóide, formado a partir de uma hibridação natural entre C canephora e C eugenioides O parental C eugenioides ainda foi pouco estudado, porém muitas características genéticas dos cafés Árabicas comerciais foram herdadas desta espécie Desta forma, é justifica-se aumentar o conhecimento sobre os genes funcionalmente ativos no transcriptoma de C eugenioides A tecnologia de sequenciamento de RNAs (RNA-Seq) tem sido muito utilizada em trabalhos de identificação e anotação funcional de genes para diversas espécies de plantas, assim como para verificar os níveis de atividade transcricional e identificação de genes diferencialmente expressos em determinadas condições e/ou tecidos específicos O presente projeto teve como objetivo realizar a montagem, anotação funcional dos transcritos de folhas e frutos de C eugenioides utilizando o seu genoma como referência para o alinhamento das sequências, e comparar os resultados obtidos com os disponíveis até o presente momento em bancos de dados públicos Foram utilizadas duas bibliotecas de RNA-Seq (folhas e frutos) de C eugenioides sequenciadas via plataforma Illumina Hiseq2 Primeiramente foi realizado o alinhamento das bibliotecas contra o genoma de referência utilizando o software HISAT2 Para montagem dos reads alinhado em transcritos foi utilizado o software StringTie e na sequência o software Kallisto para a quantificação dos transcritos O software DESeq2 foi utilizado para identificação de genes diferencialmente expressos em frutos e folhas Para anotação utilizamos o BlastX contra o banco de dados de sequências não redundantes (NCBI-nr) Foi realizada uma análise comparativa com a ferramenta BlastN contra o banco de dados de sequências expressas (EST) de C arabica e C canephora pré-existentes O resultado da montagem de transcritos identificou 16743 contigs únicos para C eugenioides, estas sequências apresentaram similaridade de 82,6% com ESTs de C arabica, 91,38% em CDS de C canephora, 94,87% com o RNA-Seq de C arabica e 98,7% com o RNA-Seq de C eugenioides Em relação ao trabalho original, foram identificados 322 novos transcritos, das quais 36 não foram descritos nas bases de dados da Coffea spp Além disso, foram identificados 923 genes diferencialmente expressos em folhas e frutos, sendo 414 mais expressos em folhas e 59 mais expressos em frutos Seis genes diferencialmente expressos em frutos tiveram sua atividade confirmada por RT-qPCR Três deles tiveram expressão exclusiva em frutos, apresentando potencial biotecnológico para a produção de compostos específicos ou para identificação e análise de promotores
publishDate 2024
dc.date.defesa.pt_BR.fl_str_mv 22.02.2019
dc.date.created.fl_str_mv 2019.00
dc.date.accessioned.fl_str_mv 2024-05-01T12:14:01Z
dc.date.available.fl_str_mv 2024-05-01T12:14:01Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.uel.br/handle/123456789/10075
url https://repositorio.uel.br/handle/123456789/10075
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.coursedegree.pt_BR.fl_str_mv Mestrado
dc.relation.coursename.pt_BR.fl_str_mv Genética e Biologia Molecular
dc.relation.departament.pt_BR.fl_str_mv Centro de Ciências Biológicas
dc.relation.ppgname.pt_BR.fl_str_mv Programa de Pós-graduação em Genética e Biologia Molecular
dc.relation.institutionname.pt_BR.fl_str_mv Centro Nacional de Pesquisa de Soja (Brasil)
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.coverage.spatial.pt_BR.fl_str_mv Londrina
dc.source.none.fl_str_mv reponame:Repositório Institucional da UEL
instname:Universidade Estadual de Londrina (UEL)
instacron:UEL
instname_str Universidade Estadual de Londrina (UEL)
instacron_str UEL
institution UEL
reponame_str Repositório Institucional da UEL
collection Repositório Institucional da UEL
bitstream.url.fl_str_mv https://repositorio.uel.br/bitstreams/f38ec741-9cc5-44dc-91c7-8c315893c345/download
https://repositorio.uel.br/bitstreams/f815020d-bf98-44b3-bc04-9a50379bac65/download
https://repositorio.uel.br/bitstreams/2e61969d-06fb-4c35-9891-c8d72c992cec/download
https://repositorio.uel.br/bitstreams/30c2070f-6541-472b-93b7-23c878778345/download
bitstream.checksum.fl_str_mv fd568b3bd318beb8cd6a5708d0f8b1d9
753f376dfdbc064b559839be95ac5523
e6c51da7e0aa9005d1abaa53da8abd64
9fed0986a6f17631e5a3dbb5432b35b3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)
repository.mail.fl_str_mv bcuel@uel.br||
_version_ 1862739677181640704