Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Conceição, Helena Beatriz da
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/95/95131/tde-17012024-115249/
Resumo: Retrocópias (também nomeadas de pseudogenes processados) são cópias de genes codificadores originadas por meio do mecanismo de duplicação mediado por RNA e são caracterizadas pela conservação apenas dos exons de seus genes parentais, a ausência de íntrons, frequente presença de cauda poliA integrada ao genoma e ausência de regiões promotoras parentais. Essas características são utilizadas para identificar retrocópias desde a década de 1980, quando muitos genes retroduplicados humanos foram reportados pela primeira vez. No entanto, a busca sistemática por retrocópias tornou-se possível apenas após o sequenciamento e montagem completos do Genoma Humano, que possibilitou o desenvolvimento de tecnologias de sequenciamento mais avançadas, melhorias na anotação do transcriptoma e o surgimento de novas ferramentas computacionais. No início dos anos 2000, as primeiras análises abrangentes para identificar retrocópias no genoma humano e em outras espécies foram realizadas, seguidas por estudos adicionais que se estendem até hoje. No entanto, a literatura sobre identificação e análise funcional de retrocópias ainda carece de análises aprofundadas e abordagens mais abrangentes. Nesta tese apresentamos uma investigação sistemática e abrangente para a identificação de retrocópias em 44 espécies, de humanos a invertebrados. Primeiro, construímos uma pipeline para identificar, caracterizar, organizar e disponibilizar via web informações sobre as 219.948 retrocópias desses 44 organismos. Todas as informações sobre posição genômica, genes parentais, tamanho das retrocópias, expressão, conservação entre espécies, entre outras, foram organizadas em um banco de dados público, a RCPedia2.0. Em um estudo complementar, investigamos o impacto e potencial funcional das retrocópias transcritas no genoma humano. Para isso, realizamos análises complexas que combinaram dados de sequenciamento de RNA de múltiplos tecidos, dados epigenéticos, e de Ribosome Sequencing para, primeiro, elucidar a expressão de retrocópias e como elas podem ser reguladas e depois avaliar suas funcionalidades. Descobrimos que aproximadamente 50% (cerca de 4.000) das retrocópias presentes no genoma humano são expressas e apresentam seus níveis de expressão regulados em tecidos saudáveis. Cerca de 25% dessas retrocópias são expressas em apenas um tecido (principalmente nos testículos), enquanto que aproximadamente 15% delas são expressas em todos os tecidos humanos investigados. Nossos dados indicam que a força motriz para a expressão dessas retrocópias é a sua localização genômica próxima a genes codificadores de proteína ou a idade (mais antiga) de origem dessas retrocópias. Confirmamos ainda que um subconjunto de retrocópias é traduzido, enfatizando seu potencial funcional. Portanto, nesta tese, destacamos um segmento frequentemente ignorado no transcriptoma humano e de outras espécies: as retrocópias (ou pseudogenes processados). Não apenas revelamos o considerável potencial funcional delas e sua capacidade de gerar inovações genéticas por meio do mecanismo de retrotransposição de genes codificadores, mas também estabelecemos as bases para uma exploração abrangente e específica de cada uma dessas numerosas retrocópias.
id USP_7c3ecd6f8fa2bec9fcf1c9a5072daa50
oai_identifier_str oai:teses.usp.br:tde-17012024-115249
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanosOrigins andfunctional potential of retrocopies in the genome of humans and other animals: a large-scale approach to identify retrocopies in diverse animal genomes and study their expression pattern in normal human tissues.AnimalsBioinformáticaBioinformaticsEvoluçãoEvolutionExpressionFuncionalidadeFunctionalityHumansIdentificaçãoIdentificationRetrocópiasRetrocopiesRetrocópias (também nomeadas de pseudogenes processados) são cópias de genes codificadores originadas por meio do mecanismo de duplicação mediado por RNA e são caracterizadas pela conservação apenas dos exons de seus genes parentais, a ausência de íntrons, frequente presença de cauda poliA integrada ao genoma e ausência de regiões promotoras parentais. Essas características são utilizadas para identificar retrocópias desde a década de 1980, quando muitos genes retroduplicados humanos foram reportados pela primeira vez. No entanto, a busca sistemática por retrocópias tornou-se possível apenas após o sequenciamento e montagem completos do Genoma Humano, que possibilitou o desenvolvimento de tecnologias de sequenciamento mais avançadas, melhorias na anotação do transcriptoma e o surgimento de novas ferramentas computacionais. No início dos anos 2000, as primeiras análises abrangentes para identificar retrocópias no genoma humano e em outras espécies foram realizadas, seguidas por estudos adicionais que se estendem até hoje. No entanto, a literatura sobre identificação e análise funcional de retrocópias ainda carece de análises aprofundadas e abordagens mais abrangentes. Nesta tese apresentamos uma investigação sistemática e abrangente para a identificação de retrocópias em 44 espécies, de humanos a invertebrados. Primeiro, construímos uma pipeline para identificar, caracterizar, organizar e disponibilizar via web informações sobre as 219.948 retrocópias desses 44 organismos. Todas as informações sobre posição genômica, genes parentais, tamanho das retrocópias, expressão, conservação entre espécies, entre outras, foram organizadas em um banco de dados público, a RCPedia2.0. Em um estudo complementar, investigamos o impacto e potencial funcional das retrocópias transcritas no genoma humano. Para isso, realizamos análises complexas que combinaram dados de sequenciamento de RNA de múltiplos tecidos, dados epigenéticos, e de Ribosome Sequencing para, primeiro, elucidar a expressão de retrocópias e como elas podem ser reguladas e depois avaliar suas funcionalidades. Descobrimos que aproximadamente 50% (cerca de 4.000) das retrocópias presentes no genoma humano são expressas e apresentam seus níveis de expressão regulados em tecidos saudáveis. Cerca de 25% dessas retrocópias são expressas em apenas um tecido (principalmente nos testículos), enquanto que aproximadamente 15% delas são expressas em todos os tecidos humanos investigados. Nossos dados indicam que a força motriz para a expressão dessas retrocópias é a sua localização genômica próxima a genes codificadores de proteína ou a idade (mais antiga) de origem dessas retrocópias. Confirmamos ainda que um subconjunto de retrocópias é traduzido, enfatizando seu potencial funcional. Portanto, nesta tese, destacamos um segmento frequentemente ignorado no transcriptoma humano e de outras espécies: as retrocópias (ou pseudogenes processados). Não apenas revelamos o considerável potencial funcional delas e sua capacidade de gerar inovações genéticas por meio do mecanismo de retrotransposição de genes codificadores, mas também estabelecemos as bases para uma exploração abrangente e específica de cada uma dessas numerosas retrocópias.Processed pseudogenes, also known as retrocopies, are copies of coding genes originating through the RNA-mediated duplication mechanism. They are characterized by the conservation of only the exons of their parental genes, the absence of introns, frequent presence of integrated poly-A tails into the genome, and the absence of parental promoter regions. These characteristics have been used to identify retrocopies since the 1980s when many human retroduplicated genes were first reported. However, the systematic search for retrocopies became possible only after the complete sequencing and assembly of the Human Genome, enabling the development of more advanced sequencing technologies, improvements in transcriptome annotation, and the emergence of new computational tools. In the early 2000s, the first comprehensive analyses to identify retrocopies in the human genome and other species were conducted, followed by additional studies that continue to this day. However, the literature on the identification and functional analysis of retrocopies still lacks in-depth analyses and more comprehensive approaches. In this thesis, we present a systematic and comprehensive investigation for the identification of retrocopies in 44 species, ranging from humans to invertebrates. First, we constructed a pipeline to identify, characterize, organize, and make information about the 219,948 retrocopies of these 44 organisms available via the web. All information, including genomic position, parental genes, retrocopy size, expression, conservation between species, among others, was organized in a public database, RCPedia 2.0. In a complementary study, we investigated the impact and functional potential of transcribed retrocopies in the human genome. For this, we conducted complex analyses combining RNA sequencing data from multiple tissues, epigenetic data, and Ribosome Sequencing to first elucidate retrocopy expression and how they may be regulated, and then evaluate their functionalities. We found that approximately 50% (around 4,000) of retrocopies in the human genome are expressed and have their expression levels regulated in healthy tissues. About 25% of these retrocopies are expressed in only one tissue (mainly in the testes), while approximately 15% of them are expressed in all investigated human tissues. Our data indicate that the driving force for the expression of these retrocopies is their genomic proximity to protein-coding genes or the (older) age of origin of these retrocopies. We further confirmed that a subset of retrocopies is translated, emphasizing their functional potential. Therefore, in this thesis, we highlight a frequently overlooked segment in the human and other species\' transcriptome: retrocopies (or processed pseudogenes). We not only reveal their considerable functional potential and their ability to generate genetic innovations through the mechanism of retrotransposition of coding genes but also lay the groundwork for a comprehensive and specific exploration of each of these numerous retrocopies.Biblioteca Digitais de Teses e Dissertações da USPGalante, Pedro Alexandre FavorettoConceição, Helena Beatriz da2023-12-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/95/95131/tde-17012024-115249/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-01-18T20:43:02Zoai:teses.usp.br:tde-17012024-115249Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-01-18T20:43:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos
Origins andfunctional potential of retrocopies in the genome of humans and other animals: a large-scale approach to identify retrocopies in diverse animal genomes and study their expression pattern in normal human tissues.
title Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos
spellingShingle Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos
Conceição, Helena Beatriz da
Animals
Bioinformática
Bioinformatics
Evolução
Evolution
Expression
Funcionalidade
Functionality
Humans
Identificação
Identification
Retrocópias
Retrocopies
title_short Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos
title_full Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos
title_fullStr Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos
title_full_unstemmed Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos
title_sort Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos
author Conceição, Helena Beatriz da
author_facet Conceição, Helena Beatriz da
author_role author
dc.contributor.none.fl_str_mv Galante, Pedro Alexandre Favoretto
dc.contributor.author.fl_str_mv Conceição, Helena Beatriz da
dc.subject.por.fl_str_mv Animals
Bioinformática
Bioinformatics
Evolução
Evolution
Expression
Funcionalidade
Functionality
Humans
Identificação
Identification
Retrocópias
Retrocopies
topic Animals
Bioinformática
Bioinformatics
Evolução
Evolution
Expression
Funcionalidade
Functionality
Humans
Identificação
Identification
Retrocópias
Retrocopies
description Retrocópias (também nomeadas de pseudogenes processados) são cópias de genes codificadores originadas por meio do mecanismo de duplicação mediado por RNA e são caracterizadas pela conservação apenas dos exons de seus genes parentais, a ausência de íntrons, frequente presença de cauda poliA integrada ao genoma e ausência de regiões promotoras parentais. Essas características são utilizadas para identificar retrocópias desde a década de 1980, quando muitos genes retroduplicados humanos foram reportados pela primeira vez. No entanto, a busca sistemática por retrocópias tornou-se possível apenas após o sequenciamento e montagem completos do Genoma Humano, que possibilitou o desenvolvimento de tecnologias de sequenciamento mais avançadas, melhorias na anotação do transcriptoma e o surgimento de novas ferramentas computacionais. No início dos anos 2000, as primeiras análises abrangentes para identificar retrocópias no genoma humano e em outras espécies foram realizadas, seguidas por estudos adicionais que se estendem até hoje. No entanto, a literatura sobre identificação e análise funcional de retrocópias ainda carece de análises aprofundadas e abordagens mais abrangentes. Nesta tese apresentamos uma investigação sistemática e abrangente para a identificação de retrocópias em 44 espécies, de humanos a invertebrados. Primeiro, construímos uma pipeline para identificar, caracterizar, organizar e disponibilizar via web informações sobre as 219.948 retrocópias desses 44 organismos. Todas as informações sobre posição genômica, genes parentais, tamanho das retrocópias, expressão, conservação entre espécies, entre outras, foram organizadas em um banco de dados público, a RCPedia2.0. Em um estudo complementar, investigamos o impacto e potencial funcional das retrocópias transcritas no genoma humano. Para isso, realizamos análises complexas que combinaram dados de sequenciamento de RNA de múltiplos tecidos, dados epigenéticos, e de Ribosome Sequencing para, primeiro, elucidar a expressão de retrocópias e como elas podem ser reguladas e depois avaliar suas funcionalidades. Descobrimos que aproximadamente 50% (cerca de 4.000) das retrocópias presentes no genoma humano são expressas e apresentam seus níveis de expressão regulados em tecidos saudáveis. Cerca de 25% dessas retrocópias são expressas em apenas um tecido (principalmente nos testículos), enquanto que aproximadamente 15% delas são expressas em todos os tecidos humanos investigados. Nossos dados indicam que a força motriz para a expressão dessas retrocópias é a sua localização genômica próxima a genes codificadores de proteína ou a idade (mais antiga) de origem dessas retrocópias. Confirmamos ainda que um subconjunto de retrocópias é traduzido, enfatizando seu potencial funcional. Portanto, nesta tese, destacamos um segmento frequentemente ignorado no transcriptoma humano e de outras espécies: as retrocópias (ou pseudogenes processados). Não apenas revelamos o considerável potencial funcional delas e sua capacidade de gerar inovações genéticas por meio do mecanismo de retrotransposição de genes codificadores, mas também estabelecemos as bases para uma exploração abrangente e específica de cada uma dessas numerosas retrocópias.
publishDate 2023
dc.date.none.fl_str_mv 2023-12-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/95/95131/tde-17012024-115249/
url https://www.teses.usp.br/teses/disponiveis/95/95131/tde-17012024-115249/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815258233440305152