Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/95/95131/tde-17012024-115249/ |
Resumo: | Retrocópias (também nomeadas de pseudogenes processados) são cópias de genes codificadores originadas por meio do mecanismo de duplicação mediado por RNA e são caracterizadas pela conservação apenas dos exons de seus genes parentais, a ausência de íntrons, frequente presença de cauda poliA integrada ao genoma e ausência de regiões promotoras parentais. Essas características são utilizadas para identificar retrocópias desde a década de 1980, quando muitos genes retroduplicados humanos foram reportados pela primeira vez. No entanto, a busca sistemática por retrocópias tornou-se possível apenas após o sequenciamento e montagem completos do Genoma Humano, que possibilitou o desenvolvimento de tecnologias de sequenciamento mais avançadas, melhorias na anotação do transcriptoma e o surgimento de novas ferramentas computacionais. No início dos anos 2000, as primeiras análises abrangentes para identificar retrocópias no genoma humano e em outras espécies foram realizadas, seguidas por estudos adicionais que se estendem até hoje. No entanto, a literatura sobre identificação e análise funcional de retrocópias ainda carece de análises aprofundadas e abordagens mais abrangentes. Nesta tese apresentamos uma investigação sistemática e abrangente para a identificação de retrocópias em 44 espécies, de humanos a invertebrados. Primeiro, construímos uma pipeline para identificar, caracterizar, organizar e disponibilizar via web informações sobre as 219.948 retrocópias desses 44 organismos. Todas as informações sobre posição genômica, genes parentais, tamanho das retrocópias, expressão, conservação entre espécies, entre outras, foram organizadas em um banco de dados público, a RCPedia2.0. Em um estudo complementar, investigamos o impacto e potencial funcional das retrocópias transcritas no genoma humano. Para isso, realizamos análises complexas que combinaram dados de sequenciamento de RNA de múltiplos tecidos, dados epigenéticos, e de Ribosome Sequencing para, primeiro, elucidar a expressão de retrocópias e como elas podem ser reguladas e depois avaliar suas funcionalidades. Descobrimos que aproximadamente 50% (cerca de 4.000) das retrocópias presentes no genoma humano são expressas e apresentam seus níveis de expressão regulados em tecidos saudáveis. Cerca de 25% dessas retrocópias são expressas em apenas um tecido (principalmente nos testículos), enquanto que aproximadamente 15% delas são expressas em todos os tecidos humanos investigados. Nossos dados indicam que a força motriz para a expressão dessas retrocópias é a sua localização genômica próxima a genes codificadores de proteína ou a idade (mais antiga) de origem dessas retrocópias. Confirmamos ainda que um subconjunto de retrocópias é traduzido, enfatizando seu potencial funcional. Portanto, nesta tese, destacamos um segmento frequentemente ignorado no transcriptoma humano e de outras espécies: as retrocópias (ou pseudogenes processados). Não apenas revelamos o considerável potencial funcional delas e sua capacidade de gerar inovações genéticas por meio do mecanismo de retrotransposição de genes codificadores, mas também estabelecemos as bases para uma exploração abrangente e específica de cada uma dessas numerosas retrocópias. |
| id |
USP_7c3ecd6f8fa2bec9fcf1c9a5072daa50 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-17012024-115249 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanosOrigins andfunctional potential of retrocopies in the genome of humans and other animals: a large-scale approach to identify retrocopies in diverse animal genomes and study their expression pattern in normal human tissues.AnimalsBioinformáticaBioinformaticsEvoluçãoEvolutionExpressionFuncionalidadeFunctionalityHumansIdentificaçãoIdentificationRetrocópiasRetrocopiesRetrocópias (também nomeadas de pseudogenes processados) são cópias de genes codificadores originadas por meio do mecanismo de duplicação mediado por RNA e são caracterizadas pela conservação apenas dos exons de seus genes parentais, a ausência de íntrons, frequente presença de cauda poliA integrada ao genoma e ausência de regiões promotoras parentais. Essas características são utilizadas para identificar retrocópias desde a década de 1980, quando muitos genes retroduplicados humanos foram reportados pela primeira vez. No entanto, a busca sistemática por retrocópias tornou-se possível apenas após o sequenciamento e montagem completos do Genoma Humano, que possibilitou o desenvolvimento de tecnologias de sequenciamento mais avançadas, melhorias na anotação do transcriptoma e o surgimento de novas ferramentas computacionais. No início dos anos 2000, as primeiras análises abrangentes para identificar retrocópias no genoma humano e em outras espécies foram realizadas, seguidas por estudos adicionais que se estendem até hoje. No entanto, a literatura sobre identificação e análise funcional de retrocópias ainda carece de análises aprofundadas e abordagens mais abrangentes. Nesta tese apresentamos uma investigação sistemática e abrangente para a identificação de retrocópias em 44 espécies, de humanos a invertebrados. Primeiro, construímos uma pipeline para identificar, caracterizar, organizar e disponibilizar via web informações sobre as 219.948 retrocópias desses 44 organismos. Todas as informações sobre posição genômica, genes parentais, tamanho das retrocópias, expressão, conservação entre espécies, entre outras, foram organizadas em um banco de dados público, a RCPedia2.0. Em um estudo complementar, investigamos o impacto e potencial funcional das retrocópias transcritas no genoma humano. Para isso, realizamos análises complexas que combinaram dados de sequenciamento de RNA de múltiplos tecidos, dados epigenéticos, e de Ribosome Sequencing para, primeiro, elucidar a expressão de retrocópias e como elas podem ser reguladas e depois avaliar suas funcionalidades. Descobrimos que aproximadamente 50% (cerca de 4.000) das retrocópias presentes no genoma humano são expressas e apresentam seus níveis de expressão regulados em tecidos saudáveis. Cerca de 25% dessas retrocópias são expressas em apenas um tecido (principalmente nos testículos), enquanto que aproximadamente 15% delas são expressas em todos os tecidos humanos investigados. Nossos dados indicam que a força motriz para a expressão dessas retrocópias é a sua localização genômica próxima a genes codificadores de proteína ou a idade (mais antiga) de origem dessas retrocópias. Confirmamos ainda que um subconjunto de retrocópias é traduzido, enfatizando seu potencial funcional. Portanto, nesta tese, destacamos um segmento frequentemente ignorado no transcriptoma humano e de outras espécies: as retrocópias (ou pseudogenes processados). Não apenas revelamos o considerável potencial funcional delas e sua capacidade de gerar inovações genéticas por meio do mecanismo de retrotransposição de genes codificadores, mas também estabelecemos as bases para uma exploração abrangente e específica de cada uma dessas numerosas retrocópias.Processed pseudogenes, also known as retrocopies, are copies of coding genes originating through the RNA-mediated duplication mechanism. They are characterized by the conservation of only the exons of their parental genes, the absence of introns, frequent presence of integrated poly-A tails into the genome, and the absence of parental promoter regions. These characteristics have been used to identify retrocopies since the 1980s when many human retroduplicated genes were first reported. However, the systematic search for retrocopies became possible only after the complete sequencing and assembly of the Human Genome, enabling the development of more advanced sequencing technologies, improvements in transcriptome annotation, and the emergence of new computational tools. In the early 2000s, the first comprehensive analyses to identify retrocopies in the human genome and other species were conducted, followed by additional studies that continue to this day. However, the literature on the identification and functional analysis of retrocopies still lacks in-depth analyses and more comprehensive approaches. In this thesis, we present a systematic and comprehensive investigation for the identification of retrocopies in 44 species, ranging from humans to invertebrates. First, we constructed a pipeline to identify, characterize, organize, and make information about the 219,948 retrocopies of these 44 organisms available via the web. All information, including genomic position, parental genes, retrocopy size, expression, conservation between species, among others, was organized in a public database, RCPedia 2.0. In a complementary study, we investigated the impact and functional potential of transcribed retrocopies in the human genome. For this, we conducted complex analyses combining RNA sequencing data from multiple tissues, epigenetic data, and Ribosome Sequencing to first elucidate retrocopy expression and how they may be regulated, and then evaluate their functionalities. We found that approximately 50% (around 4,000) of retrocopies in the human genome are expressed and have their expression levels regulated in healthy tissues. About 25% of these retrocopies are expressed in only one tissue (mainly in the testes), while approximately 15% of them are expressed in all investigated human tissues. Our data indicate that the driving force for the expression of these retrocopies is their genomic proximity to protein-coding genes or the (older) age of origin of these retrocopies. We further confirmed that a subset of retrocopies is translated, emphasizing their functional potential. Therefore, in this thesis, we highlight a frequently overlooked segment in the human and other species\' transcriptome: retrocopies (or processed pseudogenes). We not only reveal their considerable functional potential and their ability to generate genetic innovations through the mechanism of retrotransposition of coding genes but also lay the groundwork for a comprehensive and specific exploration of each of these numerous retrocopies.Biblioteca Digitais de Teses e Dissertações da USPGalante, Pedro Alexandre FavorettoConceição, Helena Beatriz da2023-12-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/95/95131/tde-17012024-115249/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-01-18T20:43:02Zoai:teses.usp.br:tde-17012024-115249Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-01-18T20:43:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos Origins andfunctional potential of retrocopies in the genome of humans and other animals: a large-scale approach to identify retrocopies in diverse animal genomes and study their expression pattern in normal human tissues. |
| title |
Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos |
| spellingShingle |
Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos Conceição, Helena Beatriz da Animals Bioinformática Bioinformatics Evolução Evolution Expression Funcionalidade Functionality Humans Identificação Identification Retrocópias Retrocopies |
| title_short |
Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos |
| title_full |
Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos |
| title_fullStr |
Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos |
| title_full_unstemmed |
Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos |
| title_sort |
Origens e potencial funcional de retrocópias no genoma de humanos e outros animais: uma abordagem em larga escala de identificação de retrocópias em diversos genomas animais e o estudo do seu padrão de expressão em tecidos normais humanos |
| author |
Conceição, Helena Beatriz da |
| author_facet |
Conceição, Helena Beatriz da |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Galante, Pedro Alexandre Favoretto |
| dc.contributor.author.fl_str_mv |
Conceição, Helena Beatriz da |
| dc.subject.por.fl_str_mv |
Animals Bioinformática Bioinformatics Evolução Evolution Expression Funcionalidade Functionality Humans Identificação Identification Retrocópias Retrocopies |
| topic |
Animals Bioinformática Bioinformatics Evolução Evolution Expression Funcionalidade Functionality Humans Identificação Identification Retrocópias Retrocopies |
| description |
Retrocópias (também nomeadas de pseudogenes processados) são cópias de genes codificadores originadas por meio do mecanismo de duplicação mediado por RNA e são caracterizadas pela conservação apenas dos exons de seus genes parentais, a ausência de íntrons, frequente presença de cauda poliA integrada ao genoma e ausência de regiões promotoras parentais. Essas características são utilizadas para identificar retrocópias desde a década de 1980, quando muitos genes retroduplicados humanos foram reportados pela primeira vez. No entanto, a busca sistemática por retrocópias tornou-se possível apenas após o sequenciamento e montagem completos do Genoma Humano, que possibilitou o desenvolvimento de tecnologias de sequenciamento mais avançadas, melhorias na anotação do transcriptoma e o surgimento de novas ferramentas computacionais. No início dos anos 2000, as primeiras análises abrangentes para identificar retrocópias no genoma humano e em outras espécies foram realizadas, seguidas por estudos adicionais que se estendem até hoje. No entanto, a literatura sobre identificação e análise funcional de retrocópias ainda carece de análises aprofundadas e abordagens mais abrangentes. Nesta tese apresentamos uma investigação sistemática e abrangente para a identificação de retrocópias em 44 espécies, de humanos a invertebrados. Primeiro, construímos uma pipeline para identificar, caracterizar, organizar e disponibilizar via web informações sobre as 219.948 retrocópias desses 44 organismos. Todas as informações sobre posição genômica, genes parentais, tamanho das retrocópias, expressão, conservação entre espécies, entre outras, foram organizadas em um banco de dados público, a RCPedia2.0. Em um estudo complementar, investigamos o impacto e potencial funcional das retrocópias transcritas no genoma humano. Para isso, realizamos análises complexas que combinaram dados de sequenciamento de RNA de múltiplos tecidos, dados epigenéticos, e de Ribosome Sequencing para, primeiro, elucidar a expressão de retrocópias e como elas podem ser reguladas e depois avaliar suas funcionalidades. Descobrimos que aproximadamente 50% (cerca de 4.000) das retrocópias presentes no genoma humano são expressas e apresentam seus níveis de expressão regulados em tecidos saudáveis. Cerca de 25% dessas retrocópias são expressas em apenas um tecido (principalmente nos testículos), enquanto que aproximadamente 15% delas são expressas em todos os tecidos humanos investigados. Nossos dados indicam que a força motriz para a expressão dessas retrocópias é a sua localização genômica próxima a genes codificadores de proteína ou a idade (mais antiga) de origem dessas retrocópias. Confirmamos ainda que um subconjunto de retrocópias é traduzido, enfatizando seu potencial funcional. Portanto, nesta tese, destacamos um segmento frequentemente ignorado no transcriptoma humano e de outras espécies: as retrocópias (ou pseudogenes processados). Não apenas revelamos o considerável potencial funcional delas e sua capacidade de gerar inovações genéticas por meio do mecanismo de retrotransposição de genes codificadores, mas também estabelecemos as bases para uma exploração abrangente e específica de cada uma dessas numerosas retrocópias. |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-12-05 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/95/95131/tde-17012024-115249/ |
| url |
https://www.teses.usp.br/teses/disponiveis/95/95131/tde-17012024-115249/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1815258233440305152 |