Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/11/11137/tde-30112020-201429/ |
Resumo: | A soja é uma importante commodity no Brasil, em 2019, a soja e seus derivados responderam por US$ 32,63 bilhões em exportações. No entanto, existem alguns obstáculos à obtenção de maior produtividade, como ataque de insetos, principalmente pelo complexo de percevejos, representados principalmente por Euschistus heros, Nezara viridula e Piezodorus guildinii, que diminuem o rendimento da cultura e podem transmitir fitopatógenos. Uma alternativa ao uso de inseticidas é o desenvolvimento de cultivares resistentes. Para um melhor entendimento da arquitetura genética envolvida na resistência da soja ao complexo do percevejo, foram sequenciados os genomas da cultivar de soja IAC-100 (resistente) e da cultivar CD-215 (suscetível), foram usados os dados de genotipagem por sequenciamento de uma população de 236 de linhagens endogâmicas recombinantes oriundas do cruzamento entre as cultivares estudadas, visando encontrar variantes comuns as mais resistentes e presentes apenas na cultivar IAC-100. Para a montagem dos genomas, utilizamos a tecnologia Chromium Genome (10x Genomics, San Francisco, EUA). A montagem do genoma foi realizada com os softwares Supernova 2.1.1, Ragoo 1.1 e REAPR 1.0.17, gerando montagens com aproximadamente 1 GB e scaffold N50 próximos de 54 MB, para ambas as cultivares nossos genomas apresentam de alta sintênia com os cromossomos da Williams 82 com número de genes e elementos repetitivos muito próximos (aproximadamente 58 mil genes e 44% de elementos repetitivos). A partir dos dados do sequenciamento do genoma, o pipeline do GATK foi usado para a descoberta de variantes e usando dados de genotyping-by-sequencing (GBS), de 236 indivíduos de uma população de linhagens endogâmicas recombinantes, oriundas do cruzamento entre a IAC-100 e CD-215, o pipeline do GATK foi usado para a chamada de SNPs. Foram selecionadas, a partir de dados históricos, as 25 linhagens mais resistentes ao complexo de percevejos, e polimorfismos compartilhados entre as mesmas e IAC-100 foram identificados. Foram identificados um total de 290.189 mil SNPs únicos na IAC-100 quando comparados com CD-215, além de 335.229 mil Indels únicos. A partir dos dados de GBS foram identificados 852 SNPs, compartilhados entre as 25 linhagens mais resistente da população e IAC-100, com esses SNPs muito próximos da posição de QTLs relatados para a resistência. Variantes estruturais foram visualizadas com o software IGV na região de QTLs relatados para a resistência, onde grandes variantes únicas na IAC-100, foram encontradas próximas de genes considerados candidatos a resistência, envolvidos com a biossíntese de fenilpropanóides/lignina, terpenos, número de vagens e desenvolvimento de sementes. Além de disponibilizar dois genomas de soja brasileiros com os melhores scaffolds N50 até hoje relatados, esses resultados abrem as portas para vários outros estudos e aplicações no melhoramento, como mapeamento fino, seleção assistida, expressão de genes candidatos e modificações genéticas nos mesmos usando CRISPR ou outros métodos. |
| id |
USP_c2fe8786f71499057ef3a7be08f01214 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-30112020-201429 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejosDe novo assembly of contrasting soybean genomes for the study of resistance to the stink bug complex10x Chromium10x ChromiumGenomaGenomeGenotipagem por sequenciamentoGenotyping by sequencingPercevejosSojaSoybeanStink bugsVariantesVariantsA soja é uma importante commodity no Brasil, em 2019, a soja e seus derivados responderam por US$ 32,63 bilhões em exportações. No entanto, existem alguns obstáculos à obtenção de maior produtividade, como ataque de insetos, principalmente pelo complexo de percevejos, representados principalmente por Euschistus heros, Nezara viridula e Piezodorus guildinii, que diminuem o rendimento da cultura e podem transmitir fitopatógenos. Uma alternativa ao uso de inseticidas é o desenvolvimento de cultivares resistentes. Para um melhor entendimento da arquitetura genética envolvida na resistência da soja ao complexo do percevejo, foram sequenciados os genomas da cultivar de soja IAC-100 (resistente) e da cultivar CD-215 (suscetível), foram usados os dados de genotipagem por sequenciamento de uma população de 236 de linhagens endogâmicas recombinantes oriundas do cruzamento entre as cultivares estudadas, visando encontrar variantes comuns as mais resistentes e presentes apenas na cultivar IAC-100. Para a montagem dos genomas, utilizamos a tecnologia Chromium Genome (10x Genomics, San Francisco, EUA). A montagem do genoma foi realizada com os softwares Supernova 2.1.1, Ragoo 1.1 e REAPR 1.0.17, gerando montagens com aproximadamente 1 GB e scaffold N50 próximos de 54 MB, para ambas as cultivares nossos genomas apresentam de alta sintênia com os cromossomos da Williams 82 com número de genes e elementos repetitivos muito próximos (aproximadamente 58 mil genes e 44% de elementos repetitivos). A partir dos dados do sequenciamento do genoma, o pipeline do GATK foi usado para a descoberta de variantes e usando dados de genotyping-by-sequencing (GBS), de 236 indivíduos de uma população de linhagens endogâmicas recombinantes, oriundas do cruzamento entre a IAC-100 e CD-215, o pipeline do GATK foi usado para a chamada de SNPs. Foram selecionadas, a partir de dados históricos, as 25 linhagens mais resistentes ao complexo de percevejos, e polimorfismos compartilhados entre as mesmas e IAC-100 foram identificados. Foram identificados um total de 290.189 mil SNPs únicos na IAC-100 quando comparados com CD-215, além de 335.229 mil Indels únicos. A partir dos dados de GBS foram identificados 852 SNPs, compartilhados entre as 25 linhagens mais resistente da população e IAC-100, com esses SNPs muito próximos da posição de QTLs relatados para a resistência. Variantes estruturais foram visualizadas com o software IGV na região de QTLs relatados para a resistência, onde grandes variantes únicas na IAC-100, foram encontradas próximas de genes considerados candidatos a resistência, envolvidos com a biossíntese de fenilpropanóides/lignina, terpenos, número de vagens e desenvolvimento de sementes. Além de disponibilizar dois genomas de soja brasileiros com os melhores scaffolds N50 até hoje relatados, esses resultados abrem as portas para vários outros estudos e aplicações no melhoramento, como mapeamento fino, seleção assistida, expressão de genes candidatos e modificações genéticas nos mesmos usando CRISPR ou outros métodos.Soybean is an important commodity in Brazil in 2019, the soybean and its derivatives accounted for $ 32,63billion in exports. However, there are some obstacles to achieving greater productivity as insect attacks, particularly by stink bug complex that reduce crop yield and can transmit pathogens. An alternative to the use of insecticides is the development of resistant cultivars. For a better understanding of the genetic architecture involved in soybean resistance to the bed bug complex, the genomes of soybean cultivar IAC-100 (resistant) and cultivar CD-215 (susceptible) were sequenced. Genotyping data by sequencing a population of 236 recombinant inbred lines from the crossing of the two cultivars studied were also used, to find common variants, the most resistant and present only in the cultivar IAC-100. The genome assemblies, we use the Chromium Genome technology (10x Genomics, San Francisco, USA). The genome assemblies was performed with the software Supernova 2.1.1, 1.0.17 Ragoo 1.1, and REAPR generating assemblies with about 1 GB and N50 scaffold next 54 MB for both genomes cultivars. Our genomes have high synteny with the Williams82 chromosomes with several genes and repetitive elements very close (approximately 58 thousand genes and 44% repetitive elements). From the genome sequencing data, the GATK pipeline was used to discover variants and using data from genotyping-by-sequencing (GBS), of 236 individuals from a population of recombinant inbred lines, originated from the crossing between the IAC -100 and CD-215, the GATK pipeline was used for calling SNPs. The 25 most resistant genotypes to the bed bug complex were selected from historical data, and polymorphisms shared between them and IAC-100 were identified. A total of 290.189 thousand unique SNPs were identified in the IAC-100 when compared to CD-215, in addition to 335.229 thousand unique Indels. From the GBS data, 852 SNPs were identified, shared among the 25 most resistant genotypes in the population and IAC-100, with these SNPs very close to the position of QTLs reported for resistance. Structural variants were visualized with the IGV software in the region of QTLs reported for resistance, where large unique variants in IAC-100, were found close to genes considered candidates for resistance, involved with the biosynthesis of phenylpropanoids / lignin, terpenes, number of pods and seed development. In addition to providing two Brazilian soybean genomes with the best N50 scaffolds reported to date, these results open the door to several other studies and applications in breeding, such as fine mapping, assisted selection, expression of candidate genes and genetic modifications in them using CRISPR or other methods.Biblioteca Digitais de Teses e Dissertações da USPPinheiro, Jose BaldinGodoy Filho, Marcos Antonio de2020-09-04info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/11/11137/tde-30112020-201429/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-12-01T19:43:02Zoai:teses.usp.br:tde-30112020-201429Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-12-01T19:43:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos De novo assembly of contrasting soybean genomes for the study of resistance to the stink bug complex |
| title |
Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos |
| spellingShingle |
Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos Godoy Filho, Marcos Antonio de 10x Chromium 10x Chromium Genoma Genome Genotipagem por sequenciamento Genotyping by sequencing Percevejos Soja Soybean Stink bugs Variantes Variants |
| title_short |
Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos |
| title_full |
Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos |
| title_fullStr |
Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos |
| title_full_unstemmed |
Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos |
| title_sort |
Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos |
| author |
Godoy Filho, Marcos Antonio de |
| author_facet |
Godoy Filho, Marcos Antonio de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Pinheiro, Jose Baldin |
| dc.contributor.author.fl_str_mv |
Godoy Filho, Marcos Antonio de |
| dc.subject.por.fl_str_mv |
10x Chromium 10x Chromium Genoma Genome Genotipagem por sequenciamento Genotyping by sequencing Percevejos Soja Soybean Stink bugs Variantes Variants |
| topic |
10x Chromium 10x Chromium Genoma Genome Genotipagem por sequenciamento Genotyping by sequencing Percevejos Soja Soybean Stink bugs Variantes Variants |
| description |
A soja é uma importante commodity no Brasil, em 2019, a soja e seus derivados responderam por US$ 32,63 bilhões em exportações. No entanto, existem alguns obstáculos à obtenção de maior produtividade, como ataque de insetos, principalmente pelo complexo de percevejos, representados principalmente por Euschistus heros, Nezara viridula e Piezodorus guildinii, que diminuem o rendimento da cultura e podem transmitir fitopatógenos. Uma alternativa ao uso de inseticidas é o desenvolvimento de cultivares resistentes. Para um melhor entendimento da arquitetura genética envolvida na resistência da soja ao complexo do percevejo, foram sequenciados os genomas da cultivar de soja IAC-100 (resistente) e da cultivar CD-215 (suscetível), foram usados os dados de genotipagem por sequenciamento de uma população de 236 de linhagens endogâmicas recombinantes oriundas do cruzamento entre as cultivares estudadas, visando encontrar variantes comuns as mais resistentes e presentes apenas na cultivar IAC-100. Para a montagem dos genomas, utilizamos a tecnologia Chromium Genome (10x Genomics, San Francisco, EUA). A montagem do genoma foi realizada com os softwares Supernova 2.1.1, Ragoo 1.1 e REAPR 1.0.17, gerando montagens com aproximadamente 1 GB e scaffold N50 próximos de 54 MB, para ambas as cultivares nossos genomas apresentam de alta sintênia com os cromossomos da Williams 82 com número de genes e elementos repetitivos muito próximos (aproximadamente 58 mil genes e 44% de elementos repetitivos). A partir dos dados do sequenciamento do genoma, o pipeline do GATK foi usado para a descoberta de variantes e usando dados de genotyping-by-sequencing (GBS), de 236 indivíduos de uma população de linhagens endogâmicas recombinantes, oriundas do cruzamento entre a IAC-100 e CD-215, o pipeline do GATK foi usado para a chamada de SNPs. Foram selecionadas, a partir de dados históricos, as 25 linhagens mais resistentes ao complexo de percevejos, e polimorfismos compartilhados entre as mesmas e IAC-100 foram identificados. Foram identificados um total de 290.189 mil SNPs únicos na IAC-100 quando comparados com CD-215, além de 335.229 mil Indels únicos. A partir dos dados de GBS foram identificados 852 SNPs, compartilhados entre as 25 linhagens mais resistente da população e IAC-100, com esses SNPs muito próximos da posição de QTLs relatados para a resistência. Variantes estruturais foram visualizadas com o software IGV na região de QTLs relatados para a resistência, onde grandes variantes únicas na IAC-100, foram encontradas próximas de genes considerados candidatos a resistência, envolvidos com a biossíntese de fenilpropanóides/lignina, terpenos, número de vagens e desenvolvimento de sementes. Além de disponibilizar dois genomas de soja brasileiros com os melhores scaffolds N50 até hoje relatados, esses resultados abrem as portas para vários outros estudos e aplicações no melhoramento, como mapeamento fino, seleção assistida, expressão de genes candidatos e modificações genéticas nos mesmos usando CRISPR ou outros métodos. |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020-09-04 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/11/11137/tde-30112020-201429/ |
| url |
https://www.teses.usp.br/teses/disponiveis/11/11137/tde-30112020-201429/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865491772197568512 |