Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Godoy Filho, Marcos Antonio de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/11/11137/tde-30112020-201429/
Resumo: A soja é uma importante commodity no Brasil, em 2019, a soja e seus derivados responderam por US$ 32,63 bilhões em exportações. No entanto, existem alguns obstáculos à obtenção de maior produtividade, como ataque de insetos, principalmente pelo complexo de percevejos, representados principalmente por Euschistus heros, Nezara viridula e Piezodorus guildinii, que diminuem o rendimento da cultura e podem transmitir fitopatógenos. Uma alternativa ao uso de inseticidas é o desenvolvimento de cultivares resistentes. Para um melhor entendimento da arquitetura genética envolvida na resistência da soja ao complexo do percevejo, foram sequenciados os genomas da cultivar de soja IAC-100 (resistente) e da cultivar CD-215 (suscetível), foram usados os dados de genotipagem por sequenciamento de uma população de 236 de linhagens endogâmicas recombinantes oriundas do cruzamento entre as cultivares estudadas, visando encontrar variantes comuns as mais resistentes e presentes apenas na cultivar IAC-100. Para a montagem dos genomas, utilizamos a tecnologia Chromium Genome (10x Genomics, San Francisco, EUA). A montagem do genoma foi realizada com os softwares Supernova 2.1.1, Ragoo 1.1 e REAPR 1.0.17, gerando montagens com aproximadamente 1 GB e scaffold N50 próximos de 54 MB, para ambas as cultivares nossos genomas apresentam de alta sintênia com os cromossomos da Williams 82 com número de genes e elementos repetitivos muito próximos (aproximadamente 58 mil genes e 44% de elementos repetitivos). A partir dos dados do sequenciamento do genoma, o pipeline do GATK foi usado para a descoberta de variantes e usando dados de genotyping-by-sequencing (GBS), de 236 indivíduos de uma população de linhagens endogâmicas recombinantes, oriundas do cruzamento entre a IAC-100 e CD-215, o pipeline do GATK foi usado para a chamada de SNPs. Foram selecionadas, a partir de dados históricos, as 25 linhagens mais resistentes ao complexo de percevejos, e polimorfismos compartilhados entre as mesmas e IAC-100 foram identificados. Foram identificados um total de 290.189 mil SNPs únicos na IAC-100 quando comparados com CD-215, além de 335.229 mil Indels únicos. A partir dos dados de GBS foram identificados 852 SNPs, compartilhados entre as 25 linhagens mais resistente da população e IAC-100, com esses SNPs muito próximos da posição de QTLs relatados para a resistência. Variantes estruturais foram visualizadas com o software IGV na região de QTLs relatados para a resistência, onde grandes variantes únicas na IAC-100, foram encontradas próximas de genes considerados candidatos a resistência, envolvidos com a biossíntese de fenilpropanóides/lignina, terpenos, número de vagens e desenvolvimento de sementes. Além de disponibilizar dois genomas de soja brasileiros com os melhores scaffolds N50 até hoje relatados, esses resultados abrem as portas para vários outros estudos e aplicações no melhoramento, como mapeamento fino, seleção assistida, expressão de genes candidatos e modificações genéticas nos mesmos usando CRISPR ou outros métodos.
id USP_c2fe8786f71499057ef3a7be08f01214
oai_identifier_str oai:teses.usp.br:tde-30112020-201429
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejosDe novo assembly of contrasting soybean genomes for the study of resistance to the stink bug complex10x Chromium10x ChromiumGenomaGenomeGenotipagem por sequenciamentoGenotyping by sequencingPercevejosSojaSoybeanStink bugsVariantesVariantsA soja é uma importante commodity no Brasil, em 2019, a soja e seus derivados responderam por US$ 32,63 bilhões em exportações. No entanto, existem alguns obstáculos à obtenção de maior produtividade, como ataque de insetos, principalmente pelo complexo de percevejos, representados principalmente por Euschistus heros, Nezara viridula e Piezodorus guildinii, que diminuem o rendimento da cultura e podem transmitir fitopatógenos. Uma alternativa ao uso de inseticidas é o desenvolvimento de cultivares resistentes. Para um melhor entendimento da arquitetura genética envolvida na resistência da soja ao complexo do percevejo, foram sequenciados os genomas da cultivar de soja IAC-100 (resistente) e da cultivar CD-215 (suscetível), foram usados os dados de genotipagem por sequenciamento de uma população de 236 de linhagens endogâmicas recombinantes oriundas do cruzamento entre as cultivares estudadas, visando encontrar variantes comuns as mais resistentes e presentes apenas na cultivar IAC-100. Para a montagem dos genomas, utilizamos a tecnologia Chromium Genome (10x Genomics, San Francisco, EUA). A montagem do genoma foi realizada com os softwares Supernova 2.1.1, Ragoo 1.1 e REAPR 1.0.17, gerando montagens com aproximadamente 1 GB e scaffold N50 próximos de 54 MB, para ambas as cultivares nossos genomas apresentam de alta sintênia com os cromossomos da Williams 82 com número de genes e elementos repetitivos muito próximos (aproximadamente 58 mil genes e 44% de elementos repetitivos). A partir dos dados do sequenciamento do genoma, o pipeline do GATK foi usado para a descoberta de variantes e usando dados de genotyping-by-sequencing (GBS), de 236 indivíduos de uma população de linhagens endogâmicas recombinantes, oriundas do cruzamento entre a IAC-100 e CD-215, o pipeline do GATK foi usado para a chamada de SNPs. Foram selecionadas, a partir de dados históricos, as 25 linhagens mais resistentes ao complexo de percevejos, e polimorfismos compartilhados entre as mesmas e IAC-100 foram identificados. Foram identificados um total de 290.189 mil SNPs únicos na IAC-100 quando comparados com CD-215, além de 335.229 mil Indels únicos. A partir dos dados de GBS foram identificados 852 SNPs, compartilhados entre as 25 linhagens mais resistente da população e IAC-100, com esses SNPs muito próximos da posição de QTLs relatados para a resistência. Variantes estruturais foram visualizadas com o software IGV na região de QTLs relatados para a resistência, onde grandes variantes únicas na IAC-100, foram encontradas próximas de genes considerados candidatos a resistência, envolvidos com a biossíntese de fenilpropanóides/lignina, terpenos, número de vagens e desenvolvimento de sementes. Além de disponibilizar dois genomas de soja brasileiros com os melhores scaffolds N50 até hoje relatados, esses resultados abrem as portas para vários outros estudos e aplicações no melhoramento, como mapeamento fino, seleção assistida, expressão de genes candidatos e modificações genéticas nos mesmos usando CRISPR ou outros métodos.Soybean is an important commodity in Brazil in 2019, the soybean and its derivatives accounted for $ 32,63billion in exports. However, there are some obstacles to achieving greater productivity as insect attacks, particularly by stink bug complex that reduce crop yield and can transmit pathogens. An alternative to the use of insecticides is the development of resistant cultivars. For a better understanding of the genetic architecture involved in soybean resistance to the bed bug complex, the genomes of soybean cultivar IAC-100 (resistant) and cultivar CD-215 (susceptible) were sequenced. Genotyping data by sequencing a population of 236 recombinant inbred lines from the crossing of the two cultivars studied were also used, to find common variants, the most resistant and present only in the cultivar IAC-100. The genome assemblies, we use the Chromium Genome technology (10x Genomics, San Francisco, USA). The genome assemblies was performed with the software Supernova 2.1.1, 1.0.17 Ragoo 1.1, and REAPR generating assemblies with about 1 GB and N50 scaffold next 54 MB for both genomes cultivars. Our genomes have high synteny with the Williams82 chromosomes with several genes and repetitive elements very close (approximately 58 thousand genes and 44% repetitive elements). From the genome sequencing data, the GATK pipeline was used to discover variants and using data from genotyping-by-sequencing (GBS), of 236 individuals from a population of recombinant inbred lines, originated from the crossing between the IAC -100 and CD-215, the GATK pipeline was used for calling SNPs. The 25 most resistant genotypes to the bed bug complex were selected from historical data, and polymorphisms shared between them and IAC-100 were identified. A total of 290.189 thousand unique SNPs were identified in the IAC-100 when compared to CD-215, in addition to 335.229 thousand unique Indels. From the GBS data, 852 SNPs were identified, shared among the 25 most resistant genotypes in the population and IAC-100, with these SNPs very close to the position of QTLs reported for resistance. Structural variants were visualized with the IGV software in the region of QTLs reported for resistance, where large unique variants in IAC-100, were found close to genes considered candidates for resistance, involved with the biosynthesis of phenylpropanoids / lignin, terpenes, number of pods and seed development. In addition to providing two Brazilian soybean genomes with the best N50 scaffolds reported to date, these results open the door to several other studies and applications in breeding, such as fine mapping, assisted selection, expression of candidate genes and genetic modifications in them using CRISPR or other methods.Biblioteca Digitais de Teses e Dissertações da USPPinheiro, Jose BaldinGodoy Filho, Marcos Antonio de2020-09-04info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/11/11137/tde-30112020-201429/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-12-01T19:43:02Zoai:teses.usp.br:tde-30112020-201429Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-12-01T19:43:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos
De novo assembly of contrasting soybean genomes for the study of resistance to the stink bug complex
title Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos
spellingShingle Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos
Godoy Filho, Marcos Antonio de
10x Chromium
10x Chromium
Genoma
Genome
Genotipagem por sequenciamento
Genotyping by sequencing
Percevejos
Soja
Soybean
Stink bugs
Variantes
Variants
title_short Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos
title_full Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos
title_fullStr Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos
title_full_unstemmed Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos
title_sort Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos
author Godoy Filho, Marcos Antonio de
author_facet Godoy Filho, Marcos Antonio de
author_role author
dc.contributor.none.fl_str_mv Pinheiro, Jose Baldin
dc.contributor.author.fl_str_mv Godoy Filho, Marcos Antonio de
dc.subject.por.fl_str_mv 10x Chromium
10x Chromium
Genoma
Genome
Genotipagem por sequenciamento
Genotyping by sequencing
Percevejos
Soja
Soybean
Stink bugs
Variantes
Variants
topic 10x Chromium
10x Chromium
Genoma
Genome
Genotipagem por sequenciamento
Genotyping by sequencing
Percevejos
Soja
Soybean
Stink bugs
Variantes
Variants
description A soja é uma importante commodity no Brasil, em 2019, a soja e seus derivados responderam por US$ 32,63 bilhões em exportações. No entanto, existem alguns obstáculos à obtenção de maior produtividade, como ataque de insetos, principalmente pelo complexo de percevejos, representados principalmente por Euschistus heros, Nezara viridula e Piezodorus guildinii, que diminuem o rendimento da cultura e podem transmitir fitopatógenos. Uma alternativa ao uso de inseticidas é o desenvolvimento de cultivares resistentes. Para um melhor entendimento da arquitetura genética envolvida na resistência da soja ao complexo do percevejo, foram sequenciados os genomas da cultivar de soja IAC-100 (resistente) e da cultivar CD-215 (suscetível), foram usados os dados de genotipagem por sequenciamento de uma população de 236 de linhagens endogâmicas recombinantes oriundas do cruzamento entre as cultivares estudadas, visando encontrar variantes comuns as mais resistentes e presentes apenas na cultivar IAC-100. Para a montagem dos genomas, utilizamos a tecnologia Chromium Genome (10x Genomics, San Francisco, EUA). A montagem do genoma foi realizada com os softwares Supernova 2.1.1, Ragoo 1.1 e REAPR 1.0.17, gerando montagens com aproximadamente 1 GB e scaffold N50 próximos de 54 MB, para ambas as cultivares nossos genomas apresentam de alta sintênia com os cromossomos da Williams 82 com número de genes e elementos repetitivos muito próximos (aproximadamente 58 mil genes e 44% de elementos repetitivos). A partir dos dados do sequenciamento do genoma, o pipeline do GATK foi usado para a descoberta de variantes e usando dados de genotyping-by-sequencing (GBS), de 236 indivíduos de uma população de linhagens endogâmicas recombinantes, oriundas do cruzamento entre a IAC-100 e CD-215, o pipeline do GATK foi usado para a chamada de SNPs. Foram selecionadas, a partir de dados históricos, as 25 linhagens mais resistentes ao complexo de percevejos, e polimorfismos compartilhados entre as mesmas e IAC-100 foram identificados. Foram identificados um total de 290.189 mil SNPs únicos na IAC-100 quando comparados com CD-215, além de 335.229 mil Indels únicos. A partir dos dados de GBS foram identificados 852 SNPs, compartilhados entre as 25 linhagens mais resistente da população e IAC-100, com esses SNPs muito próximos da posição de QTLs relatados para a resistência. Variantes estruturais foram visualizadas com o software IGV na região de QTLs relatados para a resistência, onde grandes variantes únicas na IAC-100, foram encontradas próximas de genes considerados candidatos a resistência, envolvidos com a biossíntese de fenilpropanóides/lignina, terpenos, número de vagens e desenvolvimento de sementes. Além de disponibilizar dois genomas de soja brasileiros com os melhores scaffolds N50 até hoje relatados, esses resultados abrem as portas para vários outros estudos e aplicações no melhoramento, como mapeamento fino, seleção assistida, expressão de genes candidatos e modificações genéticas nos mesmos usando CRISPR ou outros métodos.
publishDate 2020
dc.date.none.fl_str_mv 2020-09-04
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/11/11137/tde-30112020-201429/
url https://www.teses.usp.br/teses/disponiveis/11/11137/tde-30112020-201429/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865491772197568512