Análise de imputação e efeito do cromossomo x na característica reprodutiva em bovinos da Nelore

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Hermisdorff, Ísis da Costa lattes
Orientador(a): Costa, Raphael Bermal
Banca de defesa: Costa, Raphael Bermal, Bocchi, Adriana Luize, Magalhães, Ana Fabrícia Braga, Silva, Fabiane de Lima, Feitosa, Fabieli Loise Braga
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: UNIVERSIDADE FEDERAL DA BAHIA
Programa de Pós-Graduação: Programa de Pós-Graduação em Zootecnia (PPGZOO)
Departamento: Escola de Medicina Veterinária e Zootecnia
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufba.br/handle/ri/41781
Resumo: A precisão da imputação, entre outras coisas, depende do tamanho do painel de referência, da frequência alélica (MAF) do marcador e do posicionamento correto das variantes no conjunto do genoma de referência. Usando genótipos de alta densidade de 3938 bovinos Nelore do Brasil, investigamos a precisão da imputação da densidade SNPs de 50K a 777K, usando as posições determinadas de acordo com os conjuntos de genoma bovino UMD3.1 e ARS-UCD1.2. Avaliamos o efeito dos tamanhos dos painéis de referência e alvo na qualidade da imputação baseada em pré-faseamento usando a validação cruzada de dez vezes. Além disso, avaliamos a confiabilidade do Índice de qualidade de imputação (Rsq) do Minimac3, o comparando com diferentes medidas de precisão empírica da imputação. A precisão geral da imputação medida como a correlação quadrática entre as doses dos alelos verdadeiros e imputados (R2dose) foi praticamente idêntica usando o conjunto do genoma UMD3.1 ou ARS-UCD1.2. Quando o tamanho do painel de referência aumentou de 250 para 2000, a R2dose aumentou de 0,845 para 0,917 e o número de marcadores polimórficos no conjunto de dados imputados aumentou de 586.701 para 618.660. Também foram observadas vantagens tanto na precisão quanto na densidade do marcador quando foram imputados painéis-alvo maiores, provavelmente resultantes da inferência dos haplótipos mais precisa. A precisão da imputação e a densidade do marcador nos dados imputados aumentaram de 0,903 para 0,913 e de 593,239 para 595,570 quando haplótipos foram Research article submitted to the BMC genomics 121 inferidos em 500 e 2900 animais-alvo, respectivamente. Os escores de qualidade de imputação baseados no modelo do Minimac3 (Rsq) foram altamente correlacionados, mas sistematicamente mais altos do que as precisões empiricamente estimadas. A correlação entre as medidas aumentou com o tamanho do painel de referência e do MAF das variantes imputadas. É possível uma imputação precisa dos marcadores BovineHD BeadChip em bovinos Nelore usando o novo conjunto de genoma de referência bovino ARS-UCD1.2. O uso de grandes painéis de referência e alvo melhora a precisão dos genótipos imputados e fornece genótipos para mais marcadores segregando em baixa frequência para análises genômicas a jusante. O escore de qualidade de imputação baseada no modelo do Minimac3 (Rsq) pode ser usada para detectar variantes mal imputadas, mas sua confiabilidade depende do tamanho do painel de referência usado e do MAF das variantes imputadas.
id UFBA-2_196f22f32afccc81bd0a6c2bc15c2e67
oai_identifier_str oai:repositorio.ufba.br:ri/41781
network_acronym_str UFBA-2
network_name_str Repositório Institucional da UFBA
repository_id_str
spelling 2025-04-13T21:01:31Z2025-04-13T21:01:31Z2020-07-30https://repositorio.ufba.br/handle/ri/41781A precisão da imputação, entre outras coisas, depende do tamanho do painel de referência, da frequência alélica (MAF) do marcador e do posicionamento correto das variantes no conjunto do genoma de referência. Usando genótipos de alta densidade de 3938 bovinos Nelore do Brasil, investigamos a precisão da imputação da densidade SNPs de 50K a 777K, usando as posições determinadas de acordo com os conjuntos de genoma bovino UMD3.1 e ARS-UCD1.2. Avaliamos o efeito dos tamanhos dos painéis de referência e alvo na qualidade da imputação baseada em pré-faseamento usando a validação cruzada de dez vezes. Além disso, avaliamos a confiabilidade do Índice de qualidade de imputação (Rsq) do Minimac3, o comparando com diferentes medidas de precisão empírica da imputação. A precisão geral da imputação medida como a correlação quadrática entre as doses dos alelos verdadeiros e imputados (R2dose) foi praticamente idêntica usando o conjunto do genoma UMD3.1 ou ARS-UCD1.2. Quando o tamanho do painel de referência aumentou de 250 para 2000, a R2dose aumentou de 0,845 para 0,917 e o número de marcadores polimórficos no conjunto de dados imputados aumentou de 586.701 para 618.660. Também foram observadas vantagens tanto na precisão quanto na densidade do marcador quando foram imputados painéis-alvo maiores, provavelmente resultantes da inferência dos haplótipos mais precisa. A precisão da imputação e a densidade do marcador nos dados imputados aumentaram de 0,903 para 0,913 e de 593,239 para 595,570 quando haplótipos foram Research article submitted to the BMC genomics 121 inferidos em 500 e 2900 animais-alvo, respectivamente. Os escores de qualidade de imputação baseados no modelo do Minimac3 (Rsq) foram altamente correlacionados, mas sistematicamente mais altos do que as precisões empiricamente estimadas. A correlação entre as medidas aumentou com o tamanho do painel de referência e do MAF das variantes imputadas. É possível uma imputação precisa dos marcadores BovineHD BeadChip em bovinos Nelore usando o novo conjunto de genoma de referência bovino ARS-UCD1.2. O uso de grandes painéis de referência e alvo melhora a precisão dos genótipos imputados e fornece genótipos para mais marcadores segregando em baixa frequência para análises genômicas a jusante. O escore de qualidade de imputação baseada no modelo do Minimac3 (Rsq) pode ser usada para detectar variantes mal imputadas, mas sua confiabilidade depende do tamanho do painel de referência usado e do MAF das variantes imputadas.Imputation accuracy among other things depends on the size of the reference panel, the marker's minor allele frequency (MAF), and the correct placement of variants on the reference genome assembly. Using high-density genotypes of 3938 Nellore cattle from Brazil, we investigated the accuracy of imputation from 50K to 777K SNP density, using map positions determined according to the bovine genome assemblies UMD3.1 and ARS-UCD1.2. We assessed the effect of reference and target panel sizes on the prephasing-based imputation quality using ten-fold cross-validation. Further, we compared the reliability of the model-based imputation quality score (Rsq) from Minimac3 to empirical imputation accuracy. The overall accuracy of imputation measured as the squared correlation between true and imputed allele dosages (R2dose) was virtually identical using either the UMD3.1 or ARS-UCD1.2 genome assembly. When the size of the reference panel increased from 250 to 2000, R2dose increased from 0.845 to 0.917, and the number of polymorphic markers in the imputed data set increased from 586,701 to 618,660. Advantages in both accuracy and marker density were also observed when larger target panels were imputed, likely resulting from more accurate haplotype inference. Imputation accuracy and the marker density in the imputed data increased from 0.903 to 0.913 and from 593,239 to 595,570 when haplotypes were inferred in 500 and 2900 target animals, respectively. The model-based imputation quality scores from Minimac3 (Rsq) were highly correlated to but systematically higher than empirically 23 estimated accuracies. The correlation between these metrics increased with the size of the reference panel and MAF of imputed variants. Accurate imputation of BovineHD BeadChip markers is possible in Nellore cattle using the new bovine reference genome assembly ARS-UCD1.2. The use of large reference and target panels improves the accuracy of the imputed genotypes and provides genotypes for more markers segregating at low frequency for downstream genomic analyses. The model-based imputation quality score from Minimac3 (Rsq) can be used to detect poorly imputed variants but its reliability depends on the size of the reference panel used and MAF of the imputed variants.porUNIVERSIDADE FEDERAL DA BAHIAPrograma de Pós-Graduação em Zootecnia (PPGZOO)UFBABrasilEscola de Medicina Veterinária e ZootecniaARS-UCD1.2Haplotype phasingBos taurus indicusPre-phasing-basedBovine genome assemblyRare and low-frequency variantsCNPQ::CIENCIAS AGRARIASARS-UCD1.2Faseamento de haplótiposBos taurus indicusGenoma bovino de referênciaVariantes raras e de baixa frequênciaBovine genomeHaplotypeSex chromosomesRare Coding VariantePreconcityAnálise de imputação e efeito do cromossomo x na característica reprodutiva em bovinos da NeloreDoutoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionCosta, Raphael BermalCosta, Raphael BermalBocchi, Adriana LuizeMagalhães, Ana Fabrícia BragaSilva, Fabiane de LimaFeitosa, Fabieli Loise Bragahttp://lattes.cnpq.br/7534459132790074Hermisdorff, Ísis da Costainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAORIGINALIsis da Costa Hermisdorff.pdfIsis da Costa Hermisdorff.pdfapplication/pdf1697809https://repositorio.ufba.br/bitstream/ri/41781/1/Isis%20da%20Costa%20Hermisdorff.pdf4d904f5170e61be2035f351d357eb3deMD51open accessLICENSElicense.txtlicense.txttext/plain1720https://repositorio.ufba.br/bitstream/ri/41781/2/license.txtd9b7566281c22d808dbf8f29ff0425c8MD52open accessri/417812025-04-13 18:01:32.317open accessoai:repositorio.ufba.br:ri/41781TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNhw6fDo28gKGluY2x1aW5kbyBvIHJlc3Vtbykgbm8gZm9ybWF0byBpbXByZXNzbyBlL291IGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBlL291IHbDrWRlby4KCk8gYXV0b3Igb3UgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgY29uY29yZGEgcXVlIG8gUmVwb3NpdMOzcmlvIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIGUvb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8OjbywgcG9kZW5kbyBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLiAKCk8gYXV0b3Igb3UgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIG7Do28sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIGFvIFJlcG9zaXTDs3JpbyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBSRVNVTFRFIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTywgVk9Dw4ogREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklTw4NPLCBDT01PIFRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l0w7NyaW8gc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyLCBjbGFyYW1lbnRlLCBvIChzKSBzZXUocykgbm9tZSAocykgb3UgbyAocykgbm9tZSAocykgZG8gKHMpIGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHB1YmxpY2HDp8OjbyBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufba.br/oai/requestrepositorio@ufba.bropendoar:19322025-04-13T21:01:32Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false
dc.title.pt_BR.fl_str_mv Análise de imputação e efeito do cromossomo x na característica reprodutiva em bovinos da Nelore
title Análise de imputação e efeito do cromossomo x na característica reprodutiva em bovinos da Nelore
spellingShingle Análise de imputação e efeito do cromossomo x na característica reprodutiva em bovinos da Nelore
Hermisdorff, Ísis da Costa
CNPQ::CIENCIAS AGRARIAS
ARS-UCD1.2
Faseamento de haplótipos
Bos taurus indicus
Genoma bovino de referência
Variantes raras e de baixa frequência
Bovine genome
Haplotype
Sex chromosomes
Rare Coding Variante
Preconcity
ARS-UCD1.2
Haplotype phasing
Bos taurus indicus
Pre-phasing-based
Bovine genome assembly
Rare and low-frequency variants
title_short Análise de imputação e efeito do cromossomo x na característica reprodutiva em bovinos da Nelore
title_full Análise de imputação e efeito do cromossomo x na característica reprodutiva em bovinos da Nelore
title_fullStr Análise de imputação e efeito do cromossomo x na característica reprodutiva em bovinos da Nelore
title_full_unstemmed Análise de imputação e efeito do cromossomo x na característica reprodutiva em bovinos da Nelore
title_sort Análise de imputação e efeito do cromossomo x na característica reprodutiva em bovinos da Nelore
author Hermisdorff, Ísis da Costa
author_facet Hermisdorff, Ísis da Costa
author_role author
dc.contributor.advisor1.fl_str_mv Costa, Raphael Bermal
dc.contributor.referee1.fl_str_mv Costa, Raphael Bermal
dc.contributor.referee2.fl_str_mv Bocchi, Adriana Luize
dc.contributor.referee3.fl_str_mv Magalhães, Ana Fabrícia Braga
dc.contributor.referee4.fl_str_mv Silva, Fabiane de Lima
dc.contributor.referee5.fl_str_mv Feitosa, Fabieli Loise Braga
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7534459132790074
dc.contributor.author.fl_str_mv Hermisdorff, Ísis da Costa
contributor_str_mv Costa, Raphael Bermal
Costa, Raphael Bermal
Bocchi, Adriana Luize
Magalhães, Ana Fabrícia Braga
Silva, Fabiane de Lima
Feitosa, Fabieli Loise Braga
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS AGRARIAS
topic CNPQ::CIENCIAS AGRARIAS
ARS-UCD1.2
Faseamento de haplótipos
Bos taurus indicus
Genoma bovino de referência
Variantes raras e de baixa frequência
Bovine genome
Haplotype
Sex chromosomes
Rare Coding Variante
Preconcity
ARS-UCD1.2
Haplotype phasing
Bos taurus indicus
Pre-phasing-based
Bovine genome assembly
Rare and low-frequency variants
dc.subject.por.fl_str_mv ARS-UCD1.2
Faseamento de haplótipos
Bos taurus indicus
Genoma bovino de referência
Variantes raras e de baixa frequência
Bovine genome
Haplotype
Sex chromosomes
Rare Coding Variante
Preconcity
dc.subject.other.pt_BR.fl_str_mv ARS-UCD1.2
Haplotype phasing
Bos taurus indicus
Pre-phasing-based
Bovine genome assembly
Rare and low-frequency variants
description A precisão da imputação, entre outras coisas, depende do tamanho do painel de referência, da frequência alélica (MAF) do marcador e do posicionamento correto das variantes no conjunto do genoma de referência. Usando genótipos de alta densidade de 3938 bovinos Nelore do Brasil, investigamos a precisão da imputação da densidade SNPs de 50K a 777K, usando as posições determinadas de acordo com os conjuntos de genoma bovino UMD3.1 e ARS-UCD1.2. Avaliamos o efeito dos tamanhos dos painéis de referência e alvo na qualidade da imputação baseada em pré-faseamento usando a validação cruzada de dez vezes. Além disso, avaliamos a confiabilidade do Índice de qualidade de imputação (Rsq) do Minimac3, o comparando com diferentes medidas de precisão empírica da imputação. A precisão geral da imputação medida como a correlação quadrática entre as doses dos alelos verdadeiros e imputados (R2dose) foi praticamente idêntica usando o conjunto do genoma UMD3.1 ou ARS-UCD1.2. Quando o tamanho do painel de referência aumentou de 250 para 2000, a R2dose aumentou de 0,845 para 0,917 e o número de marcadores polimórficos no conjunto de dados imputados aumentou de 586.701 para 618.660. Também foram observadas vantagens tanto na precisão quanto na densidade do marcador quando foram imputados painéis-alvo maiores, provavelmente resultantes da inferência dos haplótipos mais precisa. A precisão da imputação e a densidade do marcador nos dados imputados aumentaram de 0,903 para 0,913 e de 593,239 para 595,570 quando haplótipos foram Research article submitted to the BMC genomics 121 inferidos em 500 e 2900 animais-alvo, respectivamente. Os escores de qualidade de imputação baseados no modelo do Minimac3 (Rsq) foram altamente correlacionados, mas sistematicamente mais altos do que as precisões empiricamente estimadas. A correlação entre as medidas aumentou com o tamanho do painel de referência e do MAF das variantes imputadas. É possível uma imputação precisa dos marcadores BovineHD BeadChip em bovinos Nelore usando o novo conjunto de genoma de referência bovino ARS-UCD1.2. O uso de grandes painéis de referência e alvo melhora a precisão dos genótipos imputados e fornece genótipos para mais marcadores segregando em baixa frequência para análises genômicas a jusante. O escore de qualidade de imputação baseada no modelo do Minimac3 (Rsq) pode ser usada para detectar variantes mal imputadas, mas sua confiabilidade depende do tamanho do painel de referência usado e do MAF das variantes imputadas.
publishDate 2020
dc.date.issued.fl_str_mv 2020-07-30
dc.date.accessioned.fl_str_mv 2025-04-13T21:01:31Z
dc.date.available.fl_str_mv 2025-04-13T21:01:31Z
dc.type.driver.fl_str_mv Doutorado
info:eu-repo/semantics/doctoralThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufba.br/handle/ri/41781
url https://repositorio.ufba.br/handle/ri/41781
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv UNIVERSIDADE FEDERAL DA BAHIA
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Zootecnia (PPGZOO)
dc.publisher.initials.fl_str_mv UFBA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola de Medicina Veterinária e Zootecnia
publisher.none.fl_str_mv UNIVERSIDADE FEDERAL DA BAHIA
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFBA
instname:Universidade Federal da Bahia (UFBA)
instacron:UFBA
instname_str Universidade Federal da Bahia (UFBA)
instacron_str UFBA
institution UFBA
reponame_str Repositório Institucional da UFBA
collection Repositório Institucional da UFBA
bitstream.url.fl_str_mv https://repositorio.ufba.br/bitstream/ri/41781/1/Isis%20da%20Costa%20Hermisdorff.pdf
https://repositorio.ufba.br/bitstream/ri/41781/2/license.txt
bitstream.checksum.fl_str_mv 4d904f5170e61be2035f351d357eb3de
d9b7566281c22d808dbf8f29ff0425c8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)
repository.mail.fl_str_mv repositorio@ufba.br
_version_ 1847342051847307264