Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Sena, Thomaz Marques [UNESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/11449/254469
Resumo: — Estudos para a incorporação de dados moleculares em conjunto com a avaliação genética animal têm sido propostos com os objetivos de aumento da acurácia na predição de valores genéticos genômicos (GEBV), aumento da intensidade de seleção e diminuição dos intervalos de gerações, visando aumentar o ganho genético pela seleção ao longo de sucessivas gerações de acasalamento. O uso de painéis customizados de nucleotídeos de polimorfismo único (SNP) de baixa densidade se mostra interessante devido ao menor custo em relação aos painéis de SNP de alta densidade. Dessa forma, um maior número de animais candidatos a seleção podem ser genotipados. Para a seleção dos SNP que compõem os painéis customizados o algoritmo de aprendizado de máquina tem demonstrado bons resultados em pesquisa. No entanto, com painéis de baixa densidade de SNP, dificuldades de convergência podem ocorrer nas análises de predição do GEBV. Desse modo, o objetivo desse estudo foi verificar a habilidade de predição do GEBV em bovinos da raça Gir a partir de subconjunto de SNP, classificado segundo sua importância para a produção de leite até os 305 dias de lactação. Os SNP foram classificados por regressão não paramétrica por meio do algoritmo Random Forest (RF) e foram testados 20 cenários, os quais variaram quanto à proporção da matriz A22 dentro da G e A22 -1 dentro da matriz H -1 , buscando-se verificar o impacto do subconjunto de SNP na acurácia e no viés de predição. A presença de genes em uma janela de 1Mb foi verificada usando os pacotes biomaRt, com a versão 110 de Ensembl Genomes, clusterProfiler do software R. Dentre os cenários de RF, o melhor foi aquele em que os grupos de treinamento e validação foram separados de acordo com as gerações, cujo Ntree e Mtry foram 8192 e 0,3 vezes no número de SNP presentes no painel de 400 mil marcadores, respectivamente. Os SNP com maior relevância apresentaram oito genes relacionados a importantes vias metabólicas e funções biológicas, presentes em várias espécies de animais. Para os diferentes cenários testados observou-se diferenças significativas (p-valor < 0,05) entre estimativas da variância e da média do GEBV, do fenótipo predito (YHat) e do valor dos resíduos que representam o valor fenotípico descontado dos efeitos incluídos no modelo) para os diferentes cenários de ponderação da matriz G e A22 -1 testados e para os diferentes painéis de customizados. Esse resultado mostrou-se promissor, uma vez que é possível criar painéis de SNP com menores densidades sem perder o poder de predição do GEBV.
id UNSP_fcbfa77108c9fe40cc15f116abb6ae7b
oai_identifier_str oai:repositorio.unesp.br:11449/254469
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str
spelling Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactaçãoPrediction accuracy of genomic genetic value in Gir cattle for milk production up to 305 days of lactationGenéticaLactaçãoBovinosMelhoramento genético— Estudos para a incorporação de dados moleculares em conjunto com a avaliação genética animal têm sido propostos com os objetivos de aumento da acurácia na predição de valores genéticos genômicos (GEBV), aumento da intensidade de seleção e diminuição dos intervalos de gerações, visando aumentar o ganho genético pela seleção ao longo de sucessivas gerações de acasalamento. O uso de painéis customizados de nucleotídeos de polimorfismo único (SNP) de baixa densidade se mostra interessante devido ao menor custo em relação aos painéis de SNP de alta densidade. Dessa forma, um maior número de animais candidatos a seleção podem ser genotipados. Para a seleção dos SNP que compõem os painéis customizados o algoritmo de aprendizado de máquina tem demonstrado bons resultados em pesquisa. No entanto, com painéis de baixa densidade de SNP, dificuldades de convergência podem ocorrer nas análises de predição do GEBV. Desse modo, o objetivo desse estudo foi verificar a habilidade de predição do GEBV em bovinos da raça Gir a partir de subconjunto de SNP, classificado segundo sua importância para a produção de leite até os 305 dias de lactação. Os SNP foram classificados por regressão não paramétrica por meio do algoritmo Random Forest (RF) e foram testados 20 cenários, os quais variaram quanto à proporção da matriz A22 dentro da G e A22 -1 dentro da matriz H -1 , buscando-se verificar o impacto do subconjunto de SNP na acurácia e no viés de predição. A presença de genes em uma janela de 1Mb foi verificada usando os pacotes biomaRt, com a versão 110 de Ensembl Genomes, clusterProfiler do software R. Dentre os cenários de RF, o melhor foi aquele em que os grupos de treinamento e validação foram separados de acordo com as gerações, cujo Ntree e Mtry foram 8192 e 0,3 vezes no número de SNP presentes no painel de 400 mil marcadores, respectivamente. Os SNP com maior relevância apresentaram oito genes relacionados a importantes vias metabólicas e funções biológicas, presentes em várias espécies de animais. Para os diferentes cenários testados observou-se diferenças significativas (p-valor < 0,05) entre estimativas da variância e da média do GEBV, do fenótipo predito (YHat) e do valor dos resíduos que representam o valor fenotípico descontado dos efeitos incluídos no modelo) para os diferentes cenários de ponderação da matriz G e A22 -1 testados e para os diferentes painéis de customizados. Esse resultado mostrou-se promissor, uma vez que é possível criar painéis de SNP com menores densidades sem perder o poder de predição do GEBV.Studies for the incorporation of molecular data in conjunction with animal genetic evaluation have been proposed with the objectives of increasing the accuracy in predicting genomic genetic values (GEBV), increasing the intensity of selection and decreasing generation intervals, aiming to increase the gain genetic by selection over successive generations of mating. The use of customized low-density single nucleotide polymorphism (SNP) panels is interesting due to the lower cost compared to high-density SNP panels. In this way, a greater number of candidate animals for selection can be genotyped. For the selection of SNPs that make up customized panels, the machine learning algorithm has demonstrated good research results. However, with low SNP density panels, convergence difficulties may occur in GEBV prediction analyses. Therefore, the objective of this study was to verify the ability to predict GEBV in Gir cattle based on a subset of SNP, classified according to their importance for milk production up to 305 days of lactation. The SNPs were classified by non-parametric regression using the Random Forest (RF) algorithm and 20 scenarios were tested, which varied in terms of the proportion of the matrix "A" _"22" within G and "A" _"22" ^ "-1" within the matrix "H" ^"-1", seeking to verify the impact of the SNP subset on accuracy and prediction bias. The presence of genes in a 1Mb window was verified using the biomaRt packages, with version 110 of Ensembl Genomes, clusterProfiler of the R software. Among the RF scenarios, the best was the one in which the training and validation groups were separated from according to generations, whose Ntree and Mtry were 8192 and 0.3 times the number of SNP present in the panel of 400 thousand markers, respectively. The most relevant SNPs presented eight genes related to important metabolic pathways and biological functions, present in several animal species. For the different scenarios tested, significant differences (p-value < 0.05) were observed between estimates of the variance and mean of GEBV, the predicted phenotype (YHat) and the value of the residues that represent the discounted phenotypic value of the effects included in the model) for the different matrix weighting scenarios G and "A" _"\2\2"^"\-\1" tested and for the different customized panels. This result was promising, since it is possible to create SNP panels with lower densities without losing the predictive power of GEBV.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)88887.373952/2019-00Universidade Estadual Paulista (Unesp)Munari, Danisio PradoEmpresa Brasileira de Pesquisa Agropecuária (Embrapa) Juís de fora - MGDa Silva, Marcos Vinícius Gualberto BarbosaChud, Tatiane Cristina SeleguimSena, Thomaz Marques [UNESP]2024-03-21T20:40:27Z2024-03-21T20:40:27Z2023-10-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfSENA, T. M. - Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação - 2023, 69f - Tese (Doutorado em Genética e Melhoramento Animal) - Universidade Estadual Paulista, Jaboticabal, 2024.https://hdl.handle.net/11449/25446933004102002P0porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2025-10-22T09:25:21Zoai:repositorio.unesp.br:11449/254469Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462025-10-22T09:25:21Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação
Prediction accuracy of genomic genetic value in Gir cattle for milk production up to 305 days of lactation
title Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação
spellingShingle Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação
Sena, Thomaz Marques [UNESP]
Genética
Lactação
Bovinos
Melhoramento genético
title_short Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação
title_full Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação
title_fullStr Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação
title_full_unstemmed Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação
title_sort Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação
author Sena, Thomaz Marques [UNESP]
author_facet Sena, Thomaz Marques [UNESP]
author_role author
dc.contributor.none.fl_str_mv Munari, Danisio Prado
Empresa Brasileira de Pesquisa Agropecuária (Embrapa) Juís de fora - MG
Da Silva, Marcos Vinícius Gualberto Barbosa
Chud, Tatiane Cristina Seleguim
dc.contributor.author.fl_str_mv Sena, Thomaz Marques [UNESP]
dc.subject.por.fl_str_mv Genética
Lactação
Bovinos
Melhoramento genético
topic Genética
Lactação
Bovinos
Melhoramento genético
description — Estudos para a incorporação de dados moleculares em conjunto com a avaliação genética animal têm sido propostos com os objetivos de aumento da acurácia na predição de valores genéticos genômicos (GEBV), aumento da intensidade de seleção e diminuição dos intervalos de gerações, visando aumentar o ganho genético pela seleção ao longo de sucessivas gerações de acasalamento. O uso de painéis customizados de nucleotídeos de polimorfismo único (SNP) de baixa densidade se mostra interessante devido ao menor custo em relação aos painéis de SNP de alta densidade. Dessa forma, um maior número de animais candidatos a seleção podem ser genotipados. Para a seleção dos SNP que compõem os painéis customizados o algoritmo de aprendizado de máquina tem demonstrado bons resultados em pesquisa. No entanto, com painéis de baixa densidade de SNP, dificuldades de convergência podem ocorrer nas análises de predição do GEBV. Desse modo, o objetivo desse estudo foi verificar a habilidade de predição do GEBV em bovinos da raça Gir a partir de subconjunto de SNP, classificado segundo sua importância para a produção de leite até os 305 dias de lactação. Os SNP foram classificados por regressão não paramétrica por meio do algoritmo Random Forest (RF) e foram testados 20 cenários, os quais variaram quanto à proporção da matriz A22 dentro da G e A22 -1 dentro da matriz H -1 , buscando-se verificar o impacto do subconjunto de SNP na acurácia e no viés de predição. A presença de genes em uma janela de 1Mb foi verificada usando os pacotes biomaRt, com a versão 110 de Ensembl Genomes, clusterProfiler do software R. Dentre os cenários de RF, o melhor foi aquele em que os grupos de treinamento e validação foram separados de acordo com as gerações, cujo Ntree e Mtry foram 8192 e 0,3 vezes no número de SNP presentes no painel de 400 mil marcadores, respectivamente. Os SNP com maior relevância apresentaram oito genes relacionados a importantes vias metabólicas e funções biológicas, presentes em várias espécies de animais. Para os diferentes cenários testados observou-se diferenças significativas (p-valor < 0,05) entre estimativas da variância e da média do GEBV, do fenótipo predito (YHat) e do valor dos resíduos que representam o valor fenotípico descontado dos efeitos incluídos no modelo) para os diferentes cenários de ponderação da matriz G e A22 -1 testados e para os diferentes painéis de customizados. Esse resultado mostrou-se promissor, uma vez que é possível criar painéis de SNP com menores densidades sem perder o poder de predição do GEBV.
publishDate 2023
dc.date.none.fl_str_mv 2023-10-27
2024-03-21T20:40:27Z
2024-03-21T20:40:27Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SENA, T. M. - Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação - 2023, 69f - Tese (Doutorado em Genética e Melhoramento Animal) - Universidade Estadual Paulista, Jaboticabal, 2024.
https://hdl.handle.net/11449/254469
33004102002P0
identifier_str_mv SENA, T. M. - Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação - 2023, 69f - Tese (Doutorado em Genética e Melhoramento Animal) - Universidade Estadual Paulista, Jaboticabal, 2024.
33004102002P0
url https://hdl.handle.net/11449/254469
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv repositoriounesp@unesp.br
_version_ 1854954995332415488