Efeito da saturação e do tamanho de populações F2 e de retrocruzamento sobre a acurácia do mapeamento genético

The objective of this work was to generate and analyze data of simulated genomes of F2 and backcrossed populations, and based on these data, to evaluate the optimum size of population samples for genetic mapping studies. F2 and backcrossed populations with seven sample sizes (50, 100, 150, 200, 400,...

Nível de Acesso:openAccess
Publication Date:2006
Main Author: Cruz, Eduardo Machado lattes
Orientador/a: Cruz, Cosme Damião lattes
Co-advisor: Cecon, Paulo Roberto lattes, Carneiro, Pedro Crescêncio Souza lattes
Banca: Galvão, Eduardo Rezende lattes, Martins Filho, Sebastião lattes
Format: Tese
Language:por
Published: Universidade Federal de Viçosa
Programa: Doutorado em Genética e Melhoramento
Department: Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me
Assuntos em Português:
QTL
Assuntos em Inglês:
QTL
Áreas de Conhecimento:
Online Access:http://locus.ufv.br/handle/123456789/1394
Citação:CRUZ, Eduardo Machado. Effect of saturation and size of F2 and backcrossed populations on genetic mapping accuracy. 2006. 131 f. Tese (Doutorado em Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me) - Universidade Federal de Viçosa, Viçosa, 2006.
Resumo Português:Este trabalho objetivou gerar e analisar dados de genomas simulados de populações F2 e de retrocruzamento e, com base nesses dados, avaliar o tamanho ótimo de amostras dessas populações para estudo de mapeamento genético. Para isso, foram geradas populações F2 e de retrocruzamento com sete tamanhos de amostra (50, 100, 150, 200, 400, 600 e 800 indivíduos) e quatro níveis de saturação (5, 10, 15 e 20 marcadores em cada um de 10 grupos de ligações de 100 centimorgans). As simulações foram feitas por meio do programa GQMOL (2005) e analisadas com os programas GENES (2004) e GQMOL (2005), criados pelo professor Cosme Damião Cruz, do Departamento de Biologia da Universidade Federal de Viçosa. Conclui-se que é completamente inviável a utilização de amostras pequenas, com tamanho próximo a 50 indivíduos, mesmo na saturação de 5 cM por grupo de ligação, que foi o maior nível de saturação utilizado neste trabalho, e desnecessário o emprego de amostras a partir de 400 indivíduos para obtenção de mapas genéticos acurados. Amostras com pequeno número de indivíduos não permitem recuperar o número correto de grupos de ligações da espécie e o ordenamento correto, nem possibilitam estimar corretamente a distância entre os pares de locos. Em populações F2, tamanhos mínimos de amostras de 100, 150 e 200 indivíduos podem ser utilizados para uma recuperação completa do genoma com saturações de 5, 6,66 e 10 cM, respectivamente. No caso de populações de retrocruzamento de 200 indivíduos para os três primeiros níveis de saturação e de 800 para a saturação de 20 cM e de existirem poucos indivíduos, porém acima de 100, para que seja feita uma avaliação, mapas confiáveis podem ser gerados desde que se utiliza uma saturação superior a 5 cM.
Resumo inglês:The objective of this work was to generate and analyze data of simulated genomes of F2 and backcrossed populations, and based on these data, to evaluate the optimum size of population samples for genetic mapping studies. F2 and backcrossed populations with seven sample sizes (50, 100, 150, 200, 400, 600 and 800 individuals) and four levels of saturation were generated (5, 10, 15 and 20 markers in each of the 10 linkage groups of 100 centimorgans). Simulations were performed using the GQMOL software (2005) and analyzed with both GENES (2004) and GQMOL (2005) software developed by Professor Cosme Damião Cruz, from the Department of General Biology at the Federal University of Viçosa, Viçosa, MG. The results led to the conclusion that the use of small samples, approximately 50 individuals, is completely impracticable, even with saturation of 5 cM per linkage group, which was the highest level of saturation used in this work, as well as it is unnecessary the use of samples above 400 individuals to attain map accuracy. Samples with small number of individuals do not allow the recovering of the exact number of species linkage groups and the correct order, neither the accurate estimation of the distance between pairs of loci. For F2 populations, the smallest sample sizes of 100, 150 and 200 individuals can be used for a complete recovery of the genome with saturations of 5; 6.66; and 10 cM respectively, and for backcrossed populations of 200 individuals in the first three levels of saturation and 800 in the saturation of 20 cM. If few individuals exist, above 100 though, to carry out an evaluation, reliable maps can be constructed, since saturation above 5 cM is used.