Mapeamento genético em famílias de meio-irmãos por simulação computacional

This study aimed at investigating the genetic mapping in half- sib families (HSF) through computer simulation to elucidate its limitations and advantages in genomic analysis. The following scenarios of simulation were used: (1) Study the effects of population size in HSF for N = 50, 100, 200, 300, 5...

Nível de Acesso:openAccess
Publication Date:2008
Main Author: God, Pedro Ivo Vieira Good lattes
Orientador/a: Barros, Everaldo Gonçalves de lattes
Co-advisor: Cruz, Cosme Damião lattes, Moreira, Maurílio Alves lattes
Banca: Guimarães, Cláudia Teixeira lattes, Silva, Fabyano Fonseca e lattes
Format: Tese
Language:por
Published: Universidade Federal de Viçosa
Programa: Doutorado em Genética e Melhoramento
Department: Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me
Assuntos em Português:
QTL
Assuntos em Inglês:
QTL
Áreas de Conhecimento:
Online Access:http://locus.ufv.br/handle/123456789/1285
Citação:GOD, Pedro Ivo Vieira Good. Genetic mapping in half-sib families by computer simulation.. 2008. 114 f. Tese (Doutorado em Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me) - Universidade Federal de Viçosa, Viçosa, 2008.
Resumo Português:O presente trabalho teve como objetivo central estudar a construção de mapas genéticos em Famílias de Meios-Irmãos (FMI) por meio de simulação computacional para elucidar suas limitações e vantagens na análise genômica. Para esse fim, os seguintes cenários de simulação foram empregados: (1) Estudo dos efeitos do tamanho populacional em progênies de Meios-Irmãos para N = 50, 100, 200, 300, 500 e 1000; (2) Estudo dos efeitos dos graus de saturação (5 cM, 10 cM e 15 cM) do genoma com marcas moleculares; (3) Estudo dos efeitos dos níveis de informação alélica ou o conteúdo de informação polimórfica (PIC), com s = 2, 3, 4, 5 e 6 alelos equi-freqüentes presentes na população de mapeamento. Os diferentes cenários foram combinados entre si e simulados em 100 repetições, gerando um total de 3000 populações para análise. Foram utilizados os seguintes critérios para a determinação de acurácia do mapeamento genético: (i) número de grupos de ligação recuperados; (ii) tamanhos dos grupos de ligação; (iii) distâncias médias entre marcadores adjacentes nos grupos de ligação; (iv) variâncias das distâncias entre marcas adjacentes nos grupos de ligação;(v) estresse; e, (vi) correlação de Spearman. Verificou-se que, aliado ao tamanho populacional e o grau de saturação, a informatividade teve papel fundamental no mapeamento em FMI. Populações com N = 50 e 100 não são recomendadas para o mapeamento em FMI, para quaisquer níveis de polimorfismo. Quando o nível de polimorfismo na população é mínimo (s = 2), tamanhos populacionais de N < 300 não são suficientes para a obtenção de mapas fidedignos, principalmente para mapas com baixo grau de saturação, quando ocorre um aumento relativo de inversões de marcas no mapa de ligação. Mapas menos saturados apresentaram menor recuperação de genomas, menores estimativas de correlação de Spearman e maiores variâncias das distâncias entre marcas adjacentes, principalmente para baixo nível de polimorfismo. Como conclusão geral, pode-se dizer que não é recomendável o uso de populações com N = 50 e 100 mesmo com alto nível de polimorfismo. Para N = 200 é possível obter mapas com certa fidelidade desde que o número de alelos segregando na população base seja igual ou maior do que 4, à semelhança do que ocorre em Famílias de Irmãos Completos para acasalamentos entre genitores completamente informativos.
Resumo inglês:This study aimed at investigating the genetic mapping in half- sib families (HSF) through computer simulation to elucidate its limitations and advantages in genomic analysis. The following scenarios of simulation were used: (1) Study the effects of population size in HSF for N = 50, 100, 200, 300, 500 and 1000; (2) Study the effects of saturation degrees (5 cM, 10 cM and 15 cM) of the genome with molecular markers; (3) Study the effects of levels of information by polymorphism information content (PIC), with s = 2, 3, 4, 5 and 6 alleles equifrequents in the mapping populations. All the possible combinations among these various scenarios were simulated in 100 repetitions each. This generated a total of 3000 populations for analysis. We used the following criteria for determining the accuracy of genetic mapping: (i) number of linkage groups recovered, (ii) sizes of linkage groups, (iii) average distance between adjacent markers in linkage groups, (iv) variance of the distances between adjacent markers in the linkage groups, (v) stress, and (vi) Spearman's correlation. The results show that besides population size and degree of saturation, PIC has a critical role in the mapping of HSF. Populations with N = 50 and 100 are not recommended for the mapping in HSF, for all levels of PIC. When the level of PIC in the population is minimal (s = 2), population sizes of N <300 are not sufficient to obtain reliable maps, especially for those with a low degree of saturation, in which case there occurs an increase in inversions of molecular markers in linkage map. Maps less saturated showed lower genome recovery, lower estimates of correlation of Spearman and higher variance of distances between adjacent markers, especially for low level of PIC. As a general conclusion, we do not recommended the use of populations with N = 50 and 100 even with a high level of PIC. For N = 200 one can get maps with some fidelity provided that the number of segregating alleles in the base population is equal to or greater than 4, similarly to that which occurs in Full-Sib Families from matings between fully informative parents.