Diversidade em populações simuladas com base em locos multialélicos

The availability of the new theoretical and practical referential systems has been welcome and important as a guide to using softwares and biometric methods, since it makes possible a better use of the data file and the correct interpretation of the results. So, the following simulations were accomp...

Nível de Acesso:openAccess
Publication Date:2007
Main Author: Ferreira, Fábio Medeiros lattes
Orientador/a: Cruz, Cosme Damião lattes
Co-orientador/a: Dias, Luiz Antonio dos Santos lattes, Carneiro, Pedro Crescêncio Souza lattes
Banca: Furtado, Marcos Ribeiro lattes, Waldschmidt, Ana Maria lattes
Format: Tese
Language:por
Published: Universidade Federal de Viçosa
Programa: Doutorado em Genética e Melhoramento
Department: Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me
Assuntos em Português:
Assuntos em Inglês:
Áreas de Conhecimento:
Online Access:http://locus.ufv.br/handle/123456789/1412
Citação:FERREIRA, Fábio Medeiros. Diversity in populations simulated on the basis of multiallelic loci. 2007. 192 f. Tese (Doutorado em Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me) - Universidade Federal de Viçosa, Viçosa, 2007.
Resumo Português:A disponibilidade de novos referenciais teóricos e práticos continua sendo bem vinda e importante na orientação sobre o uso de softwares e métodos biométricos, para que se possa aproveitar melhor o conjunto de dados e interpretar corretamente os resultados. Neste estudo foram simuladas populações-base, submetidas a algumas gerações de acasalamento ao acaso e autofecundação, formação de populações híbridas F1, gerações segregantes Fn e de retrocruzamento, com informações provenientes de 20 locos codominantes e multialélicos. Várias análises biométricas foram aplicadas em nível intra e interpopulacional, utilizando-se de sete programas computacionais disponibilizados gratuitamente na internet. Com isso objetivou-se: i) avaliar a diversidade genética entre e dentro das populações; ii) comparar as metodologias empregadas; iii) verificar a potencialidade e funcionalidade dos programas computacionais e iv) auxiliar pesquisadores no uso de vários métodos biométricos para análise de dados genéticos e na execução das análises através dos programas. Destacaram-se as medidas, número efetivo de alelos ( e A ), conteúdo de informação polimórfica (PIC), índice Shannon-Wiener (H ), heterozigosidade observada (Ho), índice de fixação/endogamia (f) e heterozigosidade esperada (He ou j D ), como ótimos descritores da diversidade genética intrapopulacional. Para um grande tamanho amostral (Ni = 200), os diferentes estimadores do coeficiente de fixação/endogamia pouco diferiram em relação a suas estimativas, assim como para as medidas viesadas e não viesadas de heterozigosidade esperada. Os valores de tamanho efetivo (Ne) sendo inversamente proporcional ao coeficiente de endogamia, revelaram que autofecundações proporcionam menores Ne. As populações sob acasalamento ao acaso tiveram valores de Ne =~ Ni, pois atendem aos pressupostos de uma população idealizada de cruzamentos aleatórios. Populações que sofrem autofecundação, como as gerações segregantes Fn, foram unânimes quanto ao desequilíbrio dentro de seus locos. O desequilíbrio nos locos de populações híbridas ocorre para aqueles em que não há diferenças de freqüências alélicas entre as populações cruzadas. O processo de hibridação nas populações de retrocruzamento pode levar um loco ao equilíbrio de Hardy-Weinberg (EHW) ou não, o que vai depender das combinações gênicas e genotípicas entre o hibrido F1, ou a geração antecedente de retrocruzamento, com o genitor recorrente. Desvios nas proporções do EHW servem à definição de hipóteses alternativas em relação ao excesso e deficiência de heterozigotos. Os testes de qui-quadrado, razão de verossimilhança e teste exato com permutações foram concordantes na detecção ou não do EHW. Com os avanços das gerações de acasalamento ao acaso tende-se ao equilíbrio gamético e diminuição do coeficiente de desequilíbrio. Os testes de qui-quadrado ( 2 χ ) e razão de verossimilhança (G2) foram bastante concordantes em relação à detecção ou não de desequilíbrio gamético. No geral, as medidas de distância empregadas no estudo da diversidade interpopulacional formaram grupos bem semelhantes, com a aplicação dos métodos de agrupamento de Tocher, UPGMA e projeção bidimensional (2D). No entanto, medidas de distância com filosofias afins, proporcionaram em algumas situações agrupamentos idênticos, como no caso das distâncias Euclidiana média (DE) e de Roger (DR); Latter (1972 e 1973) (DL72 e DL73) e Reynolds (D RWC); Rogers modificada (DGS), mínima (Dm) e Reynolds (DRWC) e; complemento do cosseno (DCOS), comprimento da corda (DCC) e Nei et al. (1983) (DN83). Comparações ao nível genotípico, a exemplo da distância genotípica de Hedrick (DH) proporcionam informação adicional, a qual distâncias gênicas podem não promover. As medidas de distância geométricas (DE, DR, DGS, DCOS e DCC) apresentaram maior eficiência de projeção gráfica. Verificou-se que com o avanço nas gerações de retrocruzamento, há realmente uma recuperação do genoma parental recorrente, refletidos na maior diferenciação genética entre população de retrocruzamento com o genitor doador, em situação de não seleção de genótipos. A análise de variância de freqüências alélicas promoveu uma partição mais eqüitativa da variação de indivíduos dentro de populações e de genes dentro de indivíduos, ao passo que a análise molecular de variância (AMOVA) atribuiu grande parte da variação a genes dentro de indivíduos. A variação entre populações e a soma da variação dentro de populações e dentro de indivíduos, foi quantificada de maneira idêntica pelos métodos de freqüências alélicas e de Nei. Valores das estatísticas F foram iguais pelos métodos de análise de variância de freqüências alélicas e AMOVA. A análise via estatísticas F permitiu o entendimento de como se distribui a variação entre populações parentais e gerações segregantes. Os programas utilizados se mostraram adequados para o estudo de diversidade genética de populações, com locos multialélicos. Destacam-se os programas GENES e PowerMarker, em função da variedade de métodos de análise direcionados a este estudo. O estudo simulado possibilitou realizar comparações metodológicas e de programas computacionais de maneira satisfatória, sendo este um referencial teórico que pode auxiliar pesquisadores nas inferências sobre a genética de populações.
Resumo inglês:The availability of the new theoretical and practical referential systems has been welcome and important as a guide to using softwares and biometric methods, since it makes possible a better use of the data file and the correct interpretation of the results. So, the following simulations were accomplished: base-populations subjected to either randomly mating and selfings; formation of hybrid populations F1; segregant generations Fn and backcrossing generations provided with information from twenty codominant and multiallelic loci. Several biometric analyses were applied at intra- and inter-populational levels, by using seven computer programs that were gratuitously available in internet. The objectives were: i) to evaluate the genetic diversity either between and within populations; ii) to compare the applied methodologies; iii) to verify both potentiality and functionality of the computer programs; and iv) to help the researchers either in using several biometric methods for the genetic data analysis and in accomplishing the analyses through the programs. The following measures were distinguished as optimum descriptors of the intra populational: the allele effective numbers (Ae); polymorphic information content (PIC); Shannon-Wiener index (H'); observed heterozygosity (Ho); fixation/endogamy index (f); and expected heterozygosity (He or j D ), as optimum descriptors of the intra-populational genetic diversity. For a high sample size (Ni = 200), the different estimators of the endogamy/fixation coefficient slightly differed concerning to their estimates, as well as for the biased and non-biased expected heterozygosity. Because the effective-sized values (Ne) were inversely proportional to the endogamy coefficient, they revealed selfings to provide lower Ne. The populations under random mating showed values Ne =~ Ni, since they fulfill the presuppositions of an idealized population with random matings. Those populations under selfing such as the segregant generations Fn were unanimous concerning to disequilibrium inside their loci. The disequilibrium in the hybrid population loci occurs for those where there are no different allelic frequencies between crossed populations. The hybridization process in the backcrossing populations can or cannot lead one locus to Hardy-Weinberg equilibrium (HWE), what will depend from both genic and genotypic combinations between the hybrid F1 or the antecedent backcrossing generation with the recurrent genitor. Deviations in the HWE proportions are useful to the definition of alternative hypotheses concerning to either excess or deficiency of heterozygotes. The tests of qui-square, likelihood ratio, and the exact test with permutations were in accordance for the HWE detection or not. As the random mating advances, there is a tendency to reach the gametic equilibrium and the disequilibrium coefficient to be decreased. The qui-square tests 2 χ and likelihood ratio (G2) were in concordance in relation to the detection or non-detection of the gametic disequilibrium. In general, the distance measures used in the interpopulational diversity study rather composed very similar groups, when applying the clustering methods by Tocher, UPGMA and two-dimensional projection (2D). Though, the distance measures with similar philosophies and under some situations provided identical groupings, such as the distances: the mean Euclidian (DE) and Roger (DR); Latter (1972 and 1973) (DL72 and DL73) and Reynolds (D`RWC); modified Rogers (DGS), minimum (Dm) and Reynolds (DRWC); as well as the cosine complement (DCOS), cord length (DCC) and Nei et al. (1983) (DN83). Comparisons at genotypic level, such as the Hedrick genotypic distance (DH) provide additional information at which the gene distances probably cannot promote. The geometric distance measures (DE, DR, DGS, DCOS and DCC) showed higher efficiency in graphic projection. It was verified that as the backcrossing generations advanced, the recovery of the recurrent parental genome really occurs, which is reflected on higher genetic differentiation between the backcrossing population and the donor genitor. The variance analysis of the allelic frequencies promoted an equal partition of either individual variations within populations and genes within individuals, whereas the molecular variance analysis (AMOVA) ascribed great part of the variation to the genes within individuals. The variation among populations and the sum of the variation within populations and within individuals were identically quantified by the allelic frequencies and Nei methods. The values of the statistics F were equal, based on the allelic frequency variance analysis and AMOVA. The analysis by statistics F allowed to understand how the variation is distributed between parental populations and segregant generations. The programs under study showed to be appropriate for the study of the genetic diversity in populations with multiallelic loci. The programs GENES and PowerMarker are distinguished as a function of the several analysis methods directed to this study. The simulated study made possible to accomplishing satisfactory comparisons among either the available methodologies and the computer programs, therefore constituting a theoretical referential that can help the researchers to draw inferences on the populational genetics.