Coleções nucleares e associação do teor de óleo de cártamo com variáveis ecogeográficas por inteligência computacional

Safflower (Carthamus tinctorius L.) is an oilseed species with a large genetic potential available in genebanks. Source of relevant characters, safflower germplasm banks have shown limited use due to the large number of accessions available in collections. The present study aimed to explore the gene...

Nível de Acesso:openAccess
Publication Date:2014
Main Author: Boldt, Alberto Souza lattes
Orientador/a: Motoike, Sérgio Yoshimitsu lattes
Co-orientador/a: Sediyama, Tuneo lattes, Cruz, Cosme Damião lattes
Banca: Cecon, Paulo Roberto lattes, Sá, Rogério Oliveira de lattes, Dias, Luiz Antonio dos Santos lattes
Format: Tese
Language:por
Published: Universidade Federal de Viçosa
Programa: Doutorado em Genética e Melhoramento
Department: Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me
Assuntos em Português:
Assuntos em Inglês:
Áreas de Conhecimento:
Online Access:http://locus.ufv.br/handle/123456789/1400
Citação:BOLDT, Alberto Souza. Core collections and association between safflower oil and ecogeographic data by computational intelligence. 2014. 67 f. Tese (Doutorado em Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me) - Universidade Federal de Viçosa, Viçosa, 2014.
Resumo Português:Cártamo (Carthamus tinctorius L.) é uma espécie oleaginosa com um grande potencial genético confinado nos bancos de germoplasma. Fonte de características relevantes, os bancos de germoplasma de cártamo tem apresentado uso limitado devido ao grande número de acessos disponíveis nas coleções. O presente trabalho objetivou explorar a diversidade genética de cártamo por meio do estabelecimento de coleções nucleares mais expressivas utilizando as estratégias de maximização e estratificação de genótipos em grupos genéticos conhecidos. O trabalho também objetivou investigar a existência de associação preditiva entre teor de óleo e variáveis ecogeográficas da origem de acessos de cártamo, utilizando a estratégia de identificação focada de germoplasma para explorar a associação e aumentar as chances de encontrar genótipos de cártamo com alto teor óleo. No estabelecimento das coleções nucleares foram utilizados caracteres fenotípicos, qualitativos e quantitativos, de 1640 acessos de cártamo provenientes de 48 países. Os acessos foram estratificados nos grupos genéticos de acordo com país de origem e amostrados segundo a estratégia de maximização. As coleções nucleares estabelecidas foram comparadas com a coleção base utilizando estatísticas de validação adequadas. As magnitudes das estimativas das estatísticas de validação indicaram que a variabilidade genética dos acessos da coleção base foi preservada nas coleções nucleares estabelecidas. As coleções nucleares estratificadas por grupos genéticos apresentaram aproximadamente 60 genótipos, com diferença média de apenas 7% em relação a coleção base e com taxa de coincidência de superior a 94%. O uso conjunto da estratégia de maximização e da estratificação dos genótipos em grupos genéticos maximizou a captação da variabilidade genética e introduziu maior eficiência no estabelecimento das coleções nucleares ao selecionar uma quantidade reduzida de acessos. As coleções nucleares estabelecidas incluíram aproximadamente 3.75% dos acessos conservados na coleção base. Para estabelecer coleções nucleares expressivas é necessário que os acessos sejam selecionados da coleção base de maneira apropriada. A estratégia de identificação focada de germoplasma é um método eficiente de otimizar a seleção de acessos presentes nos bancos de germoplasma. A FIGS faz uso da associação preditiva entre características e variáveis ambientais na busca de genótipos com maior probabilidade de conter a característica de interesse. Florestas aleatórias, máquinas de vetor de suporte e redes neurais artificias foram utilizadas para modelar a associação entre teor de óleo de 100 genótipos cártamo e 56 variáveis ecogeográficas. As acurácias dos modelos utilizados mostraram que a distribuição de genótipos de cártamo com alto teor de óleo não é aleatória mas ligada a fatores ambientais, mesmo com certo grau de sobreposição entre os teores de óleo em alguns ambientes. Os resultados finais sugerem que explorar a associação preditiva entre o teor de óleo e as características ecogeográficas do local de origem do germoplasma aumenta as chances de encontrar genótipos com alto teor óleo.
Resumo inglês:Safflower (Carthamus tinctorius L.) is an oilseed species with a large genetic potential available in genebanks. Source of relevant characters, safflower germplasm banks have shown limited use due to the large number of accessions available in collections. The present study aimed to explore the genetic diversity of safflower through the establishment of more expressive core collections using maximization strategy and the stratification of genotypes in genetic groups. The study also aimed to investigate the existence of predictive association between oil content and ecogeographic parameters of the original site of safflower accessions, using the focused identification of germplasm strategy to explore the association and increase the chances of finding safflower genotypes with high oil content. Core collections were established using phenotypic qualitative and quantitative traits data of 1640 safflower accessions from 48 countries. The accessions were stratified into genetic groups according to country s origin and sampled according to the maximization strategy (M strategy) . The established core collections were compared with the base collection using the following validation statistics: chi-square test, mean difference, difference of variances, coincidence rate, variable rate and Shannon index. Magnitude estimates of validation statistics indicated that base collection s genetic variability was preserved in the core collections based on safflower centers of similarity. Core collections stratified by genetic groups consisted in about 60 genotypes, with a mean difference of 7% over the base collection and coincidence rate above 94%. The combined use of the maximization strategy and stratification of genotypes in genetic groups maximized the capture of genetic variation and introduced more efficiency, establishing core collections with a fewer number of accessions. The core collections included approximately 3,75% accessions conserved in safflower base collection. To establish expressive core collections is necessary selecting accessions properly from base collection. The Focused Identification Germplasm Strategy (FIGS) is an efficient method to optimize the selection of useful accessions kept in collections. The FIGS makes use of predictive association between characteristics and environmental variables in the search for genotypes with high probability of containing the trait of interest. The present study aimed to investigate the existence of predictive association between oil content and ecogeographic parameters of the original site of safflower genotypes using the FIGS based on machine learning approaches. Random forests, support vector machines and artificial neural networks were used to model the association between oil content of 100 safflower genotypes and 56 ecogeographic parameters. The models accuracies indicated that the distribution of safflower genotypes with high oil content is not random but associated to environmental factors, even with some degree of overlap between the oil content in some environments. The final results suggest that exploring the predictive association between oil content and ecogeographic parameters of original collection site of safflower germplasm increases the chances of finding genotypes with high oil content.