Diferenciação populacional em genes sob forte seleção balanceadora:um estudo de caso com genes HLA.

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Brandt, Débora Yoshihara Caldeira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
HLA
Link de acesso: http://www.teses.usp.br/teses/disponiveis/41/41131/tde-25092015-104711/
Resumo: Seleção balanceadora é definida como aquela que aumenta a variabilidade genética de populações em relação ao esperado sob neutralidade. Uma expectativa sobre seus efeitos é a redução da diferenciação populacional nos genes onde atua. Contudo, regimes que mantêm conjuntos distintos de alelos em diferentes populações poderiam resultar em aumento de diferenciação populacional. Com o objetivo de compreender melhor os efeitos da seleção balanceadora sobre a distribuição da variação genética entre populações, investigamos a diferenciação populacional em genes dos Antígenos Leucocitários Humanos (HLA, do inglês, Human Leukocyte Antigen), que são os genes mais polimórficos do genoma humano e o exemplo mais clássico de seleção balanceadora em humanos. As proteínas HLA são responsáveis pela apresentação de peptídeos aos linfócitos T, mediando uma etapa crítica da resposta imune. A vantagem da manutenção de variação nesses genes está possivelmente associada à capacidade de resposta a uma maior diversidade de patógenos. Neste estudo, analisamos dados do projeto 1000 Genomas (1000G), que sequenciou indivíduos de diferentes populações usando sequenciamento de nova geração (NGS, do inglês, Next Generation Sequencing). Essa técnica de sequenciamento é conhecidamente problemática quando aplicada a regiões altamente polimórficas, como os genes HLA. Por isso, avaliamos a confiabilidade dos genótipos e frequências alélicas estimados a partir dos dados do 1000G nos genes HLA, utilizando como padrão ouro dados de sequenciamento Sanger de 930 das 1092 amostras do 1000G. Encontramos um viés de superestimativa da frequência do alelo referência em alguns polimorfismos de nucleotídeo único (SNPs, do inglês, Single Nucleotide Polimorphisms), indicando que viés de mapeamento é uma causa importante de erros nos dados do 1000G. Esses resultados são relevantes para a compreensão dos desafios do uso de dados de NGS em outras regiões de alta diversidade. Usando os resultados dessa análise, excluímos de nosso estudo de diferenciação populacional sítios com estimativas de frequências alélicas pouco confiáveis nos dados do 1000G. Em uma segunda etapa de controle metodológico, demonstramos o efeito do uso de dados ricos em variantes raras em estudos de diferenciação populacional. Controlando para esse efeito, e usando apenas sítios que demonstramos ser confiáveis em nossos dados, descobrimos que a diferenciação populacional de SNPs nos genes HLA é menor que a diferenciação de SNPs em outras regiões do genoma. Esse resultado aponta para um papel predominante de pressões seletivas globais na distribuição da variação genética de HLA entre populações. Contudo, apresentamos também evidências de que a diferenciação populacional de haplótipos nos genes HLA pode ser maior do que a observada no nível dos SNPs, sugerindo que pressões locais podem influenciar a distribuição de haplótipos entre populações. Nossos achados indicam que é possível reconciliar baixa diferenciação populacional em SNPs com maior diferenciação em haplótipos, possivelmente sujeitos a pressões seletivas locais.
id USP_e164643a612385917c2ced32efedffd5
oai_identifier_str oai:teses.usp.br:tde-25092015-104711
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Diferenciação populacional em genes sob forte seleção balanceadora:um estudo de caso com genes HLA.Population differentiation at genes under strong balancing selection: a case study on the HLA genes1000 genomas1000 genomesDiferenciação populacionalHLAHLAPopulation differentiationSeleção balanceadora é definida como aquela que aumenta a variabilidade genética de populações em relação ao esperado sob neutralidade. Uma expectativa sobre seus efeitos é a redução da diferenciação populacional nos genes onde atua. Contudo, regimes que mantêm conjuntos distintos de alelos em diferentes populações poderiam resultar em aumento de diferenciação populacional. Com o objetivo de compreender melhor os efeitos da seleção balanceadora sobre a distribuição da variação genética entre populações, investigamos a diferenciação populacional em genes dos Antígenos Leucocitários Humanos (HLA, do inglês, Human Leukocyte Antigen), que são os genes mais polimórficos do genoma humano e o exemplo mais clássico de seleção balanceadora em humanos. As proteínas HLA são responsáveis pela apresentação de peptídeos aos linfócitos T, mediando uma etapa crítica da resposta imune. A vantagem da manutenção de variação nesses genes está possivelmente associada à capacidade de resposta a uma maior diversidade de patógenos. Neste estudo, analisamos dados do projeto 1000 Genomas (1000G), que sequenciou indivíduos de diferentes populações usando sequenciamento de nova geração (NGS, do inglês, Next Generation Sequencing). Essa técnica de sequenciamento é conhecidamente problemática quando aplicada a regiões altamente polimórficas, como os genes HLA. Por isso, avaliamos a confiabilidade dos genótipos e frequências alélicas estimados a partir dos dados do 1000G nos genes HLA, utilizando como padrão ouro dados de sequenciamento Sanger de 930 das 1092 amostras do 1000G. Encontramos um viés de superestimativa da frequência do alelo referência em alguns polimorfismos de nucleotídeo único (SNPs, do inglês, Single Nucleotide Polimorphisms), indicando que viés de mapeamento é uma causa importante de erros nos dados do 1000G. Esses resultados são relevantes para a compreensão dos desafios do uso de dados de NGS em outras regiões de alta diversidade. Usando os resultados dessa análise, excluímos de nosso estudo de diferenciação populacional sítios com estimativas de frequências alélicas pouco confiáveis nos dados do 1000G. Em uma segunda etapa de controle metodológico, demonstramos o efeito do uso de dados ricos em variantes raras em estudos de diferenciação populacional. Controlando para esse efeito, e usando apenas sítios que demonstramos ser confiáveis em nossos dados, descobrimos que a diferenciação populacional de SNPs nos genes HLA é menor que a diferenciação de SNPs em outras regiões do genoma. Esse resultado aponta para um papel predominante de pressões seletivas globais na distribuição da variação genética de HLA entre populações. Contudo, apresentamos também evidências de que a diferenciação populacional de haplótipos nos genes HLA pode ser maior do que a observada no nível dos SNPs, sugerindo que pressões locais podem influenciar a distribuição de haplótipos entre populações. Nossos achados indicam que é possível reconciliar baixa diferenciação populacional em SNPs com maior diferenciação em haplótipos, possivelmente sujeitos a pressões seletivas locais.Balancing selection is defined as any kind of selective regime that increases genetic variability in populations relative to what is expected under neutrality. Theory predicts that balancing selection reduces population differentiation. However, balancing selection regimes in which different sets of alleles are maintained in different populations could increase population differentiation. To better understand the effects of balancing selection on the distribution of genetic variation among populations, we investigated population differentiation at the Human Leukocyte Antigen (HLA) genes, which are the most polymorphic genes in the human genome, and constitute the most striking example of balancing selection in humans. The HLA molecules are responsible for the presentation of peptides to T cells, thus mediating a critical step of the immune response. The advantage of maintaining variation in those genes through balancing selection is possibly related to the increased ability of the immune system to respond to a wider variety of pathogens. In this study, we analysed the public dataset of the 1000 Genomes project (1000G), which sequenced 1092 individuals from different populations using Next Generation Sequencing (NGS) technologies. These sequencing techniques are known to be problematic when applied to highly polymorphic genomic regions, such as the HLA genes. Therefore, we evaluated the reliability of genotype calls and allele frequency estimates of the SNPs reported by 1000G at HLA genes, using Sanger sequencing data of 930 of the 1092 1000G samples as a gold standard. We found a bias towards overestimation of reference allele frequency for some single nucleotide polymorphisms (SNPs), indicating mapping bias is an important cause of error in frequency estimation in the 1000G data. These results provide insights into the challenges of using of NGS data at other genomic regions of high diversity. Using the results of this analysis, we selected a list of sites that have reliable allele frequency estimates in the 1000G data to be used in our population differentiation study. In another methodological control, we demonstrate the effect of using a dataset rich in rare variants in population differentiation studies. Controlling for this effect, and using only the sites which we demonstrated that were reliable, we found that population differentiation of single nucleotide polymorphisms (SNPs) at the HLA genes is lower than that of SNPs in other genomic regions. This suggests a predominant role of global selective pressures in shaping the distribution of variation at the HLA genes among populations. However, we also show evidence that population differentiation of HLA haplotypes may be higher than what we observe at the SNP level, suggesting that local selective pressures may influence the distribution of haplotypes among populations. Altogether, our results indicate that it is possible to reconcile low population differentiation at the SNP level - as predicted by theory - to higher differentiation at haplotypes, which are possibly under local selective pressures.Biblioteca Digitais de Teses e Dissertações da USPMeyer, DiogoBrandt, Débora Yoshihara Caldeira2015-06-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/41/41131/tde-25092015-104711/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2019-09-24T06:00:11Zoai:teses.usp.br:tde-25092015-104711Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-09-24T06:00:11Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Diferenciação populacional em genes sob forte seleção balanceadora:um estudo de caso com genes HLA.
Population differentiation at genes under strong balancing selection: a case study on the HLA genes
title Diferenciação populacional em genes sob forte seleção balanceadora:um estudo de caso com genes HLA.
spellingShingle Diferenciação populacional em genes sob forte seleção balanceadora:um estudo de caso com genes HLA.
Brandt, Débora Yoshihara Caldeira
1000 genomas
1000 genomes
Diferenciação populacional
HLA
HLA
Population differentiation
title_short Diferenciação populacional em genes sob forte seleção balanceadora:um estudo de caso com genes HLA.
title_full Diferenciação populacional em genes sob forte seleção balanceadora:um estudo de caso com genes HLA.
title_fullStr Diferenciação populacional em genes sob forte seleção balanceadora:um estudo de caso com genes HLA.
title_full_unstemmed Diferenciação populacional em genes sob forte seleção balanceadora:um estudo de caso com genes HLA.
title_sort Diferenciação populacional em genes sob forte seleção balanceadora:um estudo de caso com genes HLA.
author Brandt, Débora Yoshihara Caldeira
author_facet Brandt, Débora Yoshihara Caldeira
author_role author
dc.contributor.none.fl_str_mv Meyer, Diogo
dc.contributor.author.fl_str_mv Brandt, Débora Yoshihara Caldeira
dc.subject.por.fl_str_mv 1000 genomas
1000 genomes
Diferenciação populacional
HLA
HLA
Population differentiation
topic 1000 genomas
1000 genomes
Diferenciação populacional
HLA
HLA
Population differentiation
description Seleção balanceadora é definida como aquela que aumenta a variabilidade genética de populações em relação ao esperado sob neutralidade. Uma expectativa sobre seus efeitos é a redução da diferenciação populacional nos genes onde atua. Contudo, regimes que mantêm conjuntos distintos de alelos em diferentes populações poderiam resultar em aumento de diferenciação populacional. Com o objetivo de compreender melhor os efeitos da seleção balanceadora sobre a distribuição da variação genética entre populações, investigamos a diferenciação populacional em genes dos Antígenos Leucocitários Humanos (HLA, do inglês, Human Leukocyte Antigen), que são os genes mais polimórficos do genoma humano e o exemplo mais clássico de seleção balanceadora em humanos. As proteínas HLA são responsáveis pela apresentação de peptídeos aos linfócitos T, mediando uma etapa crítica da resposta imune. A vantagem da manutenção de variação nesses genes está possivelmente associada à capacidade de resposta a uma maior diversidade de patógenos. Neste estudo, analisamos dados do projeto 1000 Genomas (1000G), que sequenciou indivíduos de diferentes populações usando sequenciamento de nova geração (NGS, do inglês, Next Generation Sequencing). Essa técnica de sequenciamento é conhecidamente problemática quando aplicada a regiões altamente polimórficas, como os genes HLA. Por isso, avaliamos a confiabilidade dos genótipos e frequências alélicas estimados a partir dos dados do 1000G nos genes HLA, utilizando como padrão ouro dados de sequenciamento Sanger de 930 das 1092 amostras do 1000G. Encontramos um viés de superestimativa da frequência do alelo referência em alguns polimorfismos de nucleotídeo único (SNPs, do inglês, Single Nucleotide Polimorphisms), indicando que viés de mapeamento é uma causa importante de erros nos dados do 1000G. Esses resultados são relevantes para a compreensão dos desafios do uso de dados de NGS em outras regiões de alta diversidade. Usando os resultados dessa análise, excluímos de nosso estudo de diferenciação populacional sítios com estimativas de frequências alélicas pouco confiáveis nos dados do 1000G. Em uma segunda etapa de controle metodológico, demonstramos o efeito do uso de dados ricos em variantes raras em estudos de diferenciação populacional. Controlando para esse efeito, e usando apenas sítios que demonstramos ser confiáveis em nossos dados, descobrimos que a diferenciação populacional de SNPs nos genes HLA é menor que a diferenciação de SNPs em outras regiões do genoma. Esse resultado aponta para um papel predominante de pressões seletivas globais na distribuição da variação genética de HLA entre populações. Contudo, apresentamos também evidências de que a diferenciação populacional de haplótipos nos genes HLA pode ser maior do que a observada no nível dos SNPs, sugerindo que pressões locais podem influenciar a distribuição de haplótipos entre populações. Nossos achados indicam que é possível reconciliar baixa diferenciação populacional em SNPs com maior diferenciação em haplótipos, possivelmente sujeitos a pressões seletivas locais.
publishDate 2015
dc.date.none.fl_str_mv 2015-06-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/41/41131/tde-25092015-104711/
url http://www.teses.usp.br/teses/disponiveis/41/41131/tde-25092015-104711/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815258448470736896