Um modelo Bayesiano de meta-análise para dados de ChIP-Seq

Andrade, Pablo de Morais

Um modelo Bayesiano de meta-análise para dados de ChIP-Seq

Detalhes bibliográficos
Ano de defesa:	2017
Autor(a) principal:	Andrade, Pablo de Morais
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Tese
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Bayesian Model ChIP-Seq ChIP-Seq peak calling Estatística Bayesiana Meta-análise Meta-Analysis
Link de acesso:	http://www.teses.usp.br/teses/disponiveis/95/95131/tde-04102019-141931/
Resumo:	Com o desenvolvimento do sequenciamento em larga escala, novas tecnologias surgiram para auxiliar o estudo de sequências de ácidos nucleicos (DNA e cDNA); como consequência, o desenvolvimento de novas ferramentas para analisar o grande volume de dados gerados fez-se necessário. Entre essas novas tecnologias, uma, em particular, chamada Imunoprecipitação de Cromatina seguida de sequenciamento de DNA em larga escala ou CHIP-Seq, tem recebido muita atenção nos últimos anos. Esta tecnologia tornou-se um método usado amplamente para mapear sítios de ligação de proteínas de interesse no genoma. A análise de dados resultantes de experimentos de ChIP-Seq é desaadora porque o mapeamento das sequências no genoma apresenta diferentes formas de viés. Os métodos existentes usados para encontrar picos em dados de ChIP-Seq apresentam limitações relacionadas ao número de amostras de controle e tratamento usadas, e em relação à forma como essas amostras são combinadas. Nessa tese, mostramos que métodos baseados em testes estatísticos de hipótese tendem a encontrar um número muito maior de picos à medida que aumentamos o tamanho da amostra, o que os torna pouco conáveis para análise de um grande volume de dados. O presente estudo descreve um método estatístico Bayesiano, que utiliza meta-análise para encontrar sítios de ligação de proteínas de interesse no genoma resultante de experimentos de ChIPSeq. Esse métodos foi chamado Meta-Analysis Bayesian Approach ou MABayApp. Nós mostramos que o nosso método é robusto e pode ser utilizado com diferentes números de amostras de controle e tratamentos, assim como quando comparando amostras provenientes de diferentes tratamentos.

Metadados do item

id	USP_03e0985c44050302c700e536836d22de
oai_identifier_str	oai:teses.usp.br:tde-04102019-141931
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling	Um modelo Bayesiano de meta-análise para dados de ChIP-SeqA meta-analysis Bayesian model for ChIP-Seq dataBayesian ModelChIP-SeqChIP-Seq peak callingEstatística BayesianaMeta-análiseMeta-AnalysisCom o desenvolvimento do sequenciamento em larga escala, novas tecnologias surgiram para auxiliar o estudo de sequências de ácidos nucleicos (DNA e cDNA); como consequência, o desenvolvimento de novas ferramentas para analisar o grande volume de dados gerados fez-se necessário. Entre essas novas tecnologias, uma, em particular, chamada Imunoprecipitação de Cromatina seguida de sequenciamento de DNA em larga escala ou CHIP-Seq, tem recebido muita atenção nos últimos anos. Esta tecnologia tornou-se um método usado amplamente para mapear sítios de ligação de proteínas de interesse no genoma. A análise de dados resultantes de experimentos de ChIP-Seq é desaadora porque o mapeamento das sequências no genoma apresenta diferentes formas de viés. Os métodos existentes usados para encontrar picos em dados de ChIP-Seq apresentam limitações relacionadas ao número de amostras de controle e tratamento usadas, e em relação à forma como essas amostras são combinadas. Nessa tese, mostramos que métodos baseados em testes estatísticos de hipótese tendem a encontrar um número muito maior de picos à medida que aumentamos o tamanho da amostra, o que os torna pouco conáveis para análise de um grande volume de dados. O presente estudo descreve um método estatístico Bayesiano, que utiliza meta-análise para encontrar sítios de ligação de proteínas de interesse no genoma resultante de experimentos de ChIPSeq. Esse métodos foi chamado Meta-Analysis Bayesian Approach ou MABayApp. Nós mostramos que o nosso método é robusto e pode ser utilizado com diferentes números de amostras de controle e tratamentos, assim como quando comparando amostras provenientes de diferentes tratamentos.With the development of high-throughput sequencing, new technologies emerged for the study of nucleic acid sequences (DNA and cDNA) and as a consequence, the necessity for tools to analyse a great volume of data was made necessary. Among these new technologies, one in special Chromatin Immunoprecipitation followed by massive parallel DNA Sequencing, or ChIP-Seq, has been evidenced during the last years. This technology has become a widely used method to map locations of binding sites for a given protein in the genome. The analysis of data resulting from ChIP-Seq experiments is challenging since it can have dierent sources of bias during the sequencing and mapping of reads to the genome. Current methods used to nd peaks in this ChIP-Seq have limitations regarding the number of treatment and control samples used and on how these samples should be used together. In this thesis we show that since most of these methods are based on traditional statistical hypothesis tests, by increasing the sample size the number of peaks considered signicant changes considerably. This study describes a Bayesian statistical method using meta-analysis to discover binding sites of a protein of interest based on peaks of reads found in ChIP-Seq data. We call it Meta- Analysis Bayesian Approach or MABayApp. We show that our method is robust and can be used for dierent number of control and treatment samples, as well as when comparing samples under dierent treatments.Biblioteca Digitais de Teses e Dissertações da USPPereira, Carlos Alberto de BragancaAndrade, Pablo de Morais2017-04-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/95/95131/tde-04102019-141931/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2019-11-08T20:38:48Zoai:teses.usp.br:tde-04102019-141931Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212019-11-08T20:38:48Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Um modelo Bayesiano de meta-análise para dados de ChIP-Seq A meta-analysis Bayesian model for ChIP-Seq data
title	Um modelo Bayesiano de meta-análise para dados de ChIP-Seq
spellingShingle	Um modelo Bayesiano de meta-análise para dados de ChIP-Seq Andrade, Pablo de Morais Bayesian Model ChIP-Seq ChIP-Seq peak calling Estatística Bayesiana Meta-análise Meta-Analysis
title_short	Um modelo Bayesiano de meta-análise para dados de ChIP-Seq
title_full	Um modelo Bayesiano de meta-análise para dados de ChIP-Seq
title_fullStr	Um modelo Bayesiano de meta-análise para dados de ChIP-Seq
title_full_unstemmed	Um modelo Bayesiano de meta-análise para dados de ChIP-Seq
title_sort	Um modelo Bayesiano de meta-análise para dados de ChIP-Seq
author	Andrade, Pablo de Morais
author_facet	Andrade, Pablo de Morais
author_role	author
dc.contributor.none.fl_str_mv	Pereira, Carlos Alberto de Braganca
dc.contributor.author.fl_str_mv	Andrade, Pablo de Morais
dc.subject.por.fl_str_mv	Bayesian Model ChIP-Seq ChIP-Seq peak calling Estatística Bayesiana Meta-análise Meta-Analysis
topic	Bayesian Model ChIP-Seq ChIP-Seq peak calling Estatística Bayesiana Meta-análise Meta-Analysis
description	Com o desenvolvimento do sequenciamento em larga escala, novas tecnologias surgiram para auxiliar o estudo de sequências de ácidos nucleicos (DNA e cDNA); como consequência, o desenvolvimento de novas ferramentas para analisar o grande volume de dados gerados fez-se necessário. Entre essas novas tecnologias, uma, em particular, chamada Imunoprecipitação de Cromatina seguida de sequenciamento de DNA em larga escala ou CHIP-Seq, tem recebido muita atenção nos últimos anos. Esta tecnologia tornou-se um método usado amplamente para mapear sítios de ligação de proteínas de interesse no genoma. A análise de dados resultantes de experimentos de ChIP-Seq é desaadora porque o mapeamento das sequências no genoma apresenta diferentes formas de viés. Os métodos existentes usados para encontrar picos em dados de ChIP-Seq apresentam limitações relacionadas ao número de amostras de controle e tratamento usadas, e em relação à forma como essas amostras são combinadas. Nessa tese, mostramos que métodos baseados em testes estatísticos de hipótese tendem a encontrar um número muito maior de picos à medida que aumentamos o tamanho da amostra, o que os torna pouco conáveis para análise de um grande volume de dados. O presente estudo descreve um método estatístico Bayesiano, que utiliza meta-análise para encontrar sítios de ligação de proteínas de interesse no genoma resultante de experimentos de ChIPSeq. Esse métodos foi chamado Meta-Analysis Bayesian Approach ou MABayApp. Nós mostramos que o nosso método é robusto e pode ser utilizado com diferentes números de amostras de controle e tratamentos, assim como quando comparando amostras provenientes de diferentes tratamentos.
publishDate	2017
dc.date.none.fl_str_mv	2017-04-17
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://www.teses.usp.br/teses/disponiveis/95/95131/tde-04102019-141931/
url	http://www.teses.usp.br/teses/disponiveis/95/95131/tde-04102019-141931/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1865490883518922752

Um modelo Bayesiano de meta-análise para dados de ChIP-Seq

Registros relacionados