Desenvolvimento de um pipeline para anáise genômica de metilação do DNA
| Ano de defesa: | 2016 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://teses.usp.br/teses/disponiveis/95/95131/tde-20230725-114652/ |
Resumo: | Background A metilação do DNA é uma das principais modificações epigen eticas estudadas. A plataforma Illumina In nium HumanMethylation450 oferece o menor custo para interrogar o status de metilação de 480.000 dinucleot deos CpG distribu dos pelo genoma. Para o estudo do padrão de metilação, os dados sao extra dos pelo software GenomeStudio e podem ser analisados neste software ou exportados para analises estatisticas, em geral realizadas em uma das inumeras pipelines descritas na literatura. Neste nosso trabalho, apresentamos o uso uma analise de metilaçao diferencial que considere uma relaçao de interdependencia entre as CpGs, sem a necessidade de assumir a normalidade dos dados e sem a necessidade da aplicaçao da correçao para m ultiplas testagens. Em nosso trabalho comparamos quatro testes estat sticos, o teste t Student, o teste Wilcoxon e o teste Empírico de Bayes, utilizados nas pipelines de analise de metilaçao ChAMP, RNBeads e IMA, e o m etodo QUOR, atraves de um unico uxo de analise. Relacionamos as posiçoes diferencialmente metiladas (DMPs) detectadas entre os 4 testes para determinar quais sao as diferen cas entre os testes. Analisamos também o uso do valor Beta e do valor M, que sao medidas para mensurar o valor de metilaçao, entre os 4 testes. ; Resultados O numero de DMPs detectadas entre os tres testes, o teste t Student, o teste Wilcoxon e o teste Empírico de Bayes, foi muito proximos. Conforme aumentamos o corte de confianca para o metodo QUOR, mais as DMPs detectadas estao em intersecçao as DMPs detectadas pelos tres testes e ao utilizar um valor de corte de confianca 0.9999, conseguimos encontrar as DMPs que sao realmente diferencialmente metiladas. A relaçao das DMPs detectadas pelos testes t Student, o teste Wilcoxon e o teste Emp rico de Bayes, apresentam baixo valor de confiança, demonstrando que nao ha uma diferença de metilaçao significativa nestas DMPs detectadas. ; Discussao O valor de Beta se mostra menos confiavel em comparaçao do valor M. Os testes t Student, o teste Wilcoxon e o teste Empírico de Bayes nao demonstraram muita diferenca na detecçao das DMPs entre eles. O QUOR necessita utilizar um valor de confianca muito alto para determinar as DMPs com diferenca de metilaçao significativa. ; Conclusao Atualmente, os microarrays para analise de metilaçao de DNA sao plataformas de baixo custo e grande abrangencia. O desafio encontra-se na analise da imensa quantidade de dados gerados. É preferível o uso do valor M ao inves do valor Beta, cada conjunto de dados deve ser investigado e aplicar diferentes tipos de filtragens, normalizaçoes e correçoes. O fuxo que desenvolvemos pode ser aplicado primariamente para detecçao das DMPs em casos onde nao está muito bem definido a hipotese. Outras abordagens poderao ser tomadas para o melhoramento do resultado. |
| id |
USP_47dd1711763ea20fdb04b00a0ccc2ba1 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-20230725-114652 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Desenvolvimento de um pipeline para anáise genômica de metilação do DNAPipeline of genomic analysis of DNA methylationGenômicaMetilação de DNABackground A metilação do DNA é uma das principais modificações epigen eticas estudadas. A plataforma Illumina In nium HumanMethylation450 oferece o menor custo para interrogar o status de metilação de 480.000 dinucleot deos CpG distribu dos pelo genoma. Para o estudo do padrão de metilação, os dados sao extra dos pelo software GenomeStudio e podem ser analisados neste software ou exportados para analises estatisticas, em geral realizadas em uma das inumeras pipelines descritas na literatura. Neste nosso trabalho, apresentamos o uso uma analise de metilaçao diferencial que considere uma relaçao de interdependencia entre as CpGs, sem a necessidade de assumir a normalidade dos dados e sem a necessidade da aplicaçao da correçao para m ultiplas testagens. Em nosso trabalho comparamos quatro testes estat sticos, o teste t Student, o teste Wilcoxon e o teste Empírico de Bayes, utilizados nas pipelines de analise de metilaçao ChAMP, RNBeads e IMA, e o m etodo QUOR, atraves de um unico uxo de analise. Relacionamos as posiçoes diferencialmente metiladas (DMPs) detectadas entre os 4 testes para determinar quais sao as diferen cas entre os testes. Analisamos também o uso do valor Beta e do valor M, que sao medidas para mensurar o valor de metilaçao, entre os 4 testes. ; Resultados O numero de DMPs detectadas entre os tres testes, o teste t Student, o teste Wilcoxon e o teste Empírico de Bayes, foi muito proximos. Conforme aumentamos o corte de confianca para o metodo QUOR, mais as DMPs detectadas estao em intersecçao as DMPs detectadas pelos tres testes e ao utilizar um valor de corte de confianca 0.9999, conseguimos encontrar as DMPs que sao realmente diferencialmente metiladas. A relaçao das DMPs detectadas pelos testes t Student, o teste Wilcoxon e o teste Emp rico de Bayes, apresentam baixo valor de confiança, demonstrando que nao ha uma diferença de metilaçao significativa nestas DMPs detectadas. ; Discussao O valor de Beta se mostra menos confiavel em comparaçao do valor M. Os testes t Student, o teste Wilcoxon e o teste Empírico de Bayes nao demonstraram muita diferenca na detecçao das DMPs entre eles. O QUOR necessita utilizar um valor de confianca muito alto para determinar as DMPs com diferenca de metilaçao significativa. ; Conclusao Atualmente, os microarrays para analise de metilaçao de DNA sao plataformas de baixo custo e grande abrangencia. O desafio encontra-se na analise da imensa quantidade de dados gerados. É preferível o uso do valor M ao inves do valor Beta, cada conjunto de dados deve ser investigado e aplicar diferentes tipos de filtragens, normalizaçoes e correçoes. O fuxo que desenvolvemos pode ser aplicado primariamente para detecçao das DMPs em casos onde nao está muito bem definido a hipotese. Outras abordagens poderao ser tomadas para o melhoramento do resultado.Background The DNA methylation is a major epigenetic changes studied. The Illumina In nium HumanMethylation450 platform provides the lowest cost to interrogate the methylation status of 480,000 CpG dinucleotide distributed throughout the genome. For the study of methylation pattern, the data is extracted by GenomeStudio software and can be analyzed in software or exported for statistical analysis in general carried out in one of the numerous pipelines described in the literature. In our work, we present the use of di erential methylation analysis that considers an interdependent relationship between CpG without the need to assume the normality of the data and without the need to apply the correction for multiple testings. In our study we compare four statistical tests, Student's t test, Wilcoxon test and the empirical Bayes test, used in methylation analysis pipelines ChAMP, RNBeads and IMA, and Quor method, through a single analysis ow. We relate the di erentially methylated positions (DMPs) detected among the 4 tests to determine what are the di erences between tests. We also analyzed the use of beta value and the M value, which is measured to measure the methylation value among the four tests. ; Results The number of DMPs detected between the three tests, the Student t test, Wilcoxon test and the empirical Bayes test, was very close. As we increase the con dence of court for Quor method detected more DMPs are in the intersection DMPs detected by three tests and using a reliable cuto 0.9999, we nd the DMPs that are truly di erentially methylated. The list of DMPs detected by Student t test, Wilcoxon test and the empirical Bayes test, have a low amount of con dence, demonstrating that there is no signi cant di erence in these methylation detected DMPs. ; Discuss The value of Beta proves less reliable in comparison of the value M. The test t Student, the Wilcoxon test and the empirical Bayes test did not show much di erence in the detection of DMPs between them. The Quor need to use a very high con dence value to determine the DMPs with signi cant methylation di erence. ; Conclusion Currently, the microarray for DNA methylation analysis are platforms low cost and wide coverage. The challenge lies in the analysis of the vast amount of generated data. It is preferable to use the value M rather than the beta value, each set of data should be investigated and apply di erent types of ltering, normalization and corrections. The ow we developed can be applied primarily for the detection of DMPs in cases where it is not very well de ned hypothesis. Other approaches can be taken to improve the result.Biblioteca Digitais de Teses e Dissertações da USPHelena Paula BrentaniVieira, Henrique Cursino2016-05-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/95/95131/tde-20230725-114652/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-07-27T13:52:05Zoai:teses.usp.br:tde-20230725-114652Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-07-27T13:52:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Desenvolvimento de um pipeline para anáise genômica de metilação do DNA Pipeline of genomic analysis of DNA methylation |
| title |
Desenvolvimento de um pipeline para anáise genômica de metilação do DNA |
| spellingShingle |
Desenvolvimento de um pipeline para anáise genômica de metilação do DNA Vieira, Henrique Cursino Genômica Metilação de DNA |
| title_short |
Desenvolvimento de um pipeline para anáise genômica de metilação do DNA |
| title_full |
Desenvolvimento de um pipeline para anáise genômica de metilação do DNA |
| title_fullStr |
Desenvolvimento de um pipeline para anáise genômica de metilação do DNA |
| title_full_unstemmed |
Desenvolvimento de um pipeline para anáise genômica de metilação do DNA |
| title_sort |
Desenvolvimento de um pipeline para anáise genômica de metilação do DNA |
| author |
Vieira, Henrique Cursino |
| author_facet |
Vieira, Henrique Cursino |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Helena Paula Brentani |
| dc.contributor.author.fl_str_mv |
Vieira, Henrique Cursino |
| dc.subject.por.fl_str_mv |
Genômica Metilação de DNA |
| topic |
Genômica Metilação de DNA |
| description |
Background A metilação do DNA é uma das principais modificações epigen eticas estudadas. A plataforma Illumina In nium HumanMethylation450 oferece o menor custo para interrogar o status de metilação de 480.000 dinucleot deos CpG distribu dos pelo genoma. Para o estudo do padrão de metilação, os dados sao extra dos pelo software GenomeStudio e podem ser analisados neste software ou exportados para analises estatisticas, em geral realizadas em uma das inumeras pipelines descritas na literatura. Neste nosso trabalho, apresentamos o uso uma analise de metilaçao diferencial que considere uma relaçao de interdependencia entre as CpGs, sem a necessidade de assumir a normalidade dos dados e sem a necessidade da aplicaçao da correçao para m ultiplas testagens. Em nosso trabalho comparamos quatro testes estat sticos, o teste t Student, o teste Wilcoxon e o teste Empírico de Bayes, utilizados nas pipelines de analise de metilaçao ChAMP, RNBeads e IMA, e o m etodo QUOR, atraves de um unico uxo de analise. Relacionamos as posiçoes diferencialmente metiladas (DMPs) detectadas entre os 4 testes para determinar quais sao as diferen cas entre os testes. Analisamos também o uso do valor Beta e do valor M, que sao medidas para mensurar o valor de metilaçao, entre os 4 testes. ; Resultados O numero de DMPs detectadas entre os tres testes, o teste t Student, o teste Wilcoxon e o teste Empírico de Bayes, foi muito proximos. Conforme aumentamos o corte de confianca para o metodo QUOR, mais as DMPs detectadas estao em intersecçao as DMPs detectadas pelos tres testes e ao utilizar um valor de corte de confianca 0.9999, conseguimos encontrar as DMPs que sao realmente diferencialmente metiladas. A relaçao das DMPs detectadas pelos testes t Student, o teste Wilcoxon e o teste Emp rico de Bayes, apresentam baixo valor de confiança, demonstrando que nao ha uma diferença de metilaçao significativa nestas DMPs detectadas. ; Discussao O valor de Beta se mostra menos confiavel em comparaçao do valor M. Os testes t Student, o teste Wilcoxon e o teste Empírico de Bayes nao demonstraram muita diferenca na detecçao das DMPs entre eles. O QUOR necessita utilizar um valor de confianca muito alto para determinar as DMPs com diferenca de metilaçao significativa. ; Conclusao Atualmente, os microarrays para analise de metilaçao de DNA sao plataformas de baixo custo e grande abrangencia. O desafio encontra-se na analise da imensa quantidade de dados gerados. É preferível o uso do valor M ao inves do valor Beta, cada conjunto de dados deve ser investigado e aplicar diferentes tipos de filtragens, normalizaçoes e correçoes. O fuxo que desenvolvemos pode ser aplicado primariamente para detecçao das DMPs em casos onde nao está muito bem definido a hipotese. Outras abordagens poderao ser tomadas para o melhoramento do resultado. |
| publishDate |
2016 |
| dc.date.none.fl_str_mv |
2016-05-25 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://teses.usp.br/teses/disponiveis/95/95131/tde-20230725-114652/ |
| url |
https://teses.usp.br/teses/disponiveis/95/95131/tde-20230725-114652/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492577566851072 |