Métodos estatísticos aplicados à análise da expressão gênica

Detalhes bibliográficos
Ano de defesa: 2006
Autor(a) principal: Saraiva, Erlandson Ferreira
Orientador(a): Milan, Luis Aparecido
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Estatística - PPGEs
Departamento: Não Informado pela instituição
País: BR
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/4596
Resumo: The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression.
id SCAR_f501acd9a893706845f100a85d114e5d
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/4596
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Saraiva, Erlandson FerreiraMilan, Luis Aparecido78d3f62d-90b4-4fe7-9d21-ed78d7dab9d32016-06-02T20:06:11Z2007-10-192016-06-02T20:06:11Z2006-02-23https://repositorio.ufscar.br/handle/20.500.14289/4596The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression.A tecnologia dos arranjos de DNA (DNA-array) é uma ferramenta utilizada para identificar e comparar níveis de expressão de um grande número de genes ou fragmentos de genes simultaneamente, em condições diferentes. Com esta comparação, é possível determinar possíveis genes causadores de doenças de origem genética (por exemplo, o câncer). Nestes experimentos, grandes quantidades de dados numéricos (relacionados às medidas de níveis de expressão dos genes) são gerados e métodos estatísticos são im- portantes para análise dos dados, com objetivo de identificar os genes que apresentam evidências para níveis de expressão diferentes. O objetivo de nossa pesquisa é comparar o desempenho e desenvolver métodos estatísticos, capazes de identificar genes que apresentam evidências para níveis de expressão diferentes, quando comparamos situações de interesse (tratamentos) com uma situação de controle. Para isto, descrevemos o teste t, proposto por Baldi e Long (2001) e propomos três métodos para identificar genes com evidências para níveis de expressão diferentes. O primeiro método proposto é baseado na utilização da inferência bayesiana paramétrica e dos métodos de seleção de modelos, fator de Bayes e DIC; o segundo método é baseado na inferência bayesiana semi-paramétrica conhecida como modelo de misturas de processos Dirichlet; e o terceiro método é baseado na utilização de um modelo com mistura infinita de distribuições, que aplicado à análise da expressão gênica determina grupos de níveis de expressão gênica similares, baseados nos efeitos de tratamento.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Estatística - PPGEsUFSCarBREstatística matemáticaExpressão gênicaInferência bayesianaSeleção de modelosProcessos de DirichletArranjos de DNATeste tModelo com mistura de distribuiçõesInferência bayesiana não paramétricaCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICAMétodos estatísticos aplicados à análise da expressão gênicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-101874dfd-bd1b-409c-81e8-3185c83eacf2info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTDissEFS.pdf.txtDissEFS.pdf.txtExtracted texttext/plain106436https://repositorio.ufscar.br/bitstreams/56671190-43eb-4cc2-9e3c-716c249d1b9b/downloadd42fdd03ccb84398ac28d2bd9cc8758dMD53falseAnonymousREADORIGINALDissEFS.pdfapplication/pdf1135537https://repositorio.ufscar.br/bitstreams/1430f35c-0efc-4541-9f36-012543282759/downloadb92ac0d09924bd51723ad77018da04deMD51trueAnonymousREADTHUMBNAILDissEFS.pdf.jpgDissEFS.pdf.jpgIM Thumbnailimage/jpeg6389https://repositorio.ufscar.br/bitstreams/18931db6-538d-4970-89db-27f57470b235/download1f0388679023d9663cf030181434aa0cMD52falseAnonymousREAD20.500.14289/45962025-02-05 16:23:45.878open.accessoai:repositorio.ufscar.br:20.500.14289/4596https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-05T19:23:45Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Métodos estatísticos aplicados à análise da expressão gênica
title Métodos estatísticos aplicados à análise da expressão gênica
spellingShingle Métodos estatísticos aplicados à análise da expressão gênica
Saraiva, Erlandson Ferreira
Estatística matemática
Expressão gênica
Inferência bayesiana
Seleção de modelos
Processos de Dirichlet
Arranjos de DNA
Teste t
Modelo com mistura de distribuições
Inferência bayesiana não paramétrica
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
title_short Métodos estatísticos aplicados à análise da expressão gênica
title_full Métodos estatísticos aplicados à análise da expressão gênica
title_fullStr Métodos estatísticos aplicados à análise da expressão gênica
title_full_unstemmed Métodos estatísticos aplicados à análise da expressão gênica
title_sort Métodos estatísticos aplicados à análise da expressão gênica
author Saraiva, Erlandson Ferreira
author_facet Saraiva, Erlandson Ferreira
author_role author
dc.contributor.author.fl_str_mv Saraiva, Erlandson Ferreira
dc.contributor.advisor1.fl_str_mv Milan, Luis Aparecido
dc.contributor.authorID.fl_str_mv 78d3f62d-90b4-4fe7-9d21-ed78d7dab9d3
contributor_str_mv Milan, Luis Aparecido
dc.subject.por.fl_str_mv Estatística matemática
Expressão gênica
Inferência bayesiana
Seleção de modelos
Processos de Dirichlet
Arranjos de DNA
Teste t
Modelo com mistura de distribuições
Inferência bayesiana não paramétrica
topic Estatística matemática
Expressão gênica
Inferência bayesiana
Seleção de modelos
Processos de Dirichlet
Arranjos de DNA
Teste t
Modelo com mistura de distribuições
Inferência bayesiana não paramétrica
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
description The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression.
publishDate 2006
dc.date.issued.fl_str_mv 2006-02-23
dc.date.available.fl_str_mv 2007-10-19
2016-06-02T20:06:11Z
dc.date.accessioned.fl_str_mv 2016-06-02T20:06:11Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/4596
url https://repositorio.ufscar.br/handle/20.500.14289/4596
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv 01874dfd-bd1b-409c-81e8-3185c83eacf2
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística - PPGEs
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/56671190-43eb-4cc2-9e3c-716c249d1b9b/download
https://repositorio.ufscar.br/bitstreams/1430f35c-0efc-4541-9f36-012543282759/download
https://repositorio.ufscar.br/bitstreams/18931db6-538d-4970-89db-27f57470b235/download
bitstream.checksum.fl_str_mv d42fdd03ccb84398ac28d2bd9cc8758d
b92ac0d09924bd51723ad77018da04de
1f0388679023d9663cf030181434aa0c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688759124295680