Métodos estatísticos aplicados à análise da expressão gênica
| Ano de defesa: | 2006 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
|
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Estatística - PPGEs
|
| Departamento: |
Não Informado pela instituição
|
| País: |
BR
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufscar.br/handle/20.500.14289/4596 |
Resumo: | The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression. |
| id |
SCAR_f501acd9a893706845f100a85d114e5d |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/4596 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Saraiva, Erlandson FerreiraMilan, Luis Aparecido78d3f62d-90b4-4fe7-9d21-ed78d7dab9d32016-06-02T20:06:11Z2007-10-192016-06-02T20:06:11Z2006-02-23https://repositorio.ufscar.br/handle/20.500.14289/4596The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression.A tecnologia dos arranjos de DNA (DNA-array) é uma ferramenta utilizada para identificar e comparar níveis de expressão de um grande número de genes ou fragmentos de genes simultaneamente, em condições diferentes. Com esta comparação, é possível determinar possíveis genes causadores de doenças de origem genética (por exemplo, o câncer). Nestes experimentos, grandes quantidades de dados numéricos (relacionados às medidas de níveis de expressão dos genes) são gerados e métodos estatísticos são im- portantes para análise dos dados, com objetivo de identificar os genes que apresentam evidências para níveis de expressão diferentes. O objetivo de nossa pesquisa é comparar o desempenho e desenvolver métodos estatísticos, capazes de identificar genes que apresentam evidências para níveis de expressão diferentes, quando comparamos situações de interesse (tratamentos) com uma situação de controle. Para isto, descrevemos o teste t, proposto por Baldi e Long (2001) e propomos três métodos para identificar genes com evidências para níveis de expressão diferentes. O primeiro método proposto é baseado na utilização da inferência bayesiana paramétrica e dos métodos de seleção de modelos, fator de Bayes e DIC; o segundo método é baseado na inferência bayesiana semi-paramétrica conhecida como modelo de misturas de processos Dirichlet; e o terceiro método é baseado na utilização de um modelo com mistura infinita de distribuições, que aplicado à análise da expressão gênica determina grupos de níveis de expressão gênica similares, baseados nos efeitos de tratamento.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Estatística - PPGEsUFSCarBREstatística matemáticaExpressão gênicaInferência bayesianaSeleção de modelosProcessos de DirichletArranjos de DNATeste tModelo com mistura de distribuiçõesInferência bayesiana não paramétricaCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICAMétodos estatísticos aplicados à análise da expressão gênicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-101874dfd-bd1b-409c-81e8-3185c83eacf2info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTDissEFS.pdf.txtDissEFS.pdf.txtExtracted texttext/plain106436https://repositorio.ufscar.br/bitstreams/56671190-43eb-4cc2-9e3c-716c249d1b9b/downloadd42fdd03ccb84398ac28d2bd9cc8758dMD53falseAnonymousREADORIGINALDissEFS.pdfapplication/pdf1135537https://repositorio.ufscar.br/bitstreams/1430f35c-0efc-4541-9f36-012543282759/downloadb92ac0d09924bd51723ad77018da04deMD51trueAnonymousREADTHUMBNAILDissEFS.pdf.jpgDissEFS.pdf.jpgIM Thumbnailimage/jpeg6389https://repositorio.ufscar.br/bitstreams/18931db6-538d-4970-89db-27f57470b235/download1f0388679023d9663cf030181434aa0cMD52falseAnonymousREAD20.500.14289/45962025-02-05 16:23:45.878open.accessoai:repositorio.ufscar.br:20.500.14289/4596https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-05T19:23:45Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.por.fl_str_mv |
Métodos estatísticos aplicados à análise da expressão gênica |
| title |
Métodos estatísticos aplicados à análise da expressão gênica |
| spellingShingle |
Métodos estatísticos aplicados à análise da expressão gênica Saraiva, Erlandson Ferreira Estatística matemática Expressão gênica Inferência bayesiana Seleção de modelos Processos de Dirichlet Arranjos de DNA Teste t Modelo com mistura de distribuições Inferência bayesiana não paramétrica CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
| title_short |
Métodos estatísticos aplicados à análise da expressão gênica |
| title_full |
Métodos estatísticos aplicados à análise da expressão gênica |
| title_fullStr |
Métodos estatísticos aplicados à análise da expressão gênica |
| title_full_unstemmed |
Métodos estatísticos aplicados à análise da expressão gênica |
| title_sort |
Métodos estatísticos aplicados à análise da expressão gênica |
| author |
Saraiva, Erlandson Ferreira |
| author_facet |
Saraiva, Erlandson Ferreira |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Saraiva, Erlandson Ferreira |
| dc.contributor.advisor1.fl_str_mv |
Milan, Luis Aparecido |
| dc.contributor.authorID.fl_str_mv |
78d3f62d-90b4-4fe7-9d21-ed78d7dab9d3 |
| contributor_str_mv |
Milan, Luis Aparecido |
| dc.subject.por.fl_str_mv |
Estatística matemática Expressão gênica Inferência bayesiana Seleção de modelos Processos de Dirichlet Arranjos de DNA Teste t Modelo com mistura de distribuições Inferência bayesiana não paramétrica |
| topic |
Estatística matemática Expressão gênica Inferência bayesiana Seleção de modelos Processos de Dirichlet Arranjos de DNA Teste t Modelo com mistura de distribuições Inferência bayesiana não paramétrica CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
| description |
The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression. |
| publishDate |
2006 |
| dc.date.issued.fl_str_mv |
2006-02-23 |
| dc.date.available.fl_str_mv |
2007-10-19 2016-06-02T20:06:11Z |
| dc.date.accessioned.fl_str_mv |
2016-06-02T20:06:11Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/20.500.14289/4596 |
| url |
https://repositorio.ufscar.br/handle/20.500.14289/4596 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.confidence.fl_str_mv |
-1 -1 |
| dc.relation.authority.fl_str_mv |
01874dfd-bd1b-409c-81e8-3185c83eacf2 |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Estatística - PPGEs |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| dc.publisher.country.fl_str_mv |
BR |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/56671190-43eb-4cc2-9e3c-716c249d1b9b/download https://repositorio.ufscar.br/bitstreams/1430f35c-0efc-4541-9f36-012543282759/download https://repositorio.ufscar.br/bitstreams/18931db6-538d-4970-89db-27f57470b235/download |
| bitstream.checksum.fl_str_mv |
d42fdd03ccb84398ac28d2bd9cc8758d b92ac0d09924bd51723ad77018da04de 1f0388679023d9663cf030181434aa0c |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688759124295680 |