Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica
| Ano de defesa: | 2011 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , , |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
UNIVERSIDADE FEDERAL DE LAVRAS
|
| Programa de Pós-Graduação: |
DEX - Departamento de Ciências Exatas
|
| Departamento: |
Não Informado pela instituição
|
| País: |
BRASIL
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufla.br/handle/1/4401 |
Resumo: | This work has as objective to propose a methodology for clustering genes with similar expression patterns based on parameter estimates from the autoregressive model of order p, AR (p), for panel data. Were used data from genes expression that are related with the Saccharomyces cerevisiae cell cycle. These data correspond to 114 genes, which each one had 10 fold-change values (expression measure) over time (0, 15, 30, ...., 135 minutes). The parameter estimation of AR(p) panel data model was realized by two different approaches. Under a frequentist approach, we aimed to verify the efficiency of hierarchical (Ward) and optimization (Tocher) clustering methods in the obtaining homogeneous clusters in order to FIT the AR(2) panel data model to gene expression series. The results obtained under this approach indicated that the Ward method was more appropriate to obtain homogeneous cluster in relation to gene expression pattern. Furthermore, the efficiency of the gene expressions forecasting from AR(2) panel data model were 100%. Under a bayesian approach, was considered a joint study of cluster (Ward method) and bayesian analyses of AR (p) model for panel data. The results obtained by this approaches showed that the used methodology provided clustering with similar gene expressions pattern and also effective forecasting for the expression values in future times by predictive distribution theory. |
| id |
UFLA_cfe96cde4291bc47a7dc206b6a8b840e |
|---|---|
| oai_identifier_str |
oai:repositorio.ufla.br:1/4401 |
| network_acronym_str |
UFLA |
| network_name_str |
Repositório Institucional da UFLA |
| repository_id_str |
|
| spelling |
2014-10-11T02:03:19Z2014-10-11T02:03:19Z2014-10-102011-04-19NASCIMENTO, M. Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica. 2011. 121 p. Tese (Doutorado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2011.https://repositorio.ufla.br/handle/1/4401This work has as objective to propose a methodology for clustering genes with similar expression patterns based on parameter estimates from the autoregressive model of order p, AR (p), for panel data. Were used data from genes expression that are related with the Saccharomyces cerevisiae cell cycle. These data correspond to 114 genes, which each one had 10 fold-change values (expression measure) over time (0, 15, 30, ...., 135 minutes). The parameter estimation of AR(p) panel data model was realized by two different approaches. Under a frequentist approach, we aimed to verify the efficiency of hierarchical (Ward) and optimization (Tocher) clustering methods in the obtaining homogeneous clusters in order to FIT the AR(2) panel data model to gene expression series. The results obtained under this approach indicated that the Ward method was more appropriate to obtain homogeneous cluster in relation to gene expression pattern. Furthermore, the efficiency of the gene expressions forecasting from AR(2) panel data model were 100%. Under a bayesian approach, was considered a joint study of cluster (Ward method) and bayesian analyses of AR (p) model for panel data. The results obtained by this approaches showed that the used methodology provided clustering with similar gene expressions pattern and also effective forecasting for the expression values in future times by predictive distribution theory.Este trabalho teve por objetivo propor uma metodologia para o agrupamento de genes com padrões de expressões gênicas similares, baseado nas estimativas dos parâmetros provenientes do modelo autorregressivo de ordem p, AR(p), para dados em painel. Foram utilizados dados referentes à expressão de genes que atuam sobre ciclo celular de Saccharomyces cerevisiae, os quais correspondem a 114 genes, sendo que, cada um deles apresentava 10 valores de fold-change (medida da expressão) ao longo do tempo (0, 15, 30,...., 135 minutos). A estimação dos parâmetros do modelo AR(p) para dados em painel foi realizada sob dois diferentes enfoques. Sob o enfoque frequentista buscou-se verificar a viabilidade da utilização de métodos de agrupamentos, hierárquico (Ward) e de otimização (Tocher), na formação de grupos homogêneos de séries de expressão gênica para posterior ajuste de modelos autorregressivos, AR(2), para dados em painel. Os resultados obtidos por este enfoque indicaram que o método de Ward mostrou-se mais apropriado para a obtenção de grupos homogêneos, e a eficiência de predição da expressão gênica resultante do ajuste do modelo AR(2) para dados em painel foi de 100%. Sob o enfoque bayesiano, considerou-se de forma conjunta a análise de agrupamento por meio do método de Ward e a análise bayesiana do modelo AR(p) para dados em painel. Os resultados obtidos por este enfoque mostraram que a metodologia proposta foi capaz de agrupar genes que apresentavam padrões de expressão similares e também de proporcionar previsões eficazes para valores futuros da expressão gênica, obtidos por meio da teoria de distribuições preditivas.Estatística e Experimentação AgropecuáriaUNIVERSIDADE FEDERAL DE LAVRASDEX - Departamento de Ciências ExatasUFLABRASILCNPQ_NÃO_INFORMADOModelo autoregressivoMicroarray time seriesPredição da expressão gênicaSéries temporaisAutoregressive modelGene expression forecastingTime seriesAnálise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênicaCluster analysis for panel data: applications in time series of gene expressioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisSáfadi, ThelmaBueno Filho, Júlio Sílvio de SousaFerreira, Daniel FurtadoMorais, Augusto Ramalho dePeternelli, Luiz AlexandreSilva, Fabyano Fonseca eNascimento, Moysésinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLAORIGINALTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdfTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdfapplication/pdf2583719https://repositorio.ufla.br/bitstreams/18a31400-c1b0-4b23-af07-028357769ff2/download1052bd73f71176bd314993843452fde0MD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-8953https://repositorio.ufla.br/bitstreams/fcd42f60-e9ca-41b1-8e95-f61d3e56553c/download760884c1e72224de569e74f79eb87ce3MD52falseAnonymousREADTEXTTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdf.txtTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdf.txtExtracted texttext/plain103602https://repositorio.ufla.br/bitstreams/d0dbfb1e-5d4e-4603-bffa-2855811f1d8d/downloada4e0e05b5e4f695b764395f58acefbcdMD53falseAnonymousREADTHUMBNAILTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdf.jpgTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdf.jpgGenerated Thumbnailimage/jpeg3035https://repositorio.ufla.br/bitstreams/9f9d2bed-0b62-405c-a949-6bce47ffa296/download2b71087cfbd50f246937a24cd434e88bMD54falseAnonymousREAD1/44012025-10-23 20:54:48.701open.accessoai:repositorio.ufla.br:1/4401https://repositorio.ufla.brRepositório InstitucionalPUBhttps://repositorio.ufla.br/server/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2025-10-23T23:54:48Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)falseREVDTEFSQcOHw4NPIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCk8gcmVmZXJpZG8gYXV0b3I6CmEpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4KRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50bwpsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UKZW50aWRhZGUuCmIpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcwpkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgTGF2cmFzIG9zCmRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MKZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbwpubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLiBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqQpiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbyBwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUKbsOjbyBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIExhdnJhcywgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIKb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgo= |
| dc.title.pt_BR.fl_str_mv |
Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica |
| dc.title.alternative.pt_BR.fl_str_mv |
Cluster analysis for panel data: applications in time series of gene expression |
| title |
Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica |
| spellingShingle |
Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica Nascimento, Moysés CNPQ_NÃO_INFORMADO Modelo autoregressivo Microarray time series Predição da expressão gênica Séries temporais Autoregressive model Gene expression forecasting Time series |
| title_short |
Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica |
| title_full |
Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica |
| title_fullStr |
Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica |
| title_full_unstemmed |
Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica |
| title_sort |
Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica |
| author |
Nascimento, Moysés |
| author_facet |
Nascimento, Moysés |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Sáfadi, Thelma |
| dc.contributor.referee1.fl_str_mv |
Bueno Filho, Júlio Sílvio de Sousa Ferreira, Daniel Furtado Morais, Augusto Ramalho de Peternelli, Luiz Alexandre |
| dc.contributor.advisor-co1.fl_str_mv |
Silva, Fabyano Fonseca e |
| dc.contributor.author.fl_str_mv |
Nascimento, Moysés |
| contributor_str_mv |
Sáfadi, Thelma Bueno Filho, Júlio Sílvio de Sousa Ferreira, Daniel Furtado Morais, Augusto Ramalho de Peternelli, Luiz Alexandre Silva, Fabyano Fonseca e |
| dc.subject.cnpq.fl_str_mv |
CNPQ_NÃO_INFORMADO |
| topic |
CNPQ_NÃO_INFORMADO Modelo autoregressivo Microarray time series Predição da expressão gênica Séries temporais Autoregressive model Gene expression forecasting Time series |
| dc.subject.por.fl_str_mv |
Modelo autoregressivo Microarray time series Predição da expressão gênica Séries temporais Autoregressive model Gene expression forecasting Time series |
| description |
This work has as objective to propose a methodology for clustering genes with similar expression patterns based on parameter estimates from the autoregressive model of order p, AR (p), for panel data. Were used data from genes expression that are related with the Saccharomyces cerevisiae cell cycle. These data correspond to 114 genes, which each one had 10 fold-change values (expression measure) over time (0, 15, 30, ...., 135 minutes). The parameter estimation of AR(p) panel data model was realized by two different approaches. Under a frequentist approach, we aimed to verify the efficiency of hierarchical (Ward) and optimization (Tocher) clustering methods in the obtaining homogeneous clusters in order to FIT the AR(2) panel data model to gene expression series. The results obtained under this approach indicated that the Ward method was more appropriate to obtain homogeneous cluster in relation to gene expression pattern. Furthermore, the efficiency of the gene expressions forecasting from AR(2) panel data model were 100%. Under a bayesian approach, was considered a joint study of cluster (Ward method) and bayesian analyses of AR (p) model for panel data. The results obtained by this approaches showed that the used methodology provided clustering with similar gene expressions pattern and also effective forecasting for the expression values in future times by predictive distribution theory. |
| publishDate |
2011 |
| dc.date.submitted.none.fl_str_mv |
2011-04-19 |
| dc.date.accessioned.fl_str_mv |
2014-10-11T02:03:19Z |
| dc.date.available.fl_str_mv |
2014-10-11T02:03:19Z |
| dc.date.issued.fl_str_mv |
2014-10-10 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
NASCIMENTO, M. Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica. 2011. 121 p. Tese (Doutorado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2011. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufla.br/handle/1/4401 |
| identifier_str_mv |
NASCIMENTO, M. Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica. 2011. 121 p. Tese (Doutorado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2011. |
| url |
https://repositorio.ufla.br/handle/1/4401 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
UNIVERSIDADE FEDERAL DE LAVRAS |
| dc.publisher.program.fl_str_mv |
DEX - Departamento de Ciências Exatas |
| dc.publisher.initials.fl_str_mv |
UFLA |
| dc.publisher.country.fl_str_mv |
BRASIL |
| publisher.none.fl_str_mv |
UNIVERSIDADE FEDERAL DE LAVRAS |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFLA instname:Universidade Federal de Lavras (UFLA) instacron:UFLA |
| instname_str |
Universidade Federal de Lavras (UFLA) |
| instacron_str |
UFLA |
| institution |
UFLA |
| reponame_str |
Repositório Institucional da UFLA |
| collection |
Repositório Institucional da UFLA |
| bitstream.url.fl_str_mv |
https://repositorio.ufla.br/bitstreams/18a31400-c1b0-4b23-af07-028357769ff2/download https://repositorio.ufla.br/bitstreams/fcd42f60-e9ca-41b1-8e95-f61d3e56553c/download https://repositorio.ufla.br/bitstreams/d0dbfb1e-5d4e-4603-bffa-2855811f1d8d/download https://repositorio.ufla.br/bitstreams/9f9d2bed-0b62-405c-a949-6bce47ffa296/download |
| bitstream.checksum.fl_str_mv |
1052bd73f71176bd314993843452fde0 760884c1e72224de569e74f79eb87ce3 a4e0e05b5e4f695b764395f58acefbcd 2b71087cfbd50f246937a24cd434e88b |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA) |
| repository.mail.fl_str_mv |
nivaldo@ufla.br || repositorio.biblioteca@ufla.br |
| _version_ |
1854947732066664448 |