Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica

Detalhes bibliográficos
Ano de defesa: 2011
Autor(a) principal: Nascimento, Moysés
Orientador(a): Sáfadi, Thelma
Banca de defesa: Bueno Filho, Júlio Sílvio de Sousa, Ferreira, Daniel Furtado, Morais, Augusto Ramalho de, Peternelli, Luiz Alexandre
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: UNIVERSIDADE FEDERAL DE LAVRAS
Programa de Pós-Graduação: DEX - Departamento de Ciências Exatas
Departamento: Não Informado pela instituição
País: BRASIL
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufla.br/handle/1/4401
Resumo: This work has as objective to propose a methodology for clustering genes with similar expression patterns based on parameter estimates from the autoregressive model of order p, AR (p), for panel data. Were used data from genes expression that are related with the Saccharomyces cerevisiae cell cycle. These data correspond to 114 genes, which each one had 10 fold-change values (expression measure) over time (0, 15, 30, ...., 135 minutes). The parameter estimation of AR(p) panel data model was realized by two different approaches. Under a frequentist approach, we aimed to verify the efficiency of hierarchical (Ward) and optimization (Tocher) clustering methods in the obtaining homogeneous clusters in order to FIT the AR(2) panel data model to gene expression series. The results obtained under this approach indicated that the Ward method was more appropriate to obtain homogeneous cluster in relation to gene expression pattern. Furthermore, the efficiency of the gene expressions forecasting from AR(2) panel data model were 100%. Under a bayesian approach, was considered a joint study of cluster (Ward method) and bayesian analyses of AR (p) model for panel data. The results obtained by this approaches showed that the used methodology provided clustering with similar gene expressions pattern and also effective forecasting for the expression values in future times by predictive distribution theory.
id UFLA_cfe96cde4291bc47a7dc206b6a8b840e
oai_identifier_str oai:repositorio.ufla.br:1/4401
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling 2014-10-11T02:03:19Z2014-10-11T02:03:19Z2014-10-102011-04-19NASCIMENTO, M. Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica. 2011. 121 p. Tese (Doutorado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2011.https://repositorio.ufla.br/handle/1/4401This work has as objective to propose a methodology for clustering genes with similar expression patterns based on parameter estimates from the autoregressive model of order p, AR (p), for panel data. Were used data from genes expression that are related with the Saccharomyces cerevisiae cell cycle. These data correspond to 114 genes, which each one had 10 fold-change values (expression measure) over time (0, 15, 30, ...., 135 minutes). The parameter estimation of AR(p) panel data model was realized by two different approaches. Under a frequentist approach, we aimed to verify the efficiency of hierarchical (Ward) and optimization (Tocher) clustering methods in the obtaining homogeneous clusters in order to FIT the AR(2) panel data model to gene expression series. The results obtained under this approach indicated that the Ward method was more appropriate to obtain homogeneous cluster in relation to gene expression pattern. Furthermore, the efficiency of the gene expressions forecasting from AR(2) panel data model were 100%. Under a bayesian approach, was considered a joint study of cluster (Ward method) and bayesian analyses of AR (p) model for panel data. The results obtained by this approaches showed that the used methodology provided clustering with similar gene expressions pattern and also effective forecasting for the expression values in future times by predictive distribution theory.Este trabalho teve por objetivo propor uma metodologia para o agrupamento de genes com padrões de expressões gênicas similares, baseado nas estimativas dos parâmetros provenientes do modelo autorregressivo de ordem p, AR(p), para dados em painel. Foram utilizados dados referentes à expressão de genes que atuam sobre ciclo celular de Saccharomyces cerevisiae, os quais correspondem a 114 genes, sendo que, cada um deles apresentava 10 valores de fold-change (medida da expressão) ao longo do tempo (0, 15, 30,...., 135 minutos). A estimação dos parâmetros do modelo AR(p) para dados em painel foi realizada sob dois diferentes enfoques. Sob o enfoque frequentista buscou-se verificar a viabilidade da utilização de métodos de agrupamentos, hierárquico (Ward) e de otimização (Tocher), na formação de grupos homogêneos de séries de expressão gênica para posterior ajuste de modelos autorregressivos, AR(2), para dados em painel. Os resultados obtidos por este enfoque indicaram que o método de Ward mostrou-se mais apropriado para a obtenção de grupos homogêneos, e a eficiência de predição da expressão gênica resultante do ajuste do modelo AR(2) para dados em painel foi de 100%. Sob o enfoque bayesiano, considerou-se de forma conjunta a análise de agrupamento por meio do método de Ward e a análise bayesiana do modelo AR(p) para dados em painel. Os resultados obtidos por este enfoque mostraram que a metodologia proposta foi capaz de agrupar genes que apresentavam padrões de expressão similares e também de proporcionar previsões eficazes para valores futuros da expressão gênica, obtidos por meio da teoria de distribuições preditivas.Estatística e Experimentação AgropecuáriaUNIVERSIDADE FEDERAL DE LAVRASDEX - Departamento de Ciências ExatasUFLABRASILCNPQ_NÃO_INFORMADOModelo autoregressivoMicroarray time seriesPredição da expressão gênicaSéries temporaisAutoregressive modelGene expression forecastingTime seriesAnálise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênicaCluster analysis for panel data: applications in time series of gene expressioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisSáfadi, ThelmaBueno Filho, Júlio Sílvio de SousaFerreira, Daniel FurtadoMorais, Augusto Ramalho dePeternelli, Luiz AlexandreSilva, Fabyano Fonseca eNascimento, Moysésinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLAORIGINALTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdfTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdfapplication/pdf2583719https://repositorio.ufla.br/bitstreams/18a31400-c1b0-4b23-af07-028357769ff2/download1052bd73f71176bd314993843452fde0MD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-8953https://repositorio.ufla.br/bitstreams/fcd42f60-e9ca-41b1-8e95-f61d3e56553c/download760884c1e72224de569e74f79eb87ce3MD52falseAnonymousREADTEXTTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdf.txtTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdf.txtExtracted texttext/plain103602https://repositorio.ufla.br/bitstreams/d0dbfb1e-5d4e-4603-bffa-2855811f1d8d/downloada4e0e05b5e4f695b764395f58acefbcdMD53falseAnonymousREADTHUMBNAILTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdf.jpgTESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdf.jpgGenerated Thumbnailimage/jpeg3035https://repositorio.ufla.br/bitstreams/9f9d2bed-0b62-405c-a949-6bce47ffa296/download2b71087cfbd50f246937a24cd434e88bMD54falseAnonymousREAD1/44012025-10-23 20:54:48.701open.accessoai:repositorio.ufla.br:1/4401https://repositorio.ufla.brRepositório InstitucionalPUBhttps://repositorio.ufla.br/server/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2025-10-23T23:54:48Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)falseREVDTEFSQcOHw4NPIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCk8gcmVmZXJpZG8gYXV0b3I6CmEpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4KRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50bwpsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UKZW50aWRhZGUuCmIpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcwpkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgTGF2cmFzIG9zCmRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MKZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbwpubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLiBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqQpiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbyBwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUKbsOjbyBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIExhdnJhcywgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIKb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgo=
dc.title.pt_BR.fl_str_mv Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica
dc.title.alternative.pt_BR.fl_str_mv Cluster analysis for panel data: applications in time series of gene expression
title Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica
spellingShingle Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica
Nascimento, Moysés
CNPQ_NÃO_INFORMADO
Modelo autoregressivo
Microarray time series
Predição da expressão gênica
Séries temporais
Autoregressive model
Gene expression forecasting
Time series
title_short Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica
title_full Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica
title_fullStr Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica
title_full_unstemmed Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica
title_sort Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica
author Nascimento, Moysés
author_facet Nascimento, Moysés
author_role author
dc.contributor.advisor1.fl_str_mv Sáfadi, Thelma
dc.contributor.referee1.fl_str_mv Bueno Filho, Júlio Sílvio de Sousa
Ferreira, Daniel Furtado
Morais, Augusto Ramalho de
Peternelli, Luiz Alexandre
dc.contributor.advisor-co1.fl_str_mv Silva, Fabyano Fonseca e
dc.contributor.author.fl_str_mv Nascimento, Moysés
contributor_str_mv Sáfadi, Thelma
Bueno Filho, Júlio Sílvio de Sousa
Ferreira, Daniel Furtado
Morais, Augusto Ramalho de
Peternelli, Luiz Alexandre
Silva, Fabyano Fonseca e
dc.subject.cnpq.fl_str_mv CNPQ_NÃO_INFORMADO
topic CNPQ_NÃO_INFORMADO
Modelo autoregressivo
Microarray time series
Predição da expressão gênica
Séries temporais
Autoregressive model
Gene expression forecasting
Time series
dc.subject.por.fl_str_mv Modelo autoregressivo
Microarray time series
Predição da expressão gênica
Séries temporais
Autoregressive model
Gene expression forecasting
Time series
description This work has as objective to propose a methodology for clustering genes with similar expression patterns based on parameter estimates from the autoregressive model of order p, AR (p), for panel data. Were used data from genes expression that are related with the Saccharomyces cerevisiae cell cycle. These data correspond to 114 genes, which each one had 10 fold-change values (expression measure) over time (0, 15, 30, ...., 135 minutes). The parameter estimation of AR(p) panel data model was realized by two different approaches. Under a frequentist approach, we aimed to verify the efficiency of hierarchical (Ward) and optimization (Tocher) clustering methods in the obtaining homogeneous clusters in order to FIT the AR(2) panel data model to gene expression series. The results obtained under this approach indicated that the Ward method was more appropriate to obtain homogeneous cluster in relation to gene expression pattern. Furthermore, the efficiency of the gene expressions forecasting from AR(2) panel data model were 100%. Under a bayesian approach, was considered a joint study of cluster (Ward method) and bayesian analyses of AR (p) model for panel data. The results obtained by this approaches showed that the used methodology provided clustering with similar gene expressions pattern and also effective forecasting for the expression values in future times by predictive distribution theory.
publishDate 2011
dc.date.submitted.none.fl_str_mv 2011-04-19
dc.date.accessioned.fl_str_mv 2014-10-11T02:03:19Z
dc.date.available.fl_str_mv 2014-10-11T02:03:19Z
dc.date.issued.fl_str_mv 2014-10-10
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv NASCIMENTO, M. Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica. 2011. 121 p. Tese (Doutorado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2011.
dc.identifier.uri.fl_str_mv https://repositorio.ufla.br/handle/1/4401
identifier_str_mv NASCIMENTO, M. Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica. 2011. 121 p. Tese (Doutorado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2011.
url https://repositorio.ufla.br/handle/1/4401
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv UNIVERSIDADE FEDERAL DE LAVRAS
dc.publisher.program.fl_str_mv DEX - Departamento de Ciências Exatas
dc.publisher.initials.fl_str_mv UFLA
dc.publisher.country.fl_str_mv BRASIL
publisher.none.fl_str_mv UNIVERSIDADE FEDERAL DE LAVRAS
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
bitstream.url.fl_str_mv https://repositorio.ufla.br/bitstreams/18a31400-c1b0-4b23-af07-028357769ff2/download
https://repositorio.ufla.br/bitstreams/fcd42f60-e9ca-41b1-8e95-f61d3e56553c/download
https://repositorio.ufla.br/bitstreams/d0dbfb1e-5d4e-4603-bffa-2855811f1d8d/download
https://repositorio.ufla.br/bitstreams/9f9d2bed-0b62-405c-a949-6bce47ffa296/download
bitstream.checksum.fl_str_mv 1052bd73f71176bd314993843452fde0
760884c1e72224de569e74f79eb87ce3
a4e0e05b5e4f695b764395f58acefbcd
2b71087cfbd50f246937a24cd434e88b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1854947732066664448