Métodos de agrupamento na análise de dados de expressão gênica

Detalhes bibliográficos
Ano de defesa: 2009
Autor(a) principal: Rodrigues, Fabiene Silva
Orientador(a): Milan, Luis Aparecido
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Estatística - PPGEs
Departamento: Não Informado pela instituição
País: BR
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/4537
Resumo: The clustering techniques have frequently been used in literature to the analyse data in several fields of application. The main objective of this work is to study such techniques. There is a large number of clustering techniques in literature. In this work we concentrate on Self Organizing Map (SOM), k-means, k-medoids and Expectation- Maximization (EM) algorithms. These algorithms are applied to gene expression data. The analisys of gene expression, among other possibilities, identifies which genes are differently expressed in synthesis of proteins associated to normal and sick tissues. The purpose is to do a comparing of these metods, sticking out advantages and disadvantages of such. The metods were tested for simulation and after we apply them to a real data set.
id SCAR_faab8d0314c353b6d09095bba309f22a
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/4537
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Rodrigues, Fabiene SilvaMilan, Luis Aparecidohttp://lattes.cnpq.br/0561628588859436deb79932-7761-44fd-8896-96e28199a2be2016-06-02T20:06:03Z2009-11-192016-06-02T20:06:03Z2009-02-16RODRIGUES, Fabiene Silva. Métodos de agrupamento na análise de dados de expressão gênica. 2009. 95 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2009.https://repositorio.ufscar.br/handle/20.500.14289/4537The clustering techniques have frequently been used in literature to the analyse data in several fields of application. The main objective of this work is to study such techniques. There is a large number of clustering techniques in literature. In this work we concentrate on Self Organizing Map (SOM), k-means, k-medoids and Expectation- Maximization (EM) algorithms. These algorithms are applied to gene expression data. The analisys of gene expression, among other possibilities, identifies which genes are differently expressed in synthesis of proteins associated to normal and sick tissues. The purpose is to do a comparing of these metods, sticking out advantages and disadvantages of such. The metods were tested for simulation and after we apply them to a real data set.As técnicas de agrupamento (clustering) vêm sendo utilizadas com freqüência na literatura para a solução de vários problemas de aplicações práticas em diversas áreas do conhecimento. O principal objetivo deste trabalho é estudar tais técnicas. Mais especificamente, estudamos os algoritmos Self Organizing Map (SOM), k-means, k-medoids, Expectation-Maximization (EM). Estes algoritmos foram aplicados a dados de expressão gênica. A análise de expressão gênica visa, entre outras possibilidades, a identificação de quais genes estão diferentemente expressos na sintetização de proteínas associados a tecidos normais e doentes. O objetivo deste trabalho é comparar estes métodos no que se refere à eficiência dos mesmos na identificação de grupos de elementos similares, ressaltando vantagens e desvantagens de cada um. Os métodos foram testados por simulação e depois aplicamos as metodologias a um conjunto de dados reais.application/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Estatística - PPGEsUFSCarBRAnálise multivariadaMétodo de agrupamentoFator de BayesModelos com misturasAlgoritmo EMExpressão gênicaSeleção de modelosSelf Organizing Map (SOM)K-meansK-medoidsCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICAMétodos de agrupamento na análise de dados de expressão gênicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-101874dfd-bd1b-409c-81e8-3185c83eacf2info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXT2596.pdf.txt2596.pdf.txtExtracted texttext/plain103519https://repositorio.ufscar.br/bitstreams/7794aece-5001-4bd6-b390-b867b04bf77d/download596b58ef2d5620aeb9170e97d34033e0MD53falseAnonymousREADORIGINAL2596.pdfapplication/pdf1631367https://repositorio.ufscar.br/bitstreams/164693bb-9474-4b1d-bb5e-5af988e94610/download90f2d842a935f1dd50bf587a33f6a2cbMD51trueAnonymousREADTHUMBNAIL2596.pdf.jpg2596.pdf.jpgIM Thumbnailimage/jpeg7740https://repositorio.ufscar.br/bitstreams/eef19769-f75d-4051-b519-20282d35b2c1/download245a5e17a0c62274a81d950494291b67MD52falseAnonymousREAD20.500.14289/45372025-02-05 15:11:26.155open.accessoai:repositorio.ufscar.br:20.500.14289/4537https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-05T18:11:26Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Métodos de agrupamento na análise de dados de expressão gênica
title Métodos de agrupamento na análise de dados de expressão gênica
spellingShingle Métodos de agrupamento na análise de dados de expressão gênica
Rodrigues, Fabiene Silva
Análise multivariada
Método de agrupamento
Fator de Bayes
Modelos com misturas
Algoritmo EM
Expressão gênica
Seleção de modelos
Self Organizing Map (SOM)
K-means
K-medoids
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
title_short Métodos de agrupamento na análise de dados de expressão gênica
title_full Métodos de agrupamento na análise de dados de expressão gênica
title_fullStr Métodos de agrupamento na análise de dados de expressão gênica
title_full_unstemmed Métodos de agrupamento na análise de dados de expressão gênica
title_sort Métodos de agrupamento na análise de dados de expressão gênica
author Rodrigues, Fabiene Silva
author_facet Rodrigues, Fabiene Silva
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/0561628588859436
dc.contributor.author.fl_str_mv Rodrigues, Fabiene Silva
dc.contributor.advisor1.fl_str_mv Milan, Luis Aparecido
dc.contributor.authorID.fl_str_mv deb79932-7761-44fd-8896-96e28199a2be
contributor_str_mv Milan, Luis Aparecido
dc.subject.por.fl_str_mv Análise multivariada
Método de agrupamento
Fator de Bayes
Modelos com misturas
Algoritmo EM
Expressão gênica
Seleção de modelos
topic Análise multivariada
Método de agrupamento
Fator de Bayes
Modelos com misturas
Algoritmo EM
Expressão gênica
Seleção de modelos
Self Organizing Map (SOM)
K-means
K-medoids
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
dc.subject.eng.fl_str_mv Self Organizing Map (SOM)
K-means
K-medoids
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
description The clustering techniques have frequently been used in literature to the analyse data in several fields of application. The main objective of this work is to study such techniques. There is a large number of clustering techniques in literature. In this work we concentrate on Self Organizing Map (SOM), k-means, k-medoids and Expectation- Maximization (EM) algorithms. These algorithms are applied to gene expression data. The analisys of gene expression, among other possibilities, identifies which genes are differently expressed in synthesis of proteins associated to normal and sick tissues. The purpose is to do a comparing of these metods, sticking out advantages and disadvantages of such. The metods were tested for simulation and after we apply them to a real data set.
publishDate 2009
dc.date.available.fl_str_mv 2009-11-19
2016-06-02T20:06:03Z
dc.date.issued.fl_str_mv 2009-02-16
dc.date.accessioned.fl_str_mv 2016-06-02T20:06:03Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv RODRIGUES, Fabiene Silva. Métodos de agrupamento na análise de dados de expressão gênica. 2009. 95 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2009.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/4537
identifier_str_mv RODRIGUES, Fabiene Silva. Métodos de agrupamento na análise de dados de expressão gênica. 2009. 95 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2009.
url https://repositorio.ufscar.br/handle/20.500.14289/4537
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv 01874dfd-bd1b-409c-81e8-3185c83eacf2
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística - PPGEs
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/7794aece-5001-4bd6-b390-b867b04bf77d/download
https://repositorio.ufscar.br/bitstreams/164693bb-9474-4b1d-bb5e-5af988e94610/download
https://repositorio.ufscar.br/bitstreams/eef19769-f75d-4051-b519-20282d35b2c1/download
bitstream.checksum.fl_str_mv 596b58ef2d5620aeb9170e97d34033e0
90f2d842a935f1dd50bf587a33f6a2cb
245a5e17a0c62274a81d950494291b67
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688837626986496