Modelo com mistura de multinomiais aplicado à identificação de proteínas similares

Detalhes bibliográficos
Ano de defesa: 2005
Autor(a) principal: Coimbra, Ricardo Galante
Orientador(a): Milan, Luis Aparecido
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Estatística - PPGEs
Departamento: Não Informado pela instituição
País: BR
Palavras-chave em Português:
DIC
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/4570
Resumo: The proteins are important molecules from the cells, whereas they take part since the construction of cell´s framing until the transmission of the genetic information between the generations. A protein can be characterized by its function and its function is determined by the sequence of amino acids that determines its structure. To determined the protein's function is important, for instance, in a research about the cure of diseases or searching for new drugs. In this research we use a bayesian statistical methodology with mixture of multinomial and latent variables to identify proteins with similar function. We use simulations to verify the performance of the statistical model for identifying the similar proteins. At the end we apply the modeling to a real data set.
id SCAR_d69c7bb9d820c659665773da42e596ba
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/4570
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Coimbra, Ricardo GalanteMilan, Luis Aparecido53264840-f44e-4b04-8a0f-ded8afc012642016-06-02T20:06:08Z2005-06-132016-06-02T20:06:08Z2005-02-24COIMBRA, Ricardo Galante. Modelo com mistura de multinomiais aplicado à identificação de proteínas similares. 2005. 92 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005.https://repositorio.ufscar.br/handle/20.500.14289/4570The proteins are important molecules from the cells, whereas they take part since the construction of cell´s framing until the transmission of the genetic information between the generations. A protein can be characterized by its function and its function is determined by the sequence of amino acids that determines its structure. To determined the protein's function is important, for instance, in a research about the cure of diseases or searching for new drugs. In this research we use a bayesian statistical methodology with mixture of multinomial and latent variables to identify proteins with similar function. We use simulations to verify the performance of the statistical model for identifying the similar proteins. At the end we apply the modeling to a real data set.As proteínas são moléculas importantes das células, pois participam desde a construção das estruturas celulares até a transmissão de informações genéticas entre gerações. Uma proteína pode ser caracterizada pela sua função, sendo que esta função é determinada pela sequência de aminoácidos que compõe a sua estrutura. Determinar a função protéica é importante quando, por exemplo, se pesquisa a cura de doenças ou se pesquisa a fabricação de novos medicamentos. Neste trabalho utilizamos uma metodologia bayesiana de inferência estatística para inferir sobre o modelo com mistura de distribuições multinomiais e variáveis latentes para identificar proteínas com funções similares. Verificamos a performance da modelagem proposta em separar em grupos as proteínas com funções similares através de simulação.application/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Estatística - PPGEsUFSCarBREstatística - análiseMistura de distribuiçõesVariável latenteGibbs samplingDICFator de BayesCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICAModelo com mistura de multinomiais aplicado à identificação de proteínas similaresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis01874dfd-bd1b-409c-81e8-3185c83eacf2info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTDissRGC.pdf.txtDissRGC.pdf.txtExtracted texttext/plain254412https://repositorio.ufscar.br/bitstreams/5c6f949f-165e-46f5-96fd-9d55ed3a206a/download4227280be1f7b9ad0012a831b35bbd20MD53falseAnonymousREADORIGINALDissRGC.pdfapplication/pdf2581095https://repositorio.ufscar.br/bitstreams/4536810b-ea07-48a2-9c22-fbed7be1c7ac/download4a2f54d065969def7422a978d84a16f4MD51trueAnonymousREADTHUMBNAILDissRGC.pdf.jpgDissRGC.pdf.jpgIM Thumbnailimage/jpeg11005https://repositorio.ufscar.br/bitstreams/80136f76-e155-4764-9e5b-6d78c621227e/downloadadad124cdb4debf2c1ca7b9b6460c72aMD52falseAnonymousREAD20.500.14289/45702025-02-06 05:02:21.349open.accessoai:repositorio.ufscar.br:20.500.14289/4570https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T08:02:21Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Modelo com mistura de multinomiais aplicado à identificação de proteínas similares
title Modelo com mistura de multinomiais aplicado à identificação de proteínas similares
spellingShingle Modelo com mistura de multinomiais aplicado à identificação de proteínas similares
Coimbra, Ricardo Galante
Estatística - análise
Mistura de distribuições
Variável latente
Gibbs sampling
DIC
Fator de Bayes
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
title_short Modelo com mistura de multinomiais aplicado à identificação de proteínas similares
title_full Modelo com mistura de multinomiais aplicado à identificação de proteínas similares
title_fullStr Modelo com mistura de multinomiais aplicado à identificação de proteínas similares
title_full_unstemmed Modelo com mistura de multinomiais aplicado à identificação de proteínas similares
title_sort Modelo com mistura de multinomiais aplicado à identificação de proteínas similares
author Coimbra, Ricardo Galante
author_facet Coimbra, Ricardo Galante
author_role author
dc.contributor.author.fl_str_mv Coimbra, Ricardo Galante
dc.contributor.advisor1.fl_str_mv Milan, Luis Aparecido
dc.contributor.authorID.fl_str_mv 53264840-f44e-4b04-8a0f-ded8afc01264
contributor_str_mv Milan, Luis Aparecido
dc.subject.por.fl_str_mv Estatística - análise
Mistura de distribuições
Variável latente
Gibbs sampling
DIC
Fator de Bayes
topic Estatística - análise
Mistura de distribuições
Variável latente
Gibbs sampling
DIC
Fator de Bayes
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
description The proteins are important molecules from the cells, whereas they take part since the construction of cell´s framing until the transmission of the genetic information between the generations. A protein can be characterized by its function and its function is determined by the sequence of amino acids that determines its structure. To determined the protein's function is important, for instance, in a research about the cure of diseases or searching for new drugs. In this research we use a bayesian statistical methodology with mixture of multinomial and latent variables to identify proteins with similar function. We use simulations to verify the performance of the statistical model for identifying the similar proteins. At the end we apply the modeling to a real data set.
publishDate 2005
dc.date.available.fl_str_mv 2005-06-13
2016-06-02T20:06:08Z
dc.date.issued.fl_str_mv 2005-02-24
dc.date.accessioned.fl_str_mv 2016-06-02T20:06:08Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv COIMBRA, Ricardo Galante. Modelo com mistura de multinomiais aplicado à identificação de proteínas similares. 2005. 92 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/4570
identifier_str_mv COIMBRA, Ricardo Galante. Modelo com mistura de multinomiais aplicado à identificação de proteínas similares. 2005. 92 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2005.
url https://repositorio.ufscar.br/handle/20.500.14289/4570
dc.language.iso.fl_str_mv por
language por
dc.relation.authority.fl_str_mv 01874dfd-bd1b-409c-81e8-3185c83eacf2
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística - PPGEs
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/5c6f949f-165e-46f5-96fd-9d55ed3a206a/download
https://repositorio.ufscar.br/bitstreams/4536810b-ea07-48a2-9c22-fbed7be1c7ac/download
https://repositorio.ufscar.br/bitstreams/80136f76-e155-4764-9e5b-6d78c621227e/download
bitstream.checksum.fl_str_mv 4227280be1f7b9ad0012a831b35bbd20
4a2f54d065969def7422a978d84a16f4
adad124cdb4debf2c1ca7b9b6460c72a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688833769275392