Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica

Detalhes bibliográficos
Ano de defesa: 2008
Autor(a) principal: Assao, Fabiana Mari
Orientador(a): Camargo, Heloisa de Arruda lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação - PPGCC
Departamento: Não Informado pela instituição
País: BR
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/ufscar/399
Resumo: Data clustering has been seen, in the last decades, as an important tool for gene expression data analysis. In recent years, due to the progress in gene annotation research, a growing interest has been noticed for the semi-supervised clustering techniques, which use knowledge previously available about some gene functions to discover functions of other genes by means of clustering. This work investigates non-supervised and semi-supervised clustering algorithms applied to gene expression data. The goal is to perform an inspection on strengths and weaknesses of the use of such clustering methods and, based on these findings, to provide ways of obtaining results significant to biology. Algorithms with different characteristics were implemented and tested, with the objective of verifying evidences of eventual gains with the partial labeling, as compared to the non-supervised techniques. The experiments considered data sets from the gene expression domain as well as more generic domains. The obtained results were evaluated with validation measures usually applied in similar contexts. The analysis developed, though, emphasize the important role of computational techniques in biological data analysis, by accelerating the process of deriving results and conclusions, to better understand gene functions and structures. The results of this stydy justify the large investiment in the research of behavior of semi-supervised techniques in gene expression data, as we shall see.
id SCAR_4f459dc88609024eb690ba8d19fb8fb0
oai_identifier_str oai:repositorio.ufscar.br:ufscar/399
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Assao, Fabiana MariCamargo, Heloisa de Arrudahttp://genos.cnpq.br:12010/dwlattes/owa/prc_imp_cv_int?f_cod=K4783179Z5http://lattes.cnpq.br/3998840368387781925031b8-b018-4aeb-9e2b-e1be594a84ad2016-06-02T19:05:34Z2009-09-212016-06-02T19:05:34Z2008-05-27ASSAO, Fabiana Mari. Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica. 2008. 131 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2008.https://repositorio.ufscar.br/handle/ufscar/399Data clustering has been seen, in the last decades, as an important tool for gene expression data analysis. In recent years, due to the progress in gene annotation research, a growing interest has been noticed for the semi-supervised clustering techniques, which use knowledge previously available about some gene functions to discover functions of other genes by means of clustering. This work investigates non-supervised and semi-supervised clustering algorithms applied to gene expression data. The goal is to perform an inspection on strengths and weaknesses of the use of such clustering methods and, based on these findings, to provide ways of obtaining results significant to biology. Algorithms with different characteristics were implemented and tested, with the objective of verifying evidences of eventual gains with the partial labeling, as compared to the non-supervised techniques. The experiments considered data sets from the gene expression domain as well as more generic domains. The obtained results were evaluated with validation measures usually applied in similar contexts. The analysis developed, though, emphasize the important role of computational techniques in biological data analysis, by accelerating the process of deriving results and conclusions, to better understand gene functions and structures. The results of this stydy justify the large investiment in the research of behavior of semi-supervised techniques in gene expression data, as we shall see.O agrupamento de dados destacou-se nas últimas décadas como uma importante ferramenta para a análise de dados de expressão gênica. Nos últimos anos, em função do progresso das pesquisas para rotulação de genes, surgiu um interesse pelas técnicas de agrupamento semi-supervisionado, que utilizam o conhecimento prévio disponível sobre a função de alguns genes para descobrir funções de outros genes por meio do agrupamento. Neste trabalho são investigados algoritmos de agrupamento semi-supervisionado e não supervisionados aplicados a dados de expressão gênica. O intuito é realizar uma inspeção das vantagens e desvantagens da utilização destes métodos de agrupamento e, a partir disso, prover subsídios para obtenção de resultados significativos para a área de Biologia. Foram implementados e testados algoritmos de agrupamento com diferentes características, com o objetivo de verificar evidências de eventuais ganhos obtidos com a rotulação parcial dos genes com relação a técnicas não-supervisionadas. Os experimentos realizados consideraram conjuntos de dados do domínio de expressão gênica e de outros domínios mais genéricos. Os resultados obtidos foram avaliados com medidas de validação usualmente aplicadas em contextos semelhantes. Assim, as análises desenvolvidas reforçam o importante papel da computação na análise de dados biológicos, a fim de acelerar o processo de obtenção de resultados e conclusões, na compreensão das estruturas e funções dos genes. Os resultados obtidos neste trabalho justificam o grande investimento na pesquisa do comportamento de técnicas semi-supervisionadas em dados de expressão gênica, como veremos mais adiante.application/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRMétodo de agrupamentoAgrupamento semi-supervisionadoExpressão gênicaAprendizado do computadorBioinformáticaAprendizado de MáquinaClusteringSemisupervised clusteringGene expressionMachine learningBioinformaticsCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-1abf34796-0d89-460f-9185-e460cb1c066ainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL2160.pdfapplication/pdf2987031https://repositorio.ufscar.br/bitstream/ufscar/399/1/2160.pdfc428afa9febfedfbb3e778b30d48e9c0MD51THUMBNAIL2160.pdf.jpg2160.pdf.jpgIM Thumbnailimage/jpeg6948https://repositorio.ufscar.br/bitstream/ufscar/399/2/2160.pdf.jpg5f206e5dac88a769f1595548fa10d8bcMD52ufscar/3992023-09-18 18:30:37.342oai:repositorio.ufscar.br:ufscar/399Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:30:37Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica
title Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica
spellingShingle Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica
Assao, Fabiana Mari
Método de agrupamento
Agrupamento semi-supervisionado
Expressão gênica
Aprendizado do computador
Bioinformática
Aprendizado de Máquina
Clustering
Semisupervised clustering
Gene expression
Machine learning
Bioinformatics
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica
title_full Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica
title_fullStr Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica
title_full_unstemmed Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica
title_sort Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica
author Assao, Fabiana Mari
author_facet Assao, Fabiana Mari
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/3998840368387781
dc.contributor.author.fl_str_mv Assao, Fabiana Mari
dc.contributor.advisor1.fl_str_mv Camargo, Heloisa de Arruda
dc.contributor.advisor1Lattes.fl_str_mv http://genos.cnpq.br:12010/dwlattes/owa/prc_imp_cv_int?f_cod=K4783179Z5
dc.contributor.authorID.fl_str_mv 925031b8-b018-4aeb-9e2b-e1be594a84ad
contributor_str_mv Camargo, Heloisa de Arruda
dc.subject.por.fl_str_mv Método de agrupamento
Agrupamento semi-supervisionado
Expressão gênica
Aprendizado do computador
Bioinformática
Aprendizado de Máquina
topic Método de agrupamento
Agrupamento semi-supervisionado
Expressão gênica
Aprendizado do computador
Bioinformática
Aprendizado de Máquina
Clustering
Semisupervised clustering
Gene expression
Machine learning
Bioinformatics
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Clustering
Semisupervised clustering
Gene expression
Machine learning
Bioinformatics
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Data clustering has been seen, in the last decades, as an important tool for gene expression data analysis. In recent years, due to the progress in gene annotation research, a growing interest has been noticed for the semi-supervised clustering techniques, which use knowledge previously available about some gene functions to discover functions of other genes by means of clustering. This work investigates non-supervised and semi-supervised clustering algorithms applied to gene expression data. The goal is to perform an inspection on strengths and weaknesses of the use of such clustering methods and, based on these findings, to provide ways of obtaining results significant to biology. Algorithms with different characteristics were implemented and tested, with the objective of verifying evidences of eventual gains with the partial labeling, as compared to the non-supervised techniques. The experiments considered data sets from the gene expression domain as well as more generic domains. The obtained results were evaluated with validation measures usually applied in similar contexts. The analysis developed, though, emphasize the important role of computational techniques in biological data analysis, by accelerating the process of deriving results and conclusions, to better understand gene functions and structures. The results of this stydy justify the large investiment in the research of behavior of semi-supervised techniques in gene expression data, as we shall see.
publishDate 2008
dc.date.issued.fl_str_mv 2008-05-27
dc.date.available.fl_str_mv 2009-09-21
2016-06-02T19:05:34Z
dc.date.accessioned.fl_str_mv 2016-06-02T19:05:34Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ASSAO, Fabiana Mari. Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica. 2008. 131 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2008.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/399
identifier_str_mv ASSAO, Fabiana Mari. Aprendizado semi-supervisionado e não supervisionado para análise de dados de expressão gênica. 2008. 131 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2008.
url https://repositorio.ufscar.br/handle/ufscar/399
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv abf34796-0d89-460f-9185-e460cb1c066a
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/399/1/2160.pdf
https://repositorio.ufscar.br/bitstream/ufscar/399/2/2160.pdf.jpg
bitstream.checksum.fl_str_mv c428afa9febfedfbb3e778b30d48e9c0
5f206e5dac88a769f1595548fa10d8bc
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136458046210048