Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: Kasahara, Viviani Akemi
Orientador(a): Nicoletti, Maria do Carmo lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação - PPGCC
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/8124
Resumo: Cluster analysis is the organization of a collection of patterns into clusters based on similarity which is determined by using properties of data. Clustering techniques can be useful in a variety of knowledge domains such as biotechnology, computer vision, document retrieval and many others. An interesting area of biology involves the concept of microRNAs (miRNAs) that are approximately 22 nucleotide-long non-coding RNA molecules that play important roles in gene regulation. Clustering miRNA sequences can help to understand and explore sequences belonging to the same cluster that has similar biological functions. This research work investigates and explores seven unsupervised clustering algorithms based on graphs that can be divided into three categories: algorithm based on region of influence, algorithm based on minimum spanning tree and spectral algorithm. To assess the contribution of the proposed algorithms, data from miRNA families stored in the online miRBase database were used in the conducted experiments. The results of these experiments were presented, analysed and evaluated using clustering validation indexes as well as visual analysis.
id SCAR_8860ff0ace09c05b1050e9759aeccbb2
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/8124
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Kasahara, Viviani AkemiNicoletti, Maria do Carmohttp://lattes.cnpq.br/6454154048263145http://lattes.cnpq.br/63846938657520331883aad5-3354-476d-8a33-15a60afc6fdd2016-10-21T13:03:34Z2016-10-21T13:03:34Z2016-08-12KASAHARA, Viviani Akemi. Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos. 2016. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/8124.https://repositorio.ufscar.br/handle/20.500.14289/8124Cluster analysis is the organization of a collection of patterns into clusters based on similarity which is determined by using properties of data. Clustering techniques can be useful in a variety of knowledge domains such as biotechnology, computer vision, document retrieval and many others. An interesting area of biology involves the concept of microRNAs (miRNAs) that are approximately 22 nucleotide-long non-coding RNA molecules that play important roles in gene regulation. Clustering miRNA sequences can help to understand and explore sequences belonging to the same cluster that has similar biological functions. This research work investigates and explores seven unsupervised clustering algorithms based on graphs that can be divided into three categories: algorithm based on region of influence, algorithm based on minimum spanning tree and spectral algorithm. To assess the contribution of the proposed algorithms, data from miRNA families stored in the online miRBase database were used in the conducted experiments. The results of these experiments were presented, analysed and evaluated using clustering validation indexes as well as visual analysis.A análise de agrupamento é uma organização de coleção de padrões em grupos, baseando-se na similaridade das propriedades pertencentes aos dados. A técnica de agrupamento pode ser utilizado em muitas áreas de conhecimento como biotecnologia, visão computacional, recuperação de documentos, entre outras. Uma área interessante da biologia envolve o conceito de microRNAs (miRNAs), que são moléculas não-codificadas de RNA com aproximadamente 22 nucleotídeos e que desempenham um papel importante na regulação dos genes. O agrupamento de sequências de miRNA podem ajudar em sua exploração e entendimento, pois as sequências que pertencem ao mesmo grupo possuem uma função biológica similar. Esse trabalho explora e investiga sete algoritmos de agrupamentos não-supervisionados baseados em grafos que podem ser divididos em três categorias: algoritmos baseados em região de influência, algoritmos baseados em árvore spanning minimal e algoritmo espectral. Para avaliar a contribuição dos algoritmos propostos, os experimentos conduzidos utilizaram os dados das famílias de miRNAs disponíveis no banco de dados denominado miRBase. Os resultados dos experimentos foram apresentados, analisados e avaliados usando índices de validação de agrupamento e análise visual.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAgrupamento de miRNAMineração de dadosTeoria dos grafosAlgoritmo espectralAprendizado não-supervisionadoClusteringmiRNA clusteringData miningUnsupervised learningGraph theoryGraph based clustering algorithmsAlgorithm based on region of influenceAlgorithm based on minimum spanning treeSpectral algorithmCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAgrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnline600600a06526c6-28b8-482a-b64f-3655cf6d3c38info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissVAK.pdfDissVAK.pdfapplication/pdf4608619https://repositorio.ufscar.br/bitstreams/04bc74ba-33bf-4c15-ad3b-a25ea3533387/download3022034b9035e4e8caf1195902d24581MD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://repositorio.ufscar.br/bitstreams/7b224ebd-5218-4613-84cf-b22855a1b4bf/downloadae0398b6f8b235e40ad82cba6c50031dMD52falseAnonymousREADTEXTDissVAK.pdf.txtDissVAK.pdf.txtExtracted texttext/plain271314https://repositorio.ufscar.br/bitstreams/7ac2d1f8-452e-4484-a2db-ec498f639136/download4790f26ece277b50c8e70c86e7718749MD55falseAnonymousREADTHUMBNAILDissVAK.pdf.jpgDissVAK.pdf.jpgIM Thumbnailimage/jpeg7488https://repositorio.ufscar.br/bitstreams/eb236292-69f8-44e2-934c-5cd54d968100/download24d434cd2e74e71f1a19d4e467145982MD56falseAnonymousREAD20.500.14289/81242025-02-05 17:24:24.769Acesso abertoopen.accessoai:repositorio.ufscar.br:20.500.14289/8124https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-05T20:24:24Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==
dc.title.por.fl_str_mv Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos
title Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos
spellingShingle Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos
Kasahara, Viviani Akemi
Agrupamento de miRNA
Mineração de dados
Teoria dos grafos
Algoritmo espectral
Aprendizado não-supervisionado
Clustering
miRNA clustering
Data mining
Unsupervised learning
Graph theory
Graph based clustering algorithms
Algorithm based on region of influence
Algorithm based on minimum spanning tree
Spectral algorithm
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos
title_full Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos
title_fullStr Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos
title_full_unstemmed Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos
title_sort Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos
author Kasahara, Viviani Akemi
author_facet Kasahara, Viviani Akemi
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/6384693865752033
dc.contributor.author.fl_str_mv Kasahara, Viviani Akemi
dc.contributor.advisor1.fl_str_mv Nicoletti, Maria do Carmo
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6454154048263145
dc.contributor.authorID.fl_str_mv 1883aad5-3354-476d-8a33-15a60afc6fdd
contributor_str_mv Nicoletti, Maria do Carmo
dc.subject.por.fl_str_mv Agrupamento de miRNA
Mineração de dados
Teoria dos grafos
Algoritmo espectral
Aprendizado não-supervisionado
topic Agrupamento de miRNA
Mineração de dados
Teoria dos grafos
Algoritmo espectral
Aprendizado não-supervisionado
Clustering
miRNA clustering
Data mining
Unsupervised learning
Graph theory
Graph based clustering algorithms
Algorithm based on region of influence
Algorithm based on minimum spanning tree
Spectral algorithm
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Clustering
miRNA clustering
Data mining
Unsupervised learning
Graph theory
Graph based clustering algorithms
Algorithm based on region of influence
Algorithm based on minimum spanning tree
Spectral algorithm
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Cluster analysis is the organization of a collection of patterns into clusters based on similarity which is determined by using properties of data. Clustering techniques can be useful in a variety of knowledge domains such as biotechnology, computer vision, document retrieval and many others. An interesting area of biology involves the concept of microRNAs (miRNAs) that are approximately 22 nucleotide-long non-coding RNA molecules that play important roles in gene regulation. Clustering miRNA sequences can help to understand and explore sequences belonging to the same cluster that has similar biological functions. This research work investigates and explores seven unsupervised clustering algorithms based on graphs that can be divided into three categories: algorithm based on region of influence, algorithm based on minimum spanning tree and spectral algorithm. To assess the contribution of the proposed algorithms, data from miRNA families stored in the online miRBase database were used in the conducted experiments. The results of these experiments were presented, analysed and evaluated using clustering validation indexes as well as visual analysis.
publishDate 2016
dc.date.accessioned.fl_str_mv 2016-10-21T13:03:34Z
dc.date.available.fl_str_mv 2016-10-21T13:03:34Z
dc.date.issued.fl_str_mv 2016-08-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv KASAHARA, Viviani Akemi. Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos. 2016. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/8124.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/8124
identifier_str_mv KASAHARA, Viviani Akemi. Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos. 2016. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/8124.
url https://repositorio.ufscar.br/handle/20.500.14289/8124
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv a06526c6-28b8-482a-b64f-3655cf6d3c38
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/04bc74ba-33bf-4c15-ad3b-a25ea3533387/download
https://repositorio.ufscar.br/bitstreams/7b224ebd-5218-4613-84cf-b22855a1b4bf/download
https://repositorio.ufscar.br/bitstreams/7ac2d1f8-452e-4484-a2db-ec498f639136/download
https://repositorio.ufscar.br/bitstreams/eb236292-69f8-44e2-934c-5cd54d968100/download
bitstream.checksum.fl_str_mv 3022034b9035e4e8caf1195902d24581
ae0398b6f8b235e40ad82cba6c50031d
4790f26ece277b50c8e70c86e7718749
24d434cd2e74e71f1a19d4e467145982
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688874004185088