Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos
| Ano de defesa: | 2016 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação - PPGCC
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufscar.br/handle/20.500.14289/8124 |
Resumo: | Cluster analysis is the organization of a collection of patterns into clusters based on similarity which is determined by using properties of data. Clustering techniques can be useful in a variety of knowledge domains such as biotechnology, computer vision, document retrieval and many others. An interesting area of biology involves the concept of microRNAs (miRNAs) that are approximately 22 nucleotide-long non-coding RNA molecules that play important roles in gene regulation. Clustering miRNA sequences can help to understand and explore sequences belonging to the same cluster that has similar biological functions. This research work investigates and explores seven unsupervised clustering algorithms based on graphs that can be divided into three categories: algorithm based on region of influence, algorithm based on minimum spanning tree and spectral algorithm. To assess the contribution of the proposed algorithms, data from miRNA families stored in the online miRBase database were used in the conducted experiments. The results of these experiments were presented, analysed and evaluated using clustering validation indexes as well as visual analysis. |
| id |
SCAR_8860ff0ace09c05b1050e9759aeccbb2 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/8124 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Kasahara, Viviani AkemiNicoletti, Maria do Carmohttp://lattes.cnpq.br/6454154048263145http://lattes.cnpq.br/63846938657520331883aad5-3354-476d-8a33-15a60afc6fdd2016-10-21T13:03:34Z2016-10-21T13:03:34Z2016-08-12KASAHARA, Viviani Akemi. Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos. 2016. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/8124.https://repositorio.ufscar.br/handle/20.500.14289/8124Cluster analysis is the organization of a collection of patterns into clusters based on similarity which is determined by using properties of data. Clustering techniques can be useful in a variety of knowledge domains such as biotechnology, computer vision, document retrieval and many others. An interesting area of biology involves the concept of microRNAs (miRNAs) that are approximately 22 nucleotide-long non-coding RNA molecules that play important roles in gene regulation. Clustering miRNA sequences can help to understand and explore sequences belonging to the same cluster that has similar biological functions. This research work investigates and explores seven unsupervised clustering algorithms based on graphs that can be divided into three categories: algorithm based on region of influence, algorithm based on minimum spanning tree and spectral algorithm. To assess the contribution of the proposed algorithms, data from miRNA families stored in the online miRBase database were used in the conducted experiments. The results of these experiments were presented, analysed and evaluated using clustering validation indexes as well as visual analysis.A análise de agrupamento é uma organização de coleção de padrões em grupos, baseando-se na similaridade das propriedades pertencentes aos dados. A técnica de agrupamento pode ser utilizado em muitas áreas de conhecimento como biotecnologia, visão computacional, recuperação de documentos, entre outras. Uma área interessante da biologia envolve o conceito de microRNAs (miRNAs), que são moléculas não-codificadas de RNA com aproximadamente 22 nucleotídeos e que desempenham um papel importante na regulação dos genes. O agrupamento de sequências de miRNA podem ajudar em sua exploração e entendimento, pois as sequências que pertencem ao mesmo grupo possuem uma função biológica similar. Esse trabalho explora e investiga sete algoritmos de agrupamentos não-supervisionados baseados em grafos que podem ser divididos em três categorias: algoritmos baseados em região de influência, algoritmos baseados em árvore spanning minimal e algoritmo espectral. Para avaliar a contribuição dos algoritmos propostos, os experimentos conduzidos utilizaram os dados das famílias de miRNAs disponíveis no banco de dados denominado miRBase. Os resultados dos experimentos foram apresentados, analisados e avaliados usando índices de validação de agrupamento e análise visual.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAgrupamento de miRNAMineração de dadosTeoria dos grafosAlgoritmo espectralAprendizado não-supervisionadoClusteringmiRNA clusteringData miningUnsupervised learningGraph theoryGraph based clustering algorithmsAlgorithm based on region of influenceAlgorithm based on minimum spanning treeSpectral algorithmCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAgrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnline600600a06526c6-28b8-482a-b64f-3655cf6d3c38info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissVAK.pdfDissVAK.pdfapplication/pdf4608619https://repositorio.ufscar.br/bitstreams/04bc74ba-33bf-4c15-ad3b-a25ea3533387/download3022034b9035e4e8caf1195902d24581MD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://repositorio.ufscar.br/bitstreams/7b224ebd-5218-4613-84cf-b22855a1b4bf/downloadae0398b6f8b235e40ad82cba6c50031dMD52falseAnonymousREADTEXTDissVAK.pdf.txtDissVAK.pdf.txtExtracted texttext/plain271314https://repositorio.ufscar.br/bitstreams/7ac2d1f8-452e-4484-a2db-ec498f639136/download4790f26ece277b50c8e70c86e7718749MD55falseAnonymousREADTHUMBNAILDissVAK.pdf.jpgDissVAK.pdf.jpgIM Thumbnailimage/jpeg7488https://repositorio.ufscar.br/bitstreams/eb236292-69f8-44e2-934c-5cd54d968100/download24d434cd2e74e71f1a19d4e467145982MD56falseAnonymousREAD20.500.14289/81242025-02-05 17:24:24.769Acesso abertoopen.accessoai:repositorio.ufscar.br:20.500.14289/8124https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-05T20:24:24Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg== |
| dc.title.por.fl_str_mv |
Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos |
| title |
Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos |
| spellingShingle |
Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos Kasahara, Viviani Akemi Agrupamento de miRNA Mineração de dados Teoria dos grafos Algoritmo espectral Aprendizado não-supervisionado Clustering miRNA clustering Data mining Unsupervised learning Graph theory Graph based clustering algorithms Algorithm based on region of influence Algorithm based on minimum spanning tree Spectral algorithm CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos |
| title_full |
Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos |
| title_fullStr |
Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos |
| title_full_unstemmed |
Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos |
| title_sort |
Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos |
| author |
Kasahara, Viviani Akemi |
| author_facet |
Kasahara, Viviani Akemi |
| author_role |
author |
| dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/6384693865752033 |
| dc.contributor.author.fl_str_mv |
Kasahara, Viviani Akemi |
| dc.contributor.advisor1.fl_str_mv |
Nicoletti, Maria do Carmo |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6454154048263145 |
| dc.contributor.authorID.fl_str_mv |
1883aad5-3354-476d-8a33-15a60afc6fdd |
| contributor_str_mv |
Nicoletti, Maria do Carmo |
| dc.subject.por.fl_str_mv |
Agrupamento de miRNA Mineração de dados Teoria dos grafos Algoritmo espectral Aprendizado não-supervisionado |
| topic |
Agrupamento de miRNA Mineração de dados Teoria dos grafos Algoritmo espectral Aprendizado não-supervisionado Clustering miRNA clustering Data mining Unsupervised learning Graph theory Graph based clustering algorithms Algorithm based on region of influence Algorithm based on minimum spanning tree Spectral algorithm CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Clustering miRNA clustering Data mining Unsupervised learning Graph theory Graph based clustering algorithms Algorithm based on region of influence Algorithm based on minimum spanning tree Spectral algorithm |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
Cluster analysis is the organization of a collection of patterns into clusters based on similarity which is determined by using properties of data. Clustering techniques can be useful in a variety of knowledge domains such as biotechnology, computer vision, document retrieval and many others. An interesting area of biology involves the concept of microRNAs (miRNAs) that are approximately 22 nucleotide-long non-coding RNA molecules that play important roles in gene regulation. Clustering miRNA sequences can help to understand and explore sequences belonging to the same cluster that has similar biological functions. This research work investigates and explores seven unsupervised clustering algorithms based on graphs that can be divided into three categories: algorithm based on region of influence, algorithm based on minimum spanning tree and spectral algorithm. To assess the contribution of the proposed algorithms, data from miRNA families stored in the online miRBase database were used in the conducted experiments. The results of these experiments were presented, analysed and evaluated using clustering validation indexes as well as visual analysis. |
| publishDate |
2016 |
| dc.date.accessioned.fl_str_mv |
2016-10-21T13:03:34Z |
| dc.date.available.fl_str_mv |
2016-10-21T13:03:34Z |
| dc.date.issued.fl_str_mv |
2016-08-12 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
KASAHARA, Viviani Akemi. Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos. 2016. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/8124. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/20.500.14289/8124 |
| identifier_str_mv |
KASAHARA, Viviani Akemi. Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos. 2016. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/8124. |
| url |
https://repositorio.ufscar.br/handle/20.500.14289/8124 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.confidence.fl_str_mv |
600 600 |
| dc.relation.authority.fl_str_mv |
a06526c6-28b8-482a-b64f-3655cf6d3c38 |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/04bc74ba-33bf-4c15-ad3b-a25ea3533387/download https://repositorio.ufscar.br/bitstreams/7b224ebd-5218-4613-84cf-b22855a1b4bf/download https://repositorio.ufscar.br/bitstreams/7ac2d1f8-452e-4484-a2db-ec498f639136/download https://repositorio.ufscar.br/bitstreams/eb236292-69f8-44e2-934c-5cd54d968100/download |
| bitstream.checksum.fl_str_mv |
3022034b9035e4e8caf1195902d24581 ae0398b6f8b235e40ad82cba6c50031d 4790f26ece277b50c8e70c86e7718749 24d434cd2e74e71f1a19d4e467145982 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688874004185088 |