Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Chavari, Gustavo Henrique
Orientador(a): Levada, Alexandre Luis Magalhães lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação - PPGCC
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://hdl.handle.net/20.500.14289/21388
Resumo: Unsupervised metric learning consists of constructing adaptive distance functions without knowledge of class labels and aims to improve both clustering and supervised pattern classification. Typically, this process can be performed by multiple manifold learning algorithms, through nonlinear dimensionality reduction. Recently, a new algorithm, known as K-ISOMAP, has been proposed for this purpose. It uses differential geometry-based measures to replace the Euclidean distance with measures based on local curvature in the ISOMAP method. This method uses concepts from differential geometry to construct an intrinsic distance function that measures the variations of local tangent spaces along edges in the k-NN graph, motivated by the Frenet-Serret equations and the notion of curvature. This work investigates the quality of the clustering obtained via GMM after mapping the data to lower-dimensional spaces. The results on several datasets suggest that the K-ISOMAP method can produce better clustering than those produced by the standard ISOMAP algorithm, being competitive with the state-of-the-art in metric and manifold learning.
id SCAR_eb11289d2520b47a9a9de4ec0d345673
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/21388
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Chavari, Gustavo HenriqueLevada, Alexandre Luis Magalhãeshttp://lattes.cnpq.br/3341441596395463http://lattes.cnpq.br/50520344564991232025-02-17T17:50:43Z2024-11-27CHAVARI, Gustavo Henrique. Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21388.https://hdl.handle.net/20.500.14289/21388Unsupervised metric learning consists of constructing adaptive distance functions without knowledge of class labels and aims to improve both clustering and supervised pattern classification. Typically, this process can be performed by multiple manifold learning algorithms, through nonlinear dimensionality reduction. Recently, a new algorithm, known as K-ISOMAP, has been proposed for this purpose. It uses differential geometry-based measures to replace the Euclidean distance with measures based on local curvature in the ISOMAP method. This method uses concepts from differential geometry to construct an intrinsic distance function that measures the variations of local tangent spaces along edges in the k-NN graph, motivated by the Frenet-Serret equations and the notion of curvature. This work investigates the quality of the clustering obtained via GMM after mapping the data to lower-dimensional spaces. The results on several datasets suggest that the K-ISOMAP method can produce better clustering than those produced by the standard ISOMAP algorithm, being competitive with the state-of-the-art in metric and manifold learning.O aprendizado não supervisionado de métricas consiste na construção de funções adaptativas de distância sem o conhecimento dos rótulos das classes e visa melhorar tanto o agrupamento quanto a classificação supervisionada de padrões. Normalmente, este processo pode ser realizado por múltiplos algoritmos de aprendizado de variedades, através da redução de dimensionalidade não linear. Recentemente, um novo algoritmo, conhecido como K-ISOMAP, foi proposto para esta finalidade. Ele utiliza medidas baseadas em geometria diferencial para substituir a distância euclidiana por medidas baseadas na curvatura local no método ISOMAP. Trata-se de um método que utiliza conceitos da geometria diferencial para construir uma função de distância intrínseca que mede as variações dos espaços tangentes locais ao longo dos caminhos mais curtos no grafo k-NN, motivado pelas equações de Frenet-Serret e a noção de curvatura. Este trabalho consiste em investigar a qualidade dos agrupamentos obtidos via GMM após o mapeamento dos dados para espaços de menor dimensão. Os resultados sobre diversos conjuntos de dados sugerem que o método K-ISOMAP é capaz de produzir agrupamentos melhores do que os produzidos pelo algoritmo ISOMAP padrão, sendo competitivo em relação ao estado-da-arte em aprendizado de métricas e variedades.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCurvatureUnsupervised metric learningManifold learningDimensionality reductionClusteringCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOCIENCIAS EXATAS E DA TERRA::MATEMATICAISOMAPCurvaturaAprendizado de métricas não supervisionadoAprendizado de variedadesRedução de dimensionalidadeAgrupamentoAprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dadosUnsupervised metric learning using differential geometry and the ISOMAP algorithm in data clusteringinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTAprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados.txtAprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados.txtExtracted texttext/plain111084https://repositorio.ufscar.br/bitstreams/f97dd360-3a96-403d-9e34-c1e38bce744d/download1a59ae3cafa86032b6a816a16f4247bcMD53falseAnonymousREADTHUMBNAILAprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados.jpgAprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados.jpgGenerated Thumbnailimage/jpeg4441https://repositorio.ufscar.br/bitstreams/e0d5e9f4-161e-489b-a68e-5b9f82a30a5c/downloadc98c53c3b80c818d28b537317a2db8c3MD54falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8905https://repositorio.ufscar.br/bitstreams/07695e64-c40b-480c-b7a0-30d2781ec0c6/download57e258e544f104f04afb1d5e5b4e53c0MD52falseAnonymousREADORIGINALAprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dadosAprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dadosapplication/pdf9197073https://repositorio.ufscar.br/bitstreams/1e0d1462-d0c3-4162-a37c-9fc5a3aed661/downloade66f93a831b5927d86242d1924da6462MD51trueAnonymousREAD20.500.14289/213882025-02-18 00:19:06.946http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21388https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-18T03:19:06Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.none.fl_str_mv Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados
dc.title.alternative.eng.fl_str_mv Unsupervised metric learning using differential geometry and the ISOMAP algorithm in data clustering
title Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados
spellingShingle Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados
Chavari, Gustavo Henrique
Curvature
Unsupervised metric learning
Manifold learning
Dimensionality reduction
Clustering
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::MATEMATICA
ISOMAP
Curvatura
Aprendizado de métricas não supervisionado
Aprendizado de variedades
Redução de dimensionalidade
Agrupamento
title_short Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados
title_full Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados
title_fullStr Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados
title_full_unstemmed Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados
title_sort Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados
author Chavari, Gustavo Henrique
author_facet Chavari, Gustavo Henrique
author_role author
dc.contributor.authorlattes.none.fl_str_mv http://lattes.cnpq.br/5052034456499123
dc.contributor.author.fl_str_mv Chavari, Gustavo Henrique
dc.contributor.advisor1.fl_str_mv Levada, Alexandre Luis Magalhães
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/3341441596395463
contributor_str_mv Levada, Alexandre Luis Magalhães
dc.subject.eng.fl_str_mv Curvature
Unsupervised metric learning
Manifold learning
Dimensionality reduction
Clustering
topic Curvature
Unsupervised metric learning
Manifold learning
Dimensionality reduction
Clustering
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::MATEMATICA
ISOMAP
Curvatura
Aprendizado de métricas não supervisionado
Aprendizado de variedades
Redução de dimensionalidade
Agrupamento
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::MATEMATICA
dc.subject.por.fl_str_mv ISOMAP
Curvatura
Aprendizado de métricas não supervisionado
Aprendizado de variedades
Redução de dimensionalidade
Agrupamento
description Unsupervised metric learning consists of constructing adaptive distance functions without knowledge of class labels and aims to improve both clustering and supervised pattern classification. Typically, this process can be performed by multiple manifold learning algorithms, through nonlinear dimensionality reduction. Recently, a new algorithm, known as K-ISOMAP, has been proposed for this purpose. It uses differential geometry-based measures to replace the Euclidean distance with measures based on local curvature in the ISOMAP method. This method uses concepts from differential geometry to construct an intrinsic distance function that measures the variations of local tangent spaces along edges in the k-NN graph, motivated by the Frenet-Serret equations and the notion of curvature. This work investigates the quality of the clustering obtained via GMM after mapping the data to lower-dimensional spaces. The results on several datasets suggest that the K-ISOMAP method can produce better clustering than those produced by the standard ISOMAP algorithm, being competitive with the state-of-the-art in metric and manifold learning.
publishDate 2024
dc.date.issued.fl_str_mv 2024-11-27
dc.date.accessioned.fl_str_mv 2025-02-17T17:50:43Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CHAVARI, Gustavo Henrique. Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21388.
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.14289/21388
identifier_str_mv CHAVARI, Gustavo Henrique. Aprendizado não supervisionado de métricas utilizando geometria diferencial e o algoritmo ISOMAP no agrupamento de dados. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21388.
url https://hdl.handle.net/20.500.14289/21388
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/f97dd360-3a96-403d-9e34-c1e38bce744d/download
https://repositorio.ufscar.br/bitstreams/e0d5e9f4-161e-489b-a68e-5b9f82a30a5c/download
https://repositorio.ufscar.br/bitstreams/07695e64-c40b-480c-b7a0-30d2781ec0c6/download
https://repositorio.ufscar.br/bitstreams/1e0d1462-d0c3-4162-a37c-9fc5a3aed661/download
bitstream.checksum.fl_str_mv 1a59ae3cafa86032b6a816a16f4247bc
c98c53c3b80c818d28b537317a2db8c3
57e258e544f104f04afb1d5e5b4e53c0
e66f93a831b5927d86242d1924da6462
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688922950664192