A meta-learning approach for auto-selection and auto-configuration of proximity graphs
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.uel.br/handle/123456789/9132 |
Resumo: | Resumo: Devido à alta produção de dados complexos, as últimas décadas proporcionaram um avanço considerável no desenvolvimento de métodos de busca por similaridade Esses métodos consistem em indexar e recuperar dados por meio de suas características intrínsecas Recentemente, os métodos baseados em grafos superaram outros tipos de métodos na literatura de buscas por similaridade aproximada, tais como os métodos baseados em árvore, permutação e hash No entanto, encontrar um grafo adequado junto com seus parâmetros é uma tarefa desafiadora e demorada Uma vez que não existe uma parametrização precisa que se adapte à maioria dos conjuntos de dados e exigências do usuário, a escolha dos parâmetros é arbitrária ou baseada em uma busca em grade de execuções O objetivo principal deste trabalho é desenvolver uma abordagem inteligente baseada em técnicas de meta-aprendizado para recomendar uma configuração de grafo adequada para um determinado conjunto de dados Nossas principais contribuições são a proposta de uma arquitetura genérica e estratégias para construir um sistema de recomendação preciso, evitando experimentações exaustivas para parametrizar métodos baseados em grafos para buscas por similaridade Especificamente, esta Dissertação de mestrado detalha a coleta de conhecimento para resolver o problema e duas estratégias diferentes para instanciar um recomendador A primeira estratégia é uma abordagem global, que induz modelos de regressão em relação a todo o espaço do conhecimento O segundo é baseado na similaridade do conjunto de dados, aprendendo modelos de regressão para grupos de conjuntos de dados com propriedades semelhantes Afirmamos que particionar o espaço do conjunto de dados para aprendizagem melhora a precisão das recomendações Este trabalho emprega uma variedade de conjuntos de dados reais com características extraídas de imagens e um grande conjunto de conjuntos de dados sintéticos variando os principais parâmetros que afetam a recuperação de similaridade Apresentamos experimentos avaliando as estratégias de instanciação propostas que atestam que nossas abordagens superam as linhas de base na maioria dos casos Também discutimos experimentos explorando aspectos das técnicas propostas para apoiar as alternativas que escolhemos ao longo do trabalho Os resultados mostram que nossas propostas fornecem recomendações adequadas para grafos de proximidade, auxiliando os usuários na construção de índices eficientes para recuperação por similaridade |
| id |
UEL_d57d52ae8969de21a08abd359635bf39 |
|---|---|
| oai_identifier_str |
oai:repositorio.uel.br:123456789/9132 |
| network_acronym_str |
UEL |
| network_name_str |
Repositório Institucional da UEL |
| repository_id_str |
|
| spelling |
Oyamada, Rafael SeidiBueno, Renatof525c95e-1edc-4bb0-b5c7-22ce14772f32-1Zarpelão, Bruno Bogazc616021b-488a-4c71-9089-c14c349287c9-147c1046c-2e8f-4b72-82bd-06872dd414ad84ea4dd8-8bc5-48ee-a859-dca06838444eKaster, Daniel dos Santos [Orientador]Londrina2024-05-01T11:49:39Z2024-05-01T11:49:39Z2021.0016.04.2021https://repositorio.uel.br/handle/123456789/9132Resumo: Devido à alta produção de dados complexos, as últimas décadas proporcionaram um avanço considerável no desenvolvimento de métodos de busca por similaridade Esses métodos consistem em indexar e recuperar dados por meio de suas características intrínsecas Recentemente, os métodos baseados em grafos superaram outros tipos de métodos na literatura de buscas por similaridade aproximada, tais como os métodos baseados em árvore, permutação e hash No entanto, encontrar um grafo adequado junto com seus parâmetros é uma tarefa desafiadora e demorada Uma vez que não existe uma parametrização precisa que se adapte à maioria dos conjuntos de dados e exigências do usuário, a escolha dos parâmetros é arbitrária ou baseada em uma busca em grade de execuções O objetivo principal deste trabalho é desenvolver uma abordagem inteligente baseada em técnicas de meta-aprendizado para recomendar uma configuração de grafo adequada para um determinado conjunto de dados Nossas principais contribuições são a proposta de uma arquitetura genérica e estratégias para construir um sistema de recomendação preciso, evitando experimentações exaustivas para parametrizar métodos baseados em grafos para buscas por similaridade Especificamente, esta Dissertação de mestrado detalha a coleta de conhecimento para resolver o problema e duas estratégias diferentes para instanciar um recomendador A primeira estratégia é uma abordagem global, que induz modelos de regressão em relação a todo o espaço do conhecimento O segundo é baseado na similaridade do conjunto de dados, aprendendo modelos de regressão para grupos de conjuntos de dados com propriedades semelhantes Afirmamos que particionar o espaço do conjunto de dados para aprendizagem melhora a precisão das recomendações Este trabalho emprega uma variedade de conjuntos de dados reais com características extraídas de imagens e um grande conjunto de conjuntos de dados sintéticos variando os principais parâmetros que afetam a recuperação de similaridade Apresentamos experimentos avaliando as estratégias de instanciação propostas que atestam que nossas abordagens superam as linhas de base na maioria dos casos Também discutimos experimentos explorando aspectos das técnicas propostas para apoiar as alternativas que escolhemos ao longo do trabalho Os resultados mostram que nossas propostas fornecem recomendações adequadas para grafos de proximidade, auxiliando os usuários na construção de índices eficientes para recuperação por similaridadeDissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da ComputaçãoAbstract: Due to the high production of complex data, the last decades have provided a considerable progress in developing similarity search methods Such methods consist of indexing and retrieving data through their intrinsic characteristics Recently, graph-based methods have outperformed other types of methods in the literature of approximate similarity search, such as the tree-, permutation-, and hash-based methods However, finding a suitable graph along with its parameters is a challenging and time-consuming task Since there is no precise parameterization that suits most datasets and user constraints, the choice of parameters is either arbitrary or based on a grid search of executions The main objective of this work is to develop an intelligent approach based on meta-learning techniques to recommend a suitable graph configuration for a given dataset Our main contributions are the proposal of a generic architecture and strategies to build an accurate recommendation system avoiding exhaustive experimentation to parameterize graph-based methods for similarity searching Specifically, this master’s thesis details the gathering of knowledge to address the problem and two different strategies to instantiate a recommender The first strategy is a global approach, which induces regression models regarding the whole knowledge space The second one is based on dataset-similarity, learning regression models for clusters of datasets with similar properties We claim that partitioning the dataset space for learning improves the accuracy of the recommendations This work employs an assortment of real datasets with features extracted from images and a large set of synthetic datasets varying the main parameters affecting similarity retrieval We present experiments evaluating the proposed instantiation strategies that attest that our approaches outperform the baselines in most cases We also discuss experiments exploring aspects of the proposed techniques to support the alternatives we chose throughout the work The results show that our proposals provide suitable recommendations for proximity graphs, assisting users in building efficient indexes for similarity retrievalporComputaçãoGrafos de proximidadeBanco de dadosMeta-aprendizadoBusca por similaridadeComputer scienceProximity graphsDatabasesMeta-learningSimilarity searchingA meta-learning approach for auto-selection and auto-configuration of proximity graphsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisMestradoCiência da ComputaçãoCentro de Ciências ExatasPrograma de Pós-Graduação em Ciência da Computação-1-1reponame:Repositório Institucional da UELinstname:Universidade Estadual de Londrina (UEL)instacron:UELinfo:eu-repo/semantics/openAccess6181vtls000233929SIMvtls000233929http://www.bibliotecadigital.uel.br/document/?code=vtls00023392964.00SIMhttp://www.bibliotecadigital.uel.br/document/?code=vtls0002339298182.pdf123456789/5002 - Mestrado - Ciência da ComputaçãoORIGINAL8182.pdfapplication/pdf4434468https://repositorio.uel.br/bitstreams/5850e94a-e28f-407f-87d8-3133dffa9f28/download401a114e300f4e6928c34a9af0bee602MD51LICENCElicence.txttext/plain263https://repositorio.uel.br/bitstreams/15841c51-b41b-4260-bc91-f923a55dda26/download753f376dfdbc064b559839be95ac5523MD52THUMBNAIL8182.pdf.jpg8182.pdf.jpgGenerated Thumbnailimage/jpeg3516https://repositorio.uel.br/bitstreams/261c73c8-0889-44b6-8b10-cf0f9c6cb561/download92463f1559953ab29ef86f88319c9ec3MD53123456789/91322024-07-12 01:19:29.285open.accessoai:repositorio.uel.br:123456789/9132https://repositorio.uel.brBiblioteca Digital de Teses e Dissertaçõeshttp://www.bibliotecadigital.uel.br/PUBhttp://www.bibliotecadigital.uel.br/OAI/oai2.phpbcuel@uel.br||opendoar:2024-07-12T04:19:29Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)false |
| dc.title.pt_BR.fl_str_mv |
A meta-learning approach for auto-selection and auto-configuration of proximity graphs |
| title |
A meta-learning approach for auto-selection and auto-configuration of proximity graphs |
| spellingShingle |
A meta-learning approach for auto-selection and auto-configuration of proximity graphs Oyamada, Rafael Seidi Computação Grafos de proximidade Banco de dados Meta-aprendizado Busca por similaridade Computer science Proximity graphs Databases Meta-learning Similarity searching |
| title_short |
A meta-learning approach for auto-selection and auto-configuration of proximity graphs |
| title_full |
A meta-learning approach for auto-selection and auto-configuration of proximity graphs |
| title_fullStr |
A meta-learning approach for auto-selection and auto-configuration of proximity graphs |
| title_full_unstemmed |
A meta-learning approach for auto-selection and auto-configuration of proximity graphs |
| title_sort |
A meta-learning approach for auto-selection and auto-configuration of proximity graphs |
| author |
Oyamada, Rafael Seidi |
| author_facet |
Oyamada, Rafael Seidi |
| author_role |
author |
| dc.contributor.banca.pt_BR.fl_str_mv |
Bueno, Renato Zarpelão, Bruno Bogaz |
| dc.contributor.author.fl_str_mv |
Oyamada, Rafael Seidi |
| dc.contributor.authorID.fl_str_mv |
47c1046c-2e8f-4b72-82bd-06872dd414ad |
| dc.contributor.advisor1ID.fl_str_mv |
84ea4dd8-8bc5-48ee-a859-dca06838444e |
| dc.contributor.advisor1.fl_str_mv |
Kaster, Daniel dos Santos [Orientador] |
| contributor_str_mv |
Kaster, Daniel dos Santos [Orientador] |
| dc.subject.por.fl_str_mv |
Computação Grafos de proximidade Banco de dados Meta-aprendizado Busca por similaridade Computer science Proximity graphs Databases Meta-learning Similarity searching |
| topic |
Computação Grafos de proximidade Banco de dados Meta-aprendizado Busca por similaridade Computer science Proximity graphs Databases Meta-learning Similarity searching |
| description |
Resumo: Devido à alta produção de dados complexos, as últimas décadas proporcionaram um avanço considerável no desenvolvimento de métodos de busca por similaridade Esses métodos consistem em indexar e recuperar dados por meio de suas características intrínsecas Recentemente, os métodos baseados em grafos superaram outros tipos de métodos na literatura de buscas por similaridade aproximada, tais como os métodos baseados em árvore, permutação e hash No entanto, encontrar um grafo adequado junto com seus parâmetros é uma tarefa desafiadora e demorada Uma vez que não existe uma parametrização precisa que se adapte à maioria dos conjuntos de dados e exigências do usuário, a escolha dos parâmetros é arbitrária ou baseada em uma busca em grade de execuções O objetivo principal deste trabalho é desenvolver uma abordagem inteligente baseada em técnicas de meta-aprendizado para recomendar uma configuração de grafo adequada para um determinado conjunto de dados Nossas principais contribuições são a proposta de uma arquitetura genérica e estratégias para construir um sistema de recomendação preciso, evitando experimentações exaustivas para parametrizar métodos baseados em grafos para buscas por similaridade Especificamente, esta Dissertação de mestrado detalha a coleta de conhecimento para resolver o problema e duas estratégias diferentes para instanciar um recomendador A primeira estratégia é uma abordagem global, que induz modelos de regressão em relação a todo o espaço do conhecimento O segundo é baseado na similaridade do conjunto de dados, aprendendo modelos de regressão para grupos de conjuntos de dados com propriedades semelhantes Afirmamos que particionar o espaço do conjunto de dados para aprendizagem melhora a precisão das recomendações Este trabalho emprega uma variedade de conjuntos de dados reais com características extraídas de imagens e um grande conjunto de conjuntos de dados sintéticos variando os principais parâmetros que afetam a recuperação de similaridade Apresentamos experimentos avaliando as estratégias de instanciação propostas que atestam que nossas abordagens superam as linhas de base na maioria dos casos Também discutimos experimentos explorando aspectos das técnicas propostas para apoiar as alternativas que escolhemos ao longo do trabalho Os resultados mostram que nossas propostas fornecem recomendações adequadas para grafos de proximidade, auxiliando os usuários na construção de índices eficientes para recuperação por similaridade |
| publishDate |
2024 |
| dc.date.defesa.pt_BR.fl_str_mv |
16.04.2021 |
| dc.date.created.fl_str_mv |
2021.00 |
| dc.date.accessioned.fl_str_mv |
2024-05-01T11:49:39Z |
| dc.date.available.fl_str_mv |
2024-05-01T11:49:39Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://repositorio.uel.br/handle/123456789/9132 |
| url |
https://repositorio.uel.br/handle/123456789/9132 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.confidence.fl_str_mv |
-1 -1 |
| dc.relation.coursedegree.pt_BR.fl_str_mv |
Mestrado |
| dc.relation.coursename.pt_BR.fl_str_mv |
Ciência da Computação |
| dc.relation.departament.pt_BR.fl_str_mv |
Centro de Ciências Exatas |
| dc.relation.ppgname.pt_BR.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.coverage.spatial.pt_BR.fl_str_mv |
Londrina |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UEL instname:Universidade Estadual de Londrina (UEL) instacron:UEL |
| instname_str |
Universidade Estadual de Londrina (UEL) |
| instacron_str |
UEL |
| institution |
UEL |
| reponame_str |
Repositório Institucional da UEL |
| collection |
Repositório Institucional da UEL |
| bitstream.url.fl_str_mv |
https://repositorio.uel.br/bitstreams/5850e94a-e28f-407f-87d8-3133dffa9f28/download https://repositorio.uel.br/bitstreams/15841c51-b41b-4260-bc91-f923a55dda26/download https://repositorio.uel.br/bitstreams/261c73c8-0889-44b6-8b10-cf0f9c6cb561/download |
| bitstream.checksum.fl_str_mv |
401a114e300f4e6928c34a9af0bee602 753f376dfdbc064b559839be95ac5523 92463f1559953ab29ef86f88319c9ec3 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL) |
| repository.mail.fl_str_mv |
bcuel@uel.br|| |
| _version_ |
1856675726566096896 |