On the support of the similarity-aware division operator in a relational database management system

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Vasconcelos, Guilherme Queiroz
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
SQL
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16102019-140149/
Resumo: The Division operator (&division;) from the Relational Algebra allows simple and intuitive representation of queries with the concept of \"for all\", and thus it is required by many real applications. However, the Relational Division is unable to support the needs of modern applications that manipulate complex data, such as images, audio, long texts, genetic sequences, etc. These data are better compared for similarity, whereas the Division always compares values for equality. Recent works focused on extending the Relational Algebra and database operators to support similarity comparison. This project incorporated the Similarity-Aware Divison Operator in a Relational Database Management System (RDBMS) and studied its relationship with other query operators. We extended a similarity-oriented SQL to represent the Similarity-Aware Division Operator in a simple and intuitive manner and implemented state-of-art algorithms, internal database queries and resources for similarity data manipulation all inside the RDBMS. This solution presents strategies for efficient and improved performance queries. For semantical validation, it was performed a case study of an application that finds prospective companies able to bid in public request for tenders (RFT) using similarity comparison on RFTs documents and companies\'s catalogs. We evaluated the quality of results in a case study with real datasets from request for tenders from public brazilian food companies. In the experiments, the Similarity-Aware Division Operator was able to identify which RFT which company can participate in with 90% recall.
id USP_13cadffed70415272fa2ec3928ef681d
oai_identifier_str oai:teses.usp.br:tde-16102019-140149
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling On the support of the similarity-aware division operator in a relational database management systemSuporte à divisão por similaridade em um sistema gerenciador de banco de dados relacionalComplex DataConsultas por similaridadeDados complexosDivisão relacionalRelational database management systemRelational divisionSimilarity queriesSistema gerenciador de banco de dados relacionalSQLSQLThe Division operator (&division;) from the Relational Algebra allows simple and intuitive representation of queries with the concept of \"for all\", and thus it is required by many real applications. However, the Relational Division is unable to support the needs of modern applications that manipulate complex data, such as images, audio, long texts, genetic sequences, etc. These data are better compared for similarity, whereas the Division always compares values for equality. Recent works focused on extending the Relational Algebra and database operators to support similarity comparison. This project incorporated the Similarity-Aware Divison Operator in a Relational Database Management System (RDBMS) and studied its relationship with other query operators. We extended a similarity-oriented SQL to represent the Similarity-Aware Division Operator in a simple and intuitive manner and implemented state-of-art algorithms, internal database queries and resources for similarity data manipulation all inside the RDBMS. This solution presents strategies for efficient and improved performance queries. For semantical validation, it was performed a case study of an application that finds prospective companies able to bid in public request for tenders (RFT) using similarity comparison on RFTs documents and companies\'s catalogs. We evaluated the quality of results in a case study with real datasets from request for tenders from public brazilian food companies. In the experiments, the Similarity-Aware Division Operator was able to identify which RFT which company can participate in with 90% recall.O operador de Divisão (&division;) da Álgebra Relacional permite a representação de consultas com o conceito de \"para todos\" de forma simples e intuitiva, e por isso, é empregado em várias aplicações do dia a dia. Entretanto, a Divisão Relacional é incapaz de atender as necessidades de aplicações modernas que manipulam dados complexos como imagens, áudios, textos longos, sequência genéticas, etc. Esses tipos de dados são melhor comparados por similaridade, porém, a Divisão Relacional sempre compara valores por igualdade. Estudos recentes focaram-se em estender a Álgebra Relacional e operadores de banco de dados para suportar comparações por similaridade. Esse projeto incorporou a Divisão Por Similaridade a um Sistema Gerenciador de Banco de Dados Relacional (SGBDR) e estudou seu relacionamento com outros operadores de consulta. Para isso, foi realizada a extensão de um SQL com operadores de similaridade para representar o operador de Divisão Por Similaridade de forma simples e intuitiva e a implementação de algoritmos do estado-da-arte, consultas internas ao banco e recursos para manipulação de dados por similaridade dentro do SGBD. Esta solução apresenta estratégias para execução eficiente de consultas envolvendo este operador. Para avaliação da qualidade de resultados, foi realizado um estudo de caso para encontrar empresas em potencial capazes de participar de licitações públicas através de comparações por similaridade dos documentos de licitação e da lista de produtos das empresas. Nós avaliamos o caso de uso com conjuntos de dados reais de licitações e empresas brasileiras da indústria alimentícia. Nos experimentos, a Divisão por Similaridade foi capaz de indentificar quais licitações cada empresa pode concorrer com uma revocação de 90%.Biblioteca Digitais de Teses e Dissertações da USPCordeiro, Robson Leonardo FerreiraVasconcelos, Guilherme Queiroz2019-05-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-16102019-140149/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2020-01-09T22:03:02Zoai:teses.usp.br:tde-16102019-140149Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-01-09T22:03:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv On the support of the similarity-aware division operator in a relational database management system
Suporte à divisão por similaridade em um sistema gerenciador de banco de dados relacional
title On the support of the similarity-aware division operator in a relational database management system
spellingShingle On the support of the similarity-aware division operator in a relational database management system
Vasconcelos, Guilherme Queiroz
Complex Data
Consultas por similaridade
Dados complexos
Divisão relacional
Relational database management system
Relational division
Similarity queries
Sistema gerenciador de banco de dados relacional
SQL
SQL
title_short On the support of the similarity-aware division operator in a relational database management system
title_full On the support of the similarity-aware division operator in a relational database management system
title_fullStr On the support of the similarity-aware division operator in a relational database management system
title_full_unstemmed On the support of the similarity-aware division operator in a relational database management system
title_sort On the support of the similarity-aware division operator in a relational database management system
author Vasconcelos, Guilherme Queiroz
author_facet Vasconcelos, Guilherme Queiroz
author_role author
dc.contributor.none.fl_str_mv Cordeiro, Robson Leonardo Ferreira
dc.contributor.author.fl_str_mv Vasconcelos, Guilherme Queiroz
dc.subject.por.fl_str_mv Complex Data
Consultas por similaridade
Dados complexos
Divisão relacional
Relational database management system
Relational division
Similarity queries
Sistema gerenciador de banco de dados relacional
SQL
SQL
topic Complex Data
Consultas por similaridade
Dados complexos
Divisão relacional
Relational database management system
Relational division
Similarity queries
Sistema gerenciador de banco de dados relacional
SQL
SQL
description The Division operator (&division;) from the Relational Algebra allows simple and intuitive representation of queries with the concept of \"for all\", and thus it is required by many real applications. However, the Relational Division is unable to support the needs of modern applications that manipulate complex data, such as images, audio, long texts, genetic sequences, etc. These data are better compared for similarity, whereas the Division always compares values for equality. Recent works focused on extending the Relational Algebra and database operators to support similarity comparison. This project incorporated the Similarity-Aware Divison Operator in a Relational Database Management System (RDBMS) and studied its relationship with other query operators. We extended a similarity-oriented SQL to represent the Similarity-Aware Division Operator in a simple and intuitive manner and implemented state-of-art algorithms, internal database queries and resources for similarity data manipulation all inside the RDBMS. This solution presents strategies for efficient and improved performance queries. For semantical validation, it was performed a case study of an application that finds prospective companies able to bid in public request for tenders (RFT) using similarity comparison on RFTs documents and companies\'s catalogs. We evaluated the quality of results in a case study with real datasets from request for tenders from public brazilian food companies. In the experiments, the Similarity-Aware Division Operator was able to identify which RFT which company can participate in with 90% recall.
publishDate 2019
dc.date.none.fl_str_mv 2019-05-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16102019-140149/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16102019-140149/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865491182875836416