On the support of the similarity-aware division operator in a relational database management system
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16102019-140149/ |
Resumo: | The Division operator (&division;) from the Relational Algebra allows simple and intuitive representation of queries with the concept of \"for all\", and thus it is required by many real applications. However, the Relational Division is unable to support the needs of modern applications that manipulate complex data, such as images, audio, long texts, genetic sequences, etc. These data are better compared for similarity, whereas the Division always compares values for equality. Recent works focused on extending the Relational Algebra and database operators to support similarity comparison. This project incorporated the Similarity-Aware Divison Operator in a Relational Database Management System (RDBMS) and studied its relationship with other query operators. We extended a similarity-oriented SQL to represent the Similarity-Aware Division Operator in a simple and intuitive manner and implemented state-of-art algorithms, internal database queries and resources for similarity data manipulation all inside the RDBMS. This solution presents strategies for efficient and improved performance queries. For semantical validation, it was performed a case study of an application that finds prospective companies able to bid in public request for tenders (RFT) using similarity comparison on RFTs documents and companies\'s catalogs. We evaluated the quality of results in a case study with real datasets from request for tenders from public brazilian food companies. In the experiments, the Similarity-Aware Division Operator was able to identify which RFT which company can participate in with 90% recall. |
| id |
USP_13cadffed70415272fa2ec3928ef681d |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-16102019-140149 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
On the support of the similarity-aware division operator in a relational database management systemSuporte à divisão por similaridade em um sistema gerenciador de banco de dados relacionalComplex DataConsultas por similaridadeDados complexosDivisão relacionalRelational database management systemRelational divisionSimilarity queriesSistema gerenciador de banco de dados relacionalSQLSQLThe Division operator (&division;) from the Relational Algebra allows simple and intuitive representation of queries with the concept of \"for all\", and thus it is required by many real applications. However, the Relational Division is unable to support the needs of modern applications that manipulate complex data, such as images, audio, long texts, genetic sequences, etc. These data are better compared for similarity, whereas the Division always compares values for equality. Recent works focused on extending the Relational Algebra and database operators to support similarity comparison. This project incorporated the Similarity-Aware Divison Operator in a Relational Database Management System (RDBMS) and studied its relationship with other query operators. We extended a similarity-oriented SQL to represent the Similarity-Aware Division Operator in a simple and intuitive manner and implemented state-of-art algorithms, internal database queries and resources for similarity data manipulation all inside the RDBMS. This solution presents strategies for efficient and improved performance queries. For semantical validation, it was performed a case study of an application that finds prospective companies able to bid in public request for tenders (RFT) using similarity comparison on RFTs documents and companies\'s catalogs. We evaluated the quality of results in a case study with real datasets from request for tenders from public brazilian food companies. In the experiments, the Similarity-Aware Division Operator was able to identify which RFT which company can participate in with 90% recall.O operador de Divisão (&division;) da Álgebra Relacional permite a representação de consultas com o conceito de \"para todos\" de forma simples e intuitiva, e por isso, é empregado em várias aplicações do dia a dia. Entretanto, a Divisão Relacional é incapaz de atender as necessidades de aplicações modernas que manipulam dados complexos como imagens, áudios, textos longos, sequência genéticas, etc. Esses tipos de dados são melhor comparados por similaridade, porém, a Divisão Relacional sempre compara valores por igualdade. Estudos recentes focaram-se em estender a Álgebra Relacional e operadores de banco de dados para suportar comparações por similaridade. Esse projeto incorporou a Divisão Por Similaridade a um Sistema Gerenciador de Banco de Dados Relacional (SGBDR) e estudou seu relacionamento com outros operadores de consulta. Para isso, foi realizada a extensão de um SQL com operadores de similaridade para representar o operador de Divisão Por Similaridade de forma simples e intuitiva e a implementação de algoritmos do estado-da-arte, consultas internas ao banco e recursos para manipulação de dados por similaridade dentro do SGBD. Esta solução apresenta estratégias para execução eficiente de consultas envolvendo este operador. Para avaliação da qualidade de resultados, foi realizado um estudo de caso para encontrar empresas em potencial capazes de participar de licitações públicas através de comparações por similaridade dos documentos de licitação e da lista de produtos das empresas. Nós avaliamos o caso de uso com conjuntos de dados reais de licitações e empresas brasileiras da indústria alimentícia. Nos experimentos, a Divisão por Similaridade foi capaz de indentificar quais licitações cada empresa pode concorrer com uma revocação de 90%.Biblioteca Digitais de Teses e Dissertações da USPCordeiro, Robson Leonardo FerreiraVasconcelos, Guilherme Queiroz2019-05-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-16102019-140149/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2020-01-09T22:03:02Zoai:teses.usp.br:tde-16102019-140149Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-01-09T22:03:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
On the support of the similarity-aware division operator in a relational database management system Suporte à divisão por similaridade em um sistema gerenciador de banco de dados relacional |
| title |
On the support of the similarity-aware division operator in a relational database management system |
| spellingShingle |
On the support of the similarity-aware division operator in a relational database management system Vasconcelos, Guilherme Queiroz Complex Data Consultas por similaridade Dados complexos Divisão relacional Relational database management system Relational division Similarity queries Sistema gerenciador de banco de dados relacional SQL SQL |
| title_short |
On the support of the similarity-aware division operator in a relational database management system |
| title_full |
On the support of the similarity-aware division operator in a relational database management system |
| title_fullStr |
On the support of the similarity-aware division operator in a relational database management system |
| title_full_unstemmed |
On the support of the similarity-aware division operator in a relational database management system |
| title_sort |
On the support of the similarity-aware division operator in a relational database management system |
| author |
Vasconcelos, Guilherme Queiroz |
| author_facet |
Vasconcelos, Guilherme Queiroz |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Cordeiro, Robson Leonardo Ferreira |
| dc.contributor.author.fl_str_mv |
Vasconcelos, Guilherme Queiroz |
| dc.subject.por.fl_str_mv |
Complex Data Consultas por similaridade Dados complexos Divisão relacional Relational database management system Relational division Similarity queries Sistema gerenciador de banco de dados relacional SQL SQL |
| topic |
Complex Data Consultas por similaridade Dados complexos Divisão relacional Relational database management system Relational division Similarity queries Sistema gerenciador de banco de dados relacional SQL SQL |
| description |
The Division operator (&division;) from the Relational Algebra allows simple and intuitive representation of queries with the concept of \"for all\", and thus it is required by many real applications. However, the Relational Division is unable to support the needs of modern applications that manipulate complex data, such as images, audio, long texts, genetic sequences, etc. These data are better compared for similarity, whereas the Division always compares values for equality. Recent works focused on extending the Relational Algebra and database operators to support similarity comparison. This project incorporated the Similarity-Aware Divison Operator in a Relational Database Management System (RDBMS) and studied its relationship with other query operators. We extended a similarity-oriented SQL to represent the Similarity-Aware Division Operator in a simple and intuitive manner and implemented state-of-art algorithms, internal database queries and resources for similarity data manipulation all inside the RDBMS. This solution presents strategies for efficient and improved performance queries. For semantical validation, it was performed a case study of an application that finds prospective companies able to bid in public request for tenders (RFT) using similarity comparison on RFTs documents and companies\'s catalogs. We evaluated the quality of results in a case study with real datasets from request for tenders from public brazilian food companies. In the experiments, the Similarity-Aware Division Operator was able to identify which RFT which company can participate in with 90% recall. |
| publishDate |
2019 |
| dc.date.none.fl_str_mv |
2019-05-23 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16102019-140149/ |
| url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16102019-140149/ |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865491182875836416 |