Um processo para casamento de esquemas de documentos JSON baseado na estrutura e nas instâncias

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Padilha, Renata Junges
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
dARK ID: ark:/26339/0013000003q81
Idioma: por
Instituição de defesa: Universidade Federal de Santa Maria
Brasil
Ciência da Computação
UFSM
Programa de Pós-Graduação em Ciência da Computação
Centro de Tecnologia
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.ufsm.br/handle/1/19780
Resumo: Historically, schema matching has been studied a lot, but it still presents many difficulties resulting from countless conflicts and problems. Approaches for NoSQL databases (Not Only SQL) are still poorly studied, given that they have implicit schemes in their construction. The increasing use of JSON (JavaScript Object Notation) documents shows the importance of studies that can contribute to the manipulation of this type of document. This dissertation aims to specify a process to match schemas for JSON documents. The process uses textual similarity techniques (syntactic, semantics and radical extraction), diff algorithm, analysis of the hierarchical element structure, and analysis of the instances contained in the documents. . These techniques are applied in a combined manner to determine whether elements of JSON documents are equivalent. The case study reported in this research shows accuracy and recall of 67.05% and 82.60%, respectively.
id UFSM_573394a34543a1086f6f8717a7000402
oai_identifier_str oai:repositorio.ufsm.br:1/19780
network_acronym_str UFSM
network_name_str Manancial - Repositório Digital da UFSM
repository_id_str
spelling Um processo para casamento de esquemas de documentos JSON baseado na estrutura e nas instânciasA schema matching process for JSON documents based on structure and instancesJSONCasamento de esquemasInstânciasHierarquiaSchema matchingInstancesHierarchyCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOHistorically, schema matching has been studied a lot, but it still presents many difficulties resulting from countless conflicts and problems. Approaches for NoSQL databases (Not Only SQL) are still poorly studied, given that they have implicit schemes in their construction. The increasing use of JSON (JavaScript Object Notation) documents shows the importance of studies that can contribute to the manipulation of this type of document. This dissertation aims to specify a process to match schemas for JSON documents. The process uses textual similarity techniques (syntactic, semantics and radical extraction), diff algorithm, analysis of the hierarchical element structure, and analysis of the instances contained in the documents. . These techniques are applied in a combined manner to determine whether elements of JSON documents are equivalent. The case study reported in this research shows accuracy and recall of 67.05% and 82.60%, respectively.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESHistoricamente, o casamento de esquemas é algo muito estudado, mas que apresenta, até os dias de hoje, muitas dificuldades decorrentes de inúmeros conflitos e problemáticas. Abordagens voltadas para bancos de dados NoSQL (Not Only SQL) ainda são pouco estudadas, tendo em vista que estes apresentam esquemas implícitos em sua construção. A crescente utilização de documentos JSON (JavaScript Object Notation) mostra a importância de estudos que possam contribuir com a manipulação deste tipo de documento. Esta dissertação tem como objetivo especificar um processo para o casamento de esquemas em documentos JSON. São utilizadas técnicas de similaridade textuais (sintática, semântica e extração de radicais), algoritmo diff, análise da estrutura hierárquica dos elementos, além de levar em consideração as instâncias contidas nos documentos. Estas técnicas são aplicadas de forma combinada a fim de determinar se elementos de documentos JSON são equivalentes. O estudo de caso relatado nesta pesquisa mostra uma precisão e revocação de 67,05% e 82,60%, respectivamente.Universidade Federal de Santa MariaBrasilCiência da ComputaçãoUFSMPrograma de Pós-Graduação em Ciência da ComputaçãoCentro de TecnologiaSaccol, Deise de Brumhttp://lattes.cnpq.br/7758924784164781Piveta, Eduardo Kesslerhttp://lattes.cnpq.br/8687196768910831Martins, Mirkos Ortizhttp://lattes.cnpq.br/5382133106359249Padilha, Renata Junges2020-03-09T18:45:15Z2020-03-09T18:45:15Z2020-02-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://repositorio.ufsm.br/handle/1/19780ark:/26339/0013000003q81porAttribution-NonCommercial-NoDerivatives 4.0 Internationalinfo:eu-repo/semantics/openAccessreponame:Manancial - Repositório Digital da UFSMinstname:Universidade Federal de Santa Maria (UFSM)instacron:UFSM2020-03-10T06:00:36Zoai:repositorio.ufsm.br:1/19780Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufsm.br/PUBhttps://repositorio.ufsm.br/oai/requestatendimento.sib@ufsm.br||tedebc@gmail.com||manancial@ufsm.bropendoar:2020-03-10T06:00:36Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)false
dc.title.none.fl_str_mv Um processo para casamento de esquemas de documentos JSON baseado na estrutura e nas instâncias
A schema matching process for JSON documents based on structure and instances
title Um processo para casamento de esquemas de documentos JSON baseado na estrutura e nas instâncias
spellingShingle Um processo para casamento de esquemas de documentos JSON baseado na estrutura e nas instâncias
Padilha, Renata Junges
JSON
Casamento de esquemas
Instâncias
Hierarquia
Schema matching
Instances
Hierarchy
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Um processo para casamento de esquemas de documentos JSON baseado na estrutura e nas instâncias
title_full Um processo para casamento de esquemas de documentos JSON baseado na estrutura e nas instâncias
title_fullStr Um processo para casamento de esquemas de documentos JSON baseado na estrutura e nas instâncias
title_full_unstemmed Um processo para casamento de esquemas de documentos JSON baseado na estrutura e nas instâncias
title_sort Um processo para casamento de esquemas de documentos JSON baseado na estrutura e nas instâncias
author Padilha, Renata Junges
author_facet Padilha, Renata Junges
author_role author
dc.contributor.none.fl_str_mv Saccol, Deise de Brum
http://lattes.cnpq.br/7758924784164781
Piveta, Eduardo Kessler
http://lattes.cnpq.br/8687196768910831
Martins, Mirkos Ortiz
http://lattes.cnpq.br/5382133106359249
dc.contributor.author.fl_str_mv Padilha, Renata Junges
dc.subject.por.fl_str_mv JSON
Casamento de esquemas
Instâncias
Hierarquia
Schema matching
Instances
Hierarchy
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic JSON
Casamento de esquemas
Instâncias
Hierarquia
Schema matching
Instances
Hierarchy
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Historically, schema matching has been studied a lot, but it still presents many difficulties resulting from countless conflicts and problems. Approaches for NoSQL databases (Not Only SQL) are still poorly studied, given that they have implicit schemes in their construction. The increasing use of JSON (JavaScript Object Notation) documents shows the importance of studies that can contribute to the manipulation of this type of document. This dissertation aims to specify a process to match schemas for JSON documents. The process uses textual similarity techniques (syntactic, semantics and radical extraction), diff algorithm, analysis of the hierarchical element structure, and analysis of the instances contained in the documents. . These techniques are applied in a combined manner to determine whether elements of JSON documents are equivalent. The case study reported in this research shows accuracy and recall of 67.05% and 82.60%, respectively.
publishDate 2020
dc.date.none.fl_str_mv 2020-03-09T18:45:15Z
2020-03-09T18:45:15Z
2020-02-10
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufsm.br/handle/1/19780
dc.identifier.dark.fl_str_mv ark:/26339/0013000003q81
url http://repositorio.ufsm.br/handle/1/19780
identifier_str_mv ark:/26339/0013000003q81
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Santa Maria
Brasil
Ciência da Computação
UFSM
Programa de Pós-Graduação em Ciência da Computação
Centro de Tecnologia
publisher.none.fl_str_mv Universidade Federal de Santa Maria
Brasil
Ciência da Computação
UFSM
Programa de Pós-Graduação em Ciência da Computação
Centro de Tecnologia
dc.source.none.fl_str_mv reponame:Manancial - Repositório Digital da UFSM
instname:Universidade Federal de Santa Maria (UFSM)
instacron:UFSM
instname_str Universidade Federal de Santa Maria (UFSM)
instacron_str UFSM
institution UFSM
reponame_str Manancial - Repositório Digital da UFSM
collection Manancial - Repositório Digital da UFSM
repository.name.fl_str_mv Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)
repository.mail.fl_str_mv atendimento.sib@ufsm.br||tedebc@gmail.com||manancial@ufsm.br
_version_ 1847153303027187712