Um modelo para integração de documentos XML em nível de instancia

Detalhes bibliográficos
Ano de defesa: 2008
Autor(a) principal: Nascimento, Aldo Monteiro do
Orientador(a): Hara, Carmem Satie, 1964-
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1884/18071
Resumo: Orientadora : Carmem Satie Hara
id UFPR_bb777eb648bc27e6dbd28f511ca9b21c
oai_identifier_str oai:acervodigital.ufpr.br:1884/18071
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str
spelling Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaHara, Carmem Satie, 1964-Nascimento, Aldo Monteiro do2024-11-11T21:54:38Z2024-11-11T21:54:38Z2008https://hdl.handle.net/1884/18071Orientadora : Carmem Satie HaraDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 29/09/2008Inclui bibliografiaResumo: Um repositório integrado de dados é um repositório de dados provenientes de diversas fontes. Na construção de um repositório integrado há dois grandes problemas para agrupar instâncias: ambiguidade na identificação de entidades e conflito de valor de atributos. Nesta dissertação é proposto um modelo de dados que facilita a resolução de conflitos de valor de atributos representando-os explicitamente na estrutura integrada. Neste modelo, o repositório integrado é uma árvore XML gerada a partir de dados importados de uma ou mais fontes de dados XML, e os nodos são anotados com informações de proveniência. Essas anotações têm dois propósitos. Primeiro, elas representam a origem de cada elemento no repositório integrado. Esta informação é essencial para determinar a qualidade e confiança que podem ser atribuídas aos dados. Segundo, elas permitem que a porção da árvore XML oriunda da fonte de dados e armazenada no repositório integrado seja reconstruída. Essa capacidade é importante para a comparação do documento original com novas versões da mesma fonte possibilitando a atualização da base de dados local. Algoritmos para instanciar o repositório integrado de acordo com o modelo proposto e reconstruir a fonte de dados são apresentados nesta dissertação. Resultados de um estudo experimental conduzido para determinar o impacto das anotações no tamanho do repositório integrado, bem como o desempenho dos algoritmos propostos são também discutidos.Abstract: A datawarehouse is a repository of data imported from different sources. There are two major problems for merging instances from different sources in order to build a datawarehouse: entity identification ambiguity and attribute value conflict. In this dissertation we propose a data model that facilitates the resolution of value attribute conflicts by explicitly representing them in the integrated schema. In this model, the datawarehouse is an XML tree populated with data imported from one or more XML sources, and nodes are annotated with provenance information. The purpose of annotations are two fold: first, they represent the origin of every element in the datawarehouse. This information is essential for determining the quality and amount of trust one places on the data. Second, they allow the portion of source XML tree used to populate the warehouse to be reconstructed. This capability is important if one needs the original document to compare with new releases from the same source in order to update the local database. Algorithms for populating the warehouse according to the proposed model and for reconstructing the source data are presented. We also present results from an experimental study conducted to determine the impact of the annotations on the size of the warehouse and the performance of the proposed algorithms.vi, 82f. : il.application/pdfDisponível em formato digitalXML (Linguagem de marcação de documento)Ciencia da computaçãoUm modelo para integração de documentos XML em nível de instanciainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALdissertacao.pdfapplication/pdf578373https://acervodigital.ufpr.br/bitstream/1884/18071/1/dissertacao.pdf36a927c8c6582e69db2a32e46f2d3780MD51open accessTEXTdissertacao.pdf.txtExtracted Texttext/plain174178https://acervodigital.ufpr.br/bitstream/1884/18071/2/dissertacao.pdf.txt1272015d4958cf62d6ec86515e3a7289MD52open accessTHUMBNAILdissertacao.pdf.jpgGenerated Thumbnailimage/jpeg1194https://acervodigital.ufpr.br/bitstream/1884/18071/3/dissertacao.pdf.jpg10f6342e8ae393438ebe59a991a95137MD53open access1884/180712024-11-11 18:54:39.088open accessoai:acervodigital.ufpr.br:1884/18071Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082024-11-11T21:54:39Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Um modelo para integração de documentos XML em nível de instancia
title Um modelo para integração de documentos XML em nível de instancia
spellingShingle Um modelo para integração de documentos XML em nível de instancia
Nascimento, Aldo Monteiro do
XML (Linguagem de marcação de documento)
Ciencia da computação
title_short Um modelo para integração de documentos XML em nível de instancia
title_full Um modelo para integração de documentos XML em nível de instancia
title_fullStr Um modelo para integração de documentos XML em nível de instancia
title_full_unstemmed Um modelo para integração de documentos XML em nível de instancia
title_sort Um modelo para integração de documentos XML em nível de instancia
author Nascimento, Aldo Monteiro do
author_facet Nascimento, Aldo Monteiro do
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.advisor1.fl_str_mv Hara, Carmem Satie, 1964-
dc.contributor.author.fl_str_mv Nascimento, Aldo Monteiro do
contributor_str_mv Hara, Carmem Satie, 1964-
dc.subject.por.fl_str_mv XML (Linguagem de marcação de documento)
Ciencia da computação
topic XML (Linguagem de marcação de documento)
Ciencia da computação
description Orientadora : Carmem Satie Hara
publishDate 2008
dc.date.issued.fl_str_mv 2008
dc.date.accessioned.fl_str_mv 2024-11-11T21:54:38Z
dc.date.available.fl_str_mv 2024-11-11T21:54:38Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/18071
url https://hdl.handle.net/1884/18071
dc.language.iso.fl_str_mv por
language por
dc.relation.pt_BR.fl_str_mv Disponível em formato digital
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv vi, 82f. : il.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/18071/1/dissertacao.pdf
https://acervodigital.ufpr.br/bitstream/1884/18071/2/dissertacao.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/18071/3/dissertacao.pdf.jpg
bitstream.checksum.fl_str_mv 36a927c8c6582e69db2a32e46f2d3780
1272015d4958cf62d6ec86515e3a7289
10f6342e8ae393438ebe59a991a95137
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv informacaodigital@ufpr.br
_version_ 1847526070143680512