Um modelo para integração de documentos XML em nível de instancia
| Ano de defesa: | 2008 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://hdl.handle.net/1884/18071 |
Resumo: | Orientadora : Carmem Satie Hara |
| id |
UFPR_bb777eb648bc27e6dbd28f511ca9b21c |
|---|---|
| oai_identifier_str |
oai:acervodigital.ufpr.br:1884/18071 |
| network_acronym_str |
UFPR |
| network_name_str |
Repositório Institucional da UFPR |
| repository_id_str |
|
| spelling |
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaHara, Carmem Satie, 1964-Nascimento, Aldo Monteiro do2024-11-11T21:54:38Z2024-11-11T21:54:38Z2008https://hdl.handle.net/1884/18071Orientadora : Carmem Satie HaraDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 29/09/2008Inclui bibliografiaResumo: Um repositório integrado de dados é um repositório de dados provenientes de diversas fontes. Na construção de um repositório integrado há dois grandes problemas para agrupar instâncias: ambiguidade na identificação de entidades e conflito de valor de atributos. Nesta dissertação é proposto um modelo de dados que facilita a resolução de conflitos de valor de atributos representando-os explicitamente na estrutura integrada. Neste modelo, o repositório integrado é uma árvore XML gerada a partir de dados importados de uma ou mais fontes de dados XML, e os nodos são anotados com informações de proveniência. Essas anotações têm dois propósitos. Primeiro, elas representam a origem de cada elemento no repositório integrado. Esta informação é essencial para determinar a qualidade e confiança que podem ser atribuídas aos dados. Segundo, elas permitem que a porção da árvore XML oriunda da fonte de dados e armazenada no repositório integrado seja reconstruída. Essa capacidade é importante para a comparação do documento original com novas versões da mesma fonte possibilitando a atualização da base de dados local. Algoritmos para instanciar o repositório integrado de acordo com o modelo proposto e reconstruir a fonte de dados são apresentados nesta dissertação. Resultados de um estudo experimental conduzido para determinar o impacto das anotações no tamanho do repositório integrado, bem como o desempenho dos algoritmos propostos são também discutidos.Abstract: A datawarehouse is a repository of data imported from different sources. There are two major problems for merging instances from different sources in order to build a datawarehouse: entity identification ambiguity and attribute value conflict. In this dissertation we propose a data model that facilitates the resolution of value attribute conflicts by explicitly representing them in the integrated schema. In this model, the datawarehouse is an XML tree populated with data imported from one or more XML sources, and nodes are annotated with provenance information. The purpose of annotations are two fold: first, they represent the origin of every element in the datawarehouse. This information is essential for determining the quality and amount of trust one places on the data. Second, they allow the portion of source XML tree used to populate the warehouse to be reconstructed. This capability is important if one needs the original document to compare with new releases from the same source in order to update the local database. Algorithms for populating the warehouse according to the proposed model and for reconstructing the source data are presented. We also present results from an experimental study conducted to determine the impact of the annotations on the size of the warehouse and the performance of the proposed algorithms.vi, 82f. : il.application/pdfDisponível em formato digitalXML (Linguagem de marcação de documento)Ciencia da computaçãoUm modelo para integração de documentos XML em nível de instanciainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALdissertacao.pdfapplication/pdf578373https://acervodigital.ufpr.br/bitstream/1884/18071/1/dissertacao.pdf36a927c8c6582e69db2a32e46f2d3780MD51open accessTEXTdissertacao.pdf.txtExtracted Texttext/plain174178https://acervodigital.ufpr.br/bitstream/1884/18071/2/dissertacao.pdf.txt1272015d4958cf62d6ec86515e3a7289MD52open accessTHUMBNAILdissertacao.pdf.jpgGenerated Thumbnailimage/jpeg1194https://acervodigital.ufpr.br/bitstream/1884/18071/3/dissertacao.pdf.jpg10f6342e8ae393438ebe59a991a95137MD53open access1884/180712024-11-11 18:54:39.088open accessoai:acervodigital.ufpr.br:1884/18071Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082024-11-11T21:54:39Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
| dc.title.pt_BR.fl_str_mv |
Um modelo para integração de documentos XML em nível de instancia |
| title |
Um modelo para integração de documentos XML em nível de instancia |
| spellingShingle |
Um modelo para integração de documentos XML em nível de instancia Nascimento, Aldo Monteiro do XML (Linguagem de marcação de documento) Ciencia da computação |
| title_short |
Um modelo para integração de documentos XML em nível de instancia |
| title_full |
Um modelo para integração de documentos XML em nível de instancia |
| title_fullStr |
Um modelo para integração de documentos XML em nível de instancia |
| title_full_unstemmed |
Um modelo para integração de documentos XML em nível de instancia |
| title_sort |
Um modelo para integração de documentos XML em nível de instancia |
| author |
Nascimento, Aldo Monteiro do |
| author_facet |
Nascimento, Aldo Monteiro do |
| author_role |
author |
| dc.contributor.other.pt_BR.fl_str_mv |
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática |
| dc.contributor.advisor1.fl_str_mv |
Hara, Carmem Satie, 1964- |
| dc.contributor.author.fl_str_mv |
Nascimento, Aldo Monteiro do |
| contributor_str_mv |
Hara, Carmem Satie, 1964- |
| dc.subject.por.fl_str_mv |
XML (Linguagem de marcação de documento) Ciencia da computação |
| topic |
XML (Linguagem de marcação de documento) Ciencia da computação |
| description |
Orientadora : Carmem Satie Hara |
| publishDate |
2008 |
| dc.date.issued.fl_str_mv |
2008 |
| dc.date.accessioned.fl_str_mv |
2024-11-11T21:54:38Z |
| dc.date.available.fl_str_mv |
2024-11-11T21:54:38Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1884/18071 |
| url |
https://hdl.handle.net/1884/18071 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.pt_BR.fl_str_mv |
Disponível em formato digital |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
vi, 82f. : il. application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
| instname_str |
Universidade Federal do Paraná (UFPR) |
| instacron_str |
UFPR |
| institution |
UFPR |
| reponame_str |
Repositório Institucional da UFPR |
| collection |
Repositório Institucional da UFPR |
| bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/18071/1/dissertacao.pdf https://acervodigital.ufpr.br/bitstream/1884/18071/2/dissertacao.pdf.txt https://acervodigital.ufpr.br/bitstream/1884/18071/3/dissertacao.pdf.jpg |
| bitstream.checksum.fl_str_mv |
36a927c8c6582e69db2a32e46f2d3780 1272015d4958cf62d6ec86515e3a7289 10f6342e8ae393438ebe59a991a95137 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
| repository.mail.fl_str_mv |
informacaodigital@ufpr.br |
| _version_ |
1847526070143680512 |