Um modelo para resolução de conflitos sobre repositório de dados XML
| Ano de defesa: | 2010 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://hdl.handle.net/1884/24962 |
Resumo: | Orientadora: Profª Drª Carmem Satie Hara |
| id |
UFPR_d1d179173c4ac25d13d3186b3cdcbc0b |
|---|---|
| oai_identifier_str |
oai:acervodigital.ufpr.br:1884/24962 |
| network_acronym_str |
UFPR |
| network_name_str |
Repositório Institucional da UFPR |
| repository_id_str |
|
| spelling |
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaHara, Carmem Satie, 1964-Cecchin, Frantchesco2024-11-08T19:57:17Z2024-11-08T19:57:17Z2010https://hdl.handle.net/1884/24962Orientadora: Profª Drª Carmem Satie HaraDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 27/08/2010Bibliografia: fls. 86-92Resumo: Garantir a qualidade dos dados quando se deseja manter informações provenientes de fontes heterogêneas é um desafio. Os dados importados destas fontes podem conter redundâncias, inconsistências ou ainda estar estruturados de formas completamente distintas. Existem diversas formas de melhorar a qualidade dos dados, tais como realizar bons mapeamentos entre fontes e repositório, identificar objetos semelhantes e manter uma única representação do dado. Para este trabalho, considera-se que questões como mapeamentos, integração e detecção de duplicidade já foram resolvidos. Desta forma, o modelo proposto tem seu foco no estágio subsequente, ou seja, a resolução dos conflitos gerados pela integração. A abordagem para resolução de conflitos considerada tem como base a aplicação de uma política de fusão. Esta política é uma composição de regras definidas pelo usuário para solucionar os conflitos em determinado contexto do repositório. Tais regras têm o objetivo de representar as decisões que o usuário toma quando realiza a limpeza manualmente. Desta forma, uma vez que a regra foi definida, os conflitos reincidentes são solucionados automaticamente nas integrações futuras. Além disso, o modelo proposto considera um histórico de resoluções para manter a proveniência dos dados descartados e permitir auditar asdecisões aplicadas. A manutenção da proveniência permite ao modelo reconstruir a fonte de dados original, evitando o armazenamento de uma cópia das mesmas. Para validar o modelo foi desenvolvida uma ferramenta, denominada XFusion, a qual permitiu executar todas as funcionalidades do modelo sobre um repositório integrado de dados. Adicionalmente, testes de desempenho foram executados e os resultados obtidos mostram a viabilidade do modelo.Abstract: Ensuring high quality data when collecting and integrating information from heterogeneous sources into a data warehouse is a challenging problem. In this master thesis, we propose a model for XML data integration, which allows the integrator to define data cleaning rules for solving value conflicts that may have been detected during the integration process. These rules resemble decisions that are made by users when data are manually curated and, once defined, conflicts detected in subsequent integration processes that are within the context of existing rules can be automatically solved without user intervention. Moreover, the proposed model maintains a resolution log for storing provenance information of discarded data and enable us to audit prior decisions. The maintenance of provenance allows the model to reconstruct the original data source, avoiding the need to maintain local copies. To validate our proposal, we developed XFusion, a tool that stores data integrated according to cleaning rules in a curated repository. dditionally, our experimental study shows the viability of implementing the model.92f. : il., grafs., tabs.application/pdfDisponível em formato digitalXML (Linguagem de marcação de documento)Banco de dadosArmazenamento de dadosCiência da computaçãoUm modelo para resolução de conflitos sobre repositório de dados XMLinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALdissertacao.pdfapplication/pdf1961892https://acervodigital.ufpr.br/bitstream/1884/24962/1/dissertacao.pdfb169478fc4596e82d937e9ebf1f6aba3MD51open accessTEXTdissertacao.pdf.txtExtracted Texttext/plain174852https://acervodigital.ufpr.br/bitstream/1884/24962/2/dissertacao.pdf.txtec3585be8c2418249920ea7a2c384ceaMD52open accessTHUMBNAILdissertacao.pdf.jpgGenerated Thumbnailimage/jpeg1178https://acervodigital.ufpr.br/bitstream/1884/24962/3/dissertacao.pdf.jpg8a40e7a5a54317159f9a14e43bb6b37dMD53open access1884/249622024-11-08 16:57:17.183open accessoai:acervodigital.ufpr.br:1884/24962Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082024-11-08T19:57:17Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
| dc.title.pt_BR.fl_str_mv |
Um modelo para resolução de conflitos sobre repositório de dados XML |
| title |
Um modelo para resolução de conflitos sobre repositório de dados XML |
| spellingShingle |
Um modelo para resolução de conflitos sobre repositório de dados XML Cecchin, Frantchesco XML (Linguagem de marcação de documento) Banco de dados Armazenamento de dados Ciência da computação |
| title_short |
Um modelo para resolução de conflitos sobre repositório de dados XML |
| title_full |
Um modelo para resolução de conflitos sobre repositório de dados XML |
| title_fullStr |
Um modelo para resolução de conflitos sobre repositório de dados XML |
| title_full_unstemmed |
Um modelo para resolução de conflitos sobre repositório de dados XML |
| title_sort |
Um modelo para resolução de conflitos sobre repositório de dados XML |
| author |
Cecchin, Frantchesco |
| author_facet |
Cecchin, Frantchesco |
| author_role |
author |
| dc.contributor.other.pt_BR.fl_str_mv |
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática |
| dc.contributor.advisor1.fl_str_mv |
Hara, Carmem Satie, 1964- |
| dc.contributor.author.fl_str_mv |
Cecchin, Frantchesco |
| contributor_str_mv |
Hara, Carmem Satie, 1964- |
| dc.subject.por.fl_str_mv |
XML (Linguagem de marcação de documento) Banco de dados Armazenamento de dados Ciência da computação |
| topic |
XML (Linguagem de marcação de documento) Banco de dados Armazenamento de dados Ciência da computação |
| description |
Orientadora: Profª Drª Carmem Satie Hara |
| publishDate |
2010 |
| dc.date.issued.fl_str_mv |
2010 |
| dc.date.accessioned.fl_str_mv |
2024-11-08T19:57:17Z |
| dc.date.available.fl_str_mv |
2024-11-08T19:57:17Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1884/24962 |
| url |
https://hdl.handle.net/1884/24962 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.pt_BR.fl_str_mv |
Disponível em formato digital |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
92f. : il., grafs., tabs. application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
| instname_str |
Universidade Federal do Paraná (UFPR) |
| instacron_str |
UFPR |
| institution |
UFPR |
| reponame_str |
Repositório Institucional da UFPR |
| collection |
Repositório Institucional da UFPR |
| bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/24962/1/dissertacao.pdf https://acervodigital.ufpr.br/bitstream/1884/24962/2/dissertacao.pdf.txt https://acervodigital.ufpr.br/bitstream/1884/24962/3/dissertacao.pdf.jpg |
| bitstream.checksum.fl_str_mv |
b169478fc4596e82d937e9ebf1f6aba3 ec3585be8c2418249920ea7a2c384cea 8a40e7a5a54317159f9a14e43bb6b37d |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
| repository.mail.fl_str_mv |
informacaodigital@ufpr.br |
| _version_ |
1847526174856577024 |