Exportação concluída — 

Um modelo para resolução de conflitos sobre repositório de dados XML

Detalhes bibliográficos
Ano de defesa: 2010
Autor(a) principal: Cecchin, Frantchesco
Orientador(a): Hara, Carmem Satie, 1964-
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1884/24962
Resumo: Orientadora: Profª Drª Carmem Satie Hara
id UFPR_d1d179173c4ac25d13d3186b3cdcbc0b
oai_identifier_str oai:acervodigital.ufpr.br:1884/24962
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str
spelling Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaHara, Carmem Satie, 1964-Cecchin, Frantchesco2024-11-08T19:57:17Z2024-11-08T19:57:17Z2010https://hdl.handle.net/1884/24962Orientadora: Profª Drª Carmem Satie HaraDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 27/08/2010Bibliografia: fls. 86-92Resumo: Garantir a qualidade dos dados quando se deseja manter informações provenientes de fontes heterogêneas é um desafio. Os dados importados destas fontes podem conter redundâncias, inconsistências ou ainda estar estruturados de formas completamente distintas. Existem diversas formas de melhorar a qualidade dos dados, tais como realizar bons mapeamentos entre fontes e repositório, identificar objetos semelhantes e manter uma única representação do dado. Para este trabalho, considera-se que questões como mapeamentos, integração e detecção de duplicidade já foram resolvidos. Desta forma, o modelo proposto tem seu foco no estágio subsequente, ou seja, a resolução dos conflitos gerados pela integração. A abordagem para resolução de conflitos considerada tem como base a aplicação de uma política de fusão. Esta política é uma composição de regras definidas pelo usuário para solucionar os conflitos em determinado contexto do repositório. Tais regras têm o objetivo de representar as decisões que o usuário toma quando realiza a limpeza manualmente. Desta forma, uma vez que a regra foi definida, os conflitos reincidentes são solucionados automaticamente nas integrações futuras. Além disso, o modelo proposto considera um histórico de resoluções para manter a proveniência dos dados descartados e permitir auditar asdecisões aplicadas. A manutenção da proveniência permite ao modelo reconstruir a fonte de dados original, evitando o armazenamento de uma cópia das mesmas. Para validar o modelo foi desenvolvida uma ferramenta, denominada XFusion, a qual permitiu executar todas as funcionalidades do modelo sobre um repositório integrado de dados. Adicionalmente, testes de desempenho foram executados e os resultados obtidos mostram a viabilidade do modelo.Abstract: Ensuring high quality data when collecting and integrating information from heterogeneous sources into a data warehouse is a challenging problem. In this master thesis, we propose a model for XML data integration, which allows the integrator to define data cleaning rules for solving value conflicts that may have been detected during the integration process. These rules resemble decisions that are made by users when data are manually curated and, once defined, conflicts detected in subsequent integration processes that are within the context of existing rules can be automatically solved without user intervention. Moreover, the proposed model maintains a resolution log for storing provenance information of discarded data and enable us to audit prior decisions. The maintenance of provenance allows the model to reconstruct the original data source, avoiding the need to maintain local copies. To validate our proposal, we developed XFusion, a tool that stores data integrated according to cleaning rules in a curated repository. dditionally, our experimental study shows the viability of implementing the model.92f. : il., grafs., tabs.application/pdfDisponível em formato digitalXML (Linguagem de marcação de documento)Banco de dadosArmazenamento de dadosCiência da computaçãoUm modelo para resolução de conflitos sobre repositório de dados XMLinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALdissertacao.pdfapplication/pdf1961892https://acervodigital.ufpr.br/bitstream/1884/24962/1/dissertacao.pdfb169478fc4596e82d937e9ebf1f6aba3MD51open accessTEXTdissertacao.pdf.txtExtracted Texttext/plain174852https://acervodigital.ufpr.br/bitstream/1884/24962/2/dissertacao.pdf.txtec3585be8c2418249920ea7a2c384ceaMD52open accessTHUMBNAILdissertacao.pdf.jpgGenerated Thumbnailimage/jpeg1178https://acervodigital.ufpr.br/bitstream/1884/24962/3/dissertacao.pdf.jpg8a40e7a5a54317159f9a14e43bb6b37dMD53open access1884/249622024-11-08 16:57:17.183open accessoai:acervodigital.ufpr.br:1884/24962Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082024-11-08T19:57:17Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Um modelo para resolução de conflitos sobre repositório de dados XML
title Um modelo para resolução de conflitos sobre repositório de dados XML
spellingShingle Um modelo para resolução de conflitos sobre repositório de dados XML
Cecchin, Frantchesco
XML (Linguagem de marcação de documento)
Banco de dados
Armazenamento de dados
Ciência da computação
title_short Um modelo para resolução de conflitos sobre repositório de dados XML
title_full Um modelo para resolução de conflitos sobre repositório de dados XML
title_fullStr Um modelo para resolução de conflitos sobre repositório de dados XML
title_full_unstemmed Um modelo para resolução de conflitos sobre repositório de dados XML
title_sort Um modelo para resolução de conflitos sobre repositório de dados XML
author Cecchin, Frantchesco
author_facet Cecchin, Frantchesco
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.advisor1.fl_str_mv Hara, Carmem Satie, 1964-
dc.contributor.author.fl_str_mv Cecchin, Frantchesco
contributor_str_mv Hara, Carmem Satie, 1964-
dc.subject.por.fl_str_mv XML (Linguagem de marcação de documento)
Banco de dados
Armazenamento de dados
Ciência da computação
topic XML (Linguagem de marcação de documento)
Banco de dados
Armazenamento de dados
Ciência da computação
description Orientadora: Profª Drª Carmem Satie Hara
publishDate 2010
dc.date.issued.fl_str_mv 2010
dc.date.accessioned.fl_str_mv 2024-11-08T19:57:17Z
dc.date.available.fl_str_mv 2024-11-08T19:57:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/24962
url https://hdl.handle.net/1884/24962
dc.language.iso.fl_str_mv por
language por
dc.relation.pt_BR.fl_str_mv Disponível em formato digital
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 92f. : il., grafs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/24962/1/dissertacao.pdf
https://acervodigital.ufpr.br/bitstream/1884/24962/2/dissertacao.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/24962/3/dissertacao.pdf.jpg
bitstream.checksum.fl_str_mv b169478fc4596e82d937e9ebf1f6aba3
ec3585be8c2418249920ea7a2c384cea
8a40e7a5a54317159f9a14e43bb6b37d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv informacaodigital@ufpr.br
_version_ 1847526174856577024