Proveniência de dados e metadados em repositórios de dados de pesquisa

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Silva, Felipe Ivo da
Orientador(a): Arakaki, Felipe Augusto lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Informação - PPGCI
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://hdl.handle.net/20.500.14289/21866
Resumo: Research data repositories are environments for storing, preserving, and sharing scientific data, and ensure accessibility and reuse of data. Provenance, which documents the origin, history, and transformations of data, is essential to ensure the tradition, reliability, and traceability of information. However, the lack of standardization and interoperability between the main metadata standards in these repositories can compromise the effectiveness of provenance. In this context, the central question of this research was: do the metadata standards used to describe data in research repositories ensure traceability and prevent information from becoming obsolete over time? The general objective of the study was to evaluate the adherence of provenance metadata, based on the PROV Family, to the main metadata standards used in research data repositories according to Re3data, such as Dublin Core, DataCite, and DDI. The research sought to identify how these standards can assist in identifying deficiency and traceability of information, proposing recommendations for their application. The methodology adopted was theoretical and exploratory, using a bibliographic survey in recognized databases, analysis of specialized literature and the Crosswalk method to map and compare metadata standards in relation to PROV-O. The analysis focused on the interoperability between the standards and the PROV Family, eventually identifying possible adaptations to improve semantic interoperability. The main results indicated that the developed standards have different degrees of interoperability with the PROV Family. Dublin Core presented the highest relative correspondence, while DataCite and DDI presented lower levels of interoperability. Despite the integration suggestions, limitations were specified that exclude adaptations to meet the semantic interoperability principles promoted by the W3C. In conclusion, the study reinforces the importance of provenance for the reliability and traceability of data in research data repositories, highlighting the need for interdisciplinary collaboration between Information Science and Computer Science to improve data management in digital environments. The research suggests the implementation of provenance metadata to promote data veracity and longevity.
id SCAR_b20949423f2440ae2750a18f87e7672a
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/21866
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Silva, Felipe Ivo daArakaki, Felipe Augustohttp://lattes.cnpq.br/5324289839207169Baptista, Ana Alice Rodrigues Pereirahttp://lattes.cnpq.br/0753366586589793https://orcid.org/0009-0005-1379-4692https://orcid.org/0000-0002-3983-2563https://orcid.org/0000-0003-3525-06192025-04-10T19:52:38Z2025-04-03SILVA, Felipe Ivo da. Proveniência de dados e metadados em repositórios de dados de pesquisa. 2025. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21866.https://hdl.handle.net/20.500.14289/21866Research data repositories are environments for storing, preserving, and sharing scientific data, and ensure accessibility and reuse of data. Provenance, which documents the origin, history, and transformations of data, is essential to ensure the tradition, reliability, and traceability of information. However, the lack of standardization and interoperability between the main metadata standards in these repositories can compromise the effectiveness of provenance. In this context, the central question of this research was: do the metadata standards used to describe data in research repositories ensure traceability and prevent information from becoming obsolete over time? The general objective of the study was to evaluate the adherence of provenance metadata, based on the PROV Family, to the main metadata standards used in research data repositories according to Re3data, such as Dublin Core, DataCite, and DDI. The research sought to identify how these standards can assist in identifying deficiency and traceability of information, proposing recommendations for their application. The methodology adopted was theoretical and exploratory, using a bibliographic survey in recognized databases, analysis of specialized literature and the Crosswalk method to map and compare metadata standards in relation to PROV-O. The analysis focused on the interoperability between the standards and the PROV Family, eventually identifying possible adaptations to improve semantic interoperability. The main results indicated that the developed standards have different degrees of interoperability with the PROV Family. Dublin Core presented the highest relative correspondence, while DataCite and DDI presented lower levels of interoperability. Despite the integration suggestions, limitations were specified that exclude adaptations to meet the semantic interoperability principles promoted by the W3C. In conclusion, the study reinforces the importance of provenance for the reliability and traceability of data in research data repositories, highlighting the need for interdisciplinary collaboration between Information Science and Computer Science to improve data management in digital environments. The research suggests the implementation of provenance metadata to promote data veracity and longevity.Os repositórios de dados de pesquisa são ambientes de armazenamento, preservação e compartilhamento de dados científicos, e garantem acessibilidade e reutilização dos dados. A proveniência, que documenta a origem, histórico e transformações dos dados, é fundamental para assegurar a autenticidade, confiabilidade e rastreabilidade das informações. No entanto, a falta de padronização e interoperabilidade entre os principais padrões de metadados utilizados nesses repositórios pode comprometer a eficácia da proveniência. Nesse contexto, a questão central desta pesquisa foi: os padrões de metadados utilizados para a descrição de dados em repositórios de pesquisa asseguram a rastreabilidade e autenticidade das informações ao longo do tempo? O objetivo geral do estudo foi avaliar a aderência dos metadados de proveniência, com base na Família PROV, aos principais padrões de metadados utilizados em repositórios de dados de pesquisa segundo o Re3data, como Dublin Core, DataCite e DDI. A pesquisa buscou identificar como esses padrões podem auxiliar na identificação da autenticidade e rastreabilidade das informações, propondo recomendações para sua aplicação. A metodologia adotada foi teórica e exploratória, utilizando levantamento bibliográfico em bases de dados reconhecidas, análise de literatura especializada e o método Crosswalk para mapear e comparar os padrões de metadados em relação à PROV-O. A análise focou na interoperabilidade entre os padrões e a Família PROV, visando identificar possíveis adaptações para melhorar a interoperabilidade semântica. Os resultados principais indicaram que os padrões analisados possuem diferentes graus de interoperabilidade com a Família PROV. O Dublin Core apresentou a maior correspondência relativa, enquanto DataCite e DDI mostraram níveis mais baixos de interoperabilidade. Apesar da viabilidade de integração, foram identificadas limitações que exigem adaptações para atender aos princípios de interoperabilidade semântica promovidos pelo W3C. Em conclusão, o estudo reforça a importância da proveniência para a confiabilidade e rastreabilidade dos dados em repositórios de dados pesquisa, destacando a necessidade de colaboração interdisciplinar entre Ciência da Informação e Ciência da Computação para aprimorar a gestão de dados em ambientes digitais. A pesquisa sugere a implementação de metadados de proveniência para promover a veracidade e longevidade dos dados. Palavras-chave: Metadados. DadosporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Informação - PPGCIUFSCarAttribution-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-sa/3.0/br/info:eu-repo/semantics/openAccessCIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAOMetadadosDadosProveniênciaRepositórios de dados de pesquisaProveniência de dados e metadados em repositórios de dados de pesquisaData and metadata provenance in research data repositoriesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertação Felipe Ivo da Silva .pdfDissertação Felipe Ivo da Silva .pdfapplication/pdf1653744https://repositorio.ufscar.br/bitstreams/c10a72c2-0320-4117-9192-d2a2fce4203f/download99375325d0868b37e0a225742569fb49MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81160https://repositorio.ufscar.br/bitstreams/1902362d-ac2e-46a1-8a9f-38f04548a7ac/downloadf13e5a4e1bc97f9bd1a1199b949c8749MD52falseAnonymousREADTEXTDissertação Felipe Ivo da Silva .pdf.txtDissertação Felipe Ivo da Silva .pdf.txtExtracted texttext/plain103081https://repositorio.ufscar.br/bitstreams/420fe51c-ece1-40b8-97df-5b4a88d5f0e8/downloadb6cb743dd63f8c6681cd10c0b9700cb3MD53falseAnonymousREADTHUMBNAILDissertação Felipe Ivo da Silva .pdf.jpgDissertação Felipe Ivo da Silva .pdf.jpgGenerated Thumbnailimage/jpeg3678https://repositorio.ufscar.br/bitstreams/ba856b64-5c82-4a13-b7b4-c971b011afb6/downloaddd16ac3648b8ebb5953dc5087a12c4a4MD54falseAnonymousREAD20.500.14289/218662025-04-11 00:11:04.24http://creativecommons.org/licenses/by-sa/3.0/br/Attribution-ShareAlike 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21866https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-04-11T03:11:04Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.none.fl_str_mv Proveniência de dados e metadados em repositórios de dados de pesquisa
dc.title.alternative.eng.fl_str_mv Data and metadata provenance in research data repositories
title Proveniência de dados e metadados em repositórios de dados de pesquisa
spellingShingle Proveniência de dados e metadados em repositórios de dados de pesquisa
Silva, Felipe Ivo da
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO
Metadados
Dados
Proveniência
Repositórios de dados de pesquisa
title_short Proveniência de dados e metadados em repositórios de dados de pesquisa
title_full Proveniência de dados e metadados em repositórios de dados de pesquisa
title_fullStr Proveniência de dados e metadados em repositórios de dados de pesquisa
title_full_unstemmed Proveniência de dados e metadados em repositórios de dados de pesquisa
title_sort Proveniência de dados e metadados em repositórios de dados de pesquisa
author Silva, Felipe Ivo da
author_facet Silva, Felipe Ivo da
author_role author
dc.contributor.authorlattes.none.fl_str_mv http://lattes.cnpq.br/0753366586589793
dc.contributor.authororcid.none.fl_str_mv https://orcid.org/0009-0005-1379-4692
dc.contributor.advisor1orcid.none.fl_str_mv https://orcid.org/0000-0002-3983-2563
dc.contributor.advisor-co1orcid.none.fl_str_mv https://orcid.org/0000-0003-3525-0619
dc.contributor.author.fl_str_mv Silva, Felipe Ivo da
dc.contributor.advisor1.fl_str_mv Arakaki, Felipe Augusto
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5324289839207169
dc.contributor.advisor-co1.fl_str_mv Baptista, Ana Alice Rodrigues Pereira
contributor_str_mv Arakaki, Felipe Augusto
Baptista, Ana Alice Rodrigues Pereira
dc.subject.cnpq.fl_str_mv CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO
topic CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO
Metadados
Dados
Proveniência
Repositórios de dados de pesquisa
dc.subject.por.fl_str_mv Metadados
Dados
Proveniência
Repositórios de dados de pesquisa
description Research data repositories are environments for storing, preserving, and sharing scientific data, and ensure accessibility and reuse of data. Provenance, which documents the origin, history, and transformations of data, is essential to ensure the tradition, reliability, and traceability of information. However, the lack of standardization and interoperability between the main metadata standards in these repositories can compromise the effectiveness of provenance. In this context, the central question of this research was: do the metadata standards used to describe data in research repositories ensure traceability and prevent information from becoming obsolete over time? The general objective of the study was to evaluate the adherence of provenance metadata, based on the PROV Family, to the main metadata standards used in research data repositories according to Re3data, such as Dublin Core, DataCite, and DDI. The research sought to identify how these standards can assist in identifying deficiency and traceability of information, proposing recommendations for their application. The methodology adopted was theoretical and exploratory, using a bibliographic survey in recognized databases, analysis of specialized literature and the Crosswalk method to map and compare metadata standards in relation to PROV-O. The analysis focused on the interoperability between the standards and the PROV Family, eventually identifying possible adaptations to improve semantic interoperability. The main results indicated that the developed standards have different degrees of interoperability with the PROV Family. Dublin Core presented the highest relative correspondence, while DataCite and DDI presented lower levels of interoperability. Despite the integration suggestions, limitations were specified that exclude adaptations to meet the semantic interoperability principles promoted by the W3C. In conclusion, the study reinforces the importance of provenance for the reliability and traceability of data in research data repositories, highlighting the need for interdisciplinary collaboration between Information Science and Computer Science to improve data management in digital environments. The research suggests the implementation of provenance metadata to promote data veracity and longevity.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-04-10T19:52:38Z
dc.date.issued.fl_str_mv 2025-04-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Felipe Ivo da. Proveniência de dados e metadados em repositórios de dados de pesquisa. 2025. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21866.
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.14289/21866
identifier_str_mv SILVA, Felipe Ivo da. Proveniência de dados e metadados em repositórios de dados de pesquisa. 2025. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21866.
url https://hdl.handle.net/20.500.14289/21866
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-sa/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-sa/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Informação - PPGCI
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/c10a72c2-0320-4117-9192-d2a2fce4203f/download
https://repositorio.ufscar.br/bitstreams/1902362d-ac2e-46a1-8a9f-38f04548a7ac/download
https://repositorio.ufscar.br/bitstreams/420fe51c-ece1-40b8-97df-5b4a88d5f0e8/download
https://repositorio.ufscar.br/bitstreams/ba856b64-5c82-4a13-b7b4-c971b011afb6/download
bitstream.checksum.fl_str_mv 99375325d0868b37e0a225742569fb49
f13e5a4e1bc97f9bd1a1199b949c8749
b6cb743dd63f8c6681cd10c0b9700cb3
dd16ac3648b8ebb5953dc5087a12c4a4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688842134814720