Proveniência de dados e metadados em repositórios de dados de pesquisa
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Informação - PPGCI
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://hdl.handle.net/20.500.14289/21866 |
Resumo: | Research data repositories are environments for storing, preserving, and sharing scientific data, and ensure accessibility and reuse of data. Provenance, which documents the origin, history, and transformations of data, is essential to ensure the tradition, reliability, and traceability of information. However, the lack of standardization and interoperability between the main metadata standards in these repositories can compromise the effectiveness of provenance. In this context, the central question of this research was: do the metadata standards used to describe data in research repositories ensure traceability and prevent information from becoming obsolete over time? The general objective of the study was to evaluate the adherence of provenance metadata, based on the PROV Family, to the main metadata standards used in research data repositories according to Re3data, such as Dublin Core, DataCite, and DDI. The research sought to identify how these standards can assist in identifying deficiency and traceability of information, proposing recommendations for their application. The methodology adopted was theoretical and exploratory, using a bibliographic survey in recognized databases, analysis of specialized literature and the Crosswalk method to map and compare metadata standards in relation to PROV-O. The analysis focused on the interoperability between the standards and the PROV Family, eventually identifying possible adaptations to improve semantic interoperability. The main results indicated that the developed standards have different degrees of interoperability with the PROV Family. Dublin Core presented the highest relative correspondence, while DataCite and DDI presented lower levels of interoperability. Despite the integration suggestions, limitations were specified that exclude adaptations to meet the semantic interoperability principles promoted by the W3C. In conclusion, the study reinforces the importance of provenance for the reliability and traceability of data in research data repositories, highlighting the need for interdisciplinary collaboration between Information Science and Computer Science to improve data management in digital environments. The research suggests the implementation of provenance metadata to promote data veracity and longevity. |
| id |
SCAR_b20949423f2440ae2750a18f87e7672a |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/21866 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Silva, Felipe Ivo daArakaki, Felipe Augustohttp://lattes.cnpq.br/5324289839207169Baptista, Ana Alice Rodrigues Pereirahttp://lattes.cnpq.br/0753366586589793https://orcid.org/0009-0005-1379-4692https://orcid.org/0000-0002-3983-2563https://orcid.org/0000-0003-3525-06192025-04-10T19:52:38Z2025-04-03SILVA, Felipe Ivo da. Proveniência de dados e metadados em repositórios de dados de pesquisa. 2025. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21866.https://hdl.handle.net/20.500.14289/21866Research data repositories are environments for storing, preserving, and sharing scientific data, and ensure accessibility and reuse of data. Provenance, which documents the origin, history, and transformations of data, is essential to ensure the tradition, reliability, and traceability of information. However, the lack of standardization and interoperability between the main metadata standards in these repositories can compromise the effectiveness of provenance. In this context, the central question of this research was: do the metadata standards used to describe data in research repositories ensure traceability and prevent information from becoming obsolete over time? The general objective of the study was to evaluate the adherence of provenance metadata, based on the PROV Family, to the main metadata standards used in research data repositories according to Re3data, such as Dublin Core, DataCite, and DDI. The research sought to identify how these standards can assist in identifying deficiency and traceability of information, proposing recommendations for their application. The methodology adopted was theoretical and exploratory, using a bibliographic survey in recognized databases, analysis of specialized literature and the Crosswalk method to map and compare metadata standards in relation to PROV-O. The analysis focused on the interoperability between the standards and the PROV Family, eventually identifying possible adaptations to improve semantic interoperability. The main results indicated that the developed standards have different degrees of interoperability with the PROV Family. Dublin Core presented the highest relative correspondence, while DataCite and DDI presented lower levels of interoperability. Despite the integration suggestions, limitations were specified that exclude adaptations to meet the semantic interoperability principles promoted by the W3C. In conclusion, the study reinforces the importance of provenance for the reliability and traceability of data in research data repositories, highlighting the need for interdisciplinary collaboration between Information Science and Computer Science to improve data management in digital environments. The research suggests the implementation of provenance metadata to promote data veracity and longevity.Os repositórios de dados de pesquisa são ambientes de armazenamento, preservação e compartilhamento de dados científicos, e garantem acessibilidade e reutilização dos dados. A proveniência, que documenta a origem, histórico e transformações dos dados, é fundamental para assegurar a autenticidade, confiabilidade e rastreabilidade das informações. No entanto, a falta de padronização e interoperabilidade entre os principais padrões de metadados utilizados nesses repositórios pode comprometer a eficácia da proveniência. Nesse contexto, a questão central desta pesquisa foi: os padrões de metadados utilizados para a descrição de dados em repositórios de pesquisa asseguram a rastreabilidade e autenticidade das informações ao longo do tempo? O objetivo geral do estudo foi avaliar a aderência dos metadados de proveniência, com base na Família PROV, aos principais padrões de metadados utilizados em repositórios de dados de pesquisa segundo o Re3data, como Dublin Core, DataCite e DDI. A pesquisa buscou identificar como esses padrões podem auxiliar na identificação da autenticidade e rastreabilidade das informações, propondo recomendações para sua aplicação. A metodologia adotada foi teórica e exploratória, utilizando levantamento bibliográfico em bases de dados reconhecidas, análise de literatura especializada e o método Crosswalk para mapear e comparar os padrões de metadados em relação à PROV-O. A análise focou na interoperabilidade entre os padrões e a Família PROV, visando identificar possíveis adaptações para melhorar a interoperabilidade semântica. Os resultados principais indicaram que os padrões analisados possuem diferentes graus de interoperabilidade com a Família PROV. O Dublin Core apresentou a maior correspondência relativa, enquanto DataCite e DDI mostraram níveis mais baixos de interoperabilidade. Apesar da viabilidade de integração, foram identificadas limitações que exigem adaptações para atender aos princípios de interoperabilidade semântica promovidos pelo W3C. Em conclusão, o estudo reforça a importância da proveniência para a confiabilidade e rastreabilidade dos dados em repositórios de dados pesquisa, destacando a necessidade de colaboração interdisciplinar entre Ciência da Informação e Ciência da Computação para aprimorar a gestão de dados em ambientes digitais. A pesquisa sugere a implementação de metadados de proveniência para promover a veracidade e longevidade dos dados. Palavras-chave: Metadados. DadosporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Informação - PPGCIUFSCarAttribution-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-sa/3.0/br/info:eu-repo/semantics/openAccessCIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAOMetadadosDadosProveniênciaRepositórios de dados de pesquisaProveniência de dados e metadados em repositórios de dados de pesquisaData and metadata provenance in research data repositoriesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertação Felipe Ivo da Silva .pdfDissertação Felipe Ivo da Silva .pdfapplication/pdf1653744https://repositorio.ufscar.br/bitstreams/c10a72c2-0320-4117-9192-d2a2fce4203f/download99375325d0868b37e0a225742569fb49MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81160https://repositorio.ufscar.br/bitstreams/1902362d-ac2e-46a1-8a9f-38f04548a7ac/downloadf13e5a4e1bc97f9bd1a1199b949c8749MD52falseAnonymousREADTEXTDissertação Felipe Ivo da Silva .pdf.txtDissertação Felipe Ivo da Silva .pdf.txtExtracted texttext/plain103081https://repositorio.ufscar.br/bitstreams/420fe51c-ece1-40b8-97df-5b4a88d5f0e8/downloadb6cb743dd63f8c6681cd10c0b9700cb3MD53falseAnonymousREADTHUMBNAILDissertação Felipe Ivo da Silva .pdf.jpgDissertação Felipe Ivo da Silva .pdf.jpgGenerated Thumbnailimage/jpeg3678https://repositorio.ufscar.br/bitstreams/ba856b64-5c82-4a13-b7b4-c971b011afb6/downloaddd16ac3648b8ebb5953dc5087a12c4a4MD54falseAnonymousREAD20.500.14289/218662025-04-11 00:11:04.24http://creativecommons.org/licenses/by-sa/3.0/br/Attribution-ShareAlike 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21866https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-04-11T03:11:04Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.none.fl_str_mv |
Proveniência de dados e metadados em repositórios de dados de pesquisa |
| dc.title.alternative.eng.fl_str_mv |
Data and metadata provenance in research data repositories |
| title |
Proveniência de dados e metadados em repositórios de dados de pesquisa |
| spellingShingle |
Proveniência de dados e metadados em repositórios de dados de pesquisa Silva, Felipe Ivo da CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO Metadados Dados Proveniência Repositórios de dados de pesquisa |
| title_short |
Proveniência de dados e metadados em repositórios de dados de pesquisa |
| title_full |
Proveniência de dados e metadados em repositórios de dados de pesquisa |
| title_fullStr |
Proveniência de dados e metadados em repositórios de dados de pesquisa |
| title_full_unstemmed |
Proveniência de dados e metadados em repositórios de dados de pesquisa |
| title_sort |
Proveniência de dados e metadados em repositórios de dados de pesquisa |
| author |
Silva, Felipe Ivo da |
| author_facet |
Silva, Felipe Ivo da |
| author_role |
author |
| dc.contributor.authorlattes.none.fl_str_mv |
http://lattes.cnpq.br/0753366586589793 |
| dc.contributor.authororcid.none.fl_str_mv |
https://orcid.org/0009-0005-1379-4692 |
| dc.contributor.advisor1orcid.none.fl_str_mv |
https://orcid.org/0000-0002-3983-2563 |
| dc.contributor.advisor-co1orcid.none.fl_str_mv |
https://orcid.org/0000-0003-3525-0619 |
| dc.contributor.author.fl_str_mv |
Silva, Felipe Ivo da |
| dc.contributor.advisor1.fl_str_mv |
Arakaki, Felipe Augusto |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/5324289839207169 |
| dc.contributor.advisor-co1.fl_str_mv |
Baptista, Ana Alice Rodrigues Pereira |
| contributor_str_mv |
Arakaki, Felipe Augusto Baptista, Ana Alice Rodrigues Pereira |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO |
| topic |
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO Metadados Dados Proveniência Repositórios de dados de pesquisa |
| dc.subject.por.fl_str_mv |
Metadados Dados Proveniência Repositórios de dados de pesquisa |
| description |
Research data repositories are environments for storing, preserving, and sharing scientific data, and ensure accessibility and reuse of data. Provenance, which documents the origin, history, and transformations of data, is essential to ensure the tradition, reliability, and traceability of information. However, the lack of standardization and interoperability between the main metadata standards in these repositories can compromise the effectiveness of provenance. In this context, the central question of this research was: do the metadata standards used to describe data in research repositories ensure traceability and prevent information from becoming obsolete over time? The general objective of the study was to evaluate the adherence of provenance metadata, based on the PROV Family, to the main metadata standards used in research data repositories according to Re3data, such as Dublin Core, DataCite, and DDI. The research sought to identify how these standards can assist in identifying deficiency and traceability of information, proposing recommendations for their application. The methodology adopted was theoretical and exploratory, using a bibliographic survey in recognized databases, analysis of specialized literature and the Crosswalk method to map and compare metadata standards in relation to PROV-O. The analysis focused on the interoperability between the standards and the PROV Family, eventually identifying possible adaptations to improve semantic interoperability. The main results indicated that the developed standards have different degrees of interoperability with the PROV Family. Dublin Core presented the highest relative correspondence, while DataCite and DDI presented lower levels of interoperability. Despite the integration suggestions, limitations were specified that exclude adaptations to meet the semantic interoperability principles promoted by the W3C. In conclusion, the study reinforces the importance of provenance for the reliability and traceability of data in research data repositories, highlighting the need for interdisciplinary collaboration between Information Science and Computer Science to improve data management in digital environments. The research suggests the implementation of provenance metadata to promote data veracity and longevity. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-04-10T19:52:38Z |
| dc.date.issued.fl_str_mv |
2025-04-03 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
SILVA, Felipe Ivo da. Proveniência de dados e metadados em repositórios de dados de pesquisa. 2025. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21866. |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.14289/21866 |
| identifier_str_mv |
SILVA, Felipe Ivo da. Proveniência de dados e metadados em repositórios de dados de pesquisa. 2025. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21866. |
| url |
https://hdl.handle.net/20.500.14289/21866 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Informação - PPGCI |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/c10a72c2-0320-4117-9192-d2a2fce4203f/download https://repositorio.ufscar.br/bitstreams/1902362d-ac2e-46a1-8a9f-38f04548a7ac/download https://repositorio.ufscar.br/bitstreams/420fe51c-ece1-40b8-97df-5b4a88d5f0e8/download https://repositorio.ufscar.br/bitstreams/ba856b64-5c82-4a13-b7b4-c971b011afb6/download |
| bitstream.checksum.fl_str_mv |
99375325d0868b37e0a225742569fb49 f13e5a4e1bc97f9bd1a1199b949c8749 b6cb743dd63f8c6681cd10c0b9700cb3 dd16ac3648b8ebb5953dc5087a12c4a4 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688842134814720 |