O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Tomoyose, Kazumi
Orientador(a): Arakaki, Ana Carolina Simionato lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Informação - PPGCI
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/14116
Resumo: With the development of semantic technologies, the importance and the recognition of data as information sources grow. In this context, the data generated from researches are increasingly valued, since their publication allows the foundation of the results obtained with the scientific works, also helping in the production of new knowledge in a sustainable way. Thus, there is a need to organize these research data, so as to optimize their retrieval. For this purpose, vocabularies could be used. From the standardization of data representation, vocabularies allow data to be organized and retrieved efficiently. When considering the Web environment, the discovery of new data is also improved, using Linked Data principles, and the Data Catalog Vocabulary (DCAT) appears as a vocabulary aimed at describing catalogs and its datasets, seeking to favor their interoperability. The objective of the research is to analyze the characteristcs and fundamentals of the Data Catalog Vocabulary (DCAT) and the vocabularies adopted by it, for the publication of research data in the Linked Data principles, in order to identify the discussion on the subject in the literature and verify the use of it. Through exploratory, descriptive and theoretical research, it was possible to systematize and analyze the characteristics of the vocabularies, identifying that DCAT allows catalogs and datasets to be standardized, reducing ambiguity issues and providing the discovery of data and data services, since it has specific terms for this purpose. Thus, in line with Linked Data principles, the use of DCAT allows the benefits of sharing research data to be accomplished. An analysis of re3data platforms was also carried out in order to identify the current use of vocabulary by them, where we verified low adoption of DCAT. However, the results indicate the concern of these platforms with issues of findability, accessibility, interoperability and reuse, going against the Linked Data principles and the FAIR principles. The research revealed that there are few discussions about DCAT in the literature, especially in the scope of Information Science. Thus, we point to the need to better explore the possibilities of representing information in the context of research data. In addition, further discussions that align the knowledge of the area with the semantic tools and concepts applied to the Web enhance the benefits of finding, using and retrieving information, in addition to expanding and improving the knowledge and possibilities of information professionals' performance.
id SCAR_c5406e50671a125e2c879670397b4113
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/14116
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Tomoyose, KazumiArakaki, Ana Carolina Simionatohttp://lattes.cnpq.br/9896600626524397http://lattes.cnpq.br/879458405437520152d9efe1-a97b-4f60-ade6-9fbc596a5a782021-04-15T21:01:14Z2021-04-15T21:01:14Z2021-03-10TOMOYOSE, Kazumi. O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data. 2021. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/14116.https://repositorio.ufscar.br/handle/20.500.14289/14116With the development of semantic technologies, the importance and the recognition of data as information sources grow. In this context, the data generated from researches are increasingly valued, since their publication allows the foundation of the results obtained with the scientific works, also helping in the production of new knowledge in a sustainable way. Thus, there is a need to organize these research data, so as to optimize their retrieval. For this purpose, vocabularies could be used. From the standardization of data representation, vocabularies allow data to be organized and retrieved efficiently. When considering the Web environment, the discovery of new data is also improved, using Linked Data principles, and the Data Catalog Vocabulary (DCAT) appears as a vocabulary aimed at describing catalogs and its datasets, seeking to favor their interoperability. The objective of the research is to analyze the characteristcs and fundamentals of the Data Catalog Vocabulary (DCAT) and the vocabularies adopted by it, for the publication of research data in the Linked Data principles, in order to identify the discussion on the subject in the literature and verify the use of it. Through exploratory, descriptive and theoretical research, it was possible to systematize and analyze the characteristics of the vocabularies, identifying that DCAT allows catalogs and datasets to be standardized, reducing ambiguity issues and providing the discovery of data and data services, since it has specific terms for this purpose. Thus, in line with Linked Data principles, the use of DCAT allows the benefits of sharing research data to be accomplished. An analysis of re3data platforms was also carried out in order to identify the current use of vocabulary by them, where we verified low adoption of DCAT. However, the results indicate the concern of these platforms with issues of findability, accessibility, interoperability and reuse, going against the Linked Data principles and the FAIR principles. The research revealed that there are few discussions about DCAT in the literature, especially in the scope of Information Science. Thus, we point to the need to better explore the possibilities of representing information in the context of research data. In addition, further discussions that align the knowledge of the area with the semantic tools and concepts applied to the Web enhance the benefits of finding, using and retrieving information, in addition to expanding and improving the knowledge and possibilities of information professionals' performance.Com o desenvolvimento das tecnologias semânticas, cresce a importância e o reconhecimento dos dados como fontes informacionais. Nesse contexto, os dados gerados a partir de pesquisas são cada vez mais valorizados, uma vez que sua publicação permite a fundamentação dos resultados obtidos com os trabalhos científicos, além de auxiliarem na produção de novos conhecimentos de forma sustentável. Assim, é observada a necessidade em organizar esses dados de pesquisa, de forma a otimizar a recuperação deles, sendo que poderiam ser utilizados, para tal finalidade, os vocabulários. Os vocabulários são compreendidos como conjuntos de termos que padronizam a descrição de recursos, sendo o foco da presente pesquisa aqueles voltados à padronização dos elementos de metadados, pensando-se na organização e recuperação da informação. Ao considerar o ambiente da Web, a utilização dos princípios Linked Data melhora a descoberta de novos dados, sendo que o Data Catalog Vocabulary (DCAT) figura como um vocabulário voltado à descrição de catálogos e seus conjuntos de dados, buscando favorecer a interoperabilidade na Web. O objetivo da pesquisa consiste em analisar as características e os fundamentos do DCAT e dos vocabulários adotados por ele para a publicação de dados de pesquisa nos princípios Linked Data, de modo a identificar a discussão sobre a temática na literatura e verificar a utilização do mesmo. Por meio de pesquisa exploratória, descritiva e teórica, foi possível sistematizar e analisar as características dos vocabulários, identificando-se que o DCAT permite que os catálogos e os conjuntos de dados sejam padronizados, diminuindo questões de ambiguidade e proporcionando a descoberta de dados e de serviços de dados, uma vez que dispõe termos específicos para tal finalidade. Desse modo, alinhado também aos princípios Linked Data, o uso do DCAT permite que sejam efetivados os benefícios do compartilhamento dos dados de pesquisa. Foi realizada também a análise de plataformas do re3data a fim de identificar a atual utilização do vocabulário por elas, verificando-se baixa adoção do DCAT. Entretanto, os resultados indicam a preocupação dessas plataformas com questões de encontrabilidade, acessibilidade, interoperabilidade e reutilização, indo de encontro com os princípios Linked Data e os princípios FAIR. A pesquisa revelou que existem poucas discussões sobre o DCAT na literatura, em especial no âmbito da Ciência da Informação. Dessa forma, identifica-se a necessidade de melhor explorar as possibilidades de representação da informação no contexto dos dados de pesquisa. Além disso, maiores discussões que alinhem o conhecimento da área às ferramentas e aos conceitos semânticos aplicados à Web potencializam os benefícios de encontrabilidade, utilização e recuperação de informações, além de expandir e aprimorar os conhecimentos e as possibilidades de atuação dos profissionais da informação.Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)FAPESP: 2018/23655-6porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Informação - PPGCIUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessVocabuláriosDados de pesquisaLinked dataVocabulariesResearch dataData Catalog Vocabulary (DCAT)CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAOO Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked DataData Catalog Vocabulary (DCAT) for research data publishing in the Linked Data principlesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis60060022bff02c-fafd-42b1-8acf-ec52a84bd73creponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertacao_Tomoyose_2021.pdfDissertacao_Tomoyose_2021.pdfDissertaçãoapplication/pdf5425041https://repositorio.ufscar.br/bitstreams/6b12dc01-582d-4a7e-bdc9-34f6d07e3b5a/download9688643bce40d7526e1da4deaa7321b9MD51trueAnonymousREADCarta Comprovante de Validacao da Versao Final.pdfCarta Comprovante de Validacao da Versao Final.pdfCarta comprovante de validação da versão finalapplication/pdf305092https://repositorio.ufscar.br/bitstreams/1e5b368d-a460-4136-933c-8f06d796499b/downloadf956e22089350b7bdf7506abfc2b3f62MD52falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstreams/b012a0a5-72eb-4776-a52c-cb369d72cd1f/downloade39d27027a6cc9cb039ad269a5db8e34MD53falseAnonymousREADTEXTDissertacao_Tomoyose_2021.pdf.txtDissertacao_Tomoyose_2021.pdf.txtExtracted texttext/plain357814https://repositorio.ufscar.br/bitstreams/92fc7973-1508-4f53-8f3c-2af48e493769/download841cdd3cfbd156ef10394b19746789e9MD58falseAnonymousREADCarta Comprovante de Validacao da Versao Final.pdf.txtCarta Comprovante de Validacao da Versao Final.pdf.txtExtracted texttext/plain1360https://repositorio.ufscar.br/bitstreams/4f7fb7d6-7710-4f87-a091-f21d0d32886e/download5f847e2a4676ff84632f92588e5499dfMD510falseAnonymousREADTHUMBNAILDissertacao_Tomoyose_2021.pdf.jpgDissertacao_Tomoyose_2021.pdf.jpgIM Thumbnailimage/jpeg6647https://repositorio.ufscar.br/bitstreams/9160bc29-8ef0-43dc-8735-c6e8a650cc84/downloaddd58fb9f3d280873b79a752565f52a78MD59falseAnonymousREADCarta Comprovante de Validacao da Versao Final.pdf.jpgCarta Comprovante de Validacao da Versao Final.pdf.jpgIM Thumbnailimage/jpeg13221https://repositorio.ufscar.br/bitstreams/98a27bd0-d4fd-4d16-b5da-1f2017617adf/downloadbd8e2feaa66800d73ea009bc895eccd8MD511falseAnonymousREAD20.500.14289/141162025-02-05 19:36:36.501http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/14116https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-05T22:36:36Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data
dc.title.alternative.eng.fl_str_mv Data Catalog Vocabulary (DCAT) for research data publishing in the Linked Data principles
title O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data
spellingShingle O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data
Tomoyose, Kazumi
Vocabulários
Dados de pesquisa
Linked data
Vocabularies
Research data
Data Catalog Vocabulary (DCAT)
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO
title_short O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data
title_full O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data
title_fullStr O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data
title_full_unstemmed O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data
title_sort O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data
author Tomoyose, Kazumi
author_facet Tomoyose, Kazumi
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/8794584054375201
dc.contributor.author.fl_str_mv Tomoyose, Kazumi
dc.contributor.advisor1.fl_str_mv Arakaki, Ana Carolina Simionato
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/9896600626524397
dc.contributor.authorID.fl_str_mv 52d9efe1-a97b-4f60-ade6-9fbc596a5a78
contributor_str_mv Arakaki, Ana Carolina Simionato
dc.subject.por.fl_str_mv Vocabulários
Dados de pesquisa
topic Vocabulários
Dados de pesquisa
Linked data
Vocabularies
Research data
Data Catalog Vocabulary (DCAT)
CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO
dc.subject.eng.fl_str_mv Linked data
Vocabularies
Research data
Data Catalog Vocabulary (DCAT)
dc.subject.cnpq.fl_str_mv CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO
description With the development of semantic technologies, the importance and the recognition of data as information sources grow. In this context, the data generated from researches are increasingly valued, since their publication allows the foundation of the results obtained with the scientific works, also helping in the production of new knowledge in a sustainable way. Thus, there is a need to organize these research data, so as to optimize their retrieval. For this purpose, vocabularies could be used. From the standardization of data representation, vocabularies allow data to be organized and retrieved efficiently. When considering the Web environment, the discovery of new data is also improved, using Linked Data principles, and the Data Catalog Vocabulary (DCAT) appears as a vocabulary aimed at describing catalogs and its datasets, seeking to favor their interoperability. The objective of the research is to analyze the characteristcs and fundamentals of the Data Catalog Vocabulary (DCAT) and the vocabularies adopted by it, for the publication of research data in the Linked Data principles, in order to identify the discussion on the subject in the literature and verify the use of it. Through exploratory, descriptive and theoretical research, it was possible to systematize and analyze the characteristics of the vocabularies, identifying that DCAT allows catalogs and datasets to be standardized, reducing ambiguity issues and providing the discovery of data and data services, since it has specific terms for this purpose. Thus, in line with Linked Data principles, the use of DCAT allows the benefits of sharing research data to be accomplished. An analysis of re3data platforms was also carried out in order to identify the current use of vocabulary by them, where we verified low adoption of DCAT. However, the results indicate the concern of these platforms with issues of findability, accessibility, interoperability and reuse, going against the Linked Data principles and the FAIR principles. The research revealed that there are few discussions about DCAT in the literature, especially in the scope of Information Science. Thus, we point to the need to better explore the possibilities of representing information in the context of research data. In addition, further discussions that align the knowledge of the area with the semantic tools and concepts applied to the Web enhance the benefits of finding, using and retrieving information, in addition to expanding and improving the knowledge and possibilities of information professionals' performance.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-04-15T21:01:14Z
dc.date.available.fl_str_mv 2021-04-15T21:01:14Z
dc.date.issued.fl_str_mv 2021-03-10
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv TOMOYOSE, Kazumi. O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data. 2021. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/14116.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/14116
identifier_str_mv TOMOYOSE, Kazumi. O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data. 2021. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/14116.
url https://repositorio.ufscar.br/handle/20.500.14289/14116
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv 22bff02c-fafd-42b1-8acf-ec52a84bd73c
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Informação - PPGCI
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/6b12dc01-582d-4a7e-bdc9-34f6d07e3b5a/download
https://repositorio.ufscar.br/bitstreams/1e5b368d-a460-4136-933c-8f06d796499b/download
https://repositorio.ufscar.br/bitstreams/b012a0a5-72eb-4776-a52c-cb369d72cd1f/download
https://repositorio.ufscar.br/bitstreams/92fc7973-1508-4f53-8f3c-2af48e493769/download
https://repositorio.ufscar.br/bitstreams/4f7fb7d6-7710-4f87-a091-f21d0d32886e/download
https://repositorio.ufscar.br/bitstreams/9160bc29-8ef0-43dc-8735-c6e8a650cc84/download
https://repositorio.ufscar.br/bitstreams/98a27bd0-d4fd-4d16-b5da-1f2017617adf/download
bitstream.checksum.fl_str_mv 9688643bce40d7526e1da4deaa7321b9
f956e22089350b7bdf7506abfc2b3f62
e39d27027a6cc9cb039ad269a5db8e34
841cdd3cfbd156ef10394b19746789e9
5f847e2a4676ff84632f92588e5499df
dd58fb9f3d280873b79a752565f52a78
bd8e2feaa66800d73ea009bc895eccd8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688792018124800