CompOD : framework de conformidade LGPDpara dados abertos

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Carmo, Shirlei Lúcia Oliveira do
Orientador(a): Geyer, Claudio Fernando Resin
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/280742
Resumo: Dados abertos são um conceito atribuído ao compartilhamento de dados com qualquer pessoa. Além de serem acessados, esses dados podem ser manipulados e redistribuídos. Esta é uma tendência global que incentiva a transparência dos governos e das entidades nas suas transações, além de fornecer à sociedade conhecimento sobre dados relevantes em áreas como infraestrutura, saúde, gastos públicos e meio ambiente. Diversas iniciati vas discutem atualmente a importância dos dados abertos, seja para a sociedade ou para uso e suporte em várias áreas, como em tecnologia da informação, durante o treinamento de inteligência artificial que necessitam de um grande volume de dados para operar com precisão. O uso otimizado e intercambiável de dados abertos entre organizações pode levar à chamada inovação aberta, que pode ser entendida como a utilização não apenas de dados internos das organizações, mas também de dados externos para cruzar informações e gerar sistemas e soluções mais completos e inovadores. Sabendo da relevância desse tipo de dados e de seus desafios, foi desenvolvido um framework de análise da dados abertos e verificação de sua conformidade com a lei brasileira de proteção de dados, a LGPD. A partir deste framework, foi realizado um estudo quantitativo e qualitativo de dados abertos no Brasil, e verificada a sua conformidade com a referida lei brasileira de proteção de dados, de modo a avaliar a saúde dos dados abertos disponíveis no Brasil, sendo este o diferencial da solução proposta. A metodologia utilizada nesta dissertação compreende uma análise automatizada de portais de dados abertos brasileiros por meio do sistema de gerenciamento de dados CKAN, utilizado para publicação e compartilha mento de dados abertos no mundo todo. O escopo do estudo abrange todos os estados e instituições governamentais que possuem portais de dados abertos e que são expostos por meio do CKAN. A análise quantitativa validou 1.817 conjuntos de dados, em 19 portais de dados, e verificou que, assim como estudos da literatura mencionam, as principais la cunas nos dados abertos são: dados desatualizados, ausência de metadados para suportar sua utilização e reutilização, especificação de licença de uso imprecisa e heterogeneidade no mododeexposição dos dados entre portais. O módulo de verificação de conformidade com a LGDPanalisou 11.154 recursos, contidos em 812 datasets dos estados brasileiros, e o resultado mostrou que, em quase todas as regiões analisadas, havia conjuntos de da dos com informações pessoais (como CPF) expostas. Logo, apesar do grande potencial dos dados abertos, os obstáculos também se mostraram desafiadores, e as ferramentas de controle e fiscalização necessárias.
id URGS_5cafe81ee83ae97c9109b776f2e7ac8f
oai_identifier_str oai:www.lume.ufrgs.br:10183/280742
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Carmo, Shirlei Lúcia Oliveira doGeyer, Claudio Fernando ResinAnjos, Julio Cesar Santos dos2024-11-01T06:47:32Z2024http://hdl.handle.net/10183/280742001213481Dados abertos são um conceito atribuído ao compartilhamento de dados com qualquer pessoa. Além de serem acessados, esses dados podem ser manipulados e redistribuídos. Esta é uma tendência global que incentiva a transparência dos governos e das entidades nas suas transações, além de fornecer à sociedade conhecimento sobre dados relevantes em áreas como infraestrutura, saúde, gastos públicos e meio ambiente. Diversas iniciati vas discutem atualmente a importância dos dados abertos, seja para a sociedade ou para uso e suporte em várias áreas, como em tecnologia da informação, durante o treinamento de inteligência artificial que necessitam de um grande volume de dados para operar com precisão. O uso otimizado e intercambiável de dados abertos entre organizações pode levar à chamada inovação aberta, que pode ser entendida como a utilização não apenas de dados internos das organizações, mas também de dados externos para cruzar informações e gerar sistemas e soluções mais completos e inovadores. Sabendo da relevância desse tipo de dados e de seus desafios, foi desenvolvido um framework de análise da dados abertos e verificação de sua conformidade com a lei brasileira de proteção de dados, a LGPD. A partir deste framework, foi realizado um estudo quantitativo e qualitativo de dados abertos no Brasil, e verificada a sua conformidade com a referida lei brasileira de proteção de dados, de modo a avaliar a saúde dos dados abertos disponíveis no Brasil, sendo este o diferencial da solução proposta. A metodologia utilizada nesta dissertação compreende uma análise automatizada de portais de dados abertos brasileiros por meio do sistema de gerenciamento de dados CKAN, utilizado para publicação e compartilha mento de dados abertos no mundo todo. O escopo do estudo abrange todos os estados e instituições governamentais que possuem portais de dados abertos e que são expostos por meio do CKAN. A análise quantitativa validou 1.817 conjuntos de dados, em 19 portais de dados, e verificou que, assim como estudos da literatura mencionam, as principais la cunas nos dados abertos são: dados desatualizados, ausência de metadados para suportar sua utilização e reutilização, especificação de licença de uso imprecisa e heterogeneidade no mododeexposição dos dados entre portais. O módulo de verificação de conformidade com a LGDPanalisou 11.154 recursos, contidos em 812 datasets dos estados brasileiros, e o resultado mostrou que, em quase todas as regiões analisadas, havia conjuntos de da dos com informações pessoais (como CPF) expostas. Logo, apesar do grande potencial dos dados abertos, os obstáculos também se mostraram desafiadores, e as ferramentas de controle e fiscalização necessárias.Opendata is a concept attributed to sharing data with anyone. Besides being accessed, this data can be manipulated and redistributed. This is a global trend that encourages transparency by governments and entities in their transactions, in addition to providing society with knowledge about relevant data in areas such as infrastructure, health, pub lic spending and the environment. Several initiatives currently discuss the importance of open data, whether for society or for use and support in different areas, such as artificial intelligence training or models that use machine learning and require a large volume of data to operate accurately. The optimized and interchangeable use of open data between organizations can lead to so-called open innovation, which can be understood as the use not only of organizations’ internal data, but also of external data to cross-reference in formation and generate more complete and innovative systems and solutions. Knowing the relevance of this type of data and its challenges, a quantitative and qualitative study of open data in Brazil was performed, in addition to the development of a prototype that validated the compliance of this data with the Brazilian data protection law, LGPD, this being the differential of the proposed solution. The goal is to assess the health of open data available in Brazil. The methodology used in this article comprises an automated analysis of Brazilian open data portals through the CKAN data management system used in open data portals around the world for publishing and sharing open data. The scope of the study covers all states and government institutions that have open data por tals and are exposed through CKAN. Quantitative analysis validated 1,817 datasets across 19 data portals. It was found that, as studies in the literature mention, the main points of improvement in open data are: outdated data, lack of metadata to support the use and reuse of these, inaccurate usage license specification, and heterogeneity in the way data is exposed between portals. The LGDP compliance verification module analyzed 11,154 resources, contained in 812 datasets from Brazilian states, the result showed that in al most all regions analyzed, there were data sets with personal information (such as CPF) exposed. Therefore, despite the great potential of open data, the obstacles also proved to be challenging, and control and inspection tools are necessary.application/pdfengDados abertosFrameworkCompartilhamento de dados pessoaisLeis de proteção de dadoslgpd frameworkData sharingPersonal identifiable informationData protection lawCompOD : framework de conformidade LGPDpara dados abertosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2024mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001213481.pdf.txt001213481.pdf.txtExtracted Texttext/plain210968http://www.lume.ufrgs.br/bitstream/10183/280742/2/001213481.pdf.txt1bc0444e2f4ea417245c8a7fec67e9b1MD52ORIGINAL001213481.pdfTexto completoapplication/pdf16637696http://www.lume.ufrgs.br/bitstream/10183/280742/1/001213481.pdf40dff5c4e1f34fd4fd7d0e9fc9b9e841MD5110183/2807422024-11-02 06:50:54.462162oai:www.lume.ufrgs.br:10183/280742Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532024-11-02T09:50:54Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv CompOD : framework de conformidade LGPDpara dados abertos
title CompOD : framework de conformidade LGPDpara dados abertos
spellingShingle CompOD : framework de conformidade LGPDpara dados abertos
Carmo, Shirlei Lúcia Oliveira do
Dados abertos
Framework
Compartilhamento de dados pessoais
Leis de proteção de dados
lgpd framework
Data sharing
Personal identifiable information
Data protection law
title_short CompOD : framework de conformidade LGPDpara dados abertos
title_full CompOD : framework de conformidade LGPDpara dados abertos
title_fullStr CompOD : framework de conformidade LGPDpara dados abertos
title_full_unstemmed CompOD : framework de conformidade LGPDpara dados abertos
title_sort CompOD : framework de conformidade LGPDpara dados abertos
author Carmo, Shirlei Lúcia Oliveira do
author_facet Carmo, Shirlei Lúcia Oliveira do
author_role author
dc.contributor.author.fl_str_mv Carmo, Shirlei Lúcia Oliveira do
dc.contributor.advisor1.fl_str_mv Geyer, Claudio Fernando Resin
dc.contributor.advisor-co1.fl_str_mv Anjos, Julio Cesar Santos dos
contributor_str_mv Geyer, Claudio Fernando Resin
Anjos, Julio Cesar Santos dos
dc.subject.por.fl_str_mv Dados abertos
Framework
Compartilhamento de dados pessoais
Leis de proteção de dados
topic Dados abertos
Framework
Compartilhamento de dados pessoais
Leis de proteção de dados
lgpd framework
Data sharing
Personal identifiable information
Data protection law
dc.subject.eng.fl_str_mv lgpd framework
Data sharing
Personal identifiable information
Data protection law
description Dados abertos são um conceito atribuído ao compartilhamento de dados com qualquer pessoa. Além de serem acessados, esses dados podem ser manipulados e redistribuídos. Esta é uma tendência global que incentiva a transparência dos governos e das entidades nas suas transações, além de fornecer à sociedade conhecimento sobre dados relevantes em áreas como infraestrutura, saúde, gastos públicos e meio ambiente. Diversas iniciati vas discutem atualmente a importância dos dados abertos, seja para a sociedade ou para uso e suporte em várias áreas, como em tecnologia da informação, durante o treinamento de inteligência artificial que necessitam de um grande volume de dados para operar com precisão. O uso otimizado e intercambiável de dados abertos entre organizações pode levar à chamada inovação aberta, que pode ser entendida como a utilização não apenas de dados internos das organizações, mas também de dados externos para cruzar informações e gerar sistemas e soluções mais completos e inovadores. Sabendo da relevância desse tipo de dados e de seus desafios, foi desenvolvido um framework de análise da dados abertos e verificação de sua conformidade com a lei brasileira de proteção de dados, a LGPD. A partir deste framework, foi realizado um estudo quantitativo e qualitativo de dados abertos no Brasil, e verificada a sua conformidade com a referida lei brasileira de proteção de dados, de modo a avaliar a saúde dos dados abertos disponíveis no Brasil, sendo este o diferencial da solução proposta. A metodologia utilizada nesta dissertação compreende uma análise automatizada de portais de dados abertos brasileiros por meio do sistema de gerenciamento de dados CKAN, utilizado para publicação e compartilha mento de dados abertos no mundo todo. O escopo do estudo abrange todos os estados e instituições governamentais que possuem portais de dados abertos e que são expostos por meio do CKAN. A análise quantitativa validou 1.817 conjuntos de dados, em 19 portais de dados, e verificou que, assim como estudos da literatura mencionam, as principais la cunas nos dados abertos são: dados desatualizados, ausência de metadados para suportar sua utilização e reutilização, especificação de licença de uso imprecisa e heterogeneidade no mododeexposição dos dados entre portais. O módulo de verificação de conformidade com a LGDPanalisou 11.154 recursos, contidos em 812 datasets dos estados brasileiros, e o resultado mostrou que, em quase todas as regiões analisadas, havia conjuntos de da dos com informações pessoais (como CPF) expostas. Logo, apesar do grande potencial dos dados abertos, os obstáculos também se mostraram desafiadores, e as ferramentas de controle e fiscalização necessárias.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-11-01T06:47:32Z
dc.date.issued.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/280742
dc.identifier.nrb.pt_BR.fl_str_mv 001213481
url http://hdl.handle.net/10183/280742
identifier_str_mv 001213481
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/280742/2/001213481.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/280742/1/001213481.pdf
bitstream.checksum.fl_str_mv 1bc0444e2f4ea417245c8a7fec67e9b1
40dff5c4e1f34fd4fd7d0e9fc9b9e841
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831316188975595520