Anonimização de dados: um comparativo de algoritmos de privacidade baseados no modelo K-Anonymity

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Figueiredo, Diogo Souza de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Centro Federal de Educação Tecnológica de Minas Gerais
Programa de Pós-Graduação em Modelagem Matemática e Computacional
Brasil
CEFET-MG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.cefetmg.br//handle/123456789/881
Resumo: Em quase todas as atividades diárias, a internet está sempre presente. Muitas dessas atividades, requerem o compartilhamento de dados pessoais (por exemplo, endereço, telefone, idade, localidade, dentre outros) e dados considerados sensíveis (por exemplo, diagnóstico médico, conta de banco, número de documentos, dentre outros), gerando uma preocupação quanto a privacidade dessas informações perante a sociedade. Compartilhar informações exige a utilização de ferramentas de proteção de dados, de forma que as informações desses dados não possam ser utilizadas para identificar um indivíduo. Para atender as Leis e regulamentações aplicáveis, bem como, as políticas de proteção de dados informadas, surgiu um mecanismo de proteção de dados chamado anonimização de dados. Esse mecanismo consiste basicamente em remover os identificadores e ocultar dados sensíveis impossibilitando sua re-identificação. À medida que grandes quantidades de dados de indivíduos são disseminadas, novos desafios aparecem para a proteção de sua privacidade. Vários algoritmos de anonimização foram propostos, tornando-se a publicação de dados de preservação de privacidade em uma área de pesquisa bem abrangente. No entanto, é difícil identificar e selecionar o algoritmo mais adequado, devido ao grande número de algoritmos disponíveis e informações limitadas sobre seus desempenhos. Neste trabalho, são apresentados três algoritmos de anonimização chamados DataFly, Incognito e Mondrian. Será abordado suas eficiências no processamento dos dados, suas eficácias na quantidade de dados utilizados empregando um conjunto amplo de diferentes parâmetros, métricas e conjuntos de dados. Para orientar na seleção de um algoritmo, uma bateria de experimentos será realizada entre eles para identificar quais fatores podem influenciar no desempenho, apresentando as condições em que cada algoritmo supera uns aos outros em determinados requisitos de privacidade bem como suas vantagens e desvantagens.
id CEFETMG_3c1ceafe3eb6fbfbe2440739cc6e7187
oai_identifier_str oai:repositorio.cefetmg.br:123456789/881
network_acronym_str CEFETMG
network_name_str Repositório Institucional do CEFET-MG
repository_id_str
spelling Anonimização de dados: um comparativo de algoritmos de privacidade baseados no modelo K-AnonymityAlgoritmos computacionaisProteção de dadosMedidas de segurança (Computadores)Em quase todas as atividades diárias, a internet está sempre presente. Muitas dessas atividades, requerem o compartilhamento de dados pessoais (por exemplo, endereço, telefone, idade, localidade, dentre outros) e dados considerados sensíveis (por exemplo, diagnóstico médico, conta de banco, número de documentos, dentre outros), gerando uma preocupação quanto a privacidade dessas informações perante a sociedade. Compartilhar informações exige a utilização de ferramentas de proteção de dados, de forma que as informações desses dados não possam ser utilizadas para identificar um indivíduo. Para atender as Leis e regulamentações aplicáveis, bem como, as políticas de proteção de dados informadas, surgiu um mecanismo de proteção de dados chamado anonimização de dados. Esse mecanismo consiste basicamente em remover os identificadores e ocultar dados sensíveis impossibilitando sua re-identificação. À medida que grandes quantidades de dados de indivíduos são disseminadas, novos desafios aparecem para a proteção de sua privacidade. Vários algoritmos de anonimização foram propostos, tornando-se a publicação de dados de preservação de privacidade em uma área de pesquisa bem abrangente. No entanto, é difícil identificar e selecionar o algoritmo mais adequado, devido ao grande número de algoritmos disponíveis e informações limitadas sobre seus desempenhos. Neste trabalho, são apresentados três algoritmos de anonimização chamados DataFly, Incognito e Mondrian. Será abordado suas eficiências no processamento dos dados, suas eficácias na quantidade de dados utilizados empregando um conjunto amplo de diferentes parâmetros, métricas e conjuntos de dados. Para orientar na seleção de um algoritmo, uma bateria de experimentos será realizada entre eles para identificar quais fatores podem influenciar no desempenho, apresentando as condições em que cada algoritmo supera uns aos outros em determinados requisitos de privacidade bem como suas vantagens e desvantagens.In almost every daily activity, the internet is always present. Many of these activities require the sharing of personal data (e.g. address, telephone, age, location, among others) and data considered sensitive (e.g. medical diagnosis, bank account, among others), generating a privacy concern. of this information to society. Sharing information requires the use of data protection tools, so the information in this data cannot be used to identify an individual. In order to comply with applicable laws and regulations, as well as informed data protection policies, a data protection mechanism called data anonymization has emerged. This mechanism basically consists of removing identifiers and hiding sensitive data, making it impossible to re-identify. As large amounts of data from individuals are disseminated, new challenges arise for the protection of their privacy. Various anonymization algorithms have been proposed, making publishing privacy-preserving data a very broad area of research. However, it is difficult to identify and select the most suitable algorithm, due to the large number of available algorithms and limited information about their performance. In this work, three anonymization algorithms called DataFly, Incognito and Mondrian are presented. Its efficiencies in data processing, its effectiveness in the amount of data used will be addressed, employing a wide set of different parameters, metrics and data sets. To guide the selection of an algorithm, a battery of experiments will be carried out among them to identify which factors can influence performance, presenting the conditions in which each algorithm outperforms each other in certain privacy requirements as well as their advantages and disadvantages.Centro Federal de Educação Tecnológica de Minas GeraisPrograma de Pós-Graduação em Modelagem Matemática e ComputacionalBrasilCEFET-MGRodrigues, Thiago de Souzahttp://lattes.cnpq.br/4182923743939851http://lattes.cnpq.br/9220227208158608Rodrigues, Thiago de SouzaDias, Sandro RenatoMenezes, Gustavo CamposFigueiredo, Diogo Souza de2025-03-21T22:38:02Z2023-02-272025-03-21T22:38:02Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://repositorio.cefetmg.br//handle/123456789/881porreponame:Repositório Institucional do CEFET-MGinstname:Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG)instacron:CEFETinfo:eu-repo/semantics/openAccess2026-03-31T14:32:23Zoai:repositorio.cefetmg.br:123456789/881Repositório InstitucionalPUBhttps://repositorio.cefetmg.br/server/oai/requestrepositorio@cefetmg.bropendoar:2026-03-31T14:32:23Repositório Institucional do CEFET-MG - Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG)false
dc.title.none.fl_str_mv Anonimização de dados: um comparativo de algoritmos de privacidade baseados no modelo K-Anonymity
title Anonimização de dados: um comparativo de algoritmos de privacidade baseados no modelo K-Anonymity
spellingShingle Anonimização de dados: um comparativo de algoritmos de privacidade baseados no modelo K-Anonymity
Figueiredo, Diogo Souza de
Algoritmos computacionais
Proteção de dados
Medidas de segurança (Computadores)
title_short Anonimização de dados: um comparativo de algoritmos de privacidade baseados no modelo K-Anonymity
title_full Anonimização de dados: um comparativo de algoritmos de privacidade baseados no modelo K-Anonymity
title_fullStr Anonimização de dados: um comparativo de algoritmos de privacidade baseados no modelo K-Anonymity
title_full_unstemmed Anonimização de dados: um comparativo de algoritmos de privacidade baseados no modelo K-Anonymity
title_sort Anonimização de dados: um comparativo de algoritmos de privacidade baseados no modelo K-Anonymity
author Figueiredo, Diogo Souza de
author_facet Figueiredo, Diogo Souza de
author_role author
dc.contributor.none.fl_str_mv Rodrigues, Thiago de Souza
http://lattes.cnpq.br/4182923743939851
http://lattes.cnpq.br/9220227208158608
Rodrigues, Thiago de Souza
Dias, Sandro Renato
Menezes, Gustavo Campos
dc.contributor.author.fl_str_mv Figueiredo, Diogo Souza de
dc.subject.por.fl_str_mv Algoritmos computacionais
Proteção de dados
Medidas de segurança (Computadores)
topic Algoritmos computacionais
Proteção de dados
Medidas de segurança (Computadores)
description Em quase todas as atividades diárias, a internet está sempre presente. Muitas dessas atividades, requerem o compartilhamento de dados pessoais (por exemplo, endereço, telefone, idade, localidade, dentre outros) e dados considerados sensíveis (por exemplo, diagnóstico médico, conta de banco, número de documentos, dentre outros), gerando uma preocupação quanto a privacidade dessas informações perante a sociedade. Compartilhar informações exige a utilização de ferramentas de proteção de dados, de forma que as informações desses dados não possam ser utilizadas para identificar um indivíduo. Para atender as Leis e regulamentações aplicáveis, bem como, as políticas de proteção de dados informadas, surgiu um mecanismo de proteção de dados chamado anonimização de dados. Esse mecanismo consiste basicamente em remover os identificadores e ocultar dados sensíveis impossibilitando sua re-identificação. À medida que grandes quantidades de dados de indivíduos são disseminadas, novos desafios aparecem para a proteção de sua privacidade. Vários algoritmos de anonimização foram propostos, tornando-se a publicação de dados de preservação de privacidade em uma área de pesquisa bem abrangente. No entanto, é difícil identificar e selecionar o algoritmo mais adequado, devido ao grande número de algoritmos disponíveis e informações limitadas sobre seus desempenhos. Neste trabalho, são apresentados três algoritmos de anonimização chamados DataFly, Incognito e Mondrian. Será abordado suas eficiências no processamento dos dados, suas eficácias na quantidade de dados utilizados empregando um conjunto amplo de diferentes parâmetros, métricas e conjuntos de dados. Para orientar na seleção de um algoritmo, uma bateria de experimentos será realizada entre eles para identificar quais fatores podem influenciar no desempenho, apresentando as condições em que cada algoritmo supera uns aos outros em determinados requisitos de privacidade bem como suas vantagens e desvantagens.
publishDate 2023
dc.date.none.fl_str_mv 2023-02-27
2025-03-21T22:38:02Z
2025-03-21T22:38:02Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.cefetmg.br//handle/123456789/881
url https://repositorio.cefetmg.br//handle/123456789/881
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Centro Federal de Educação Tecnológica de Minas Gerais
Programa de Pós-Graduação em Modelagem Matemática e Computacional
Brasil
CEFET-MG
publisher.none.fl_str_mv Centro Federal de Educação Tecnológica de Minas Gerais
Programa de Pós-Graduação em Modelagem Matemática e Computacional
Brasil
CEFET-MG
dc.source.none.fl_str_mv reponame:Repositório Institucional do CEFET-MG
instname:Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG)
instacron:CEFET
instname_str Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG)
instacron_str CEFET
institution CEFET
reponame_str Repositório Institucional do CEFET-MG
collection Repositório Institucional do CEFET-MG
repository.name.fl_str_mv Repositório Institucional do CEFET-MG - Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG)
repository.mail.fl_str_mv repositorio@cefetmg.br
_version_ 1863183898867924992