ChaSAM Forensics: Uma Arquitetura para Detecção de Imagens na Forense Computacional Utilizando Hashes Perceptivos

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Santos, Hericson dos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-02082024-103051/
Resumo: O objetivo deste trabalho foi desenvolver um algoritmo de hash perceptivo para detecção de similaridade entre imagens para ser implementado em uma arquitetura portátil e independente de plataforma computacional. Esta arquitetura tem por finalidade proporcionar ao analista forense a comparação de grandes volumes de imagens em busca de arquivos que possuem características visuais em comum. Atualmente, a grande parte das soluções forenses se baseiam em bases de hashes criptográficos, os quais apresentam deficiência neste quesito, isto é, hashes criptográficos são capazes de comparar apenas arquivos idênticos computacionalmente gerando resultados falsos negativos, pois se um arquivo for minimamente alterado em seu conteúdo, o seu valor hash mudará completamente e assim não será detectado como um arquivo de interesse. Em contrapartida, os hashes perceptivos levam em consideração as características visuais da imagem. Neste sentido dois arquivos computacionalmente diferentes, mas com similaridades visuais poderão ser apresentados como possíveis resultados desta comparação se estas diferenças visuais estiverem dentro de um intervalo de tolerância. Para sustentar o método proposto através dos hashes perceptivos foi desenvolvido um protótipo de software forense denominado ChaSAM. Para testar a eficiência e a eficácia do software foi criado um dataset de imagens composto de 12.920 arquivos, os quais foram submetidos às mais diversas transformações como: recortes, inclinações, inserção de textos e etc. Procurou-se responder se o ChaSAM apresenta eficiência, isto é, se ele é capaz de processar grandes volumes de imagens com velocidade e; se possui eficácia, isto é, os hashes perceptivos apresentam resultados mais eficazes que os hashes criptográficos. Para realizar estes testes utilizamos vários algoritmos de hashes perceptivos existentes e desenvolvemos outras duas variantes: o domiHash e o chHash. Este último apresentou resultados acima de 80% em relação aos demais algoritmos, principalmente quando executando em conjunto com outro algoritmo de hash perceptivo.
id USP_7b41e7968f9f4cc15d1822bcf76ff766
oai_identifier_str oai:teses.usp.br:tde-02082024-103051
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling ChaSAM Forensics: Uma Arquitetura para Detecção de Imagens na Forense Computacional Utilizando Hashes PerceptivosChaSAM Forensics: An Architecture for Image Detection in Computer Forensics Using Perceptual HashesChaSAMChaSAMComputaçãoComputingForenseForensicHash perceptivoPerceptual hashSimilaridadeSimilarityO objetivo deste trabalho foi desenvolver um algoritmo de hash perceptivo para detecção de similaridade entre imagens para ser implementado em uma arquitetura portátil e independente de plataforma computacional. Esta arquitetura tem por finalidade proporcionar ao analista forense a comparação de grandes volumes de imagens em busca de arquivos que possuem características visuais em comum. Atualmente, a grande parte das soluções forenses se baseiam em bases de hashes criptográficos, os quais apresentam deficiência neste quesito, isto é, hashes criptográficos são capazes de comparar apenas arquivos idênticos computacionalmente gerando resultados falsos negativos, pois se um arquivo for minimamente alterado em seu conteúdo, o seu valor hash mudará completamente e assim não será detectado como um arquivo de interesse. Em contrapartida, os hashes perceptivos levam em consideração as características visuais da imagem. Neste sentido dois arquivos computacionalmente diferentes, mas com similaridades visuais poderão ser apresentados como possíveis resultados desta comparação se estas diferenças visuais estiverem dentro de um intervalo de tolerância. Para sustentar o método proposto através dos hashes perceptivos foi desenvolvido um protótipo de software forense denominado ChaSAM. Para testar a eficiência e a eficácia do software foi criado um dataset de imagens composto de 12.920 arquivos, os quais foram submetidos às mais diversas transformações como: recortes, inclinações, inserção de textos e etc. Procurou-se responder se o ChaSAM apresenta eficiência, isto é, se ele é capaz de processar grandes volumes de imagens com velocidade e; se possui eficácia, isto é, os hashes perceptivos apresentam resultados mais eficazes que os hashes criptográficos. Para realizar estes testes utilizamos vários algoritmos de hashes perceptivos existentes e desenvolvemos outras duas variantes: o domiHash e o chHash. Este último apresentou resultados acima de 80% em relação aos demais algoritmos, principalmente quando executando em conjunto com outro algoritmo de hash perceptivo.The objective of this work was to develop a perceptual hash algorithm for detecting similarity between images to be implemented in a portable and platform-independent architecture. This architecture aims to allow the forensic analyst to compare large volumes of images in search of files that have visual characteristics in common. Currently, most forensic solutions are based on cryptographic hash bases, which present a deficiency in this regard, that is, cryptographic hashes are capable of comparing only computationally identical files, generating false negative results, because if a file is minimally altered in its content, its hash value will change completely and thus it will not be detected as a file of interest. In contrast, perceptual hashes take into account the visual characteristics of the image. In this sense, two computationally different files, but with visual similarities, can be presented as possible results of this comparison if these visual differences are within a tolerance range. To support the proposed method through perceptual hashes, a forensic software prototype called ChaSAM was developed. To test the efficiency and effectiveness of the software, an image dataset was created consisting of 12,920 files, which were subjected to the most diverse transformations such as: cropping, tilting, text insertion, etc. We sought to answer whether ChaSAM is efficient, that is, whether it is capable of processing large volumes of images quickly and; whether it is effective, that is, perceptual hashes present more effective results than cryptographic hashes. To carry out these tests, we used several existing perceptual hashing algorithms and developed two other variants: domiHash and chHash. The latter presented results above 80% in relation to the other algorithms, especially when running in conjunction with another perceptual hash algorithm.Biblioteca Digitais de Teses e Dissertações da USPMeneguette, Rodolfo IpolitoSantos, Hericson dos2024-06-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-02082024-103051/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-08-02T13:38:02Zoai:teses.usp.br:tde-02082024-103051Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-08-02T13:38:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv ChaSAM Forensics: Uma Arquitetura para Detecção de Imagens na Forense Computacional Utilizando Hashes Perceptivos
ChaSAM Forensics: An Architecture for Image Detection in Computer Forensics Using Perceptual Hashes
title ChaSAM Forensics: Uma Arquitetura para Detecção de Imagens na Forense Computacional Utilizando Hashes Perceptivos
spellingShingle ChaSAM Forensics: Uma Arquitetura para Detecção de Imagens na Forense Computacional Utilizando Hashes Perceptivos
Santos, Hericson dos
ChaSAM
ChaSAM
Computação
Computing
Forense
Forensic
Hash perceptivo
Perceptual hash
Similaridade
Similarity
title_short ChaSAM Forensics: Uma Arquitetura para Detecção de Imagens na Forense Computacional Utilizando Hashes Perceptivos
title_full ChaSAM Forensics: Uma Arquitetura para Detecção de Imagens na Forense Computacional Utilizando Hashes Perceptivos
title_fullStr ChaSAM Forensics: Uma Arquitetura para Detecção de Imagens na Forense Computacional Utilizando Hashes Perceptivos
title_full_unstemmed ChaSAM Forensics: Uma Arquitetura para Detecção de Imagens na Forense Computacional Utilizando Hashes Perceptivos
title_sort ChaSAM Forensics: Uma Arquitetura para Detecção de Imagens na Forense Computacional Utilizando Hashes Perceptivos
author Santos, Hericson dos
author_facet Santos, Hericson dos
author_role author
dc.contributor.none.fl_str_mv Meneguette, Rodolfo Ipolito
dc.contributor.author.fl_str_mv Santos, Hericson dos
dc.subject.por.fl_str_mv ChaSAM
ChaSAM
Computação
Computing
Forense
Forensic
Hash perceptivo
Perceptual hash
Similaridade
Similarity
topic ChaSAM
ChaSAM
Computação
Computing
Forense
Forensic
Hash perceptivo
Perceptual hash
Similaridade
Similarity
description O objetivo deste trabalho foi desenvolver um algoritmo de hash perceptivo para detecção de similaridade entre imagens para ser implementado em uma arquitetura portátil e independente de plataforma computacional. Esta arquitetura tem por finalidade proporcionar ao analista forense a comparação de grandes volumes de imagens em busca de arquivos que possuem características visuais em comum. Atualmente, a grande parte das soluções forenses se baseiam em bases de hashes criptográficos, os quais apresentam deficiência neste quesito, isto é, hashes criptográficos são capazes de comparar apenas arquivos idênticos computacionalmente gerando resultados falsos negativos, pois se um arquivo for minimamente alterado em seu conteúdo, o seu valor hash mudará completamente e assim não será detectado como um arquivo de interesse. Em contrapartida, os hashes perceptivos levam em consideração as características visuais da imagem. Neste sentido dois arquivos computacionalmente diferentes, mas com similaridades visuais poderão ser apresentados como possíveis resultados desta comparação se estas diferenças visuais estiverem dentro de um intervalo de tolerância. Para sustentar o método proposto através dos hashes perceptivos foi desenvolvido um protótipo de software forense denominado ChaSAM. Para testar a eficiência e a eficácia do software foi criado um dataset de imagens composto de 12.920 arquivos, os quais foram submetidos às mais diversas transformações como: recortes, inclinações, inserção de textos e etc. Procurou-se responder se o ChaSAM apresenta eficiência, isto é, se ele é capaz de processar grandes volumes de imagens com velocidade e; se possui eficácia, isto é, os hashes perceptivos apresentam resultados mais eficazes que os hashes criptográficos. Para realizar estes testes utilizamos vários algoritmos de hashes perceptivos existentes e desenvolvemos outras duas variantes: o domiHash e o chHash. Este último apresentou resultados acima de 80% em relação aos demais algoritmos, principalmente quando executando em conjunto com outro algoritmo de hash perceptivo.
publishDate 2024
dc.date.none.fl_str_mv 2024-06-19
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-02082024-103051/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-02082024-103051/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257776461447168