Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: SILVA, Carlo Marcelo Revoredo da
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/38151
Resumo: Não é incomum encontrar estudos que investigaram abordagens que analisam características estáticas (i) e dinâmicas (ii) de uma página Web para detectar ataques de phishing através de predição. Em (i), as características não consideram aspectos como tempo ou de terceiros envolvidos, o que propõem benefícios em termos de desempenho, contudo, tem baixa precisão devido ao escopo ser limitado porque não considera a página em execução. Diante disso, estudos são impulsionados a adotarem uma abordagem (ii) que considera aspectos temporais e contexto da atuação do phishing, oferecendo maior eficiência nas soluções anti-phishing. Todavia, a análise em (ii) tem limitações devido a mudança contínua de conteúdo. Não obstante, alguns phishing, a exemplo dos direcionados a uma marca específica, possuem um alto grau de fidedignidade com a página genuína, portanto, ao mesmo tempo que aumentam a exploração da suscetibilidade do usuário final, a riqueza em detalhes dificulta a predição de algo malicioso. Há também o desafio em identificar quais características são mais e menos relevantes devido as novas tendências, considerando o cenário dinâmico de atuação do phishing. Diante disso, o estudo faz uma investigação sobre a relevância, relação e similaridade entre (i) e (ii) através de uma regressão logística sobre amostras de phishing reais. O intuito é contribuir com os rumos para novas abordagens baseadas em predição, considerando aspectos como fidedignidade, ofuscação, propagação, sazonalidade e volatilidade, que podem dificultar a identificação dos padrões em páginas maliciosas. A proposta apresenta-se como uma solução complementar, ou seja, atuar em conjunto com soluções já existentes que são baseadas em lista de bloqueio. Adicionalmente, também é pretendido disponibilizar um mecanismo de lista de permissão baseado em um protocolo de autenticação e autorização para fortalecer a proposta contra falsos positivos. O presente estudo propõe um sistema especialista como mecanismo anti-phishing baseado em regras. Sua detecção é tida como gradual porque sua máquina de inferência processa as regras em profundidade gradativa, visando reduzir o custo computacional e ser menos invasivo no contexto da privacidade durante o processamento da predição. A proposta demonstra maior eficiência em phishing com maior riqueza em detalhes, e com isso, se caracterizando como uma alternativa de proteção de marcas. Como prova de conceito (PoC), o estudo faz uma avaliação de possíveis falsos positivos e negativos da proposta quando a mesma é submetida à amostras reais de phishing e de páginas genuínas. Também é pretendido avaliar o caráter complementar da proposta com as soluções nativas em navegadores Web e também avaliar os impactos positivos atingidos pela análise gradual da proposta. Como resultado, além dos dados quantitativos, essa pesquisa também realizou uma análise qualitativa da proteção, identificando contribuições e limitações.
id UFPE_ea7a9eaea2a6662532523dd4ec89eba4
oai_identifier_str oai:repositorio.ufpe.br:123456789/38151
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionadosEngenharia de Software e Linguagens de ProgramaçãoPhishingProteção de marcasHeurística baseada em característicasNão é incomum encontrar estudos que investigaram abordagens que analisam características estáticas (i) e dinâmicas (ii) de uma página Web para detectar ataques de phishing através de predição. Em (i), as características não consideram aspectos como tempo ou de terceiros envolvidos, o que propõem benefícios em termos de desempenho, contudo, tem baixa precisão devido ao escopo ser limitado porque não considera a página em execução. Diante disso, estudos são impulsionados a adotarem uma abordagem (ii) que considera aspectos temporais e contexto da atuação do phishing, oferecendo maior eficiência nas soluções anti-phishing. Todavia, a análise em (ii) tem limitações devido a mudança contínua de conteúdo. Não obstante, alguns phishing, a exemplo dos direcionados a uma marca específica, possuem um alto grau de fidedignidade com a página genuína, portanto, ao mesmo tempo que aumentam a exploração da suscetibilidade do usuário final, a riqueza em detalhes dificulta a predição de algo malicioso. Há também o desafio em identificar quais características são mais e menos relevantes devido as novas tendências, considerando o cenário dinâmico de atuação do phishing. Diante disso, o estudo faz uma investigação sobre a relevância, relação e similaridade entre (i) e (ii) através de uma regressão logística sobre amostras de phishing reais. O intuito é contribuir com os rumos para novas abordagens baseadas em predição, considerando aspectos como fidedignidade, ofuscação, propagação, sazonalidade e volatilidade, que podem dificultar a identificação dos padrões em páginas maliciosas. A proposta apresenta-se como uma solução complementar, ou seja, atuar em conjunto com soluções já existentes que são baseadas em lista de bloqueio. Adicionalmente, também é pretendido disponibilizar um mecanismo de lista de permissão baseado em um protocolo de autenticação e autorização para fortalecer a proposta contra falsos positivos. O presente estudo propõe um sistema especialista como mecanismo anti-phishing baseado em regras. Sua detecção é tida como gradual porque sua máquina de inferência processa as regras em profundidade gradativa, visando reduzir o custo computacional e ser menos invasivo no contexto da privacidade durante o processamento da predição. A proposta demonstra maior eficiência em phishing com maior riqueza em detalhes, e com isso, se caracterizando como uma alternativa de proteção de marcas. Como prova de conceito (PoC), o estudo faz uma avaliação de possíveis falsos positivos e negativos da proposta quando a mesma é submetida à amostras reais de phishing e de páginas genuínas. Também é pretendido avaliar o caráter complementar da proposta com as soluções nativas em navegadores Web e também avaliar os impactos positivos atingidos pela análise gradual da proposta. Como resultado, além dos dados quantitativos, essa pesquisa também realizou uma análise qualitativa da proteção, identificando contribuições e limitações.It is not uncommon to find studies that have investigated approaches that analyze static (i) and dynamic (ii) features of a Web page to detect phishing attacks through prediction. In (i), the features do not consider aspects such as time or third parties involved, which propose benefits in terms of performance, however, it has low precision due to the scope being limited because it does not consider the page in execution. Therefore, studies are encouraged to adopt an approach (ii) that considers temporal aspects and context of phishing ’s performance, offering greater efficiency in anti-phishing solutions. However, the analysis in (ii) has limitations due to the continuous change of content. Nevertheless, some phishing, like those targeting a specific brand, have a high degree of reliability with the genuine page, therefore, while increasing the exploitation of the end user’s susceptibility, the wealth of details makes it difficult the prediction of something malicious. There is also the challenge of identifying which features are more and less relevant due to new trends, considering the dynamic scenario of phishing. Therefore, the study investigates the relevance, relationship and similarity between (i) and (ii) through a logistic regression on real phishing samples. The aim is to contribute with directions for new approaches based on prediction, considering aspects such as reliability, obfuscation, propagation, seasonality and volatility, which can make it difficult to identify patterns on malicious pages. The proposal presents itself as a complementary solution, that is, to act in conjunction with existing solutions that are based on a blacklist. In addition, it is also intended to provide a whitelist mechanism based on an authentication and authorization protocol to strengthen the proposal against false positives. The present study proposes a specialist system as a rule-based anti-phishing mechanism. Its detection is considered to be gradual because its inference machine processes the rules in gradual depth, aiming to reduce the computational cost and be less invasive in the context of privacy during the prediction processing. The proposal demonstrates greater efficiency in phishing with greater richness in details, and with that, it is characterized as an alternative for brand protection. As a proof of concept (PoC), the study makes an assessment of possible false positives and negatives of the proposal when it is submitted to real samples of phishing and genuine pages. It is also intended to assess the complementary character of the proposal with native solutions in Web browsers and also to evaluate the positive impacts achieved by the gradual analysis of the proposal. As a result, in addition to the quantitative data, this research also carried out a qualitative analysis of protection, identifying contributions and limitations.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Ciencia da ComputacaoGARCIA, Vinícius CardosoFEITOSA, Eduardo Luzeirohttp://lattes.cnpq.br/5941653866734201http://lattes.cnpq.br/6613487636748832http://lattes.cnpq.br/5939944067207881SILVA, Carlo Marcelo Revoredo da2020-09-29T15:54:15Z2020-09-29T15:54:15Z2020-07-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfSILVA, Carlo Marcelo Revoredo da. Piracema.io: um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados. 2020. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2020.https://repositorio.ufpe.br/handle/123456789/38151porAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2020-09-30T05:15:10Zoai:repositorio.ufpe.br:123456789/38151Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212020-09-30T05:15:10Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.none.fl_str_mv Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados
title Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados
spellingShingle Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados
SILVA, Carlo Marcelo Revoredo da
Engenharia de Software e Linguagens de Programação
Phishing
Proteção de marcas
Heurística baseada em características
title_short Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados
title_full Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados
title_fullStr Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados
title_full_unstemmed Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados
title_sort Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados
author SILVA, Carlo Marcelo Revoredo da
author_facet SILVA, Carlo Marcelo Revoredo da
author_role author
dc.contributor.none.fl_str_mv GARCIA, Vinícius Cardoso
FEITOSA, Eduardo Luzeiro
http://lattes.cnpq.br/5941653866734201
http://lattes.cnpq.br/6613487636748832
http://lattes.cnpq.br/5939944067207881
dc.contributor.author.fl_str_mv SILVA, Carlo Marcelo Revoredo da
dc.subject.por.fl_str_mv Engenharia de Software e Linguagens de Programação
Phishing
Proteção de marcas
Heurística baseada em características
topic Engenharia de Software e Linguagens de Programação
Phishing
Proteção de marcas
Heurística baseada em características
description Não é incomum encontrar estudos que investigaram abordagens que analisam características estáticas (i) e dinâmicas (ii) de uma página Web para detectar ataques de phishing através de predição. Em (i), as características não consideram aspectos como tempo ou de terceiros envolvidos, o que propõem benefícios em termos de desempenho, contudo, tem baixa precisão devido ao escopo ser limitado porque não considera a página em execução. Diante disso, estudos são impulsionados a adotarem uma abordagem (ii) que considera aspectos temporais e contexto da atuação do phishing, oferecendo maior eficiência nas soluções anti-phishing. Todavia, a análise em (ii) tem limitações devido a mudança contínua de conteúdo. Não obstante, alguns phishing, a exemplo dos direcionados a uma marca específica, possuem um alto grau de fidedignidade com a página genuína, portanto, ao mesmo tempo que aumentam a exploração da suscetibilidade do usuário final, a riqueza em detalhes dificulta a predição de algo malicioso. Há também o desafio em identificar quais características são mais e menos relevantes devido as novas tendências, considerando o cenário dinâmico de atuação do phishing. Diante disso, o estudo faz uma investigação sobre a relevância, relação e similaridade entre (i) e (ii) através de uma regressão logística sobre amostras de phishing reais. O intuito é contribuir com os rumos para novas abordagens baseadas em predição, considerando aspectos como fidedignidade, ofuscação, propagação, sazonalidade e volatilidade, que podem dificultar a identificação dos padrões em páginas maliciosas. A proposta apresenta-se como uma solução complementar, ou seja, atuar em conjunto com soluções já existentes que são baseadas em lista de bloqueio. Adicionalmente, também é pretendido disponibilizar um mecanismo de lista de permissão baseado em um protocolo de autenticação e autorização para fortalecer a proposta contra falsos positivos. O presente estudo propõe um sistema especialista como mecanismo anti-phishing baseado em regras. Sua detecção é tida como gradual porque sua máquina de inferência processa as regras em profundidade gradativa, visando reduzir o custo computacional e ser menos invasivo no contexto da privacidade durante o processamento da predição. A proposta demonstra maior eficiência em phishing com maior riqueza em detalhes, e com isso, se caracterizando como uma alternativa de proteção de marcas. Como prova de conceito (PoC), o estudo faz uma avaliação de possíveis falsos positivos e negativos da proposta quando a mesma é submetida à amostras reais de phishing e de páginas genuínas. Também é pretendido avaliar o caráter complementar da proposta com as soluções nativas em navegadores Web e também avaliar os impactos positivos atingidos pela análise gradual da proposta. Como resultado, além dos dados quantitativos, essa pesquisa também realizou uma análise qualitativa da proteção, identificando contribuições e limitações.
publishDate 2020
dc.date.none.fl_str_mv 2020-09-29T15:54:15Z
2020-09-29T15:54:15Z
2020-07-08
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Carlo Marcelo Revoredo da. Piracema.io: um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados. 2020. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2020.
https://repositorio.ufpe.br/handle/123456789/38151
identifier_str_mv SILVA, Carlo Marcelo Revoredo da. Piracema.io: um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados. 2020. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2020.
url https://repositorio.ufpe.br/handle/123456789/38151
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1856041885241442304