Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/38151 |
Resumo: | Não é incomum encontrar estudos que investigaram abordagens que analisam características estáticas (i) e dinâmicas (ii) de uma página Web para detectar ataques de phishing através de predição. Em (i), as características não consideram aspectos como tempo ou de terceiros envolvidos, o que propõem benefícios em termos de desempenho, contudo, tem baixa precisão devido ao escopo ser limitado porque não considera a página em execução. Diante disso, estudos são impulsionados a adotarem uma abordagem (ii) que considera aspectos temporais e contexto da atuação do phishing, oferecendo maior eficiência nas soluções anti-phishing. Todavia, a análise em (ii) tem limitações devido a mudança contínua de conteúdo. Não obstante, alguns phishing, a exemplo dos direcionados a uma marca específica, possuem um alto grau de fidedignidade com a página genuína, portanto, ao mesmo tempo que aumentam a exploração da suscetibilidade do usuário final, a riqueza em detalhes dificulta a predição de algo malicioso. Há também o desafio em identificar quais características são mais e menos relevantes devido as novas tendências, considerando o cenário dinâmico de atuação do phishing. Diante disso, o estudo faz uma investigação sobre a relevância, relação e similaridade entre (i) e (ii) através de uma regressão logística sobre amostras de phishing reais. O intuito é contribuir com os rumos para novas abordagens baseadas em predição, considerando aspectos como fidedignidade, ofuscação, propagação, sazonalidade e volatilidade, que podem dificultar a identificação dos padrões em páginas maliciosas. A proposta apresenta-se como uma solução complementar, ou seja, atuar em conjunto com soluções já existentes que são baseadas em lista de bloqueio. Adicionalmente, também é pretendido disponibilizar um mecanismo de lista de permissão baseado em um protocolo de autenticação e autorização para fortalecer a proposta contra falsos positivos. O presente estudo propõe um sistema especialista como mecanismo anti-phishing baseado em regras. Sua detecção é tida como gradual porque sua máquina de inferência processa as regras em profundidade gradativa, visando reduzir o custo computacional e ser menos invasivo no contexto da privacidade durante o processamento da predição. A proposta demonstra maior eficiência em phishing com maior riqueza em detalhes, e com isso, se caracterizando como uma alternativa de proteção de marcas. Como prova de conceito (PoC), o estudo faz uma avaliação de possíveis falsos positivos e negativos da proposta quando a mesma é submetida à amostras reais de phishing e de páginas genuínas. Também é pretendido avaliar o caráter complementar da proposta com as soluções nativas em navegadores Web e também avaliar os impactos positivos atingidos pela análise gradual da proposta. Como resultado, além dos dados quantitativos, essa pesquisa também realizou uma análise qualitativa da proteção, identificando contribuições e limitações. |
| id |
UFPE_ea7a9eaea2a6662532523dd4ec89eba4 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/38151 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionadosEngenharia de Software e Linguagens de ProgramaçãoPhishingProteção de marcasHeurística baseada em característicasNão é incomum encontrar estudos que investigaram abordagens que analisam características estáticas (i) e dinâmicas (ii) de uma página Web para detectar ataques de phishing através de predição. Em (i), as características não consideram aspectos como tempo ou de terceiros envolvidos, o que propõem benefícios em termos de desempenho, contudo, tem baixa precisão devido ao escopo ser limitado porque não considera a página em execução. Diante disso, estudos são impulsionados a adotarem uma abordagem (ii) que considera aspectos temporais e contexto da atuação do phishing, oferecendo maior eficiência nas soluções anti-phishing. Todavia, a análise em (ii) tem limitações devido a mudança contínua de conteúdo. Não obstante, alguns phishing, a exemplo dos direcionados a uma marca específica, possuem um alto grau de fidedignidade com a página genuína, portanto, ao mesmo tempo que aumentam a exploração da suscetibilidade do usuário final, a riqueza em detalhes dificulta a predição de algo malicioso. Há também o desafio em identificar quais características são mais e menos relevantes devido as novas tendências, considerando o cenário dinâmico de atuação do phishing. Diante disso, o estudo faz uma investigação sobre a relevância, relação e similaridade entre (i) e (ii) através de uma regressão logística sobre amostras de phishing reais. O intuito é contribuir com os rumos para novas abordagens baseadas em predição, considerando aspectos como fidedignidade, ofuscação, propagação, sazonalidade e volatilidade, que podem dificultar a identificação dos padrões em páginas maliciosas. A proposta apresenta-se como uma solução complementar, ou seja, atuar em conjunto com soluções já existentes que são baseadas em lista de bloqueio. Adicionalmente, também é pretendido disponibilizar um mecanismo de lista de permissão baseado em um protocolo de autenticação e autorização para fortalecer a proposta contra falsos positivos. O presente estudo propõe um sistema especialista como mecanismo anti-phishing baseado em regras. Sua detecção é tida como gradual porque sua máquina de inferência processa as regras em profundidade gradativa, visando reduzir o custo computacional e ser menos invasivo no contexto da privacidade durante o processamento da predição. A proposta demonstra maior eficiência em phishing com maior riqueza em detalhes, e com isso, se caracterizando como uma alternativa de proteção de marcas. Como prova de conceito (PoC), o estudo faz uma avaliação de possíveis falsos positivos e negativos da proposta quando a mesma é submetida à amostras reais de phishing e de páginas genuínas. Também é pretendido avaliar o caráter complementar da proposta com as soluções nativas em navegadores Web e também avaliar os impactos positivos atingidos pela análise gradual da proposta. Como resultado, além dos dados quantitativos, essa pesquisa também realizou uma análise qualitativa da proteção, identificando contribuições e limitações.It is not uncommon to find studies that have investigated approaches that analyze static (i) and dynamic (ii) features of a Web page to detect phishing attacks through prediction. In (i), the features do not consider aspects such as time or third parties involved, which propose benefits in terms of performance, however, it has low precision due to the scope being limited because it does not consider the page in execution. Therefore, studies are encouraged to adopt an approach (ii) that considers temporal aspects and context of phishing ’s performance, offering greater efficiency in anti-phishing solutions. However, the analysis in (ii) has limitations due to the continuous change of content. Nevertheless, some phishing, like those targeting a specific brand, have a high degree of reliability with the genuine page, therefore, while increasing the exploitation of the end user’s susceptibility, the wealth of details makes it difficult the prediction of something malicious. There is also the challenge of identifying which features are more and less relevant due to new trends, considering the dynamic scenario of phishing. Therefore, the study investigates the relevance, relationship and similarity between (i) and (ii) through a logistic regression on real phishing samples. The aim is to contribute with directions for new approaches based on prediction, considering aspects such as reliability, obfuscation, propagation, seasonality and volatility, which can make it difficult to identify patterns on malicious pages. The proposal presents itself as a complementary solution, that is, to act in conjunction with existing solutions that are based on a blacklist. In addition, it is also intended to provide a whitelist mechanism based on an authentication and authorization protocol to strengthen the proposal against false positives. The present study proposes a specialist system as a rule-based anti-phishing mechanism. Its detection is considered to be gradual because its inference machine processes the rules in gradual depth, aiming to reduce the computational cost and be less invasive in the context of privacy during the prediction processing. The proposal demonstrates greater efficiency in phishing with greater richness in details, and with that, it is characterized as an alternative for brand protection. As a proof of concept (PoC), the study makes an assessment of possible false positives and negatives of the proposal when it is submitted to real samples of phishing and genuine pages. It is also intended to assess the complementary character of the proposal with native solutions in Web browsers and also to evaluate the positive impacts achieved by the gradual analysis of the proposal. As a result, in addition to the quantitative data, this research also carried out a qualitative analysis of protection, identifying contributions and limitations.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Ciencia da ComputacaoGARCIA, Vinícius CardosoFEITOSA, Eduardo Luzeirohttp://lattes.cnpq.br/5941653866734201http://lattes.cnpq.br/6613487636748832http://lattes.cnpq.br/5939944067207881SILVA, Carlo Marcelo Revoredo da2020-09-29T15:54:15Z2020-09-29T15:54:15Z2020-07-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfSILVA, Carlo Marcelo Revoredo da. Piracema.io: um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados. 2020. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2020.https://repositorio.ufpe.br/handle/123456789/38151porAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2020-09-30T05:15:10Zoai:repositorio.ufpe.br:123456789/38151Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212020-09-30T05:15:10Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.none.fl_str_mv |
Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados |
| title |
Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados |
| spellingShingle |
Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados SILVA, Carlo Marcelo Revoredo da Engenharia de Software e Linguagens de Programação Phishing Proteção de marcas Heurística baseada em características |
| title_short |
Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados |
| title_full |
Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados |
| title_fullStr |
Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados |
| title_full_unstemmed |
Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados |
| title_sort |
Piracema.io : um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados |
| author |
SILVA, Carlo Marcelo Revoredo da |
| author_facet |
SILVA, Carlo Marcelo Revoredo da |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
GARCIA, Vinícius Cardoso FEITOSA, Eduardo Luzeiro http://lattes.cnpq.br/5941653866734201 http://lattes.cnpq.br/6613487636748832 http://lattes.cnpq.br/5939944067207881 |
| dc.contributor.author.fl_str_mv |
SILVA, Carlo Marcelo Revoredo da |
| dc.subject.por.fl_str_mv |
Engenharia de Software e Linguagens de Programação Phishing Proteção de marcas Heurística baseada em características |
| topic |
Engenharia de Software e Linguagens de Programação Phishing Proteção de marcas Heurística baseada em características |
| description |
Não é incomum encontrar estudos que investigaram abordagens que analisam características estáticas (i) e dinâmicas (ii) de uma página Web para detectar ataques de phishing através de predição. Em (i), as características não consideram aspectos como tempo ou de terceiros envolvidos, o que propõem benefícios em termos de desempenho, contudo, tem baixa precisão devido ao escopo ser limitado porque não considera a página em execução. Diante disso, estudos são impulsionados a adotarem uma abordagem (ii) que considera aspectos temporais e contexto da atuação do phishing, oferecendo maior eficiência nas soluções anti-phishing. Todavia, a análise em (ii) tem limitações devido a mudança contínua de conteúdo. Não obstante, alguns phishing, a exemplo dos direcionados a uma marca específica, possuem um alto grau de fidedignidade com a página genuína, portanto, ao mesmo tempo que aumentam a exploração da suscetibilidade do usuário final, a riqueza em detalhes dificulta a predição de algo malicioso. Há também o desafio em identificar quais características são mais e menos relevantes devido as novas tendências, considerando o cenário dinâmico de atuação do phishing. Diante disso, o estudo faz uma investigação sobre a relevância, relação e similaridade entre (i) e (ii) através de uma regressão logística sobre amostras de phishing reais. O intuito é contribuir com os rumos para novas abordagens baseadas em predição, considerando aspectos como fidedignidade, ofuscação, propagação, sazonalidade e volatilidade, que podem dificultar a identificação dos padrões em páginas maliciosas. A proposta apresenta-se como uma solução complementar, ou seja, atuar em conjunto com soluções já existentes que são baseadas em lista de bloqueio. Adicionalmente, também é pretendido disponibilizar um mecanismo de lista de permissão baseado em um protocolo de autenticação e autorização para fortalecer a proposta contra falsos positivos. O presente estudo propõe um sistema especialista como mecanismo anti-phishing baseado em regras. Sua detecção é tida como gradual porque sua máquina de inferência processa as regras em profundidade gradativa, visando reduzir o custo computacional e ser menos invasivo no contexto da privacidade durante o processamento da predição. A proposta demonstra maior eficiência em phishing com maior riqueza em detalhes, e com isso, se caracterizando como uma alternativa de proteção de marcas. Como prova de conceito (PoC), o estudo faz uma avaliação de possíveis falsos positivos e negativos da proposta quando a mesma é submetida à amostras reais de phishing e de páginas genuínas. Também é pretendido avaliar o caráter complementar da proposta com as soluções nativas em navegadores Web e também avaliar os impactos positivos atingidos pela análise gradual da proposta. Como resultado, além dos dados quantitativos, essa pesquisa também realizou uma análise qualitativa da proteção, identificando contribuições e limitações. |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020-09-29T15:54:15Z 2020-09-29T15:54:15Z 2020-07-08 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
SILVA, Carlo Marcelo Revoredo da. Piracema.io: um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados. 2020. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2020. https://repositorio.ufpe.br/handle/123456789/38151 |
| identifier_str_mv |
SILVA, Carlo Marcelo Revoredo da. Piracema.io: um sistema especialista baseado em heurística direcionada por características estáticas e dinâmicas para a detecção gradual de phishing direcionados. 2020. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2020. |
| url |
https://repositorio.ufpe.br/handle/123456789/38151 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1856041885241442304 |