Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Tojeiro, Carlos Alexandre Carvalho [UNESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/11449/257359
Resumo: A necessidade de trabalhar com as informações digitais nas empresas gerou um crescimento nos números de ataques cibernéticos em busca de ativos valiosos. Em contraproposta, pesquisadores e administradores de redes vêm buscando uma precisão maior do processo que visa descobrir portas “abertas” em dispositivos de rede, sendo que as “portas” são pontos de acesso pelos quais os dados transitam nos dispositivos. Dentro desta proposta, este trabalho apresenta um estudo da aplicação de combinações de algoritmos de Aprendizado de Máquina (AM) que possam identificar uma maior quantidade de tentativas de “escaneamento de portas”, técnica usada para identificar o estado de uma porta de rede, já que os cibercrimes normalmente iniciam-se com um ataque de Portscan. O trabalho proposto compara dois métodos de seleção de características, aplicando métodos de undersampling e oversampling para o balanceamento das classes “normal” e “ataque”, classificando-os com Rede Neural, Regressão Logística, Máquinas de Vetores de Suporte, Random Forest (RF), Decision Tree (DT) e k-Nearest Neighbors (kNN) no conjunto de dados CICIDS2017. O resultado adquirido com as diferentes combinaçõesde algoritmos de AM demonstrou-se que a combinação dos classificadores RF, DT e kNN juntamente com a técnica de SMOTEENN, obtiveram desempenhos superiores as demais combinações propostas no trabalho.
id UNSP_d7524a7e0b9af37e7561ccde8f0e0dbb
oai_identifier_str oai:repositorio.unesp.br:11449/257359
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str
spelling Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusãoPortscan identification with machine learning: an analysis of the impacts of oversampling and undersampling algorithms on the development of intrusion detection systemsAprendizado do computadorRedes de computadoresSistemas de detecção de intrusão (Medidas de segurança)Machine learningData balancingPortscanIntrusion detection systemsComputer networksA necessidade de trabalhar com as informações digitais nas empresas gerou um crescimento nos números de ataques cibernéticos em busca de ativos valiosos. Em contraproposta, pesquisadores e administradores de redes vêm buscando uma precisão maior do processo que visa descobrir portas “abertas” em dispositivos de rede, sendo que as “portas” são pontos de acesso pelos quais os dados transitam nos dispositivos. Dentro desta proposta, este trabalho apresenta um estudo da aplicação de combinações de algoritmos de Aprendizado de Máquina (AM) que possam identificar uma maior quantidade de tentativas de “escaneamento de portas”, técnica usada para identificar o estado de uma porta de rede, já que os cibercrimes normalmente iniciam-se com um ataque de Portscan. O trabalho proposto compara dois métodos de seleção de características, aplicando métodos de undersampling e oversampling para o balanceamento das classes “normal” e “ataque”, classificando-os com Rede Neural, Regressão Logística, Máquinas de Vetores de Suporte, Random Forest (RF), Decision Tree (DT) e k-Nearest Neighbors (kNN) no conjunto de dados CICIDS2017. O resultado adquirido com as diferentes combinaçõesde algoritmos de AM demonstrou-se que a combinação dos classificadores RF, DT e kNN juntamente com a técnica de SMOTEENN, obtiveram desempenhos superiores as demais combinações propostas no trabalho.The need to work with digital information in companies has led to an increase in the number of cyber attacks in search of valuable assets. In counter-proposal researchers and network administrators have been searching for greater precision of the process of discovering “open ports” on network devices, where “ports” are access points for which information passes through the devices. Within this proposal, this work presents a study of the application of combinations of Machine Learning (ML) algorithms that can identify a greater number of “port scanning” attempts, a technique used to identify the state of a network port, since cybercrime cybercrimes usually begin with a port scanning attack. The proposed work compares two feature selection methods, applying undersampling and oversampling methods to balance the “normal” and “attack” classes, classifying them with using Neural Networks (NN), Logistic Regression (LR), Support Vector Machines (SVM), Random Forest (RF), Decision Tree (DT) and k-Nearest Neighbours (kNN) on the CICIDS2017 dataset. The results obtained with the different combinations of algorithms showed that the combination of the RF, DT and kNN classifiers together with the SMOTEENN technique performed better than the other combinations proposed in the work.Universidade Estadual Paulista (Unesp)Costa, Kelton Augusto Pontara da [UNESP]Universidade Estadual Paulista (Unesp)Lucas, Thiago JoséTojeiro, Carlos Alexandre Carvalho [UNESP]2024-09-10T12:57:22Z2024-09-10T12:57:22Z2024-07-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfTOJEIRO, Carlos Alexandre Carvalho. Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão. Orientador: Kelton Augusto Pontara da Costa. 100 f. 2024. Dissertação (Mestrado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2024.https://hdl.handle.net/11449/25735933004153073P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2025-06-24T05:56:41Zoai:repositorio.unesp.br:11449/257359Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462025-06-24T05:56:41Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão
Portscan identification with machine learning: an analysis of the impacts of oversampling and undersampling algorithms on the development of intrusion detection systems
title Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão
spellingShingle Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão
Tojeiro, Carlos Alexandre Carvalho [UNESP]
Aprendizado do computador
Redes de computadores
Sistemas de detecção de intrusão (Medidas de segurança)
Machine learning
Data balancing
Portscan
Intrusion detection systems
Computer networks
title_short Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão
title_full Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão
title_fullStr Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão
title_full_unstemmed Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão
title_sort Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão
author Tojeiro, Carlos Alexandre Carvalho [UNESP]
author_facet Tojeiro, Carlos Alexandre Carvalho [UNESP]
author_role author
dc.contributor.none.fl_str_mv Costa, Kelton Augusto Pontara da [UNESP]
Universidade Estadual Paulista (Unesp)
Lucas, Thiago José
dc.contributor.author.fl_str_mv Tojeiro, Carlos Alexandre Carvalho [UNESP]
dc.subject.por.fl_str_mv Aprendizado do computador
Redes de computadores
Sistemas de detecção de intrusão (Medidas de segurança)
Machine learning
Data balancing
Portscan
Intrusion detection systems
Computer networks
topic Aprendizado do computador
Redes de computadores
Sistemas de detecção de intrusão (Medidas de segurança)
Machine learning
Data balancing
Portscan
Intrusion detection systems
Computer networks
description A necessidade de trabalhar com as informações digitais nas empresas gerou um crescimento nos números de ataques cibernéticos em busca de ativos valiosos. Em contraproposta, pesquisadores e administradores de redes vêm buscando uma precisão maior do processo que visa descobrir portas “abertas” em dispositivos de rede, sendo que as “portas” são pontos de acesso pelos quais os dados transitam nos dispositivos. Dentro desta proposta, este trabalho apresenta um estudo da aplicação de combinações de algoritmos de Aprendizado de Máquina (AM) que possam identificar uma maior quantidade de tentativas de “escaneamento de portas”, técnica usada para identificar o estado de uma porta de rede, já que os cibercrimes normalmente iniciam-se com um ataque de Portscan. O trabalho proposto compara dois métodos de seleção de características, aplicando métodos de undersampling e oversampling para o balanceamento das classes “normal” e “ataque”, classificando-os com Rede Neural, Regressão Logística, Máquinas de Vetores de Suporte, Random Forest (RF), Decision Tree (DT) e k-Nearest Neighbors (kNN) no conjunto de dados CICIDS2017. O resultado adquirido com as diferentes combinaçõesde algoritmos de AM demonstrou-se que a combinação dos classificadores RF, DT e kNN juntamente com a técnica de SMOTEENN, obtiveram desempenhos superiores as demais combinações propostas no trabalho.
publishDate 2024
dc.date.none.fl_str_mv 2024-09-10T12:57:22Z
2024-09-10T12:57:22Z
2024-07-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv TOJEIRO, Carlos Alexandre Carvalho. Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão. Orientador: Kelton Augusto Pontara da Costa. 100 f. 2024. Dissertação (Mestrado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2024.
https://hdl.handle.net/11449/257359
33004153073P2
identifier_str_mv TOJEIRO, Carlos Alexandre Carvalho. Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão. Orientador: Kelton Augusto Pontara da Costa. 100 f. 2024. Dissertação (Mestrado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2024.
33004153073P2
url https://hdl.handle.net/11449/257359
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv repositoriounesp@unesp.br
_version_ 1854954855182893056