Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Silva, Cristiano Luiz Stresser da lattes
Orientador(a): Machado, Renato Bobsin lattes
Banca de defesa: Franco, Edgar Manuel Carreño lattes, Naves, Thiago França lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual do Oeste do Paraná
Foz do Iguaçu
Programa de Pós-Graduação: Programa de Pós-Graduação em Engenharia Elétrica e Computação
Departamento: Centro de Engenharias e Ciências Exatas
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://tede.unioeste.br/handle/tede/7258
Resumo: The exponential growth of digital technologies and the Internet has been accompanied by an alarming increase in cybercrimes. This scenario has motivated the intensification of investments in cybersecurity. Furthermore, studies on the topic are also constantly evolving. Within this context, this work consists of an intrusion detection method that addresses the problems associated with the imbalance present in the CIC-IDS2018 dataset, through pre-processing and model training techniques. The method addresses the combined use of undersampling and oversampling techniques along with weights for cost-sensitive training. With the approach used to address the imbalance, it was possible to provide an improvement in the macro average of the models’ AUC from 92.0% to 98.2%. Additionally, the WebAttack minority class demonstrated an AUC increase from 56.2% to 99.6%. Finally, the mean accuracy obtained was 95.4%, approaching the results of related works. The experiments conducted show that the proposed approach can improve performance on intrusion detection and identification, especially in minority classes, without significantly compromising the overall performance.
id UNIOESTE-1_3a5e391940bfd5b75268419827101dc8
oai_identifier_str oai:tede.unioeste.br:tede/7258
network_acronym_str UNIOESTE-1
network_name_str Biblioteca Digital de Teses e Dissertações do UNIOESTE
repository_id_str
spelling Machado, Renato Bobsinhttp://lattes.cnpq.br/8407723021436270Franco, Edgar Manuel Carreñohttp://lattes.cnpq.br/4430719667450640Naves, Thiago Françahttp://lattes.cnpq.br/2177644773849043http://lattes.cnpq.br/5987191627640733Silva, Cristiano Luiz Stresser da2024-06-19T16:57:24Z2024-03-28Silva, Cristiano Luiz Stresser da. Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018. 2024. 95 f. Dissertação (Programa de Pós-Graduação em Engenharia Elétrica e Computação) - Universidade Estadual do Oeste do Paraná, Foz do Iguaçu - PR.https://tede.unioeste.br/handle/tede/7258The exponential growth of digital technologies and the Internet has been accompanied by an alarming increase in cybercrimes. This scenario has motivated the intensification of investments in cybersecurity. Furthermore, studies on the topic are also constantly evolving. Within this context, this work consists of an intrusion detection method that addresses the problems associated with the imbalance present in the CIC-IDS2018 dataset, through pre-processing and model training techniques. The method addresses the combined use of undersampling and oversampling techniques along with weights for cost-sensitive training. With the approach used to address the imbalance, it was possible to provide an improvement in the macro average of the models’ AUC from 92.0% to 98.2%. Additionally, the WebAttack minority class demonstrated an AUC increase from 56.2% to 99.6%. Finally, the mean accuracy obtained was 95.4%, approaching the results of related works. The experiments conducted show that the proposed approach can improve performance on intrusion detection and identification, especially in minority classes, without significantly compromising the overall performance.O crescimento exponencial das tecnologias digitais e da Internet tem sido acompanhado por um aumento alarmante nos crimes virtuais. Este cenário tem motivado a intensificação de investimentos direcionados à segurança cibernética. Além disso, estudos acerca do tema também seguem em constante evolução. Dentro deste contexto, o presente trabalho consiste em um método de detecção de intrusão que aborda os problemas inerentes ao desbalanceamento presente no conjunto de dados CIC-IDS2018, por meio de técnicas de pré-processamento e treinamento do modelo. O método aborda o uso combinado de técnicas de undersampling, oversampling e pesos para treinamento sensível a custo. Com a abordagem adotada para endereçar o desbalanceamento, foi possível proporcionar uma melhoria na média aritmética das AUC do modelo de 92,0% para 98,2%. Além disso, a classe minoritária WebAttack demonstrou um aumento de AUC de 56,2% para 99,6%. Por fim, a acurácia média obtida foi de 95,4%, aproximandose dos resultados de trabalhos relacionados. Os experimentos conduzidos demonstram que a abordagem proposta pode melhorar a capacidade de detecção e identificação de ameaças, especialmente em classes minoritárias, sem comprometer significativamente o desempenho geral.Submitted by Katia Abreu (katia.abreu@unioeste.br) on 2024-06-19T16:57:24Z No. of bitstreams: 1 Cristiano_Luiz_Stresser_da_Silva_2024.pdf: 1071641 bytes, checksum: e33e703881c61a1f7162fedac31ef677 (MD5)Made available in DSpace on 2024-06-19T16:57:24Z (GMT). No. of bitstreams: 1 Cristiano_Luiz_Stresser_da_Silva_2024.pdf: 1071641 bytes, checksum: e33e703881c61a1f7162fedac31ef677 (MD5) Previous issue date: 2024-03-28application/pdfpor8774263440366006536500Universidade Estadual do Oeste do ParanáFoz do IguaçuPrograma de Pós-Graduação em Engenharia Elétrica e ComputaçãoUNIOESTEBrasilCentro de Engenharias e Ciências Exatashttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessDetecção de intrusãoCIC-IDS2018LightGBMDesbalanceamentoIntrusion DetectionCIC-IDS2018LightGBMImbalanceCIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOAbordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018Aproaches to the embalance problem in intrusion detection: a case study applying CIC-IDS2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1040084669565072649600600600-77344021240821469228770386617567581936reponame:Biblioteca Digital de Teses e Dissertações do UNIOESTEinstname:Universidade Estadual do Oeste do Paraná (UNIOESTE)instacron:UNIOESTEORIGINALCristiano_Luiz_Stresser_da_Silva_2024.pdfCristiano_Luiz_Stresser_da_Silva_2024.pdfapplication/pdf1071641http://tede.unioeste.br:8080/tede/bitstream/tede/7258/2/Cristiano_Luiz_Stresser_da_Silva_2024.pdfe33e703881c61a1f7162fedac31ef677MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://tede.unioeste.br:8080/tede/bitstream/tede/7258/1/license.txtbd3efa91386c1718a7f26a329fdcb468MD51tede/72582024-06-19 13:57:24.979oai:tede.unioeste.br:tede/7258Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede.unioeste.br/PUBhttp://tede.unioeste.br/oai/requestbiblioteca.repositorio@unioeste.bropendoar:2024-06-19T16:57:24Biblioteca Digital de Teses e Dissertações do UNIOESTE - Universidade Estadual do Oeste do Paraná (UNIOESTE)false
dc.title.por.fl_str_mv Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018
dc.title.alternative.eng.fl_str_mv Aproaches to the embalance problem in intrusion detection: a case study applying CIC-IDS2018
title Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018
spellingShingle Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018
Silva, Cristiano Luiz Stresser da
Detecção de intrusão
CIC-IDS2018
LightGBM
Desbalanceamento
Intrusion Detection
CIC-IDS2018
LightGBM
Imbalance
CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
title_short Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018
title_full Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018
title_fullStr Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018
title_full_unstemmed Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018
title_sort Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018
author Silva, Cristiano Luiz Stresser da
author_facet Silva, Cristiano Luiz Stresser da
author_role author
dc.contributor.advisor1.fl_str_mv Machado, Renato Bobsin
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8407723021436270
dc.contributor.referee1.fl_str_mv Franco, Edgar Manuel Carreño
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/4430719667450640
dc.contributor.referee2.fl_str_mv Naves, Thiago França
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/2177644773849043
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/5987191627640733
dc.contributor.author.fl_str_mv Silva, Cristiano Luiz Stresser da
contributor_str_mv Machado, Renato Bobsin
Franco, Edgar Manuel Carreño
Naves, Thiago França
dc.subject.por.fl_str_mv Detecção de intrusão
CIC-IDS2018
LightGBM
Desbalanceamento
topic Detecção de intrusão
CIC-IDS2018
LightGBM
Desbalanceamento
Intrusion Detection
CIC-IDS2018
LightGBM
Imbalance
CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
dc.subject.eng.fl_str_mv Intrusion Detection
CIC-IDS2018
LightGBM
Imbalance
dc.subject.cnpq.fl_str_mv CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
description The exponential growth of digital technologies and the Internet has been accompanied by an alarming increase in cybercrimes. This scenario has motivated the intensification of investments in cybersecurity. Furthermore, studies on the topic are also constantly evolving. Within this context, this work consists of an intrusion detection method that addresses the problems associated with the imbalance present in the CIC-IDS2018 dataset, through pre-processing and model training techniques. The method addresses the combined use of undersampling and oversampling techniques along with weights for cost-sensitive training. With the approach used to address the imbalance, it was possible to provide an improvement in the macro average of the models’ AUC from 92.0% to 98.2%. Additionally, the WebAttack minority class demonstrated an AUC increase from 56.2% to 99.6%. Finally, the mean accuracy obtained was 95.4%, approaching the results of related works. The experiments conducted show that the proposed approach can improve performance on intrusion detection and identification, especially in minority classes, without significantly compromising the overall performance.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-06-19T16:57:24Z
dc.date.issued.fl_str_mv 2024-03-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Silva, Cristiano Luiz Stresser da. Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018. 2024. 95 f. Dissertação (Programa de Pós-Graduação em Engenharia Elétrica e Computação) - Universidade Estadual do Oeste do Paraná, Foz do Iguaçu - PR.
dc.identifier.uri.fl_str_mv https://tede.unioeste.br/handle/tede/7258
identifier_str_mv Silva, Cristiano Luiz Stresser da. Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018. 2024. 95 f. Dissertação (Programa de Pós-Graduação em Engenharia Elétrica e Computação) - Universidade Estadual do Oeste do Paraná, Foz do Iguaçu - PR.
url https://tede.unioeste.br/handle/tede/7258
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv -1040084669565072649
dc.relation.confidence.fl_str_mv 600
600
600
dc.relation.department.fl_str_mv -7734402124082146922
dc.relation.cnpq.fl_str_mv 8770386617567581936
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual do Oeste do Paraná
Foz do Iguaçu
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Elétrica e Computação
dc.publisher.initials.fl_str_mv UNIOESTE
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Centro de Engenharias e Ciências Exatas
publisher.none.fl_str_mv Universidade Estadual do Oeste do Paraná
Foz do Iguaçu
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do UNIOESTE
instname:Universidade Estadual do Oeste do Paraná (UNIOESTE)
instacron:UNIOESTE
instname_str Universidade Estadual do Oeste do Paraná (UNIOESTE)
instacron_str UNIOESTE
institution UNIOESTE
reponame_str Biblioteca Digital de Teses e Dissertações do UNIOESTE
collection Biblioteca Digital de Teses e Dissertações do UNIOESTE
bitstream.url.fl_str_mv http://tede.unioeste.br:8080/tede/bitstream/tede/7258/2/Cristiano_Luiz_Stresser_da_Silva_2024.pdf
http://tede.unioeste.br:8080/tede/bitstream/tede/7258/1/license.txt
bitstream.checksum.fl_str_mv e33e703881c61a1f7162fedac31ef677
bd3efa91386c1718a7f26a329fdcb468
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do UNIOESTE - Universidade Estadual do Oeste do Paraná (UNIOESTE)
repository.mail.fl_str_mv biblioteca.repositorio@unioeste.br
_version_ 1851949240677302272