Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Estadual do Oeste do Paraná
Foz do Iguaçu |
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Engenharia Elétrica e Computação
|
| Departamento: |
Centro de Engenharias e Ciências Exatas
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://tede.unioeste.br/handle/tede/7258 |
Resumo: | The exponential growth of digital technologies and the Internet has been accompanied by an alarming increase in cybercrimes. This scenario has motivated the intensification of investments in cybersecurity. Furthermore, studies on the topic are also constantly evolving. Within this context, this work consists of an intrusion detection method that addresses the problems associated with the imbalance present in the CIC-IDS2018 dataset, through pre-processing and model training techniques. The method addresses the combined use of undersampling and oversampling techniques along with weights for cost-sensitive training. With the approach used to address the imbalance, it was possible to provide an improvement in the macro average of the models’ AUC from 92.0% to 98.2%. Additionally, the WebAttack minority class demonstrated an AUC increase from 56.2% to 99.6%. Finally, the mean accuracy obtained was 95.4%, approaching the results of related works. The experiments conducted show that the proposed approach can improve performance on intrusion detection and identification, especially in minority classes, without significantly compromising the overall performance. |
| id |
UNIOESTE-1_3a5e391940bfd5b75268419827101dc8 |
|---|---|
| oai_identifier_str |
oai:tede.unioeste.br:tede/7258 |
| network_acronym_str |
UNIOESTE-1 |
| network_name_str |
Biblioteca Digital de Teses e Dissertações do UNIOESTE |
| repository_id_str |
|
| spelling |
Machado, Renato Bobsinhttp://lattes.cnpq.br/8407723021436270Franco, Edgar Manuel Carreñohttp://lattes.cnpq.br/4430719667450640Naves, Thiago Françahttp://lattes.cnpq.br/2177644773849043http://lattes.cnpq.br/5987191627640733Silva, Cristiano Luiz Stresser da2024-06-19T16:57:24Z2024-03-28Silva, Cristiano Luiz Stresser da. Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018. 2024. 95 f. Dissertação (Programa de Pós-Graduação em Engenharia Elétrica e Computação) - Universidade Estadual do Oeste do Paraná, Foz do Iguaçu - PR.https://tede.unioeste.br/handle/tede/7258The exponential growth of digital technologies and the Internet has been accompanied by an alarming increase in cybercrimes. This scenario has motivated the intensification of investments in cybersecurity. Furthermore, studies on the topic are also constantly evolving. Within this context, this work consists of an intrusion detection method that addresses the problems associated with the imbalance present in the CIC-IDS2018 dataset, through pre-processing and model training techniques. The method addresses the combined use of undersampling and oversampling techniques along with weights for cost-sensitive training. With the approach used to address the imbalance, it was possible to provide an improvement in the macro average of the models’ AUC from 92.0% to 98.2%. Additionally, the WebAttack minority class demonstrated an AUC increase from 56.2% to 99.6%. Finally, the mean accuracy obtained was 95.4%, approaching the results of related works. The experiments conducted show that the proposed approach can improve performance on intrusion detection and identification, especially in minority classes, without significantly compromising the overall performance.O crescimento exponencial das tecnologias digitais e da Internet tem sido acompanhado por um aumento alarmante nos crimes virtuais. Este cenário tem motivado a intensificação de investimentos direcionados à segurança cibernética. Além disso, estudos acerca do tema também seguem em constante evolução. Dentro deste contexto, o presente trabalho consiste em um método de detecção de intrusão que aborda os problemas inerentes ao desbalanceamento presente no conjunto de dados CIC-IDS2018, por meio de técnicas de pré-processamento e treinamento do modelo. O método aborda o uso combinado de técnicas de undersampling, oversampling e pesos para treinamento sensível a custo. Com a abordagem adotada para endereçar o desbalanceamento, foi possível proporcionar uma melhoria na média aritmética das AUC do modelo de 92,0% para 98,2%. Além disso, a classe minoritária WebAttack demonstrou um aumento de AUC de 56,2% para 99,6%. Por fim, a acurácia média obtida foi de 95,4%, aproximandose dos resultados de trabalhos relacionados. Os experimentos conduzidos demonstram que a abordagem proposta pode melhorar a capacidade de detecção e identificação de ameaças, especialmente em classes minoritárias, sem comprometer significativamente o desempenho geral.Submitted by Katia Abreu (katia.abreu@unioeste.br) on 2024-06-19T16:57:24Z No. of bitstreams: 1 Cristiano_Luiz_Stresser_da_Silva_2024.pdf: 1071641 bytes, checksum: e33e703881c61a1f7162fedac31ef677 (MD5)Made available in DSpace on 2024-06-19T16:57:24Z (GMT). No. of bitstreams: 1 Cristiano_Luiz_Stresser_da_Silva_2024.pdf: 1071641 bytes, checksum: e33e703881c61a1f7162fedac31ef677 (MD5) Previous issue date: 2024-03-28application/pdfpor8774263440366006536500Universidade Estadual do Oeste do ParanáFoz do IguaçuPrograma de Pós-Graduação em Engenharia Elétrica e ComputaçãoUNIOESTEBrasilCentro de Engenharias e Ciências Exatashttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessDetecção de intrusãoCIC-IDS2018LightGBMDesbalanceamentoIntrusion DetectionCIC-IDS2018LightGBMImbalanceCIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOAbordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018Aproaches to the embalance problem in intrusion detection: a case study applying CIC-IDS2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1040084669565072649600600600-77344021240821469228770386617567581936reponame:Biblioteca Digital de Teses e Dissertações do UNIOESTEinstname:Universidade Estadual do Oeste do Paraná (UNIOESTE)instacron:UNIOESTEORIGINALCristiano_Luiz_Stresser_da_Silva_2024.pdfCristiano_Luiz_Stresser_da_Silva_2024.pdfapplication/pdf1071641http://tede.unioeste.br:8080/tede/bitstream/tede/7258/2/Cristiano_Luiz_Stresser_da_Silva_2024.pdfe33e703881c61a1f7162fedac31ef677MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://tede.unioeste.br:8080/tede/bitstream/tede/7258/1/license.txtbd3efa91386c1718a7f26a329fdcb468MD51tede/72582024-06-19 13:57:24.979oai:tede.unioeste.br:tede/7258Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede.unioeste.br/PUBhttp://tede.unioeste.br/oai/requestbiblioteca.repositorio@unioeste.bropendoar:2024-06-19T16:57:24Biblioteca Digital de Teses e Dissertações do UNIOESTE - Universidade Estadual do Oeste do Paraná (UNIOESTE)false |
| dc.title.por.fl_str_mv |
Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018 |
| dc.title.alternative.eng.fl_str_mv |
Aproaches to the embalance problem in intrusion detection: a case study applying CIC-IDS2018 |
| title |
Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018 |
| spellingShingle |
Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018 Silva, Cristiano Luiz Stresser da Detecção de intrusão CIC-IDS2018 LightGBM Desbalanceamento Intrusion Detection CIC-IDS2018 LightGBM Imbalance CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
| title_short |
Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018 |
| title_full |
Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018 |
| title_fullStr |
Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018 |
| title_full_unstemmed |
Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018 |
| title_sort |
Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018 |
| author |
Silva, Cristiano Luiz Stresser da |
| author_facet |
Silva, Cristiano Luiz Stresser da |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Machado, Renato Bobsin |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/8407723021436270 |
| dc.contributor.referee1.fl_str_mv |
Franco, Edgar Manuel Carreño |
| dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/4430719667450640 |
| dc.contributor.referee2.fl_str_mv |
Naves, Thiago França |
| dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/2177644773849043 |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/5987191627640733 |
| dc.contributor.author.fl_str_mv |
Silva, Cristiano Luiz Stresser da |
| contributor_str_mv |
Machado, Renato Bobsin Franco, Edgar Manuel Carreño Naves, Thiago França |
| dc.subject.por.fl_str_mv |
Detecção de intrusão CIC-IDS2018 LightGBM Desbalanceamento |
| topic |
Detecção de intrusão CIC-IDS2018 LightGBM Desbalanceamento Intrusion Detection CIC-IDS2018 LightGBM Imbalance CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Intrusion Detection CIC-IDS2018 LightGBM Imbalance |
| dc.subject.cnpq.fl_str_mv |
CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
| description |
The exponential growth of digital technologies and the Internet has been accompanied by an alarming increase in cybercrimes. This scenario has motivated the intensification of investments in cybersecurity. Furthermore, studies on the topic are also constantly evolving. Within this context, this work consists of an intrusion detection method that addresses the problems associated with the imbalance present in the CIC-IDS2018 dataset, through pre-processing and model training techniques. The method addresses the combined use of undersampling and oversampling techniques along with weights for cost-sensitive training. With the approach used to address the imbalance, it was possible to provide an improvement in the macro average of the models’ AUC from 92.0% to 98.2%. Additionally, the WebAttack minority class demonstrated an AUC increase from 56.2% to 99.6%. Finally, the mean accuracy obtained was 95.4%, approaching the results of related works. The experiments conducted show that the proposed approach can improve performance on intrusion detection and identification, especially in minority classes, without significantly compromising the overall performance. |
| publishDate |
2024 |
| dc.date.accessioned.fl_str_mv |
2024-06-19T16:57:24Z |
| dc.date.issued.fl_str_mv |
2024-03-28 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
Silva, Cristiano Luiz Stresser da. Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018. 2024. 95 f. Dissertação (Programa de Pós-Graduação em Engenharia Elétrica e Computação) - Universidade Estadual do Oeste do Paraná, Foz do Iguaçu - PR. |
| dc.identifier.uri.fl_str_mv |
https://tede.unioeste.br/handle/tede/7258 |
| identifier_str_mv |
Silva, Cristiano Luiz Stresser da. Abordagens para o problema do desbalanceamento em detecção de intrusão: um estudo de caso aplicando CIC-IDS2018. 2024. 95 f. Dissertação (Programa de Pós-Graduação em Engenharia Elétrica e Computação) - Universidade Estadual do Oeste do Paraná, Foz do Iguaçu - PR. |
| url |
https://tede.unioeste.br/handle/tede/7258 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.program.fl_str_mv |
-1040084669565072649 |
| dc.relation.confidence.fl_str_mv |
600 600 600 |
| dc.relation.department.fl_str_mv |
-7734402124082146922 |
| dc.relation.cnpq.fl_str_mv |
8770386617567581936 |
| dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Estadual do Oeste do Paraná Foz do Iguaçu |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia Elétrica e Computação |
| dc.publisher.initials.fl_str_mv |
UNIOESTE |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Centro de Engenharias e Ciências Exatas |
| publisher.none.fl_str_mv |
Universidade Estadual do Oeste do Paraná Foz do Iguaçu |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do UNIOESTE instname:Universidade Estadual do Oeste do Paraná (UNIOESTE) instacron:UNIOESTE |
| instname_str |
Universidade Estadual do Oeste do Paraná (UNIOESTE) |
| instacron_str |
UNIOESTE |
| institution |
UNIOESTE |
| reponame_str |
Biblioteca Digital de Teses e Dissertações do UNIOESTE |
| collection |
Biblioteca Digital de Teses e Dissertações do UNIOESTE |
| bitstream.url.fl_str_mv |
http://tede.unioeste.br:8080/tede/bitstream/tede/7258/2/Cristiano_Luiz_Stresser_da_Silva_2024.pdf http://tede.unioeste.br:8080/tede/bitstream/tede/7258/1/license.txt |
| bitstream.checksum.fl_str_mv |
e33e703881c61a1f7162fedac31ef677 bd3efa91386c1718a7f26a329fdcb468 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do UNIOESTE - Universidade Estadual do Oeste do Paraná (UNIOESTE) |
| repository.mail.fl_str_mv |
biblioteca.repositorio@unioeste.br |
| _version_ |
1851949240677302272 |