Análise Comparativa de Técnicas de Aprendizado de Máquina para Detecção de Intrusões em Redes no Conjunto de Dados CICIDS2017

Silva, Pedro Henrique Domeneghi da

Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/46463

ORCID:	http://orcid.org/0009-0002-8520-2623
Document type:	Trabalho de Conclusão de Curso
Access type:	Acesso Aberto
Title:	Análise Comparativa de Técnicas de Aprendizado de Máquina para Detecção de Intrusões em Redes no Conjunto de Dados CICIDS2017
Alternate title (s):	Comparative Analysis of Machine Learning Techniques for Network Intrusion Detection on the CICIDS2017 Dataset
Author:	Silva, Pedro Henrique Domeneghi da
First Advisor:	Faina, Luís Fernando
First coorientator:	Fernandes, Márcia Aparecida
First member of the Committee:	Coelho, Paulo Rodolfo da Silva Leite
Second member of the Committee:	Gabriel, Paulo Henrique Ribeiro
Summary:	Este trabalho apresenta a análise e comparação de modelos de Aprendizado de Máquina no contexto de um Sistema de Detecção de Intrusões em Redes, utilizando o conjunto de dados CICIDS2017. Para isso, foram avaliados os modelos Random Forest (RF) e Multi-Layer Perceptron (MLP), combinados com técnicas de redução de dimensionalidade, como Principal Component Analysis (PCA) e Mean Decrease in Impurity (MDI). A técnica MDI resultou em uma redução de 70 para 51 características, enquanto a técnica PCA resultou em uma redução de 70 para 33 características. A validação dos modelos foi realizada por meio da técnica Stratified K-Fold Cross-Validation, e as métricas de desempenho, como precisão ponderada, recall ponderado e F1-Score ponderado, foram utilizadas para avaliar os resultados. Testes com diferentes valores de n_estimators no RF revelaram que 25 árvores proporcionam o melhor equilíbrio entre desempenho e eficiência computacional, com um F1-Score ponderado aproximado de 0,9981 e levando apenas 8,7 minutos para treinar o modelo. Já o MLP atingiu um F1-Score ponderado aproximado de 0,9959 e levando 13,1 minutos para treinar o modelo.
Abstract:	This work presents the analysis and comparison of Machine Learning models in the context of a Network Intrusion Detection System, using the CICIDS2017 dataset. For this purpose, the Random Forest (RF) and Multi-Layer Perceptron (MLP) models were evaluated, combined with dimensionality reduction techniques, such as Principal Component Analysis (PCA) and Mean Decrease in Impurity (MDI). The MDI technique resulted in a reduction from 70 to 51 features, while the PCA technique resulted in a reduction from 70 to 33 features. The models were validated using the Stratified K-Fold Cross-Validation technique, and performance metrics, such as weighted precision, weighted recall, and weighted F1-Score, were used to evaluate the results. Tests with different values of n_estimators in RF revealed that 25 trees provide the best balance between performance and computational efficiency, with a weighted F1-Score of approximately 0.9981 and taking only 8.7 minutes to train the model. MLP achieved a weighted F1-Score of approximately 0.9959 and taking 13.1 minutes to train the model.
Keywords:	Aprendizado de máquina Detecção de intrusões Redução de dimensionalidade CICIDS2017 Redes neurais
Area (s) of CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language:	por
Country:	Brasil
Publisher:	Universidade Federal de Uberlândia
Quote:	SILVA, Pedro Henrique Domeneghi da. Análise Comparativa de Técnicas de Aprendizado de Máquina para Detecção de Intrusões em Redes no Conjunto de Dados CICIDS2017. 2025. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2025.
URI:	https://repositorio.ufu.br/handle/123456789/46463
Date of defense:	4-Apr-2025
Appears in Collections:	TCC - Ciência da Computação

Files in This Item:

File	Description	Size	Format
Analise_Comparativa_de_Tecnicas_de_ML_para_IDS_CICIDS2017 (1).pdf		4.01 MB	Adobe PDF	View/Open

Show full item record