Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/46463| ORCID: | http://orcid.org/0009-0002-8520-2623 |
| Document type: | Trabalho de Conclusão de Curso |
| Access type: | Acesso Aberto |
| Title: | Análise Comparativa de Técnicas de Aprendizado de Máquina para Detecção de Intrusões em Redes no Conjunto de Dados CICIDS2017 |
| Alternate title (s): | Comparative Analysis of Machine Learning Techniques for Network Intrusion Detection on the CICIDS2017 Dataset |
| Author: | Silva, Pedro Henrique Domeneghi da |
| First Advisor: | Faina, Luís Fernando |
| First coorientator: | Fernandes, Márcia Aparecida |
| First member of the Committee: | Coelho, Paulo Rodolfo da Silva Leite |
| Second member of the Committee: | Gabriel, Paulo Henrique Ribeiro |
| Summary: | Este trabalho apresenta a análise e comparação de modelos de Aprendizado de Máquina no contexto de um Sistema de Detecção de Intrusões em Redes, utilizando o conjunto de dados CICIDS2017. Para isso, foram avaliados os modelos Random Forest (RF) e Multi-Layer Perceptron (MLP), combinados com técnicas de redução de dimensionalidade, como Principal Component Analysis (PCA) e Mean Decrease in Impurity (MDI). A técnica MDI resultou em uma redução de 70 para 51 características, enquanto a técnica PCA resultou em uma redução de 70 para 33 características. A validação dos modelos foi realizada por meio da técnica Stratified K-Fold Cross-Validation, e as métricas de desempenho, como precisão ponderada, recall ponderado e F1-Score ponderado, foram utilizadas para avaliar os resultados. Testes com diferentes valores de n_estimators no RF revelaram que 25 árvores proporcionam o melhor equilíbrio entre desempenho e eficiência computacional, com um F1-Score ponderado aproximado de 0,9981 e levando apenas 8,7 minutos para treinar o modelo. Já o MLP atingiu um F1-Score ponderado aproximado de 0,9959 e levando 13,1 minutos para treinar o modelo. |
| Abstract: | This work presents the analysis and comparison of Machine Learning models in the context of a Network Intrusion Detection System, using the CICIDS2017 dataset. For this purpose, the Random Forest (RF) and Multi-Layer Perceptron (MLP) models were evaluated, combined with dimensionality reduction techniques, such as Principal Component Analysis (PCA) and Mean Decrease in Impurity (MDI). The MDI technique resulted in a reduction from 70 to 51 features, while the PCA technique resulted in a reduction from 70 to 33 features. The models were validated using the Stratified K-Fold Cross-Validation technique, and performance metrics, such as weighted precision, weighted recall, and weighted F1-Score, were used to evaluate the results. Tests with different values of n_estimators in RF revealed that 25 trees provide the best balance between performance and computational efficiency, with a weighted F1-Score of approximately 0.9981 and taking only 8.7 minutes to train the model. MLP achieved a weighted F1-Score of approximately 0.9959 and taking 13.1 minutes to train the model. |
| Keywords: | Aprendizado de máquina Detecção de intrusões Redução de dimensionalidade CICIDS2017 Redes neurais |
| Area (s) of CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| Language: | por |
| Country: | Brasil |
| Publisher: | Universidade Federal de Uberlândia |
| Quote: | SILVA, Pedro Henrique Domeneghi da. Análise Comparativa de Técnicas de Aprendizado de Máquina para Detecção de Intrusões em Redes no Conjunto de Dados CICIDS2017. 2025. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2025. |
| URI: | https://repositorio.ufu.br/handle/123456789/46463 |
| Date of defense: | 4-Apr-2025 |
| Appears in Collections: | TCC - Ciência da Computação |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Analise_Comparativa_de_Tecnicas_de_ML_para_IDS_CICIDS2017 (1).pdf | 4.01 MB | Adobe PDF | ![]() View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
