Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/46463
Full metadata record
DC FieldValueLanguage
dc.creatorSilva, Pedro Henrique Domeneghi da-
dc.date.accessioned2025-07-23T13:34:48Z-
dc.date.available2025-07-23T13:34:48Z-
dc.date.issued2025-04-04-
dc.identifier.citationSILVA, Pedro Henrique Domeneghi da. Análise Comparativa de Técnicas de Aprendizado de Máquina para Detecção de Intrusões em Redes no Conjunto de Dados CICIDS2017. 2025. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2025.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/46463-
dc.description.abstractThis work presents the analysis and comparison of Machine Learning models in the context of a Network Intrusion Detection System, using the CICIDS2017 dataset. For this purpose, the Random Forest (RF) and Multi-Layer Perceptron (MLP) models were evaluated, combined with dimensionality reduction techniques, such as Principal Component Analysis (PCA) and Mean Decrease in Impurity (MDI). The MDI technique resulted in a reduction from 70 to 51 features, while the PCA technique resulted in a reduction from 70 to 33 features. The models were validated using the Stratified K-Fold Cross-Validation technique, and performance metrics, such as weighted precision, weighted recall, and weighted F1-Score, were used to evaluate the results. Tests with different values ​​of n_estimators in RF revealed that 25 trees provide the best balance between performance and computational efficiency, with a weighted F1-Score of approximately 0.9981 and taking only 8.7 minutes to train the model. MLP achieved a weighted F1-Score of approximately 0.9959 and taking 13.1 minutes to train the model.pt_BR
dc.description.sponsorshipPesquisa sem auxílio de agências de fomentopt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectDetecção de intrusõespt_BR
dc.subjectRedução de dimensionalidadept_BR
dc.subjectCICIDS2017pt_BR
dc.subjectRedes neuraispt_BR
dc.titleAnálise Comparativa de Técnicas de Aprendizado de Máquina para Detecção de Intrusões em Redes no Conjunto de Dados CICIDS2017pt_BR
dc.title.alternativeComparative Analysis of Machine Learning Techniques for Network Intrusion Detection on the CICIDS2017 Datasetpt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.contributor.advisor-co1Fernandes, Márcia Aparecida-
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/8946715881289701pt_BR
dc.contributor.advisor1Faina, Luís Fernando-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0242166091176964pt_BR
dc.contributor.referee1Coelho, Paulo Rodolfo da Silva Leite-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/8115351564191626pt_BR
dc.contributor.referee2Gabriel, Paulo Henrique Ribeiro-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/3181954061121790pt_BR
dc.description.degreenameTrabalho de Conclusão de Curso (Graduação)pt_BR
dc.description.resumoEste trabalho apresenta a análise e comparação de modelos de Aprendizado de Máquina no contexto de um Sistema de Detecção de Intrusões em Redes, utilizando o conjunto de dados CICIDS2017. Para isso, foram avaliados os modelos Random Forest (RF) e Multi-Layer Perceptron (MLP), combinados com técnicas de redução de dimensionalidade, como Principal Component Analysis (PCA) e Mean Decrease in Impurity (MDI). A técnica MDI resultou em uma redução de 70 para 51 características, enquanto a técnica PCA resultou em uma redução de 70 para 33 características. A validação dos modelos foi realizada por meio da técnica Stratified K-Fold Cross-Validation, e as métricas de desempenho, como precisão ponderada, recall ponderado e F1-Score ponderado, foram utilizadas para avaliar os resultados. Testes com diferentes valores de n_estimators no RF revelaram que 25 árvores proporcionam o melhor equilíbrio entre desempenho e eficiência computacional, com um F1-Score ponderado aproximado de 0,9981 e levando apenas 8,7 minutos para treinar o modelo. Já o MLP atingiu um F1-Score ponderado aproximado de 0,9959 e levando 13,1 minutos para treinar o modelo.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.courseCiência da Computaçãopt_BR
dc.sizeorduration41pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.orcid.putcode188522484-
Appears in Collections:TCC - Ciência da Computação

Files in This Item:
File Description SizeFormat 
Analise_Comparativa_de_Tecnicas_de_ML_para_IDS_CICIDS2017 (1).pdf4.01 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.