Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/46149
Document type: | Trabalho de Conclusão de Curso |
Access type: | Acesso Aberto |
Title: | Aprendizado de máquina e interpretabilidade com SHAP para detecção de spyware em dados de memória |
Alternate title (s): | Machine learning and interpretability with SHAP for spyware detection in memory data |
Author: | Santos, Matheus Antônio |
First Advisor: | Molinos, Diego Nunes |
First coorientator: | Miani, Rodrigo Sanches |
First member of the Committee: | Ribeiro, Thiago Pirola |
Second member of the Committee: | Tinoco, Claudiney Ramos |
Summary: | A segurança da informação enfrenta desafios cada vez maiores com o avanço de ameaças cibernéticas sofisticadas, como os spywares. Esses malwares atuam de forma silenciosa, dificultando sua detecção por soluções tradicionais baseadas em assinaturas. Este traba- lho propõe o desenvolvimento de um algoritmo baseado em aprendizado de máquina para a detecção de spyware por meio da análise de memória volátil, utilizando o conjunto de dados CIC-MalMem-2022. Foram aplicadas técnicas de pré-processamento, seleção de atributos e validação cruzada para treinar e avaliar quatro modelos: Árvore de Decisão, Naive Bayes, Support Vector Machine (SVM) e Rede Neural. A avali- ação dos modelos considerou métricas como acurácia e tempo de inferência. Os resultados demonstraram que é possível identificar comportamentos maliciosos relacionados a spywa- res com elevada precisão utilizando conjuntos de dados extraídos da memória. Este estudo contribui para o avanço de abordagens inteligentes na segurança cibernética, explorando um tipo de ameaça pouco abordado em relação a outros tipos de malware. |
Abstract: | Information security faces increasing challenges with the advancement of sophisticated cyber threats, such as spyware. These malwares operate silently, making them difficult to detect using traditional signature-based solutions. This work proposes the development of a machine learning-based algorithm for spyware detection through volatile memory analysis, using the CIC-MalMem-2022 dataset. Preprocessing, feature selection, and cross-validation techniques were applied to train and evaluate four models: Decision Tree, Naive Bayes, Support Vector Machine (SVM), and Neural Network. The evaluation of the models considered metrics such as accuracy and inference time. The results demonstrated that it is possible to identify malicious behaviors related to spyware with high precision using datasets extracted from memory. This study contributes to the advancement of intelligent approaches in cybersecurity, exploring a type of threat that is little addressed in relation to other types of malware. |
Keywords: | Malware Spyware Segurança da informação Machine learning Inteligência arficial |
Area (s) of CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Language: | por |
Country: | Brasil |
Publisher: | Universidade Federal de Uberlândia |
Quote: | SANTOS, Matheus Antônio. Aprendizado de máquina e interpretabilidade com SHAP para detecção de spyware em dados de memória. 2025. 60 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) - Universidade Federal de Uberlândia, Uberlândia, 2025. |
URI: | https://repositorio.ufu.br/handle/123456789/46149 |
Date of defense: | 15-May-2025 |
Appears in Collections: | TCC - Sistemas de Informação (Uberlândia) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
AprendizadoMáquinaInterpretabilidade.pdf | 9.67 MB | Adobe PDF | ![]() View/Open |
This item is licensed under a Creative Commons License