Aprendizado de máquina e interpretabilidade com SHAP para detecção de spyware em dados de memória

Santos, Matheus Antônio

Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/46149

Document type:	Trabalho de Conclusão de Curso
Access type:	Acesso Aberto
Title:	Aprendizado de máquina e interpretabilidade com SHAP para detecção de spyware em dados de memória
Alternate title (s):	Machine learning and interpretability with SHAP for spyware detection in memory data
Author:	Santos, Matheus Antônio
First Advisor:	Molinos, Diego Nunes
First coorientator:	Miani, Rodrigo Sanches
First member of the Committee:	Ribeiro, Thiago Pirola
Second member of the Committee:	Tinoco, Claudiney Ramos
Summary:	A segurança da informação enfrenta desafios cada vez maiores com o avanço de ameaças cibernéticas sofisticadas, como os spywares. Esses malwares atuam de forma silenciosa, dificultando sua detecção por soluções tradicionais baseadas em assinaturas. Este traba- lho propõe o desenvolvimento de um algoritmo baseado em aprendizado de máquina para a detecção de spyware por meio da análise de memória volátil, utilizando o conjunto de dados CIC-MalMem-2022. Foram aplicadas técnicas de pré-processamento, seleção de atributos e validação cruzada para treinar e avaliar quatro modelos: Árvore de Decisão, Naive Bayes, Support Vector Machine (SVM) e Rede Neural. A avali- ação dos modelos considerou métricas como acurácia e tempo de inferência. Os resultados demonstraram que é possível identificar comportamentos maliciosos relacionados a spywa- res com elevada precisão utilizando conjuntos de dados extraídos da memória. Este estudo contribui para o avanço de abordagens inteligentes na segurança cibernética, explorando um tipo de ameaça pouco abordado em relação a outros tipos de malware.
Abstract:	Information security faces increasing challenges with the advancement of sophisticated cyber threats, such as spyware. These malwares operate silently, making them difficult to detect using traditional signature-based solutions. This work proposes the development of a machine learning-based algorithm for spyware detection through volatile memory analysis, using the CIC-MalMem-2022 dataset. Preprocessing, feature selection, and cross-validation techniques were applied to train and evaluate four models: Decision Tree, Naive Bayes, Support Vector Machine (SVM), and Neural Network. The evaluation of the models considered metrics such as accuracy and inference time. The results demonstrated that it is possible to identify malicious behaviors related to spyware with high precision using datasets extracted from memory. This study contributes to the advancement of intelligent approaches in cybersecurity, exploring a type of threat that is little addressed in relation to other types of malware.
Keywords:	Malware Spyware Segurança da informação Machine learning Inteligência arficial
Area (s) of CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language:	por
Country:	Brasil
Publisher:	Universidade Federal de Uberlândia
Quote:	SANTOS, Matheus Antônio. Aprendizado de máquina e interpretabilidade com SHAP para detecção de spyware em dados de memória. 2025. 60 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) - Universidade Federal de Uberlândia, Uberlândia, 2025.
URI:	https://repositorio.ufu.br/handle/123456789/46149
Date of defense:	15-May-2025
Appears in Collections:	TCC - Sistemas de Informação (Uberlândia)

Files in This Item:

File	Description	Size	Format
AprendizadoMáquinaInterpretabilidade.pdf		9.67 MB	Adobe PDF	View/Open

Show full item record

This item is licensed under a Creative Commons License