Análise de posts maliciosos na Dark Web usando aprendizado de máquina não supervisionado

Reis, Anna Letycia Fernandes

Use este identificador para citar ou linkar para este item: https://repositorio.ufu.br/handle/123456789/44118

ORCID:	http://orcid.org/0009-0000-2873-4506
Tipo do documento:	Trabalho de Conclusão de Curso
Tipo de acesso:	Acesso Aberto
Título:	Análise de posts maliciosos na Dark Web usando aprendizado de máquina não supervisionado
Título(s) alternativo(s):	Analysis of malicious posts on the Dark Web using unsupervised machine learning
Autor(es):	Reis, Anna Letycia Fernandes
Primeiro orientador:	Miani, Rodrigo Sanches
Primeiro membro da banca:	Gabriel, Paulo Henrique Ribeiro
Segundo membro da banca:	Travençolo, Bruno Augusto Nassif
Resumo:	Este trabalho apresenta uma análise de posts maliciosos extraídos de fóruns da Dark Web por meio de técnicas de aprendizado não supervisionado, com o objetivo de identificar as temáticas predominantes associadas a ameaças cibernéticas. Para isso, foi empregada uma metodologia baseada em algoritmos de agrupamento, como K-means, DBSCAN e KNN, além da aplicação da Análise de Tópicos Latentes (LDA) para identificar padrões temáticos latentes. Os resultados demonstraram que o algoritmo K-means se destacou ao estruturar os dados em três clusters principais, identificando temas predominantes como segurança de dados, busca por informações sensíveis e comunidades de hacking. Essa abordagem possibilitou a rotulagem e interpretação dos conteúdos com base nos padrões observados, contribuindo para a compreensão das táticas e intenções dos cibercriminosos. Como perspectivas futuras, sugere-se ampliar a base de dados para incluir ambientes como a Deep Web, Surface Web e redes sociais, além de incorporar algoritmos avançados de aprendizado profundo e ferramentas de monitoramento em tempo real, visando um aprimoramento contínuo na detecção e categorização de ameaças.
Abstract:	This work presents an analysis of malicious posts extracted from Dark Web forums using unsupervised learning techniques, aiming to identify the predominant themes associated with cyber threats. A methodology was employed based on clustering algorithms, such as K-means, DBSCAN, and KNN, in addition to applying Latent Dirichlet Allocation (LDA) to identify latent thematic patterns. The results demonstrated that the K-means algorithm excelled in structuring the data into three main clusters, identifying predominant themes such as data security, search for sensitive information, and hacking communities. This approach enabled the labeling and interpretation of content based on observed patterns, contributing to the understanding of cybercriminals’ tactics and intentions. For future work, it is suggested to expand the dataset to include environments such as the Deep Web, Surface Web, and social networks, as well as to incorporate advanced deep learning algorithms and real-time monitoring tools, aiming for continuous improvement in threat detection and categorization.
Palavras-chave:	Dark Web, Aprendizado não supervisionado, K-means, LDA, Segurança cibernética, Análise de posts maliciosos Dark Web, Unsupervised learning, K-means, LDA, Cybersecurity, Malicious post analysis.
Área(s) do CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Idioma:	por
País:	Brasil
Editora:	Universidade Federal de Uberlândia
Referência:	REIS, Anna Letycia Fernandes. Análise de posts maliciosos na Dark Web usando aprendizado de máquina não supervisionado. 2024. 44 f. Trabalho de Conclusão de Curso ( Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Uberlândia, 2024.
URI:	https://repositorio.ufu.br/handle/123456789/44118
Data de defesa:	18-Nov-2024
Aparece nas coleções:	TCC - Sistemas de Informação (Uberlândia)

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
AnalisePostsMaliciosos.pdf	TCC	935.58 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas