Use este identificador para citar ou linkar para este item:
https://repositorio.ufu.br/handle/123456789/44118
ORCID: | http://orcid.org/0009-0000-2873-4506 |
Tipo do documento: | Trabalho de Conclusão de Curso |
Tipo de acesso: | Acesso Aberto |
Título: | Análise de posts maliciosos na Dark Web usando aprendizado de máquina não supervisionado |
Título(s) alternativo(s): | Analysis of malicious posts on the Dark Web using unsupervised machine learning |
Autor(es): | Reis, Anna Letycia Fernandes |
Primeiro orientador: | Miani, Rodrigo Sanches |
Primeiro membro da banca: | Gabriel, Paulo Henrique Ribeiro |
Segundo membro da banca: | Travençolo, Bruno Augusto Nassif |
Resumo: | Este trabalho apresenta uma análise de posts maliciosos extraídos de fóruns da Dark Web por meio de técnicas de aprendizado não supervisionado, com o objetivo de identificar as temáticas predominantes associadas a ameaças cibernéticas. Para isso, foi empregada uma metodologia baseada em algoritmos de agrupamento, como K-means, DBSCAN e KNN, além da aplicação da Análise de Tópicos Latentes (LDA) para identificar padrões temáticos latentes. Os resultados demonstraram que o algoritmo K-means se destacou ao estruturar os dados em três clusters principais, identificando temas predominantes como segurança de dados, busca por informações sensíveis e comunidades de hacking. Essa abordagem possibilitou a rotulagem e interpretação dos conteúdos com base nos padrões observados, contribuindo para a compreensão das táticas e intenções dos cibercriminosos. Como perspectivas futuras, sugere-se ampliar a base de dados para incluir ambientes como a Deep Web, Surface Web e redes sociais, além de incorporar algoritmos avançados de aprendizado profundo e ferramentas de monitoramento em tempo real, visando um aprimoramento contínuo na detecção e categorização de ameaças. |
Abstract: | This work presents an analysis of malicious posts extracted from Dark Web forums using unsupervised learning techniques, aiming to identify the predominant themes associated with cyber threats. A methodology was employed based on clustering algorithms, such as K-means, DBSCAN, and KNN, in addition to applying Latent Dirichlet Allocation (LDA) to identify latent thematic patterns. The results demonstrated that the K-means algorithm excelled in structuring the data into three main clusters, identifying predominant themes such as data security, search for sensitive information, and hacking communities. This approach enabled the labeling and interpretation of content based on observed patterns, contributing to the understanding of cybercriminals’ tactics and intentions. For future work, it is suggested to expand the dataset to include environments such as the Deep Web, Surface Web, and social networks, as well as to incorporate advanced deep learning algorithms and real-time monitoring tools, aiming for continuous improvement in threat detection and categorization. |
Palavras-chave: | Dark Web, Aprendizado não supervisionado, K-means, LDA, Segurança cibernética, Análise de posts maliciosos Dark Web, Unsupervised learning, K-means, LDA, Cybersecurity, Malicious post analysis. |
Área(s) do CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editora: | Universidade Federal de Uberlândia |
Referência: | REIS, Anna Letycia Fernandes. Análise de posts maliciosos na Dark Web usando aprendizado de máquina não supervisionado. 2024. 44 f. Trabalho de Conclusão de Curso ( Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Uberlândia, 2024. |
URI: | https://repositorio.ufu.br/handle/123456789/44118 |
Data de defesa: | 18-Nov-2024 |
Aparece nas coleções: | TCC - Sistemas de Informação (Uberlândia) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
AnalisePostsMaliciosos.pdf | TCC | 935.58 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.