Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufu.br/handle/123456789/48464
Registro completo de metadatos
Campo DCValorLengua/Idioma
dc.creatorPereira, Miguel Henrique de Brito-
dc.date.accessioned2026-03-03T17:24:20Z-
dc.date.available2026-03-03T17:24:20Z-
dc.date.issued2026-02-28-
dc.identifier.citationPEREIRA, Miguel Henrique de Brito. Identificação de ameaças em fóruns da Dark Web e Surface Web: um estudo sobre a evolução temporal das discussões e generalização de modelos. 2026. 105 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2026. DOI https://doi.org/10.14393/ufu.di.2026.5021.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/48464-
dc.description.abstractIn light of the increasing structuring of cybercrime and the rise of coordinated threats in anonymous environments, Cyber Threat Intelligence (CTI) becomes essential for proactive defense. This dissertation proposes two case studies aimed at evaluating practical applications of CTI through the integration of data mining techniques in Surface Web and Dark Web forums. The first study investigates the temporal evolution of discussions between 2015 and 2024 using topic modeling with LDA, identifying seasonal patterns and a thematic transition from technical debates to criminal practices, such as the commercialization of personal data in the Portuguese language. The second study evaluates the effectiveness of transfer learning to overcome the scarcity of labeled data in the security domain. To this end, a model based on the LightGBM algorithm with TF-IDF representation was employed, previously developed by a member of the same research project, and applied across distinct domains and multilingual environments, Portuguese and English. The results demonstrate that the model exhibits generalization capability by isolating risk-related vocabularies in new sources, such as Dark Web marketplaces and generic discussion forums, although it shows high sensitivity to technical terms. This study contributes to the development of CTI models with high efficiency and adaptability across heterogeneous data sources, supporting the anticipation of incidents even in the presence of limited labeled data.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectAtaques Cibernéticospt_BR
dc.subjectCyber Attackspt_BR
dc.subjectSegurança Cibernéticapt_BR
dc.subjectCybersecuritypt_BR
dc.subjectInteligência de Ameaças Cibernéticaspt_BR
dc.subjectCyber Threat Intelligencept_BR
dc.subjectProcessamento de Linguagem Naturalpt_BR
dc.subjectNatural Language Processingpt_BR
dc.subjectAprendizado de Máquinapt_BR
dc.subjectMachine Learningpt_BR
dc.subjectModelagem de Tópicospt_BR
dc.subjectTopic Modelingpt_BR
dc.titleIdentificação de ameaças em fóruns da Dark Web e Surface Web: um estudo sobre a evolução temporal das discussões e generalização de modelospt_BR
dc.title.alternativeThreat identification in Dark Web and Surface Web Forums: a study on the temporal evolution of discussions and model generalizationpt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor1Miani, Rodrigo Sanches-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2992074747740327pt_BR
dc.contributor.referee1Quincozes, Silvio Ereno-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/9401130360785458pt_BR
dc.contributor.referee2Kreutz, Diego Luis-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/2781747995973774pt_BR
dc.contributor.referee3Pereira, Miguel Henrique de Brito-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/1184079207378937pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/1184079207378937pt_BR
dc.description.degreenameDissertação (Mestrado)pt_BR
dc.description.resumoDiante da crescente estruturação do cibercrime e do aumento de ameaças articuladas em ambientes anônimos, a Inteligência de Ameaças Cibernéticas (CTI) torna-se essencial para uma defesa proativa. Esta dissertação propõe dois estudos de caso com o intuito de avaliar aplicações práticas de CTI por meio da integração de técnicas de mineração de dados em fóruns da Surface Web e Dark Web. O primeiro estudo consiste em investigar a evolução temporal das discussões entre 2015 e 2024 utilizando modelagem de tópicos LDA, identificando padrões sazonais e uma transição temática de debates técnicos para práticas criminosas, como a comercialização de dados pessoais em língua portuguesa. O segundo estudo consiste em avaliar a eficácia da transferência de aprendizado para superar a escassez de dados rotulados no domínio da segurança. Para isso, foi utilizado um modelo baseado no algoritmo LightGBM com representação TF-IDF, desenvolvido previamente por um integrante do mesmo projeto de pesquisa, sendo este aplicado em domínios distintos e ambientes multilíngues, português e inglês. Os resultados demonstram que o modelo utilizado possui capacidade de generalização ao isolar vocabulários de risco em novas fontes, como mercados da Dark Web e fóruns de discussão genéricos, embora apresente alta sensibilidade a termos técnicos. Este estudo contribui para o desenvolvimento de modelos de CTI com alta eficiência e adaptabilidade em fontes de dados heterogêneas, auxiliando na antecipação de incidentes mesmo diante da escassez de dados rotulados.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computaçãopt_BR
dc.sizeorduration105pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpt_BR
dc.identifier.doihttps://doi.org/10.14393/ufu.di.2026.5021pt_BR
dc.orcid.putcode207331158-
dc.subject.autorizadoComputaçãopt_BR
dc.subject.autorizadoCiberterrorismopt_BR
dc.subject.autorizadoCrime por computadorpt_BR
dc.subject.autorizadoPortais da Webpt_BR
dc.subject.odsODS::ODS 8. Trabalho decente e crescimento econômico - Promover o crescimento econômico sustentado, inclusivo e sustentável, emprego pleno e produtivo, e trabalho decente para todos.pt_BR
Aparece en las colecciones:DISSERTAÇÃO - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
IdentificacaoAmeacasForuns.pdfDissertação14.86 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons