Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/47494
Full metadata record
DC FieldValueLanguage
dc.creatorRocha, Radharani Santos-
dc.date.accessioned2025-10-24T12:35:45Z-
dc.date.available2025-10-24T12:35:45Z-
dc.date.issued2025-09-16-
dc.identifier.citationROCHA, Radharani Santos. ZTA-RAD: Conjunto de Dados de Avaliação de Risco para Ameaças Internas em Arquiteturas Zero Trust. 2025. 62 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Uberlândia, 2025.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/47494-
dc.description.abstractInternal threats, often referred to as insider threats, pose significant risks to informa- tion security, particularly in corporate environments that manage sensitive data. Unlike external threats, insider attacks utilize valid credentials and insider knowledge of the organization’s infrastructure, which renders traditional perimeter-based security models inadequate. In this context, the Zero Trust Architecture (ZTA) becomes a crucial ap- proach, adhering to the principle of "never trust, always verify."This model emphasizes continuous verification, microsegmentation, and real-time monitoring to enhance secu- rity. Motivated by the absence of specific datasets for this scenario, this work introduces ZTA-RAD (Zero Trust Architecture – Risk Assessment Dataset). This dataset is derived from and expanded upon the CERT dataset, incorporating metrics related to logon, de- vices, and HTTP access. The dataset was labeled using two methods: (i) expert curation and (ii) risk analysis conducted by five large language models (LLMs). Evaluation, trai- ning, and validation experiments were conducted with three machine learning algorithms (MLP, Random Forest, and SVM) in both balanced and imbalanced scenarios. The re- sults indicate that MLP and Random Forest achieved superior performance, especially after balancing with SMOTE, while SVM showed greater sensitivity to class imbalance. Additionally, it was observed that expert labeling enabled the construction of more con- sistent classifiers compared to those generated by LLMs, reinforcing the importance of human curation. In conclusion, this study offers a new dataset for investigating insider th- reats within Zero Trust Architecture (ZTA), providing both methodological and practical insights to enhance machine learning–based security solutions.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAmeaças Internaspt_BR
dc.subjectDatasetpt_BR
dc.subjectRotulagem de Riscopt_BR
dc.subjectZTApt_BR
dc.titleZTA-RAD: Conjunto de Dados de Avaliação de Risco para Ameaças Internas em Arquiteturas Zero Trustpt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.contributor.advisor1Miani, Rodrigo Sanches-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2992074747740327pt_BR
dc.contributor.referee1Tinoco, Claudiney Ramos-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/2686526877112687pt_BR
dc.contributor.referee2Faina, Luís Fernando-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/0242166091176964pt_BR
dc.description.degreenameTrabalho de Conclusão de Curso (Graduação)pt_BR
dc.description.resumoAs ameaças internas, do inglês (insider threats), configuram-se como um dos principais riscos de segurança da informação, sobretudo em ambientes corporativos que lidam com dados sensíveis. Diferentemente das ameaças externas, esses ataques exploram credenciais válidas e conhecimento prévio da infraestrutura, tornando insuficientes os modelos tradi- cionais de segurança baseados em perímetro. Nesse contexto, a Arquitetura de Confiança Zero (ZTA) desponta como um paradigma essencial, ao adotar o princípio do “nunca con- fiar, sempre verificar”, com verificação contínua, microsegmentação e monitoramento em tempo real. Motivado pela ausência de datasets específicos para esse cenário, este trabalho propõe o ZTA-RAD (Zero Trust Architecture – Risk Assessment Dataset), derivado e ex- pandido a partir do CERT, incorporando métricas de logon, dispositivos e acessos HTTP. O dataset foi rotulado por meio de duas abordagens: (i) curadoria de especialista e (ii) análise de risco realizada por cinco LLMs. Para avaliação, foram conduzidos experimentos de treinamento e validação com três algoritmos de aprendizado de máquina (MLP, Ran- dom Forest e SVM), em cenários balanceados e não balanceados. Os resultados indicam que MLP e Random Forest obtiveram desempenho superior, sobretudo após o balancea- mento via SMOTE, enquanto o SVM mostrou maior sensibilidade ao desbalanceamento. Além disso, verificou-se que a rotulagem do especialista proporcionou a construção de classificadores mais consistentes em comparação às LLMs, reforçando a importância da curadoria humana. Em síntese, o trabalho contribui para disponibilizar um dataset inédito para o estudo de ameaças internas em ZTA, oferecendo subsídios metodológicos e práticos para a evolução de soluções baseadas em aprendizado de máquina.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.courseSistemas de Informaçãopt_BR
dc.sizeorduration62pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRApt_BR
Appears in Collections:TCC - Sistemas de Informação (Uberlândia)

Files in This Item:
File Description SizeFormat 
ZTA-RADConjuntoDados.pdfTCC2.5 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.