Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/36179
Full metadata record
DC FieldValueLanguage
dc.creatorLima Filho, Ricardo Barbosa-
dc.date.accessioned2022-09-26T19:29:04Z-
dc.date.available2022-09-26T19:29:04Z-
dc.date.issued2022-08-19-
dc.identifier.citationLIMA FILHO, Ricardo Barbosa. Classificação de dados baseada em redes complexas para detecção de binários empacotados. 2022. 46 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Monte Carmelo, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/36179-
dc.description.abstractThe information security field is constantly being tested with new vulnerabilities and challenges to fix them, an example is packed binaries that are malicious executables obfuscated in the process of compressing a file. However, antivirus systems find it difficult to detect the package as dangerous, due to the hiding technique present in the file. Data classification, which is a branch of machine learning, takes several approaches when analyzing physical data, which can limit performance. Complex networks in machine learning are structures that do not follow a regular or random pattern. Due to its versatility, its use for data classification has become increasingly relevant, due to successful results when analyzing its measures and properties for labeling an instance. The construction of a network interconnects data, through their common characteristics, with this it is possible to interpret structural and topological patterns. In view of this scenario, this work proposes the construction of a network based on k-nearest neighbors and the learning of network patterns via pattern compliance through six network measures selected in the literature: assortativity, clustering coefficient, average degree, betweenness, shortest mean path and closeness. The results point to an average accuracy of more than ninety percent, in addition to a better result in the seven packagers analyzed in relation to different classifiers in the literature, validating the generated network and helping the detection of packed files.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Embargadopt_BR
dc.subjectRedes complexaspt_BR
dc.subjectComplex networkspt_BR
dc.subjectConformidade padrãopt_BR
dc.subjectHigh level ratingpt_BR
dc.subjectClassificação de dadospt_BR
dc.subjectData classificationpt_BR
dc.subjectSegurança da informaçãopt_BR
dc.subjectInformation securitypt_BR
dc.subjectBinários empacotadospt_BR
dc.subjectPacked executablespt_BR
dc.titleClassificação de dados baseada em redes complexas para detecção de binários empacotadospt_BR
dc.title.alternativeData classification based on complex networks for detecting packed binarypt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.contributor.advisor1Carneiro, Murillo Guimarães-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8158868389973535pt_BR
dc.contributor.referee1Miani, Rodrigo Sanches-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/2992074747740327pt_BR
dc.contributor.referee2Park, Kil Jin Brandini-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/2730204955649484pt_BR
dc.description.degreenameTrabalho de Conclusão de Curso (Graduação)pt_BR
dc.description.resumoA área de segurança da informação está constantemente sendo testada com novas vulnerabilidades e desafios para corrigi-lás, um exemplo são os binários empacotados que são executáveis maliciosos ofuscados no processo de compactação de um arquivo. No entanto, sistemas de antivírus encontram dificuldades para detectar o empacotado como perigoso, devido a técnica de ocultamento presente no arquivo. A classificação de dados que é um ramo do aprendizado de máquina apresenta diversas abordagens ao analisar os atributos físicos dos dados e não investigam padrões de formação, podendo limitar o desempenho. Redes complexas em aprendizado de máquina são estruturas que apresentam padrões de conexões não triviais, nem completamente regular e nem completamente aleatório. Mediante a sua versatilidade, o seu uso para classificação de dados tem se tornado cada vez mais relevante, por resultados bem sucedidos ao analisar suas medidas e propriedades para classificação de uma instância. A confeção de uma rede interliga dados por meio de suas características em comum, com isso é possível interpretar padrões estruturais e topológicos. Diante deste cenário, este trabalho propõe a construção de uma rede baseado em k-vizinhos mais próximos e o aprendizado de padrões da rede via conformidade padrão através de seis medidas de rede selecionadas na literatura: assortatividade, coeficiente de agrupamento, grau médio, intermedialidade, menor caminho médio e proximidade. Os resultados apontam uma acurácia média superior a noventa por cento, além de um melhor resultado nos sete empacotadores analisados em relação a diferentes classificadores da literatura, validando a rede gerada e auxiliando a detecção de arquivos empacotados.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.courseSistemas de Informaçãopt_BR
dc.sizeorduration46pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.orcid.putcode119734956-
dc.description.embargo2024-08-19-
Appears in Collections:TCC - Sistemas de Informação (Monte Carmelo)

Files in This Item:
File Description SizeFormat 
ClassificacaoDadosBaseada.pdf8.64 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.