Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufu.br/handle/123456789/36179
ORCID: | http://orcid.org/0000-0002-7138-2208 |
Tipo de documento: | Trabalho de Conclusão de Curso |
Tipo de acceso: | Acesso Embargado |
Fecha de embargo: | 2024-08-19 |
Título: | Classificação de dados baseada em redes complexas para detecção de binários empacotados |
Título (s) alternativo (s): | Data classification based on complex networks for detecting packed binary |
Autor: | Lima Filho, Ricardo Barbosa |
Primer orientador: | Carneiro, Murillo Guimarães |
Primer miembro de la banca: | Miani, Rodrigo Sanches |
Segundo miembro de la banca: | Park, Kil Jin Brandini |
Resumen: | A área de segurança da informação está constantemente sendo testada com novas vulnerabilidades e desafios para corrigi-lás, um exemplo são os binários empacotados que são executáveis maliciosos ofuscados no processo de compactação de um arquivo. No entanto, sistemas de antivírus encontram dificuldades para detectar o empacotado como perigoso, devido a técnica de ocultamento presente no arquivo. A classificação de dados que é um ramo do aprendizado de máquina apresenta diversas abordagens ao analisar os atributos físicos dos dados e não investigam padrões de formação, podendo limitar o desempenho. Redes complexas em aprendizado de máquina são estruturas que apresentam padrões de conexões não triviais, nem completamente regular e nem completamente aleatório. Mediante a sua versatilidade, o seu uso para classificação de dados tem se tornado cada vez mais relevante, por resultados bem sucedidos ao analisar suas medidas e propriedades para classificação de uma instância. A confeção de uma rede interliga dados por meio de suas características em comum, com isso é possível interpretar padrões estruturais e topológicos. Diante deste cenário, este trabalho propõe a construção de uma rede baseado em k-vizinhos mais próximos e o aprendizado de padrões da rede via conformidade padrão através de seis medidas de rede selecionadas na literatura: assortatividade, coeficiente de agrupamento, grau médio, intermedialidade, menor caminho médio e proximidade. Os resultados apontam uma acurácia média superior a noventa por cento, além de um melhor resultado nos sete empacotadores analisados em relação a diferentes classificadores da literatura, validando a rede gerada e auxiliando a detecção de arquivos empacotados. |
Abstract: | The information security field is constantly being tested with new vulnerabilities and challenges to fix them, an example is packed binaries that are malicious executables obfuscated in the process of compressing a file. However, antivirus systems find it difficult to detect the package as dangerous, due to the hiding technique present in the file. Data classification, which is a branch of machine learning, takes several approaches when analyzing physical data, which can limit performance. Complex networks in machine learning are structures that do not follow a regular or random pattern. Due to its versatility, its use for data classification has become increasingly relevant, due to successful results when analyzing its measures and properties for labeling an instance. The construction of a network interconnects data, through their common characteristics, with this it is possible to interpret structural and topological patterns. In view of this scenario, this work proposes the construction of a network based on k-nearest neighbors and the learning of network patterns via pattern compliance through six network measures selected in the literature: assortativity, clustering coefficient, average degree, betweenness, shortest mean path and closeness. The results point to an average accuracy of more than ninety percent, in addition to a better result in the seven packagers analyzed in relation to different classifiers in the literature, validating the generated network and helping the detection of packed files. |
Palabras clave: | Redes complexas Complex networks Conformidade padrão High level rating Classificação de dados Data classification Segurança da informação Information security Binários empacotados Packed executables |
Área (s) del CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editora: | Universidade Federal de Uberlândia |
Cita: | LIMA FILHO, Ricardo Barbosa. Classificação de dados baseada em redes complexas para detecção de binários empacotados. 2022. 46 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Monte Carmelo, 2022. |
URI: | https://repositorio.ufu.br/handle/123456789/36179 |
Fecha de defensa: | 19-ago-2022 |
Aparece en las colecciones: | TCC - Sistemas de Informação (Monte Carmelo) |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
ClassificacaoDadosBaseada.pdf | 8.64 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.