Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/36179
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.creator | Lima Filho, Ricardo Barbosa | - |
dc.date.accessioned | 2022-09-26T19:29:04Z | - |
dc.date.available | 2022-09-26T19:29:04Z | - |
dc.date.issued | 2022-08-19 | - |
dc.identifier.citation | LIMA FILHO, Ricardo Barbosa. Classificação de dados baseada em redes complexas para detecção de binários empacotados. 2022. 46 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Monte Carmelo, 2022. | pt_BR |
dc.identifier.uri | https://repositorio.ufu.br/handle/123456789/36179 | - |
dc.description.abstract | The information security field is constantly being tested with new vulnerabilities and challenges to fix them, an example is packed binaries that are malicious executables obfuscated in the process of compressing a file. However, antivirus systems find it difficult to detect the package as dangerous, due to the hiding technique present in the file. Data classification, which is a branch of machine learning, takes several approaches when analyzing physical data, which can limit performance. Complex networks in machine learning are structures that do not follow a regular or random pattern. Due to its versatility, its use for data classification has become increasingly relevant, due to successful results when analyzing its measures and properties for labeling an instance. The construction of a network interconnects data, through their common characteristics, with this it is possible to interpret structural and topological patterns. In view of this scenario, this work proposes the construction of a network based on k-nearest neighbors and the learning of network patterns via pattern compliance through six network measures selected in the literature: assortativity, clustering coefficient, average degree, betweenness, shortest mean path and closeness. The results point to an average accuracy of more than ninety percent, in addition to a better result in the seven packagers analyzed in relation to different classifiers in the literature, validating the generated network and helping the detection of packed files. | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Uberlândia | pt_BR |
dc.rights | Acesso Embargado | pt_BR |
dc.subject | Redes complexas | pt_BR |
dc.subject | Complex networks | pt_BR |
dc.subject | Conformidade padrão | pt_BR |
dc.subject | High level rating | pt_BR |
dc.subject | Classificação de dados | pt_BR |
dc.subject | Data classification | pt_BR |
dc.subject | Segurança da informação | pt_BR |
dc.subject | Information security | pt_BR |
dc.subject | Binários empacotados | pt_BR |
dc.subject | Packed executables | pt_BR |
dc.title | Classificação de dados baseada em redes complexas para detecção de binários empacotados | pt_BR |
dc.title.alternative | Data classification based on complex networks for detecting packed binary | pt_BR |
dc.type | Trabalho de Conclusão de Curso | pt_BR |
dc.contributor.advisor1 | Carneiro, Murillo Guimarães | - |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/8158868389973535 | pt_BR |
dc.contributor.referee1 | Miani, Rodrigo Sanches | - |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/2992074747740327 | pt_BR |
dc.contributor.referee2 | Park, Kil Jin Brandini | - |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/2730204955649484 | pt_BR |
dc.description.degreename | Trabalho de Conclusão de Curso (Graduação) | pt_BR |
dc.description.resumo | A área de segurança da informação está constantemente sendo testada com novas vulnerabilidades e desafios para corrigi-lás, um exemplo são os binários empacotados que são executáveis maliciosos ofuscados no processo de compactação de um arquivo. No entanto, sistemas de antivírus encontram dificuldades para detectar o empacotado como perigoso, devido a técnica de ocultamento presente no arquivo. A classificação de dados que é um ramo do aprendizado de máquina apresenta diversas abordagens ao analisar os atributos físicos dos dados e não investigam padrões de formação, podendo limitar o desempenho. Redes complexas em aprendizado de máquina são estruturas que apresentam padrões de conexões não triviais, nem completamente regular e nem completamente aleatório. Mediante a sua versatilidade, o seu uso para classificação de dados tem se tornado cada vez mais relevante, por resultados bem sucedidos ao analisar suas medidas e propriedades para classificação de uma instância. A confeção de uma rede interliga dados por meio de suas características em comum, com isso é possível interpretar padrões estruturais e topológicos. Diante deste cenário, este trabalho propõe a construção de uma rede baseado em k-vizinhos mais próximos e o aprendizado de padrões da rede via conformidade padrão através de seis medidas de rede selecionadas na literatura: assortatividade, coeficiente de agrupamento, grau médio, intermedialidade, menor caminho médio e proximidade. Os resultados apontam uma acurácia média superior a noventa por cento, além de um melhor resultado nos sete empacotadores analisados em relação a diferentes classificadores da literatura, validando a rede gerada e auxiliando a detecção de arquivos empacotados. | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.course | Sistemas de Informação | pt_BR |
dc.sizeorduration | 46 | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
dc.orcid.putcode | 119734956 | - |
dc.description.embargo | 2024-08-19 | - |
Appears in Collections: | TCC - Sistemas de Informação (Monte Carmelo) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ClassificacaoDadosBaseada.pdf | 8.64 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.