Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/43652
ORCID:  http://orcid.org/0009-0001-1375-6072
Document type: Trabalho de Conclusão de Curso
Access type: Acesso Aberto
Title: Avaliação de medidas de rede complexas para classificação de dados via caracterização de importância
Alternate title (s): Evaluation of complex network measures for data classification via importance characterization
Author: Suzuki, Guilherme Massahiro
First Advisor: Carneiro, Murillo Guimarães
First member of the Committee: Nascimento, Marcelo Zanchetta do
Second member of the Committee: Lima, Maria Adriana Vidigal de
Summary: O uso de redes complexas se tornou um tópico cada vez mais falado em vários domínios incluindo a classificação de dados. Por utilizarem apenas características físicas dos dados classificadores tradicionais possuem dificuldade em classificar um novo dado baseado em seu padrão estrutural ou topológico, tal como fazem técnicas de classificação baseadas em redes complexas para caracterização de importância ou conformidade de padrão. Este trabalho consiste em investigar o modelo de classificação via caracterização de importância a fim de analisar empiricamente outras medidas de redes complexas em comparação a medida PageRank. O ambiente desenvolvido para realização destes testes e posteriormente das análises é feito a partir de um grafo contruído a partir da rede k-vizinhos mais próximos, e a utilização de medidas de redes complexas a capazes de caracterizar algum tipo de importância entre os vértices da rede. Para isso foram selecionadas 4 medidas de redes complexas, a saber: grau, proximidade, PageRank e menor caminho médio. Para os experimentos foi utilizadas 2 bases artificiais com diferentes níveis de ruídos e outras 4 bases reais. Os resultados obtidos demonstram que outras medidas de redes podem ter o resultado competitivo em comparação ao PageRank, e que algumas medidas de redes podem ser bem sensíveis em relação a etapa de construção da rede. De forma concisa, este trabalho tem grande potencial para auxiliar trabalhos relacionados à classificação de dados via caracterização de importância bem como a seleção mais adequada de medidas de redes complexas para tarefas de classificação.
Abstract: The use of complex networks has gained attention in various domains including data classification. Because they essentially consider physical characteristics of data, traditional classifiers have difficulty classifying new data based on its structural or topological pattern, as do classification techniques based on complex networks like importance characterization or pattern conformity. This work consists of investigating the classification model via importance characterization in order to empirically analyze other measures of complex networks in comparison to the PageRank measure. The environment developed to carry out these tests and subsequently the analyses is made from a graph constructed using the k-nearest neighbors network, and the use of measures of complex networks capable of characterizing some type of importance between the vertices of the network. For this purpose, 4 measures of complex networks were selected, namely: degree, closeness, PageRank and average shortest path. For the experiments we used 2 artificial datasets with varying levels of noise and another 4 real-world datasets. The obatined results demonstrate that other network measures can have a competitive result compared to PageRank, and that some network measures can be very sensitive in relation to the network construction phase. Concisely, this work has potential to assist other works related to data classification via importance characterization or even those regarding the appropriate selection of complex network measures for classification tasks.
Keywords: Redes complexas
Classificação de dados
Classificação baseada em importância
Classificação de alto nível
Conformidade de padrão
Complex networks
data classification
classification by data importance
classification by pattern conformation
high level classification
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::ANALISE DE ALGORITMOS E COMPLEXIDADE DE COMPUTACAO
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Quote: SUZUKI, Guilherme Massahiro. Avaliação de medidas de rede complexas para classificação de dados via caracterização de importância. 2023. 51 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Monte Carmelo, 2023.
URI: https://repositorio.ufu.br/handle/123456789/43652
Date of defense: 30-Nov-2023
Appears in Collections:TCC - Sistemas de Informação (Monte Carmelo)

Files in This Item:
File Description SizeFormat 
AvaliacaoMedidasRede.pdfTCC1.31 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons