Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/14506
Document type: Dissertação
Access type: Acesso Aberto
Title: Análise do índice de nebulosidade para otimização do processo de agrupamentos de dados
Alternate title (s): Analysis of cloudiness index for process optimization of data arrays
Author: Borges, Ernani Cláudio
First Advisor: Pereira, Adriano Alves
First coorientator: Milagre, Selma Terezinha
Summary: A técnica de análise de agrupamento (clustering analysis) é uma ferramenta importante na pesquisa científica, podendo ser utilizada em diversas áreas do conhecimento tais como medicina, biologia e estatística. Agrupar dados é uma forma de refletir a estrutura interna dos dados e identificar classes presentes nesses agrupamentos, de modo que haja homogeneidade dentro das mesmas classes e heterogeneidade entre classes diferentes. Existem vários métodos de agrupamentos utilizados para encontrar o particionamento ótimo, dentre estes pode-se destacar: os métodos hierárquicos, métodos baseados em teorias dos grafos e métodos baseados em função objetivo. Neste trabalho foi utilizado o algoritmo baseado na função objetivo Fuzzy C-Means em conjunto com a técnica de reamostragem bootstrap. A ideia é variar o índice de nebulosidade para encontrar a melhor faixa de valores a ser utilizada para a classificação dos dados e consequentemente obtenção de melhores particionamentos. A qualidade da classificação é baseada em medidas de comparação tradicionais tais como Classificação Cruzada (Acc), F1, Hubert (Hub), Jaccard, Índice Randômico (Rand) e Fowlkes and Mallows (Fowlkes). As bases de dados utilizadas foram a Iris, Wine e três bases de dados artificiais. Os resultados obtidos demonstram que a melhor faixa de valor para o índice de nebulosidade está entre 1,04 e 1,2 para as medidas e bases de dados estudadas.
Abstract: The technique of clustering analysis is an important tool in scientific research, it can be used in various fields of knowledge such as medicine, biology and statistics. To group data in clusters is a way to reflect the internal data structure and identify classes present in this clusters so within the same class there is homogeneity and there is heterogeneity between different classes. There are three types of clustering methods used to find optimal partitioning: hierarchical methods, methods based on graph theory and methods based on objective function. In this study we used the objective function algorithm based on Fuzzy C-Means and also the bootstrap resampling technique. The idea is to vary the cloudiness index in order to find the best value to be used for sorting the databases: Iris, Wine and three other artificial databases, consequently obtaining better partitioning results. The quality of the partitioning is based on traditional measures of comparison such as Crusade Classification (Acc), F1, Hubert (Hub), Jaccard, Random index (Rand) and Fowlkes and Mallows (Fowlkes). The results obtained so far show that the best range for the cloudiness index is between 1.04 and 1.2 for the contents of measures adopted.
Keywords: Agrupamento de dados
Índice de nebulosidade
Fuzzy C-Means
Clustering analysis
Weighting exponent
Index cloudiness
Area (s) of CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Language: por
Country: BR
Publisher: Universidade Federal de Uberlândia
Institution Acronym: UFU
Department: Engenharias
Program: Programa de Pós-graduação em Engenharia Elétrica
Quote: BORGES, Ernani Cláudio. Analysis of cloudiness index for process optimization of data arrays. 2012. 64 f. Dissertação (Mestrado em Engenharias) - Universidade Federal de Uberlândia, Uberlândia, 2012.
URI: https://repositorio.ufu.br/handle/123456789/14506
Date of defense: 9-Oct-2012
Appears in Collections:DISSERTAÇÃO - Engenharia Elétrica

Files in This Item:
File Description SizeFormat 
t.pdf1.6 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.