Use este identificador para citar ou linkar para este item: https://repositorio.ufu.br/handle/123456789/14506
Tipo do documento: Dissertação
Tipo de acesso: Acesso Aberto
Título: Análise do índice de nebulosidade para otimização do processo de agrupamentos de dados
Título(s) alternativo(s): Analysis of cloudiness index for process optimization of data arrays
Autor(es): Borges, Ernani Cláudio
Primeiro orientador: Pereira, Adriano Alves
Primeiro coorientador: Milagre, Selma Terezinha
Resumo: A técnica de análise de agrupamento (clustering analysis) é uma ferramenta importante na pesquisa científica, podendo ser utilizada em diversas áreas do conhecimento tais como medicina, biologia e estatística. Agrupar dados é uma forma de refletir a estrutura interna dos dados e identificar classes presentes nesses agrupamentos, de modo que haja homogeneidade dentro das mesmas classes e heterogeneidade entre classes diferentes. Existem vários métodos de agrupamentos utilizados para encontrar o particionamento ótimo, dentre estes pode-se destacar: os métodos hierárquicos, métodos baseados em teorias dos grafos e métodos baseados em função objetivo. Neste trabalho foi utilizado o algoritmo baseado na função objetivo Fuzzy C-Means em conjunto com a técnica de reamostragem bootstrap. A ideia é variar o índice de nebulosidade para encontrar a melhor faixa de valores a ser utilizada para a classificação dos dados e consequentemente obtenção de melhores particionamentos. A qualidade da classificação é baseada em medidas de comparação tradicionais tais como Classificação Cruzada (Acc), F1, Hubert (Hub), Jaccard, Índice Randômico (Rand) e Fowlkes and Mallows (Fowlkes). As bases de dados utilizadas foram a Iris, Wine e três bases de dados artificiais. Os resultados obtidos demonstram que a melhor faixa de valor para o índice de nebulosidade está entre 1,04 e 1,2 para as medidas e bases de dados estudadas.
Abstract: The technique of clustering analysis is an important tool in scientific research, it can be used in various fields of knowledge such as medicine, biology and statistics. To group data in clusters is a way to reflect the internal data structure and identify classes present in this clusters so within the same class there is homogeneity and there is heterogeneity between different classes. There are three types of clustering methods used to find optimal partitioning: hierarchical methods, methods based on graph theory and methods based on objective function. In this study we used the objective function algorithm based on Fuzzy C-Means and also the bootstrap resampling technique. The idea is to vary the cloudiness index in order to find the best value to be used for sorting the databases: Iris, Wine and three other artificial databases, consequently obtaining better partitioning results. The quality of the partitioning is based on traditional measures of comparison such as Crusade Classification (Acc), F1, Hubert (Hub), Jaccard, Random index (Rand) and Fowlkes and Mallows (Fowlkes). The results obtained so far show that the best range for the cloudiness index is between 1.04 and 1.2 for the contents of measures adopted.
Palavras-chave: Agrupamento de dados
Índice de nebulosidade
Fuzzy C-Means
Clustering analysis
Weighting exponent
Index cloudiness
Área(s) do CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Idioma: por
País: BR
Editora: Universidade Federal de Uberlândia
Sigla da instituição: UFU
Departamento: Engenharias
Programa: Programa de Pós-graduação em Engenharia Elétrica
Referência: BORGES, Ernani Cláudio. Analysis of cloudiness index for process optimization of data arrays. 2012. 64 f. Dissertação (Mestrado em Engenharias) - Universidade Federal de Uberlândia, Uberlândia, 2012. DOI https://doi.org/10.14393/ufu.di.2012.347
Identificador do documento: https://doi.org/10.14393/ufu.di.2012.347
URI: https://repositorio.ufu.br/handle/123456789/14506
Data de defesa: 9-Out-2012
Aparece nas coleções:DISSERTAÇÃO - Engenharia Elétrica

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
AnáliseIndiceNebulosidade.pdf1.6 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.