Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/28888
Document type: Dissertação
Access type: Acesso Aberto
Title: Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos
Alternate title (s): Analysis of New Approaches to Mining Classification Rules Using Genetic Algorithms
Author: Alves, Alexandre Henrick da Silva
First Advisor: Amaral, Laurence Rodrigues do
First member of the Committee: Carneiro, Murillo Guimarães
Second member of the Committee: Xavier, Carolina RIbeiro
Summary: A tarefa de classificação está entre as mais utilizadas em Mineração de Dados e é amplamente pesquisada nos dias atuais. Vários trabalhos já foram desenvolvidos utilizando Algoritmos Genéticos para tarefa de classificação através da evolução de regras de classificação do tipo SE-ENTÃO e bons resultados já foram obtidos. Esses métodos geralmente utilizam a mesma estrutura cromossômica, números inteiros e reais, e essa estrutura pode impor algumas limitações na sua operação. Além da representação cromossômica, esses métodos também utilizam a mesma abordagem para escolha dos atributos para compor as regras. Nesse trabalho, foram propostos dois novos métodos, chamados de BIN-NLCEE e IG-CEE. O BIN-NLCEE utiliza uma nova estrutura cromossômica, através de valores binários. Já o método IG-CEE utiliza uma medida de avaliação de atributos, o Information Gain, para selecionar os atributos que podem compor as regras. Foram utilizados 4 datasets de domíno médico para a validação do BIN-NLCEE e 3 datasets sintéticos para a validação do IG-CEE. Ambos foram comparados com seus métodos de origem e outros 4 classificadores tradicionais (J48, IBK, Naive Bayes e SVM). Os resultados mostraram que os métodos propostos foram capazes de gerar melhores valores de fitness e melhores taxas de convergência.
Abstract: The classification task is among the most used in Data Mining and is widely researched nowadays. Several works have already been developed using Genetic Algorithms for classification tasks through the evolution of IF-THEN classification rules and good results have been obtained. These methods often use the same chromosome structure, integer, and real values, and this structure may impose some limitations on their operation. Also, these methods use the same approach for choosing the attributes that will compose the rules. In this work, two new methods were proposed, called BIN-NLCEE and IG-CEE. BIN-NLCEE uses a new chromosomal structure by binary values. The IG-CEE method uses an attribute evaluation measure, called Information Gain, to select the attributes that can compose the rules. Four medical domain datasets were used for BIN-NLCEE validation and 3 synthetic datasets for IG-CEE validation. Both were compared with their source methods and 4 other traditional classifiers (J48, IBK, Naive Bayes and SVM). The results showed that the proposed methods were able to generate better fitness values and better convergence rates.
Keywords: Algoritmos Genéticos
Classificação de Dados
Regras SE-ENTÃO
Cromossomo Binário
Ganho de Informação
Genetic Algorithms
Data classification
IF-THEN Rules
Binary Chromosome
Information Gain
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Program: Programa de Pós-graduação em Ciência da Computação
Quote: ALVES, Alexandre Henrick da Silva. Análise de novas abordagens para mineração de regras de classificação utilizando algoritmos genéticos. 2020. 134 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2020. DOI http://doi.org/10.14393/ufu.di.2020.260.
Document identifier: http://doi.org/10.14393/ufu.di.2020.260
URI: https://repositorio.ufu.br/handle/123456789/28888
Date of defense: 20-Feb-2020
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
AnaliseNovasAbordagens.pdfDissertação1.15 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.