Use este identificador para citar ou linkar para este item: https://repositorio.ufu.br/handle/123456789/12596
Tipo do documento: Dissertação
Tipo de acesso: Acesso Aberto
Título: Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados
Autor(es): Silva, Walter José da
Primeiro orientador: Barioni, Maria Camila Nardini
Primeiro coorientador: Amo, Sandra Aparecida de
Primeiro membro da banca: Guliato, Denise
Segundo membro da banca: Sousa, Elaine Parros Machado de
Resumo: A incorporação de semi-supervisão no processo de detecção de agrupamento de dados tem sido especialmente útil quando se deseja obter uma alta consistência entre o particionamento dos dados e o conhecimento do usuário sobre a verdadeira estrutura dos dados. Nos últimos tempos, várias estratégias para detecção de agrupamentos semisupervisionado de dados têm sido propostas. As abordagens adotadas por essas estratégias têm como objetivo guiar o processo de detecção de agrupamentos por meio do uso de restrições com os seguintes propósitos: interferindo na atribuição das instâncias ao grupo mais apropriado a cada iteração do algoritmo; ou modificando a função objetivo utilizada. Esta dissertação apresenta uma nova abordagem para incorporar semi-supervisão ao amplamente conhecido algoritmo k-means. Esse método de agrupamento semi-supervisionado emprega as informações de restrições na definição de múltiplos representantes auxiliares para os centróides utilizados a cada iteração do k-means e na geração de novos tipos de restrições que agem em nível de protótipo. Um processo de refinamento é desenvolvido para reduzir o número de representantes auxiliares considerados a cada centróide, sem perder a qualidade do agrupamento. Os resultados experimentais mostram o potencial da abordagem proposta para lidar com agrupamentos de diferentes formas, tamanhos e densidades.
Abstract: The incorporation of semi-supervision in the cluster detection process has proved especially useful when one wants to get a high consistency between the data partitioning and the knowledge the user has about the data domain. In recent years, several strategies for semi-supervised clustering have been proposed. The approaches adopted by these strategies aim at guiding the process of cluster detection by using constraints with the following purposes: to interfere with the allocation of instances to the most appropriate cluster at each iteration of the algorithm; or to modify the objective function employed. This dissertation presents a novel approach for incorporating semi-supervision in the wellknown k-means algorithm. This semi-supervised clustering method employs constraint information in the definition of multiple assistant representatives for the centroids used at each iteration of k-means and generating new types of constraints acting on prototype level. A refinement process is designed to reduce the number of assistant representatives considered for each centroid without losing the clustering quality. The experimental results show the potential of the proposed approach for dealing with clustering composed by clusters of different shapes, sizes and densities.
Palavras-chave: Agrupamento de dados
Agrupamento semi-supervisionado
Agrupamento por particionamento
Restrição em nível de protótipo
Data clustering
Semi-supervised clustering
Partitional clustering
Prototypelevel constraints
Área(s) do CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: BR
Editora: Universidade Federal de Uberlândia
Sigla da instituição: UFU
Departamento: Ciências Exatas e da Terra
Programa: Programa de Pós-graduação em Ciência da Computação
Referência: SILVA, Walter José da. Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados. 2015. 128 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de Uberlândia, Uberlândia, 2015. DOI https://doi.org/10.14393/ufu.di.2015.286
Identificador do documento: https://doi.org/10.14393/ufu.di.2015.286
URI: https://repositorio.ufu.br/handle/123456789/12596
Data de defesa: 2-Jun-2015
Aparece nas coleções:DISSERTAÇÃO - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
IncorporacaoMultiplosRepresentantes.pdf8.69 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.