Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/12584
metadata.dc.type: Dissertação
metadata.dc.rights: Acesso Embargado
Title: Agrupamento automático baseado em autoridade e conteúdo
metadata.dc.creator: Prado, Ana Carolina do
metadata.dc.contributor.advisor1: Silva, Ilmério Reis da
metadata.dc.contributor.advisor-co1: Souza, João Nunes de
metadata.dc.contributor.referee1: Lopes, Carlos Roberto
metadata.dc.contributor.referee2: Meira Junior, Wagner
metadata.dc.description.resumo: Esta dissertação apresenta uma técnica de análise de agrupamentos que combina conceitos de similaridade de documentos por conteúdo com informações de ligações. O Modelo Vetorial Clássico é utilizado para efetuar o cálculo de similaridades entre os documentos e um algoritmo de análise de ligações é utilizado para obter o valor de autoridade de cada documento. Calculam-se os valores das autoridades locais dos documentos pertencentes a cada um dos grupos e, nomeando a maior autoridade local como representante do grupo, temos uma redistribuição dos documentos nos grupos. Essa combinação possibilita a obtenção de grupos onde, quem melhor o representa é a maior autoridade daquele assunto. Esse algoritmo, chamado de Agrupamento por Autoridade Local (AAL), foi proposto, implementado e a qualidade do agrupamento resultante foi avaliada através de comparação com o método de agrupamento tradicional k-médias. O AAL possui a estrutura de ligações da Web como definidora das características que serão utilizadas para agrupar os documentos, trazendo consigo inúmeras aplicações nesse ambiente, como identificação de grupos em uma grande coleção de páginas com o intuito de minimizar o escopo da busca, ou até mesmo agrupar o resultado de pesquisa realizada, gerando grupos distintos de documentos.
Abstract: This dissertation introduces a technique of clustering analysis that combines concepts of document similarities by contents with link information. The Classic Vector Model is used to carry out the calculation of the similarities between the documents and a link analysis algorithm that is used to get the value of the authority of each document. Calculating the values of the local authorities from the documents belonging to each one of the groups and employing the biggest local authority as the reassign the cluster, we have redistribution of the documents to the clusters. This combination provides clusters represented by the best authority in that subject. This algorithm, called Local Authority Clustering, was proposed, introduced and the quality of its results was evaluated through comparison with the traditional K-means. The AAL has the link structures of the Web as definite from the characteristics that will be used to clustering the documents with several applications in this environment, as the identification of the clusters in a large collection of pages to minimize the search or even to gather together the result of the search generating different clusters of documents.
Keywords: Agrupamento não supervisionado
Agrupamento por autoridade local
Grupo
Recuperação de Informação
AAL
Local authority clustering
Clustering
Cluster
Information retrieval
Link analysis
Computação
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
metadata.dc.language: por
metadata.dc.publisher.country: BR
Publisher: Universidade Federal de Uberlândia
metadata.dc.publisher.initials: UFU
metadata.dc.publisher.department: Ciências Exatas e da Terra
metadata.dc.publisher.program: Programa de Pós-graduação em Ciência da Computação
Citation: PRADO, Ana Carolina do. Agrupamento automático baseado em autoridade e conteúdo. 2005. 87 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de Uberlândia, Uberlândia, 2005.
URI: https://repositorio.ufu.br/handle/123456789/12584
Issue Date: 9-Aug-2005
Appears in Collections:PPGCC - Mestrado em Ciência da Computação

Files in This Item:
There are no files associated with this item.


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.