Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufu.br/handle/123456789/19558
Tipo de documento: | Dissertação |
Tipo de acceso: | Acesso Aberto |
Título: | Agrupamento automático baseado em autoridade e conteúdo |
Autor: | Prado, Ana Carolina do |
Primer orientador: | Silva, Ilmério Reis da |
Primer coorientador: | Souza, João Nunes de |
Primer miembro de la banca: | Meira Júnior, Wagner |
Segundo miembro de la banca: | Lopes, Carlos Roberto |
Resumen: | Esta dissertação apresenta uma técnica de análise de agrupamentos que combina conceitos de similaridade de documentos por conteúdo com informações de ligacoes. O Modelo Vetorial Clássico e utilizado para efetuar o cálculo de similaridades entre os documentos e um algoritmo de analise de ligacoes e utilizado para obter o valor de autoridade de cada documento. Calculam-se os valores das autoridades locais dos documentos pertencentes a cada um dos grupos e, nomeando a maior autoridade local como representante do grupo, temos uma redistribuicão dos documentos nos grupos. Essa combinaçao possibilita a obtençao de grupos onde, quem melhor o representa e a maior autoridade daquele assunto. Esse algoritmo, chamado de Agrupamento por Autoridade Local (AAL), foi proposto, implementado e a qualidade do agrupamento resultante foi avaliada atraves de comparaçcãao com o metodo de agrupamento tradicional k-medias. O AAL possui a estrutura de ligaçoes da Web como definidora das características que serao utilizadas para agrupar os documentos, trazendo consigo inuámeras aplicaçcãoes nesse ambiente, como identificacao de grupos em uma grande colecão de paginas com o intuito de minimizar o escopo da busca, ou ate mesmo agrupar o resultado de pesquisa realizada, gerando grupos distintos de documentos. |
Abstract: | This dissertation introduces a technique of clustering analysis that combines concepts of document similarities by contents with link information. The Classic Vector Model is used to carry out the calculation of the similarities between the documents and a link analysis algorithm that is used to get the value of the authority of each document. Calculating the values of the local authorities from the documents belonging to each one of the groups and employing the biggest local authority as the reassign the cluster, we have redistribution of the documents to the clusters. This combination provides clusters represented by the best authority in that subject. This algorithm, called Local Authority Clustering, was proposed, introduced and the quality of its results was evaluated through comparison with the traditional K-means. The AAL has the link structures of the Web as definite from the characteristics that will be used to clustering the documents with several applications in this environment, as the identification of the clusters in a large collection of pages to minimize the search or even to gather together the result of the search generating different clusters of documents. |
Palabras clave: | Agrupamento não supervisionado Agrupamento por autoridade local Grupo Recuperação de informação AAL Local authority clustering Clustering Cluster Information fetrieval Link analysis |
Área (s) del CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editora: | Universidade Federal de Uberlândia |
Programa: | Programa de Pós-graduação em Ciência da Computação |
Cita: | PRADO, Ana Carolina do. Agrupamento automático baseado em autoridade e conteúdo. 2005. 87 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2005. |
URI: | https://repositorio.ufu.br/handle/123456789/19558 |
Fecha de defensa: | 9-ago-2005 |
Aparece en las colecciones: | DISSERTAÇÃO - Ciência da Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
AgrupamentoAutomaticoBaseado.pdf | Dissertação | 2.39 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.