Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/31060
ORCID:  http://orcid.org/0000-0001-6250-8844
Document type: Trabalho de Conclusão de Curso
Access type: Acesso Aberto
Attribution-NonCommercial-NoDerivs 3.0 United States
Title: Classificação de documentos científicos usando modelos de Recuperação da Informação
Author: Hespanholo, Richard Mateus
First Advisor: Tuma, Carlos Cesar Mansur
First member of the Committee: Soares, Mara Alves
Second member of the Committee: Simão, João Batista
Summary: Mecanismos de buscas como Google Scholar e Microsoft Academic, tidos como clássicos, apresentam uma deficiência ao classificar os resultados, utilizando-se de vários fatores externos aos conteúdos dos documentos, o que leva a uma classificação de resultados não interessante ao usuário. Este trabalho foi desenvolvido com o propósito de criar uma aplicação que classifique por relevância uma coleção de documentos de um repositório, em formato PDF ou TXT. O processo proposto extrai o conteúdo textual dos documentos, aplica várias técnicas de pré-processamento de Recuperação de Informação, modela na estrutura Bag of Words, aplica o modelo Vetorial com as métricas TF e IDF. A esta aplicação foi adicionado um dicionário de sinônimos a ser preenchido pelo usuário. No momento das buscas a aplicação expande a busca baseada no dicionário. Esta aplicação não considera os fatores externos ao conteúdo dos documentos e busca reduzir o tempo de pesquisa dos usuários por meio de uma classificação mais eficiente. Os resultados obtidos indicam que se alcançou o objetivo.
Keywords: Recuperação da informação
Modelo de espaço vetorial
Mecanismos de busca
Expansão de consulta
Tempo de analise de documentos
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::SOFTWARE BASICO
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Quote: HESPANHOLO, Richard Mateus. Classificação de documentos científicos usando modelos de Recuperação da Informação. 2020. 53 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Monte Carmelo, 2020.
URI: https://repositorio.ufu.br/handle/123456789/31060
Date of defense: 22-Dec-2020
Appears in Collections:TCC - Sistemas de Informação (Monte Carmelo)

Files in This Item:
File Description SizeFormat 
ClassificaçãoDeDocumentos.pdf1.02 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons