Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/31060
ORCID: | http://orcid.org/0000-0001-6250-8844 |
Document type: | Trabalho de Conclusão de Curso |
Access type: | Acesso Aberto Attribution-NonCommercial-NoDerivs 3.0 United States |
Title: | Classificação de documentos científicos usando modelos de Recuperação da Informação |
Author: | Hespanholo, Richard Mateus |
First Advisor: | Tuma, Carlos Cesar Mansur |
First member of the Committee: | Soares, Mara Alves |
Second member of the Committee: | Simão, João Batista |
Summary: | Mecanismos de buscas como Google Scholar e Microsoft Academic, tidos como clássicos, apresentam uma deficiência ao classificar os resultados, utilizando-se de vários fatores externos aos conteúdos dos documentos, o que leva a uma classificação de resultados não interessante ao usuário. Este trabalho foi desenvolvido com o propósito de criar uma aplicação que classifique por relevância uma coleção de documentos de um repositório, em formato PDF ou TXT. O processo proposto extrai o conteúdo textual dos documentos, aplica várias técnicas de pré-processamento de Recuperação de Informação, modela na estrutura Bag of Words, aplica o modelo Vetorial com as métricas TF e IDF. A esta aplicação foi adicionado um dicionário de sinônimos a ser preenchido pelo usuário. No momento das buscas a aplicação expande a busca baseada no dicionário. Esta aplicação não considera os fatores externos ao conteúdo dos documentos e busca reduzir o tempo de pesquisa dos usuários por meio de uma classificação mais eficiente. Os resultados obtidos indicam que se alcançou o objetivo. |
Keywords: | Recuperação da informação Modelo de espaço vetorial Mecanismos de busca Expansão de consulta Tempo de analise de documentos |
Area (s) of CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::SOFTWARE BASICO |
Language: | por |
Country: | Brasil |
Publisher: | Universidade Federal de Uberlândia |
Quote: | HESPANHOLO, Richard Mateus. Classificação de documentos científicos usando modelos de Recuperação da Informação. 2020. 53 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Monte Carmelo, 2020. |
URI: | https://repositorio.ufu.br/handle/123456789/31060 |
Date of defense: | 22-Dec-2020 |
Appears in Collections: | TCC - Sistemas de Informação (Monte Carmelo) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ClassificaçãoDeDocumentos.pdf | 1.02 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License