Use este identificador para citar ou linkar para este item:
https://repositorio.ufu.br/handle/123456789/31060
ORCID: | http://orcid.org/0000-0001-6250-8844 |
Tipo do documento: | Trabalho de Conclusão de Curso |
Tipo de acesso: | Acesso Aberto Attribution-NonCommercial-NoDerivs 3.0 United States |
Título: | Classificação de documentos científicos usando modelos de Recuperação da Informação |
Autor(es): | Hespanholo, Richard Mateus |
Primeiro orientador: | Tuma, Carlos Cesar Mansur |
Primeiro membro da banca: | Soares, Mara Alves |
Segundo membro da banca: | Simão, João Batista |
Resumo: | Mecanismos de buscas como Google Scholar e Microsoft Academic, tidos como clássicos, apresentam uma deficiência ao classificar os resultados, utilizando-se de vários fatores externos aos conteúdos dos documentos, o que leva a uma classificação de resultados não interessante ao usuário. Este trabalho foi desenvolvido com o propósito de criar uma aplicação que classifique por relevância uma coleção de documentos de um repositório, em formato PDF ou TXT. O processo proposto extrai o conteúdo textual dos documentos, aplica várias técnicas de pré-processamento de Recuperação de Informação, modela na estrutura Bag of Words, aplica o modelo Vetorial com as métricas TF e IDF. A esta aplicação foi adicionado um dicionário de sinônimos a ser preenchido pelo usuário. No momento das buscas a aplicação expande a busca baseada no dicionário. Esta aplicação não considera os fatores externos ao conteúdo dos documentos e busca reduzir o tempo de pesquisa dos usuários por meio de uma classificação mais eficiente. Os resultados obtidos indicam que se alcançou o objetivo. |
Palavras-chave: | Recuperação da informação Modelo de espaço vetorial Mecanismos de busca Expansão de consulta Tempo de analise de documentos |
Área(s) do CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::SOFTWARE BASICO |
Idioma: | por |
País: | Brasil |
Editora: | Universidade Federal de Uberlândia |
Referência: | HESPANHOLO, Richard Mateus. Classificação de documentos científicos usando modelos de Recuperação da Informação. 2020. 53 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Monte Carmelo, 2020. |
URI: | https://repositorio.ufu.br/handle/123456789/31060 |
Data de defesa: | 22-Dez-2020 |
Aparece nas coleções: | TCC - Sistemas de Informação (Monte Carmelo) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
ClassificaçãoDeDocumentos.pdf | 1.02 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons