Use este identificador para citar ou linkar para este item: https://repositorio.ufu.br/handle/123456789/31060
ORCID:  http://orcid.org/0000-0001-6250-8844
Tipo do documento: Trabalho de Conclusão de Curso
Tipo de acesso: Acesso Aberto
Attribution-NonCommercial-NoDerivs 3.0 United States
Título: Classificação de documentos científicos usando modelos de Recuperação da Informação
Autor(es): Hespanholo, Richard Mateus
Primeiro orientador: Tuma, Carlos Cesar Mansur
Primeiro membro da banca: Soares, Mara Alves
Segundo membro da banca: Simão, João Batista
Resumo: Mecanismos de buscas como Google Scholar e Microsoft Academic, tidos como clássicos, apresentam uma deficiência ao classificar os resultados, utilizando-se de vários fatores externos aos conteúdos dos documentos, o que leva a uma classificação de resultados não interessante ao usuário. Este trabalho foi desenvolvido com o propósito de criar uma aplicação que classifique por relevância uma coleção de documentos de um repositório, em formato PDF ou TXT. O processo proposto extrai o conteúdo textual dos documentos, aplica várias técnicas de pré-processamento de Recuperação de Informação, modela na estrutura Bag of Words, aplica o modelo Vetorial com as métricas TF e IDF. A esta aplicação foi adicionado um dicionário de sinônimos a ser preenchido pelo usuário. No momento das buscas a aplicação expande a busca baseada no dicionário. Esta aplicação não considera os fatores externos ao conteúdo dos documentos e busca reduzir o tempo de pesquisa dos usuários por meio de uma classificação mais eficiente. Os resultados obtidos indicam que se alcançou o objetivo.
Palavras-chave: Recuperação da informação
Modelo de espaço vetorial
Mecanismos de busca
Expansão de consulta
Tempo de analise de documentos
Área(s) do CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::SOFTWARE BASICO
Idioma: por
País: Brasil
Editora: Universidade Federal de Uberlândia
Referência: HESPANHOLO, Richard Mateus. Classificação de documentos científicos usando modelos de Recuperação da Informação. 2020. 53 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Monte Carmelo, 2020.
URI: https://repositorio.ufu.br/handle/123456789/31060
Data de defesa: 22-Dez-2020
Aparece nas coleções:TCC - Sistemas de Informação (Monte Carmelo)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ClassificaçãoDeDocumentos.pdf1.02 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons