Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufu.br/handle/123456789/31060
ORCID: | http://orcid.org/0000-0001-6250-8844 |
Tipo de documento: | Trabalho de Conclusão de Curso |
Tipo de acceso: | Acesso Aberto Attribution-NonCommercial-NoDerivs 3.0 United States |
Título: | Classificação de documentos científicos usando modelos de Recuperação da Informação |
Autor: | Hespanholo, Richard Mateus |
Primer orientador: | Tuma, Carlos Cesar Mansur |
Primer miembro de la banca: | Soares, Mara Alves |
Segundo miembro de la banca: | Simão, João Batista |
Resumen: | Mecanismos de buscas como Google Scholar e Microsoft Academic, tidos como clássicos, apresentam uma deficiência ao classificar os resultados, utilizando-se de vários fatores externos aos conteúdos dos documentos, o que leva a uma classificação de resultados não interessante ao usuário. Este trabalho foi desenvolvido com o propósito de criar uma aplicação que classifique por relevância uma coleção de documentos de um repositório, em formato PDF ou TXT. O processo proposto extrai o conteúdo textual dos documentos, aplica várias técnicas de pré-processamento de Recuperação de Informação, modela na estrutura Bag of Words, aplica o modelo Vetorial com as métricas TF e IDF. A esta aplicação foi adicionado um dicionário de sinônimos a ser preenchido pelo usuário. No momento das buscas a aplicação expande a busca baseada no dicionário. Esta aplicação não considera os fatores externos ao conteúdo dos documentos e busca reduzir o tempo de pesquisa dos usuários por meio de uma classificação mais eficiente. Os resultados obtidos indicam que se alcançou o objetivo. |
Palabras clave: | Recuperação da informação Modelo de espaço vetorial Mecanismos de busca Expansão de consulta Tempo de analise de documentos |
Área (s) del CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::SOFTWARE BASICO |
Idioma: | por |
País: | Brasil |
Editora: | Universidade Federal de Uberlândia |
Cita: | HESPANHOLO, Richard Mateus. Classificação de documentos científicos usando modelos de Recuperação da Informação. 2020. 53 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Monte Carmelo, 2020. |
URI: | https://repositorio.ufu.br/handle/123456789/31060 |
Fecha de defensa: | 22-dic-2020 |
Aparece en las colecciones: | TCC - Sistemas de Informação (Monte Carmelo) |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
ClassificaçãoDeDocumentos.pdf | 1.02 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons