Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/43804
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.creator | Ribeiro, Felipe Barcelos | - |
dc.date.accessioned | 2024-11-06T17:02:45Z | - |
dc.date.available | 2024-11-06T17:02:45Z | - |
dc.date.issued | 2024-10-19 | - |
dc.identifier.citation | RIBEIRO, Felipe Barcelos. ClusterPub: Um sistema para clusterização de artigos científicos. 2024. 46 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Uberlândia, 2024. | pt_BR |
dc.identifier.uri | https://repositorio.ufu.br/handle/123456789/43804 | - |
dc.description.sponsorship | Pesquisa sem auxílio de agências de fomento | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Uberlândia | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | * |
dc.subject | Levantamento Bibliográfico, Arquivos Bibliográficos, Aplicação de Linha de Comando, Aprendizado de Máquina, Clusterização. | pt_BR |
dc.title | Clusterpub: um sistema para clusterização de artigos científicos | pt_BR |
dc.type | Trabalho de Conclusão de Curso | pt_BR |
dc.contributor.advisor1 | Santos, Anderson Rodrigues dos | - |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/3752226356973936 | pt_BR |
dc.contributor.referee1 | Abdala, Daniel Duarte | - |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/0083781586520627 | pt_BR |
dc.contributor.referee2 | Nascimento, Marcelo Zanchetta do | - |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/5800175874658088 | pt_BR |
dc.description.degreename | Trabalho de Conclusão de Curso (Graduação) | pt_BR |
dc.description.resumo | Os processos de pesquisa bibliográfica são extremamente comuns na vida acadêmica, visto que, para a confecção de alguns trabalhos, como, projetos de conclusão de curso, dissertações de mestrado e teses de doutorado, uma parte fundamental do processo de elaboração é a busca por referencial bibliográfico. Entretanto, tal processo atualmente é bastante laboroso, pois, ao realizar uma busca em repositórios acadêmicos, como, IEEE Xplore, Google Acadêmico e Pubmed, milhares de resultados são obtidos, o que faz com que o pesquisador precise executar uma tarefa manual de organização, classificação e filtragem dos artigos retornados, tarefa essa, que demanda muito tempo e esforço. Este trabalho tem como proposta a confecção de uma aplicação de linha de comando que seja capaz de processar arquivos bibliográficos, resultando na geração de dendogramas que reflitam as similaridades presentes entre os trabalhos contidos no arquivo processado, afim, de agilizar o processo de levantamento bibliográfico. Durante a confecção do corrente trabalho foi desenvolvida a ferramenta proposta, utilizando a linguagem de programação Python, juntamente com o framework para desenvolvimento de aplicações de linha de comando, Typer, além de terem sido usadas diversas bibliotecas, como, Scikit-Learn e Scipy, para confeccionar o algoritmo de agrupamento. Para a realização dos testes foi utilizado um arquivo bibliográfico no formato BibTex composto por 25 artigos de cada um dos seguintes temas: Inteligência Artificial, Biotecnologia, Economia Circular, Mudanças Climáticas, Sistemas Complexos, Genética, Saúde Mental e Neurociência. A combinação entre o método de ligação da média ponderada das distâncias e a medida de distância da similaridade dos cossenos pode ser considerada como a que obteve os melhores resultados de maneira geral, visto que, resultou nos valores de 0,8545, 118,0987 e 0,5394 para os índices de Davies-Bouldin, Calinski-Harabasz e de silhueta, respectivamente. Ao analisar os valores enumerados no corrente texto frente aos resultados obtidos por outros trabalhos também relacionados a modelos de clusterização textual, pode-se concluir que os resultados aferidos pelo corrente trabalho são satisfatórios, visto que, por vezes são observados valores numericamente melhores. Entretanto, não é plausível utilizar essas comparações para afirmar que a ferramenta ClusterPub é superior aos trabalhos utilizados nos comparativos citados, pois, esse trabalho não realizou testes com as bases de dados usadas pelas outras ferramentas, sendo esses artigos utilizados apenas com o intuito de obter valores de referência para as métricas analisadas. A ferramenta desenvolvida foi disponibilizada para instalação no repositório público de pacotes Python, PyPi. | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.course | Sistemas de Informação | pt_BR |
dc.sizeorduration | 46 | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO | pt_BR |
dc.orcid.putcode | 171155882 | - |
Appears in Collections: | TCC - Sistemas de Informação (Uberlândia) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TCC-ClusterPub-FelipeBarcelos.pdf | Documento referenta à versão que será publicada (TCC) | 1.29 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License