Use este identificador para citar ou linkar para este item:
https://repositorio.ufu.br/handle/123456789/45951| ORCID: | http://orcid.org/0009-0006-1342-5990 |
| Tipo do documento: | Trabalho de Conclusão de Curso |
| Tipo de acesso: | Acesso Aberto |
| Título: | Análise Comparativa de Modelos de Representação de Texto e Métodos de Aprendizado de Máquina na Classificação de Notícias Falsas em Português |
| Autor(es): | Trevilato, Larissa Alves |
| Primeiro orientador: | Lima, Maria Adriana Vidigal de |
| Primeiro membro da banca: | Tinoco, Claudiney Ramos |
| Segundo membro da banca: | Travençolo, Bruno Augusto Nassif |
| Resumo: | Este trabalho investigou o impacto do aumento progressivo do volume de dados no desem- penho de modelos de classificação de notícias falsas em língua portuguesa. Foram avaliadas três técnicas de representação textual — Bag of Words (BoW), TF-IDF e Word2Vec — combinadas com quatro classificadores supervisionados: Support Vector Classifier (SVC), Regressão Logística, Multinomial Naive Bayes e Random Forest. Os experimentos utili- zaram quatro conjuntos de dados construídos de forma incremental, totalizando até 28 mil amostras. Os resultados mostraram que, embora os ganhos numéricos nas métricas (acurácia, precisão, revocação e F1-score) tenham sido suaves — geralmente na ordem de uma casa decimal —, o aumento da base contribuiu para maior estabilidade e robustez dos modelos frente à variabilidade textual. A representação TF-IDF, em especial, obteve os melhores desempenhos médios, com destaque para os classificadores SVC e Random Forest, cujos F1-scores superaram 0,96. Os resultados confirmam a importância de con- juntos de dados amplos e diversificados na construção de modelos de classificação mais confiáveis e generalizáveis. |
| Palavras-chave: | Processamento de Linguagem Natural Aprendizado de Máquina Fake News Classificação de Textos Representação Textual |
| Área(s) do CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO |
| Idioma: | por |
| País: | Brasil |
| Editora: | Universidade Federal de Uberlândia |
| Referência: | TREVILATO, Larissa Alves. Análise comparativa de modelos de representação de texto e métodos de aprendizado de máquina na classificação de notícias falsas em português. 2025, 118fl. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de Uberlândia, Uberlândia, 2025. |
| URI: | https://repositorio.ufu.br/handle/123456789/45951 |
| Data de defesa: | 23-Mai-2025 |
| Aparece nas coleções: | TCC - Ciência da Computação |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| AnaliseComparativaModelos.pdf | 5.33 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons
