Análise Comparativa de Modelos de Representação de Texto e Métodos de Aprendizado de Máquina na Classificação de Notícias Falsas em Português

Trevilato, Larissa Alves

Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufu.br/handle/123456789/45951

ORCID:	http://orcid.org/0009-0006-1342-5990
Tipo de documento:	Trabalho de Conclusão de Curso
Tipo de acceso:	Acesso Aberto
Título:	Análise Comparativa de Modelos de Representação de Texto e Métodos de Aprendizado de Máquina na Classificação de Notícias Falsas em Português
Autor:	Trevilato, Larissa Alves
Primer orientador:	Lima, Maria Adriana Vidigal de
Primer miembro de la banca:	Tinoco, Claudiney Ramos
Segundo miembro de la banca:	Travençolo, Bruno Augusto Nassif
Resumen:	Este trabalho investigou o impacto do aumento progressivo do volume de dados no desem- penho de modelos de classificação de notícias falsas em língua portuguesa. Foram avaliadas três técnicas de representação textual — Bag of Words (BoW), TF-IDF e Word2Vec — combinadas com quatro classificadores supervisionados: Support Vector Classifier (SVC), Regressão Logística, Multinomial Naive Bayes e Random Forest. Os experimentos utili- zaram quatro conjuntos de dados construídos de forma incremental, totalizando até 28 mil amostras. Os resultados mostraram que, embora os ganhos numéricos nas métricas (acurácia, precisão, revocação e F1-score) tenham sido suaves — geralmente na ordem de uma casa decimal —, o aumento da base contribuiu para maior estabilidade e robustez dos modelos frente à variabilidade textual. A representação TF-IDF, em especial, obteve os melhores desempenhos médios, com destaque para os classificadores SVC e Random Forest, cujos F1-scores superaram 0,96. Os resultados confirmam a importância de con- juntos de dados amplos e diversificados na construção de modelos de classificação mais confiáveis e generalizáveis.
Palabras clave:	Processamento de Linguagem Natural Aprendizado de Máquina Fake News Classificação de Textos Representação Textual
Área (s) del CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO
Idioma:	por
País:	Brasil
Editora:	Universidade Federal de Uberlândia
Cita:	TREVILATO, Larissa Alves. Análise comparativa de modelos de representação de texto e métodos de aprendizado de máquina na classificação de notícias falsas em português. 2025, 118fl. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de Uberlândia, Uberlândia, 2025.
URI:	https://repositorio.ufu.br/handle/123456789/45951
Fecha de defensa:	23-may-2025
Aparece en las colecciones:	TCC - Ciência da Computação

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
AnaliseComparativaModelos.pdf		5.33 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons