Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/45951
Full metadata record
DC FieldValueLanguage
dc.creatorTrevilato, Larissa Alves-
dc.date.accessioned2025-05-28T17:19:50Z-
dc.date.available2025-05-28T17:19:50Z-
dc.date.issued2025-05-23-
dc.identifier.citationTREVILATO, Larissa Alves. Análise comparativa de modelos de representação de texto e métodos de aprendizado de máquina na classificação de notícias falsas em português. 2025, 118fl. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de Uberlândia, Uberlândia, 2025.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/45951-
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectProcessamento de Linguagem Naturalpt_BR
dc.subjectAprendizado de Máquinapt_BR
dc.subjectFake Newspt_BR
dc.subjectClassificação de Textospt_BR
dc.subjectRepresentação Textualpt_BR
dc.titleAnálise Comparativa de Modelos de Representação de Texto e Métodos de Aprendizado de Máquina na Classificação de Notícias Falsas em Portuguêspt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.contributor.advisor1Lima, Maria Adriana Vidigal de-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0532686872124118pt_BR
dc.contributor.referee1Tinoco, Claudiney Ramos-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/2686526877112687pt_BR
dc.contributor.referee2Travençolo, Bruno Augusto Nassif-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/2590427557264952pt_BR
dc.description.degreenameTrabalho de Conclusão de Curso (Graduação)pt_BR
dc.description.resumoEste trabalho investigou o impacto do aumento progressivo do volume de dados no desem- penho de modelos de classificação de notícias falsas em língua portuguesa. Foram avaliadas três técnicas de representação textual — Bag of Words (BoW), TF-IDF e Word2Vec — combinadas com quatro classificadores supervisionados: Support Vector Classifier (SVC), Regressão Logística, Multinomial Naive Bayes e Random Forest. Os experimentos utili- zaram quatro conjuntos de dados construídos de forma incremental, totalizando até 28 mil amostras. Os resultados mostraram que, embora os ganhos numéricos nas métricas (acurácia, precisão, revocação e F1-score) tenham sido suaves — geralmente na ordem de uma casa decimal —, o aumento da base contribuiu para maior estabilidade e robustez dos modelos frente à variabilidade textual. A representação TF-IDF, em especial, obteve os melhores desempenhos médios, com destaque para os classificadores SVC e Random Forest, cujos F1-scores superaram 0,96. Os resultados confirmam a importância de con- juntos de dados amplos e diversificados na construção de modelos de classificação mais confiáveis e generalizáveis.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.courseCiência da Computaçãopt_BR
dc.sizeorduration118pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAOpt_BR
dc.orcid.putcode184981780-
Appears in Collections:TCC - Ciência da Computação

Files in This Item:
File Description SizeFormat 
AnaliseComparativaModelos.pdf5.33 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons