Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/44215
Document type: Trabalho de Conclusão de Curso
Access type: Acesso Aberto
Title: Criação de um Corpus Português para Auxiliar a Identificação de Notícias Verdadeiras e Falsas
Author: Cantarino, Felipe Harrison Silva
First Advisor: Santos, Fernanda Maria da Cunha
First member of the Committee: Miani, Rodrigo Sanches
Second member of the Committee: Carneiro, Murillo Guimarães
Summary: O trabalho aborda o desafio da detecção de notícias falsas (fake news) em um contexto marcado pela rápida disseminação de informações pela internet. Dessa forma, o objetivo é a criação de um novo corpus, constituído por notícias textuais, atuais, extraídas de sites da Internet e escritas na linguagem portuguesa do Brasil. Cada texto será classificado como sendo “Verdade” ou “Falso”. A criação do novo corpus, denominado BoatosBr, contou com o auxílio de Web-Crawlers, responsáveis por obter textos de boatos já classificados. A etapa de validação do corpus BoatosBr foi formalizada pelos testes de um modelo computacional formado por técnicas de PLN e por algoritmos de classificação de AM. Os algoritmos implementados foram Naive Bayes, Support Vector Machine e Random Forest. Os resultados obtidos indicaram que o novo corpus é capaz de viabilizar diferentes estudos, podendo ser preciso para ser testado por sistemas computacionais automatizados pelo AM para detectar fake news.
Keywords: fake news, corpus, Processamento de Linguagem Natural, crawler.
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::SOFTWARE BASICO
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Quote: CANTARINO, Felipe Harrison Silva. Criação de um Corpus Português para Auxiliar a Identificação de Notícias Verdadeiras e Falsas. 2024. 44 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de informação) – Universidade Federal de Uberlândia, Uberlândia, 2024.
URI: https://repositorio.ufu.br/handle/123456789/44215
Date of defense: 23-Oct-2024
Appears in Collections:TCC - Sistemas de Informação (Uberlândia)

Files in This Item:
File Description SizeFormat 
TCC__Felipe_Harrison_Silva_Cantarino_final.pdf2.52 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons