Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/33739
Document type: | Trabalho de Conclusão de Curso |
Access type: | Acesso Aberto Attribution-NonCommercial 3.0 United States |
Title: | Reforma da Previdência no Brasil: Uma análise a partir de dados do Twitter |
Alternate title (s): | Social security reform in Brazil: an analysis from Twitter data |
Author: | Protásio, Matheus Henrique Ferreira |
First Advisor: | Gabriel, Paulo Henrique Ribeiro |
First member of the Committee: | Paiva, Elaine Ribeiro de Faria |
Second member of the Committee: | Miani, Rodrigo Sanches |
Summary: | A reforma da previdência votada e aprovada no ano de 2019 foi uma das pautas mais relevantes na política brasileira nos últimos anos. Dada a relevância do tema, é importante analisar a opinião dos cidadãos sobre o mesmo. Isso pode ser feito utilizando dados provenientes de redes sociais que, com o advento da inclusão digital, cada vez são mais utilizadas pelos brasileiros com o passar dos anos. A rede social mais conhecida pelo compartilhamento rápido de notícias e opiniões na forma de curtos textos é o Twitter, onde esses pequenos textos são chamados tuítes. Neste trabalho foi feita uma análise qualitativa dos dados de uma base já montada com tuítes sobre a reforma da previdência no Brasil no ano de 2019. Foi realizada a classificação dos usuários da base, distinguindo usuários comuns de contas automatizadas (conhecidas como bots), esta análise foi feita utilizando a ferramenta Botometer que classificou 8.180 usuários como bots dentre os 237.894 usuários únicos da base. Com a classificação de usuários realizada, foi analisada a possibilidade de uma “rede” de propagação de mensagens ter sido utilizada para propagar uma determinada opinião a respeito do tema, tudo levou a crer que não houve utilização deste tipo de “rede”, pois os bots produziram 40.151 tuítes dos 980.577 tuítes da base. Também foram realizadas classificações dos tuítes, por meio da análise de sentimentos, onde as classificações podiam ser: “positivo”, “negativo” ou “neutro”. Para a realização destas classificações foram utilizados quatro modelos: Naïve Bayes, Regressão Logística, Floresta Aleatória e Máquinas de Vetores de Suporte (SVM). Estes modelos possibilitaram uma comparação de resultados com os resultados obtidos pelo criador da base, pois ele os utilizou em seu trabalho para classificar os tuítes. Com relação à classificação dos tuítes produzidos pelos bots, para todos os modelos utilizados, a maioria dos tuítes recebeu classificação neutra. Algo que pode ter levado a este resultado é o fato de que muitos veículos de comunicação utilizam contas automatizadas para replicação de notícias que foram publicadas em seus sites, assim muitas contas de veículos de comunicação foram consideradas bots nesta análise. Na etapa de pré-processamento da base também houve o tratamento de hashtags, algo que não foi realizado na classificação feita pelo criador da base em seu trabalho. Em seguida foram comparados os novos resultados obtidos após o tratamento de hashtags com os resultados originais e foi possível observar que tanto para a classificação original, como para a nova classificação, Naïve Bayes classificou a maioria dos tuítes como positivos, já os demais modelos classificaram a maioria dos tuítes como neutros. Este comportamento se repetiu em outras análises realizadas na base, como por exemplo na classificação dos mil tuítes mais favoritados. |
Abstract: | The social security reform voted and approved in 2019 was one of the most relevant topics in Brazilian politics in recent years. Given the relevance of the topic, it is essential to analyze the opinion of citizens about it. This analysis can be done using data from social networks that Brazilians increasingly used over the years with the advent of digital inclusion. The social network best known for quick sharing of news and opinions in the form of short texts is Twitter, where these short texts are called tweets. In this final course assignment, we propose a qualitative analysis of the dataset already assembled with tweets about the social security reform in Brazil in 2019. The classification of users from the dataset was performed, distinguishing ordinary users from automated accounts (known as bots); we performed this analysis using the Botometer tool, which classified 8,180 users as bots among the 237,894 unique users from the dataset. With the completed classification of users, we analyze the possibility of a message propagation “network” had been used to propagate a certain opinion on the topic. Everything led to believe that there was no use of this type of “network”, as the bots produced 40,151 tweets out of the 980,577 tweets. We also classify the tweets through sentiment analysis, where the possible outcomes could be: “positive”, “negative” or “neutral”. Four models were used to do these classifications: Naïve Bayes, Logistic Regression, Random Forest, and Support Vector Machines (SVM). These models allowed a comparison of results with the results obtained by the creator of the dataset, as he used them in his work to classify the tweets. Regarding the classification of tweets produced by the bots, most tweets received the neutral classification for all models used. Something that may have led to this result is that media generally use automated accounts to replicate news published on their websites; thus, many media accounts were considered bots in this analysis. In the pre-processing stage, we treated hashtags and compared the new results of this treatment with the initial results. It was possible to observe that both for the original classification and for the new classification, Naïve Bayes classified most of the tweets as positive. In contrast, the other models classified most tweets as neutral. We observed this behavior in other analyses performed in the dataset, such as the classification of the thousand tweets who received the most favorites. |
Keywords: | Análise de sentimentos Sentiment analysis Mineração de opinião Opinion mining Reforma da previdência Brazilian social sSecurity reform Aprendizado de máquina Machine learning Classificação de bots Bot classification |
Area (s) of CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Language: | por |
Country: | Brasil |
Publisher: | Universidade Federal de Uberlândia |
Quote: | PROTÁSIO, Matheus Henrique Ferreira. Reforma da Previdência no Brasil: Uma análise a partir de dados do Twitter. 2021. 40 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de Uberlândia, Uberlândia, 2021. |
URI: | https://repositorio.ufu.br/handle/123456789/33739 |
Date of defense: | 3-Nov-2021 |
Appears in Collections: | TCC - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ReformaPrevidênciaBrasil.pdf | TCC | 1.33 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License