Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/33739
Full metadata record
DC FieldValueLanguage
dc.creatorProtásio, Matheus Henrique Ferreira-
dc.date.accessioned2021-12-10T19:15:54Z-
dc.date.available2021-12-10T19:15:54Z-
dc.date.issued2021-11-03-
dc.identifier.citationPROTÁSIO, Matheus Henrique Ferreira. Reforma da Previdência no Brasil: Uma análise a partir de dados do Twitter. 2021. 40 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de Uberlândia, Uberlândia, 2021.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/33739-
dc.description.abstractThe social security reform voted and approved in 2019 was one of the most relevant topics in Brazilian politics in recent years. Given the relevance of the topic, it is essential to analyze the opinion of citizens about it. This analysis can be done using data from social networks that Brazilians increasingly used over the years with the advent of digital inclusion. The social network best known for quick sharing of news and opinions in the form of short texts is Twitter, where these short texts are called tweets. In this final course assignment, we propose a qualitative analysis of the dataset already assembled with tweets about the social security reform in Brazil in 2019. The classification of users from the dataset was performed, distinguishing ordinary users from automated accounts (known as bots); we performed this analysis using the Botometer tool, which classified 8,180 users as bots among the 237,894 unique users from the dataset. With the completed classification of users, we analyze the possibility of a message propagation “network” had been used to propagate a certain opinion on the topic. Everything led to believe that there was no use of this type of “network”, as the bots produced 40,151 tweets out of the 980,577 tweets. We also classify the tweets through sentiment analysis, where the possible outcomes could be: “positive”, “negative” or “neutral”. Four models were used to do these classifications: Naïve Bayes, Logistic Regression, Random Forest, and Support Vector Machines (SVM). These models allowed a comparison of results with the results obtained by the creator of the dataset, as he used them in his work to classify the tweets. Regarding the classification of tweets produced by the bots, most tweets received the neutral classification for all models used. Something that may have led to this result is that media generally use automated accounts to replicate news published on their websites; thus, many media accounts were considered bots in this analysis. In the pre-processing stage, we treated hashtags and compared the new results of this treatment with the initial results. It was possible to observe that both for the original classification and for the new classification, Naïve Bayes classified most of the tweets as positive. In contrast, the other models classified most tweets as neutral. We observed this behavior in other analyses performed in the dataset, such as the classification of the thousand tweets who received the most favorites.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.rightsAttribution-NonCommercial 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc/3.0/us/*
dc.subjectAnálise de sentimentospt_BR
dc.subjectSentiment analysispt_BR
dc.subjectMineração de opiniãopt_BR
dc.subjectOpinion miningpt_BR
dc.subjectReforma da previdênciapt_BR
dc.subjectBrazilian social sSecurity reformpt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectMachine learningpt_BR
dc.subjectClassificação de botspt_BR
dc.subjectBot classificationpt_BR
dc.titleReforma da Previdência no Brasil: Uma análise a partir de dados do Twitterpt_BR
dc.title.alternativeSocial security reform in Brazil: an analysis from Twitter datapt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.contributor.advisor1Gabriel, Paulo Henrique Ribeiro-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3181954061121790pt_BR
dc.contributor.referee1Paiva, Elaine Ribeiro de Faria-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/8238524390290386pt_BR
dc.contributor.referee2Miani, Rodrigo Sanches-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/2992074747740327pt_BR
dc.description.degreenameTrabalho de Conclusão de Curso (Graduação)pt_BR
dc.description.resumoA reforma da previdência votada e aprovada no ano de 2019 foi uma das pautas mais relevantes na política brasileira nos últimos anos. Dada a relevância do tema, é importante analisar a opinião dos cidadãos sobre o mesmo. Isso pode ser feito utilizando dados provenientes de redes sociais que, com o advento da inclusão digital, cada vez são mais utilizadas pelos brasileiros com o passar dos anos. A rede social mais conhecida pelo compartilhamento rápido de notícias e opiniões na forma de curtos textos é o Twitter, onde esses pequenos textos são chamados tuítes. Neste trabalho foi feita uma análise qualitativa dos dados de uma base já montada com tuítes sobre a reforma da previdência no Brasil no ano de 2019. Foi realizada a classificação dos usuários da base, distinguindo usuários comuns de contas automatizadas (conhecidas como bots), esta análise foi feita utilizando a ferramenta Botometer que classificou 8.180 usuários como bots dentre os 237.894 usuários únicos da base. Com a classificação de usuários realizada, foi analisada a possibilidade de uma “rede” de propagação de mensagens ter sido utilizada para propagar uma determinada opinião a respeito do tema, tudo levou a crer que não houve utilização deste tipo de “rede”, pois os bots produziram 40.151 tuítes dos 980.577 tuítes da base. Também foram realizadas classificações dos tuítes, por meio da análise de sentimentos, onde as classificações podiam ser: “positivo”, “negativo” ou “neutro”. Para a realização destas classificações foram utilizados quatro modelos: Naïve Bayes, Regressão Logística, Floresta Aleatória e Máquinas de Vetores de Suporte (SVM). Estes modelos possibilitaram uma comparação de resultados com os resultados obtidos pelo criador da base, pois ele os utilizou em seu trabalho para classificar os tuítes. Com relação à classificação dos tuítes produzidos pelos bots, para todos os modelos utilizados, a maioria dos tuítes recebeu classificação neutra. Algo que pode ter levado a este resultado é o fato de que muitos veículos de comunicação utilizam contas automatizadas para replicação de notícias que foram publicadas em seus sites, assim muitas contas de veículos de comunicação foram consideradas bots nesta análise. Na etapa de pré-processamento da base também houve o tratamento de hashtags, algo que não foi realizado na classificação feita pelo criador da base em seu trabalho. Em seguida foram comparados os novos resultados obtidos após o tratamento de hashtags com os resultados originais e foi possível observar que tanto para a classificação original, como para a nova classificação, Naïve Bayes classificou a maioria dos tuítes como positivos, já os demais modelos classificaram a maioria dos tuítes como neutros. Este comportamento se repetiu em outras análises realizadas na base, como por exemplo na classificação dos mil tuítes mais favoritados.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.courseCiência da Computaçãopt_BR
dc.sizeorduration40pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
Appears in Collections:TCC - Ciência da Computação

Files in This Item:
File Description SizeFormat 
ReformaPrevidênciaBrasil.pdfTCC1.33 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons