Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/26342
ORCID:  http://orcid.org/0000-0002-1386-0259
Document type: Trabalho de Conclusão de Curso
Access type: Acesso Aberto
Title: Criação de um modelo de classificação de tweets depressivos utilizando máquina de vetores de suporte
Alternate title (s): Creation of a classification model of depressive tweets using support vector machine
Author: Zanchini, Vinícius Augusto Alves
First Advisor: Pantaleao, Eliana
First member of the Committee: Amaral, Laurence Rodrigues do
Second member of the Committee: Melo, Alexander Bento
Summary: O uso crescente das redes sociais em todo o mundo tem estimulado as pessoas a expressarem e compartilharem seus sentimentos e opiniões sobre determinado tópico ou assunto. A partir dos padrões destes dados pode-se criar modelos de predição utilizando técnicas de Processamento de Linguagem Natural em conjunto com algoritmos de Aprendizado de Máquinas. Este trabalho propõe a criação de um modelo de classificação de tweets depressivos utilizando o método de reconhecimento de padrões SVM (Support Vector Machine), tendo como fonte de dados dois datasets de domínio público retirados à partir da rede social Twitter. O ambiente de desenvolvimento utilizado foi o Jupyter Notebook, onde a partir de várias bibliotecas auxiliares foram implementadas técnicas de pré-processamento nos tweets para eliminar informações indesejáveis e o treinamento do modelo construído obtendo-se uma taxa de acerto de 99.7% com os dados de treinamento após o modelo ser otimizado utilizando a técnica de Grade de Busca. A partir do modelo criado obteve-se classificações corretas de tweets não utilizados no treinamento como pertencentes à classe depressiva ou não-depressiva.
Abstract: The increase of social network usage around the world has encouraged people to express and share their feelings and opinions on a particular topic or subject. From the patterns of these data, one can create prediction models using Natural Language Processing techniques in conjunction with Machine Learning algorithms. This work proposes the creation of a classification model of depressive tweets using the method of pattern recognition SVM (Support Vector Machine), having as data source two public domain datasets taken from the social network Twitter. The development environment used was the Jupyter Notebook, where, with the help of several auxiliary libraries, pre-processing techniques were implemented and applied on the tweets to eliminate undesirable information. The training of the constructed model obtaining a rate of success of 99.7%with the data of training after the model is optimized using the Search Grid technique. Using the created model, it was possible to label new tweets as depressive or non-depressive.
Keywords: Twitter
Twitter
Processamento de Linguagem Natural
Natural Language Processing
Aprendizado de Máquina
Machine Learning
Depressão
Depression
Classificação de Dados
Data Classification
Máquinas de Vetores de Suporte
Support Vector Machines
Scikit-learn
Scikit-learn
Otimização de Parâmetros
Parameter Optimization
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Quote: ZANCHINI, Vinícius Augusto Alves. Criação de um modelo de classificação de tweets depressivos utilizando máquina de vetores de suporte. 2019. 38 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Eletrônica e Telecomunicações) - Universidade Federal de Uberlândia, Uberlândia, 2019.
URI: https://repositorio.ufu.br/handle/123456789/26342
Date of defense: 3-Jul-2019
Appears in Collections:TCC - Engenharia Eletrônica e de Telecomunicações (Patos de Minas)

Files in This Item:
File Description SizeFormat 
CriaçãoModeloClassificação.pdf642.46 kBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons