Use este identificador para citar ou linkar para este item: https://repositorio.ufu.br/handle/123456789/26342
ORCID:  http://orcid.org/0000-0002-1386-0259
Tipo do documento: Trabalho de Conclusão de Curso
Tipo de acesso: Acesso Aberto
Título: Criação de um modelo de classificação de tweets depressivos utilizando máquina de vetores de suporte
Título(s) alternativo(s): Creation of a classification model of depressive tweets using support vector machine
Autor(es): Zanchini, Vinícius Augusto Alves
Primeiro orientador: Pantaleão, Eliana
Primeiro membro da banca: Amaral, Laurence Rodrigues do
Segundo membro da banca: Melo, Alexander Bento
Resumo: O uso crescente das redes sociais em todo o mundo tem estimulado as pessoas a expressarem e compartilharem seus sentimentos e opiniões sobre determinado tópico ou assunto. A partir dos padrões destes dados pode-se criar modelos de predição utilizando técnicas de Processamento de Linguagem Natural em conjunto com algoritmos de Aprendizado de Máquinas. Este trabalho propõe a criação de um modelo de classificação de tweets depressivos utilizando o método de reconhecimento de padrões SVM (Support Vector Machine), tendo como fonte de dados dois datasets de domínio público retirados à partir da rede social Twitter. O ambiente de desenvolvimento utilizado foi o Jupyter Notebook, onde a partir de várias bibliotecas auxiliares foram implementadas técnicas de pré-processamento nos tweets para eliminar informações indesejáveis e o treinamento do modelo construído obtendo-se uma taxa de acerto de 99.7% com os dados de treinamento após o modelo ser otimizado utilizando a técnica de Grade de Busca. A partir do modelo criado obteve-se classificações corretas de tweets não utilizados no treinamento como pertencentes à classe depressiva ou não-depressiva.
Abstract: The increase of social network usage around the world has encouraged people to express and share their feelings and opinions on a particular topic or subject. From the patterns of these data, one can create prediction models using Natural Language Processing techniques in conjunction with Machine Learning algorithms. This work proposes the creation of a classification model of depressive tweets using the method of pattern recognition SVM (Support Vector Machine), having as data source two public domain datasets taken from the social network Twitter. The development environment used was the Jupyter Notebook, where, with the help of several auxiliary libraries, pre-processing techniques were implemented and applied on the tweets to eliminate undesirable information. The training of the constructed model obtaining a rate of success of 99.7%with the data of training after the model is optimized using the Search Grid technique. Using the created model, it was possible to label new tweets as depressive or non-depressive.
Palavras-chave: Twitter
Twitter
Processamento de Linguagem Natural
Natural Language Processing
Aprendizado de Máquina
Machine Learning
Depressão
Depression
Classificação de Dados
Data Classification
Máquinas de Vetores de Suporte
Support Vector Machines
Scikit-learn
Scikit-learn
Otimização de Parâmetros
Parameter Optimization
Área(s) do CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO
Idioma: por
País: Brasil
Editora: Universidade Federal de Uberlândia
Referência: ZANCHINI, Vinícius Augusto Alves. Criação de um modelo de classificação de tweets depressivos utilizando máquina de vetores de suporte. 2019. 38 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Eletrônica e Telecomunicações) - Universidade Federal de Uberlândia, Uberlândia, 2019.
URI: https://repositorio.ufu.br/handle/123456789/26342
Data de defesa: 3-Jul-2019
Aparece nas coleções:TCC - Engenharia Eletrônica e de Telecomunicações (Patos de Minas)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CriaçãoModeloClassificação.pdf642.46 kBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons