Use este identificador para citar ou linkar para este item:
https://repositorio.ufu.br/handle/123456789/26342
ORCID: | http://orcid.org/0000-0002-1386-0259 |
Tipo do documento: | Trabalho de Conclusão de Curso |
Tipo de acesso: | Acesso Aberto |
Título: | Criação de um modelo de classificação de tweets depressivos utilizando máquina de vetores de suporte |
Título(s) alternativo(s): | Creation of a classification model of depressive tweets using support vector machine |
Autor(es): | Zanchini, Vinícius Augusto Alves |
Primeiro orientador: | Pantaleão, Eliana |
Primeiro membro da banca: | Amaral, Laurence Rodrigues do |
Segundo membro da banca: | Melo, Alexander Bento |
Resumo: | O uso crescente das redes sociais em todo o mundo tem estimulado as pessoas a expressarem e compartilharem seus sentimentos e opiniões sobre determinado tópico ou assunto. A partir dos padrões destes dados pode-se criar modelos de predição utilizando técnicas de Processamento de Linguagem Natural em conjunto com algoritmos de Aprendizado de Máquinas. Este trabalho propõe a criação de um modelo de classificação de tweets depressivos utilizando o método de reconhecimento de padrões SVM (Support Vector Machine), tendo como fonte de dados dois datasets de domínio público retirados à partir da rede social Twitter. O ambiente de desenvolvimento utilizado foi o Jupyter Notebook, onde a partir de várias bibliotecas auxiliares foram implementadas técnicas de pré-processamento nos tweets para eliminar informações indesejáveis e o treinamento do modelo construído obtendo-se uma taxa de acerto de 99.7% com os dados de treinamento após o modelo ser otimizado utilizando a técnica de Grade de Busca. A partir do modelo criado obteve-se classificações corretas de tweets não utilizados no treinamento como pertencentes à classe depressiva ou não-depressiva. |
Abstract: | The increase of social network usage around the world has encouraged people to express and share their feelings and opinions on a particular topic or subject. From the patterns of these data, one can create prediction models using Natural Language Processing techniques in conjunction with Machine Learning algorithms. This work proposes the creation of a classification model of depressive tweets using the method of pattern recognition SVM (Support Vector Machine), having as data source two public domain datasets taken from the social network Twitter. The development environment used was the Jupyter Notebook, where, with the help of several auxiliary libraries, pre-processing techniques were implemented and applied on the tweets to eliminate undesirable information. The training of the constructed model obtaining a rate of success of 99.7%with the data of training after the model is optimized using the Search Grid technique. Using the created model, it was possible to label new tweets as depressive or non-depressive. |
Palavras-chave: | Twitter Processamento de Linguagem Natural Natural Language Processing Aprendizado de Máquina Machine Learning Depressão Depression Classificação de Dados Data Classification Máquinas de Vetores de Suporte Support Vector Machines Scikit-learn Scikit-learn Otimização de Parâmetros Parameter Optimization |
Área(s) do CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO |
Idioma: | por |
País: | Brasil |
Editora: | Universidade Federal de Uberlândia |
Referência: | ZANCHINI, Vinícius Augusto Alves. Criação de um modelo de classificação de tweets depressivos utilizando máquina de vetores de suporte. 2019. 38 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Eletrônica e Telecomunicações) - Universidade Federal de Uberlândia, Uberlândia, 2019. |
URI: | https://repositorio.ufu.br/handle/123456789/26342 |
Data de defesa: | 3-Jul-2019 |
Aparece nas coleções: | TCC - Engenharia Eletrônica e de Telecomunicações (Patos de Minas) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
CriaçãoModeloClassificação.pdf | 642.46 kB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons