Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/38729
Full metadata record
DC FieldValueLanguage
dc.creatorSantos, Matheus Henrique-
dc.date.accessioned2023-07-21T12:09:44Z-
dc.date.available2023-07-21T12:09:44Z-
dc.date.issued2023-06-13-
dc.identifier.citationSANTOS, Matheus Henrique. Classificação do perfil dos clientes através de técnicas de mineração de dados. 2023. 59 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/38729-
dc.description.abstractCurrently, ever-increasing volumes of data are generated, but they are not always used in an “intelligent” way to extract information. In this scenario, data mining tools are used to help extract information that is not always so obvious or explicit, which makes it one of the most promising technologies today. The present work was developed with the purpose of creating a classification model, through data mining techniques, for the classification of the profile of the customers (Customer for Sale or Customer Not for Sale) of a real company. The structure of this Case Study used the CRISP-DM methodology, which is the most common in problems involving Data Mining. This methodology is segmented into 06 stages, which are: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation and Use. Two Classification algorithms were tested for model development: Decision Tree and Logistic Regression. For application in the algorithms, the database was divided into two bases: Training Base (composed of 70% of the data) and Test Base (Comprised of 30% of the data). As this is a database with unbalanced data, due to the significant superiority of customers in the Non-Sales class, two methodologies were evaluated for data balancing: application of SMOTE (Synthetic Minority Oversampling Technique) for oversampling technique and adjustment of weights of the minority and majority classes within the cost functions of the algorithms. The Logistic Regression models both for the application of SMOTE and for adjusting the weights of the classes presented similar results, and were the ones that presented the best results. With this, the study concluded that the classification model found, through the Logistic Regression technique, is extremely relevant for the company, resulting in a reduction in the costs of contacting customers and a significant increase in the volume of return of these contacts (Sales).pt_BR
dc.description.sponsorshipVALE S. A.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAprendizado de Máquinapt_BR
dc.subjectRegressão Logísticapt_BR
dc.subjectÁrvore de Decisãopt_BR
dc.subjectPerfil de Clientespt_BR
dc.subjectMachine Learningpt_BR
dc.subjectLogistic Regressionpt_BR
dc.subjectDecision Treept_BR
dc.subjectCustomer Profilept_BR
dc.titleClassificação do perfil dos clientes através de técnicas de mineração de dadospt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.contributor.advisor1Silva, José Waldemar da-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3076056770753848pt_BR
dc.contributor.referee1Paiva, Elaine Ribeiro de Faria-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/8238524390290386pt_BR
dc.contributor.referee2Araújo, Lucio Borges-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/1633451941969946pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/1917600982681457pt_BR
dc.description.degreenameTrabalho de Conclusão de Curso (Graduação)pt_BR
dc.description.resumoAtualmente volumes de dados cada vez maiores são gerados, porém nem sempre os mesmos são utilizados de forma “inteligente” para extração de informações. Nesse cenário, as ferramentas de mineração de dados são utilizadas para auxiliar a extrair informações que nem sempre são tão óbvias ou explícitas, o que faz com que ela seja uma das tecnologias mais promissoras da atualidade. O presente trabalho foi desenvolvido com a finalidade de criar um modelo de classificação, através de técnicas de mineração de dados, para a classificação do perfil dos clientes (Cliente Venda ou Cliente Não Venda) de uma empresa real. A estrutura deste Estudo de Caso utilizou a metodologia CRISP-DM, que é a mais usual em problemas que envolvam Mineração de Dados. Essa metodologia é segmentada em 06 etapas, que são: Entendimento do Negócio, Entendimento dos Dados, Preparação dos Dados, Modelagem, Avaliação e Utilização. Dois algoritmos de Classificação foram testados para desenvolvimento do modelo: Árvore de Decisão e Regressão Logística. Para aplicação nos algoritmos, a base de dados foi dividida em duas bases: Base de Treino (composta por 70% dos dados) e Base de Teste (Composta por 30% dos dados). Por se tratar de uma base com dados desbalanceados, devido a expressiva superioridade de clientes na classe Não Vendas, duas metodologias foram avaliadas para balanceamento dos dados: aplicação do SMOTE (Synthetic Minority Oversampling Technique) para técnica de sobreamostragem e ajuste dos pesos das classes minoritária e majoritária dentro das funções de custo dos algoritmos. Os modelos de Regressão Logística tanto para a aplicação do SMOTE quanto para ajuste dos pesos das classes apresentaram resultados semelhantes, e foram os que apresentaram melhores resultados. Com isso, o estudo permitiu concluir que o modelo de classificação encontrado, através da técnica de Regressão Logística, é de extrema relevância para a empresa, resultando em uma redução dos custos com a contactação dos clientes e um aumento expressivo do volume de retorno desses contatos (Vendas).pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.courseEstatísticapt_BR
dc.sizeorduration59pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICApt_BR
dc.orcid.putcode139122791-
Appears in Collections:TCC - Estatística

Files in This Item:
File Description SizeFormat 
ClassificaçãoPerfilClientes.pdfTCC1.3 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.