Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/41843
Full metadata record
DC FieldValueLanguage
dc.creatorCaetano, Tatiane Moreira-
dc.date.accessioned2024-07-25T19:02:04Z-
dc.date.available2024-07-25T19:02:04Z-
dc.date.issued2024-04-26-
dc.identifier.citationCAETANO, Tatiane Moreira. Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira. 2024. 50 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2024.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/41843-
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectÁrvore de decisãopt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectFloresta aleatóriapt_BR
dc.subjectInadimplênciapt_BR
dc.subjectRegressão logísticapt_BR
dc.titleAlgoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeirapt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.contributor.advisor1Silva, José Waldemar da-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3076056770753848pt_BR
dc.contributor.referee1Silva, Maria Imaculada-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/5214152217965576pt_BR
dc.contributor.referee2Miranda, Vânia de Fátima-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/8593958950706880pt_BR
dc.description.degreenameTrabalho de Conclusão de Curso (Graduação)pt_BR
dc.description.resumoA inadimplência é um desafio significativo para as instituições financeiras, impactando diretamente na sua saúde financeira e operacional. Identificar clientes propensos à inadimplência, com precisão e antecedência, pode contribuir para amenizar prejuízos ou para a maximização dos lucros. Os algoritmos de aprendizado supervisionado de máquina são úteis para a construção de modelos preditivos e neste caso em especial para classificação. Este estudo propõe uma análise comparativa entre três algoritmos de aprendizado de máquina para previsão de inadimplência, sendo eles a regressão logística, a árvore de decisão e a floresta aleatória aplicados aos dados originais, não normalizados e normalizados. Estas seis análises foram realizados com os dados não balanceados e balanceados pelas técnicas de SMOTE e ADASYN. O balanceamento consiste na geração de dados sintéticos na(s) classe(s) minoritárias, neste caso, na classe dos inadimplentes, para que o modelo possa ser bem treinado para realizar predições também nestas classes. Portanto, foram realizadas dezoito análises diferentes. A validação dos modelos é um ponto importante e consiste em aplicar o modelo treinado a uma parte dos dados, não utilizados no treinamento, e avaliar a sua performance por meio de alguma métrica de desempenho. Neste trabalho foram utilizadas as métricas acurácia, recall e F1-score. A metodologia, por meio da linguagem de programação Python, foi aplicada a um conjunto de dados do banco Stone composto por 7.081 clientes e 14 variáveis previsoras. Uma análise exploratória inicial foi realizada e não foram detectadas inconsistências ou dados faltantes. Identificou-se também, graficamente, que a distribuição das variáveis, em geral, são similares nas duas categorias, adimplentes e inadimplentes. Os resultados obtidos a partir da aplicação dos algoritmos, num total de dezoito análises, revelam que o melhor modelo foi obtido a partir do algoritmo floresta aleatória, nos casos com balanceamento, independente do tipo. A normalização dos dados não produziu alterações importantes nas métricas e portanto, para dados como estes considerados neste trabalho, bem como para os algoritmos utilizados, a normalização não se faz necessária. Haja vista a similaridade do algoritmo árvore de decisão com o algoritmo floresta aleatória, o primeiro pode ser indicado devido a sua simplicidade quando comparado ao segundo e, além disso, o algoritmo árvore de decisão demanda menor esforço computacional.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.courseEstatísticapt_BR
dc.sizeorduration50pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICApt_BR
dc.orcid.putcode164350452-
Appears in Collections:TCC - Estatística

Files in This Item:
File Description SizeFormat 
Projeto_TCC_TatianeMoreira.pdf774.31 kBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.