Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufu.br/handle/123456789/41843
ORCID:  http://orcid.org/0009-0009-3889-3098
Tipo de documento: Trabalho de Conclusão de Curso
Tipo de acceso: Acesso Aberto
Título: Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira
Autor: Caetano, Tatiane Moreira
Primer orientador: Silva, José Waldemar da
Primer miembro de la banca: Silva, Maria Imaculada
Segundo miembro de la banca: Miranda, Vânia de Fátima
Resumen: A inadimplência é um desafio significativo para as instituições financeiras, impactando diretamente na sua saúde financeira e operacional. Identificar clientes propensos à inadimplência, com precisão e antecedência, pode contribuir para amenizar prejuízos ou para a maximização dos lucros. Os algoritmos de aprendizado supervisionado de máquina são úteis para a construção de modelos preditivos e neste caso em especial para classificação. Este estudo propõe uma análise comparativa entre três algoritmos de aprendizado de máquina para previsão de inadimplência, sendo eles a regressão logística, a árvore de decisão e a floresta aleatória aplicados aos dados originais, não normalizados e normalizados. Estas seis análises foram realizados com os dados não balanceados e balanceados pelas técnicas de SMOTE e ADASYN. O balanceamento consiste na geração de dados sintéticos na(s) classe(s) minoritárias, neste caso, na classe dos inadimplentes, para que o modelo possa ser bem treinado para realizar predições também nestas classes. Portanto, foram realizadas dezoito análises diferentes. A validação dos modelos é um ponto importante e consiste em aplicar o modelo treinado a uma parte dos dados, não utilizados no treinamento, e avaliar a sua performance por meio de alguma métrica de desempenho. Neste trabalho foram utilizadas as métricas acurácia, recall e F1-score. A metodologia, por meio da linguagem de programação Python, foi aplicada a um conjunto de dados do banco Stone composto por 7.081 clientes e 14 variáveis previsoras. Uma análise exploratória inicial foi realizada e não foram detectadas inconsistências ou dados faltantes. Identificou-se também, graficamente, que a distribuição das variáveis, em geral, são similares nas duas categorias, adimplentes e inadimplentes. Os resultados obtidos a partir da aplicação dos algoritmos, num total de dezoito análises, revelam que o melhor modelo foi obtido a partir do algoritmo floresta aleatória, nos casos com balanceamento, independente do tipo. A normalização dos dados não produziu alterações importantes nas métricas e portanto, para dados como estes considerados neste trabalho, bem como para os algoritmos utilizados, a normalização não se faz necessária. Haja vista a similaridade do algoritmo árvore de decisão com o algoritmo floresta aleatória, o primeiro pode ser indicado devido a sua simplicidade quando comparado ao segundo e, além disso, o algoritmo árvore de decisão demanda menor esforço computacional.
Palabras clave: Árvore de decisão
Aprendizado de máquina
Floresta aleatória
Inadimplência
Regressão logística
Área (s) del CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
Idioma: por
País: Brasil
Editora: Universidade Federal de Uberlândia
Cita: CAETANO, Tatiane Moreira. Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira. 2024. 50 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2024.
URI: https://repositorio.ufu.br/handle/123456789/41843
Fecha de defensa: 26-abr-2024
Aparece en las colecciones:TCC - Estatística

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
Projeto_TCC_TatianeMoreira.pdf774.31 kBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.