Use este identificador para citar ou linkar para este item: https://repositorio.ufu.br/handle/123456789/41843
ORCID:  http://orcid.org/0009-0009-3889-3098
Tipo do documento: Trabalho de Conclusão de Curso
Tipo de acesso: Acesso Aberto
Título: Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira
Autor(es): Caetano, Tatiane Moreira
Primeiro orientador: Silva, José Waldemar da
Primeiro membro da banca: Silva, Maria Imaculada
Segundo membro da banca: Miranda, Vânia de Fátima
Resumo: A inadimplência é um desafio significativo para as instituições financeiras, impactando diretamente na sua saúde financeira e operacional. Identificar clientes propensos à inadimplência, com precisão e antecedência, pode contribuir para amenizar prejuízos ou para a maximização dos lucros. Os algoritmos de aprendizado supervisionado de máquina são úteis para a construção de modelos preditivos e neste caso em especial para classificação. Este estudo propõe uma análise comparativa entre três algoritmos de aprendizado de máquina para previsão de inadimplência, sendo eles a regressão logística, a árvore de decisão e a floresta aleatória aplicados aos dados originais, não normalizados e normalizados. Estas seis análises foram realizados com os dados não balanceados e balanceados pelas técnicas de SMOTE e ADASYN. O balanceamento consiste na geração de dados sintéticos na(s) classe(s) minoritárias, neste caso, na classe dos inadimplentes, para que o modelo possa ser bem treinado para realizar predições também nestas classes. Portanto, foram realizadas dezoito análises diferentes. A validação dos modelos é um ponto importante e consiste em aplicar o modelo treinado a uma parte dos dados, não utilizados no treinamento, e avaliar a sua performance por meio de alguma métrica de desempenho. Neste trabalho foram utilizadas as métricas acurácia, recall e F1-score. A metodologia, por meio da linguagem de programação Python, foi aplicada a um conjunto de dados do banco Stone composto por 7.081 clientes e 14 variáveis previsoras. Uma análise exploratória inicial foi realizada e não foram detectadas inconsistências ou dados faltantes. Identificou-se também, graficamente, que a distribuição das variáveis, em geral, são similares nas duas categorias, adimplentes e inadimplentes. Os resultados obtidos a partir da aplicação dos algoritmos, num total de dezoito análises, revelam que o melhor modelo foi obtido a partir do algoritmo floresta aleatória, nos casos com balanceamento, independente do tipo. A normalização dos dados não produziu alterações importantes nas métricas e portanto, para dados como estes considerados neste trabalho, bem como para os algoritmos utilizados, a normalização não se faz necessária. Haja vista a similaridade do algoritmo árvore de decisão com o algoritmo floresta aleatória, o primeiro pode ser indicado devido a sua simplicidade quando comparado ao segundo e, além disso, o algoritmo árvore de decisão demanda menor esforço computacional.
Palavras-chave: Árvore de decisão
Aprendizado de máquina
Floresta aleatória
Inadimplência
Regressão logística
Área(s) do CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
Idioma: por
País: Brasil
Editora: Universidade Federal de Uberlândia
Referência: CAETANO, Tatiane Moreira. Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira. 2024. 50 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2024.
URI: https://repositorio.ufu.br/handle/123456789/41843
Data de defesa: 26-Abr-2024
Aparece nas coleções:TCC - Estatística

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Projeto_TCC_TatianeMoreira.pdf774.31 kBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.