Use este identificador para citar ou linkar para este item:
https://repositorio.ufu.br/handle/123456789/41843
ORCID: | http://orcid.org/0009-0009-3889-3098 |
Tipo do documento: | Trabalho de Conclusão de Curso |
Tipo de acesso: | Acesso Aberto |
Título: | Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira |
Autor(es): | Caetano, Tatiane Moreira |
Primeiro orientador: | Silva, José Waldemar da |
Primeiro membro da banca: | Silva, Maria Imaculada |
Segundo membro da banca: | Miranda, Vânia de Fátima |
Resumo: | A inadimplência é um desafio significativo para as instituições financeiras, impactando diretamente na sua saúde financeira e operacional. Identificar clientes propensos à inadimplência, com precisão e antecedência, pode contribuir para amenizar prejuízos ou para a maximização dos lucros. Os algoritmos de aprendizado supervisionado de máquina são úteis para a construção de modelos preditivos e neste caso em especial para classificação. Este estudo propõe uma análise comparativa entre três algoritmos de aprendizado de máquina para previsão de inadimplência, sendo eles a regressão logística, a árvore de decisão e a floresta aleatória aplicados aos dados originais, não normalizados e normalizados. Estas seis análises foram realizados com os dados não balanceados e balanceados pelas técnicas de SMOTE e ADASYN. O balanceamento consiste na geração de dados sintéticos na(s) classe(s) minoritárias, neste caso, na classe dos inadimplentes, para que o modelo possa ser bem treinado para realizar predições também nestas classes. Portanto, foram realizadas dezoito análises diferentes. A validação dos modelos é um ponto importante e consiste em aplicar o modelo treinado a uma parte dos dados, não utilizados no treinamento, e avaliar a sua performance por meio de alguma métrica de desempenho. Neste trabalho foram utilizadas as métricas acurácia, recall e F1-score. A metodologia, por meio da linguagem de programação Python, foi aplicada a um conjunto de dados do banco Stone composto por 7.081 clientes e 14 variáveis previsoras. Uma análise exploratória inicial foi realizada e não foram detectadas inconsistências ou dados faltantes. Identificou-se também, graficamente, que a distribuição das variáveis, em geral, são similares nas duas categorias, adimplentes e inadimplentes. Os resultados obtidos a partir da aplicação dos algoritmos, num total de dezoito análises, revelam que o melhor modelo foi obtido a partir do algoritmo floresta aleatória, nos casos com balanceamento, independente do tipo. A normalização dos dados não produziu alterações importantes nas métricas e portanto, para dados como estes considerados neste trabalho, bem como para os algoritmos utilizados, a normalização não se faz necessária. Haja vista a similaridade do algoritmo árvore de decisão com o algoritmo floresta aleatória, o primeiro pode ser indicado devido a sua simplicidade quando comparado ao segundo e, além disso, o algoritmo árvore de decisão demanda menor esforço computacional. |
Palavras-chave: | Árvore de decisão Aprendizado de máquina Floresta aleatória Inadimplência Regressão logística |
Área(s) do CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
Idioma: | por |
País: | Brasil |
Editora: | Universidade Federal de Uberlândia |
Referência: | CAETANO, Tatiane Moreira. Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira. 2024. 50 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2024. |
URI: | https://repositorio.ufu.br/handle/123456789/41843 |
Data de defesa: | 26-Abr-2024 |
Aparece nas coleções: | TCC - Estatística |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Projeto_TCC_TatianeMoreira.pdf | 774.31 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.