Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/47641
ORCID:  http://orcid.org/0009-0004-3117-2443
Document type: Trabalho de Conclusão de Curso
Access type: Acesso Aberto
Title: Inteligência Artificial Explicável: Classificação de Lesões da Cavidade Oral com Modelos de Aprendizagem Profunda
Alternate title (s): Explainable Artificial Intelligence: Classification of Oral Cavity Lesions Using Deep Learning Models
Author: Guimarães, Rafael Henrique
First Advisor: Nascimento , Marcelo Zanchetta do
First member of the Committee: Silva , Adriano Barbosa
Second member of the Committee: Ribeiro, Thiago Pirola
Summary: A classificação histológica automatizada de displasias orais representa um desafio sig nificativo na patologia digital, demandando arquiteturas de aprendizado profundo que combinem alto desempenho com interpretabilidade clínica. Este trabalho teve como ob jetivo investigar e comparar a aplicação de duas arquiteturas modernas de redes neurais, Vision Transformer (ViT-Base16) e ResNeSt-50, para classificação automatizada de ima gens histológicas de displasia oral, com foco em explicabilidade através de técnicas de Inteligência Artificial Explicável (do inglês, eXplainable Artificial Intelligence- XAI). A metodologia experimental utilizou dois bancos de imagens histológicas de tecidos orais murinos, sendo o primeiro constituído por quatro classes: saudável, displasia leve, mode rada e severa e o respectivo com duas subfamílias representando duas variantes genéticas- wild-type (WT) e knockout (KO), ambos com 7 classes histopatológicas. Foram conduzi dos experimentos inicias para estabelecimento de baseline, seguidos de otimizações através de aumento de dados especializado para histologia (9 técnicas), regularização avançada e ajuste de hiperparâmetros. Para análise de explicabilidade, implementaram-se seis técni cas XAI distintas: três específicas para ViT (Grad-CAM tradicional, mapas de atenção nativos e Grad-CAM melhorado) e três para ResNeSt (Grad-CAM especializado, atenção CNN e Grad-CAM de entrada). Os resultados dos experimentos de baseline revelaram superioridade inicial do ResNeSt (72,41% vs 64,00% acurácia média), porém as otimiza ções resultaram em inversão completa desta hierarquia, com o ViT superando o ResNeSt (80,79% vs 78,63%). O ViT demonstrou maior responsividade às técnicas de otimização (+16,79% ganho médio vs +6,22% do ResNeSt), alcançando melhor resultado de 87,50% de acurácia no banco com 4 classes. As técnicas de otimização proporcionaram ganhos substanciais em desempenho médio (+11,51%), redução significativa de overfitting (gap treino-validação de 37,18% para 19,82%) e excelente concordância validação-teste (R2 = 0,9988). A análise XAI revelou evolução temporal consistente das explicações, corres pondência entre atenção dos modelos e características histopatológicas relevantes, com o ViT apresentando foco global enquanto o ResNeSt privilegiou detalhes locais. A va lidação clínica das explicações demonstrou identificação correta de regiões de invasão estromal em carcinomas, alterações epiteliais em displasias e espessamento tecidual em hiperplasias. Conclui-se que o ViT, quando adequadamente otimizado, supera arquitetu ras convolucionais especializadas em classificação histológica, oferecendo simultaneamente alto desempenho e interpretabilidade clínica, estabelecendo fundamentos para translação de inteligência artificial explicável para aplicações clínicas em patologia oral.
Abstract: The automated histological classification of oral dysplasias represents a significant challenge in digital pathology, demanding deep learning architectures that combine high performance with clinical interpretability. This work aimed to investigate and compare the application of two modern neural network architectures, Vision Transformer (ViT-Base16) and ResNeSt-50, for the automated classification of histological images of oral dysplasia, with a focus on explainability through eXplainable Artificial Intelligence (XAI) techniques. The experimental methodology employed two datasets of murine oral tissue histological images: the first composed of four classes—healthy, mild, moderate, and severe dysplasia—and the second including two genetic variants, wild-type (WT) and knockout (KO), each comprising seven histopathological classes. Initial baseline experiments were conducted, followed by optimizations through histology-specific data augmentation (nine techniques), advanced regularization, and hyperparameter tuning. For explainability analysis, six distinct XAI techniques were implemented: three specific to ViT (traditional Grad-CAM, native attention maps, and enhanced Grad-CAM) and three for ResNeSt (specialized Grad-CAM, CNN attention, and input-based Grad-CAM). Baseline results revealed an initial superiority of ResNeSt (72.41% vs. 64.00% mean accuracy); however, after optimization, this hierarchy was completely reversed, with ViT outperforming ResNeSt (80.79% vs. 78.63%). ViT demonstrated greater responsiveness to optimization techniques (+16.79% average gain vs. +6.22% for ResNeSt), achieving a best accuracy of 87.50% on the four-class dataset. The optimization procedures provided substantial improvements in overall performance (+11.51%), a significant reduction in overfitting (training–validation gap reduced from 37.18% to 19.82%), and excellent validation–test agreement (R² = 0.9988). XAI analysis revealed consistent temporal evolution of explanations and correspondence between model attention and relevant histopathological features, with ViT showing a global focus while ResNeSt emphasized local details. Clinical validation of the explanations confirmed correct identification of stromal invasion regions in carcinomas, epithelial alterations in dysplasias, and tissue thickening in hyperplasias. It is concluded that ViT, when properly optimized, surpasses specialized convolutional architectures in histological classification, offering both high performance and clinical interpretability, thus establishing a foundation for the clinical translation of explainable artificial intelligence in oral pathology applications.
Keywords: Vision Transformer
ResNeSt
Classificação Histológica
Displasia Oral
Inteligência Artificial Explicável
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Quote: GUIMARÃES, Rafael Henrique. Inteligência Artificial Explicável: Classificação de Lesões da Cavidade Oral com Modelos de Aprendizagem Profunda. 2025. 96 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de Uberlândia, Uberlândia, 2025.
URI: https://repositorio.ufu.br/handle/123456789/47641
Date of defense: 24-Sep-2025
Appears in Collections:TCC - Ciência da Computação

Files in This Item:
File Description SizeFormat 
Inteligência Artificial Explicável.pdfTrabalho de Conclusão de Curso31.09 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons