Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/47641| ORCID: | http://orcid.org/0009-0004-3117-2443 |
| Document type: | Trabalho de Conclusão de Curso |
| Access type: | Acesso Aberto |
| Title: | Inteligência Artificial Explicável: Classificação de Lesões da Cavidade Oral com Modelos de Aprendizagem Profunda |
| Alternate title (s): | Explainable Artificial Intelligence: Classification of Oral Cavity Lesions Using Deep Learning Models |
| Author: | Guimarães, Rafael Henrique |
| First Advisor: | Nascimento , Marcelo Zanchetta do |
| First member of the Committee: | Silva , Adriano Barbosa |
| Second member of the Committee: | Ribeiro, Thiago Pirola |
| Summary: | A classificação histológica automatizada de displasias orais representa um desafio sig nificativo na patologia digital, demandando arquiteturas de aprendizado profundo que combinem alto desempenho com interpretabilidade clínica. Este trabalho teve como ob jetivo investigar e comparar a aplicação de duas arquiteturas modernas de redes neurais, Vision Transformer (ViT-Base16) e ResNeSt-50, para classificação automatizada de ima gens histológicas de displasia oral, com foco em explicabilidade através de técnicas de Inteligência Artificial Explicável (do inglês, eXplainable Artificial Intelligence- XAI). A metodologia experimental utilizou dois bancos de imagens histológicas de tecidos orais murinos, sendo o primeiro constituído por quatro classes: saudável, displasia leve, mode rada e severa e o respectivo com duas subfamílias representando duas variantes genéticas- wild-type (WT) e knockout (KO), ambos com 7 classes histopatológicas. Foram conduzi dos experimentos inicias para estabelecimento de baseline, seguidos de otimizações através de aumento de dados especializado para histologia (9 técnicas), regularização avançada e ajuste de hiperparâmetros. Para análise de explicabilidade, implementaram-se seis técni cas XAI distintas: três específicas para ViT (Grad-CAM tradicional, mapas de atenção nativos e Grad-CAM melhorado) e três para ResNeSt (Grad-CAM especializado, atenção CNN e Grad-CAM de entrada). Os resultados dos experimentos de baseline revelaram superioridade inicial do ResNeSt (72,41% vs 64,00% acurácia média), porém as otimiza ções resultaram em inversão completa desta hierarquia, com o ViT superando o ResNeSt (80,79% vs 78,63%). O ViT demonstrou maior responsividade às técnicas de otimização (+16,79% ganho médio vs +6,22% do ResNeSt), alcançando melhor resultado de 87,50% de acurácia no banco com 4 classes. As técnicas de otimização proporcionaram ganhos substanciais em desempenho médio (+11,51%), redução significativa de overfitting (gap treino-validação de 37,18% para 19,82%) e excelente concordância validação-teste (R2 = 0,9988). A análise XAI revelou evolução temporal consistente das explicações, corres pondência entre atenção dos modelos e características histopatológicas relevantes, com o ViT apresentando foco global enquanto o ResNeSt privilegiou detalhes locais. A va lidação clínica das explicações demonstrou identificação correta de regiões de invasão estromal em carcinomas, alterações epiteliais em displasias e espessamento tecidual em hiperplasias. Conclui-se que o ViT, quando adequadamente otimizado, supera arquitetu ras convolucionais especializadas em classificação histológica, oferecendo simultaneamente alto desempenho e interpretabilidade clínica, estabelecendo fundamentos para translação de inteligência artificial explicável para aplicações clínicas em patologia oral. |
| Abstract: | The automated histological classification of oral dysplasias represents a significant challenge in digital pathology, demanding deep learning architectures that combine high performance with clinical interpretability. This work aimed to investigate and compare the application of two modern neural network architectures, Vision Transformer (ViT-Base16) and ResNeSt-50, for the automated classification of histological images of oral dysplasia, with a focus on explainability through eXplainable Artificial Intelligence (XAI) techniques. The experimental methodology employed two datasets of murine oral tissue histological images: the first composed of four classes—healthy, mild, moderate, and severe dysplasia—and the second including two genetic variants, wild-type (WT) and knockout (KO), each comprising seven histopathological classes. Initial baseline experiments were conducted, followed by optimizations through histology-specific data augmentation (nine techniques), advanced regularization, and hyperparameter tuning. For explainability analysis, six distinct XAI techniques were implemented: three specific to ViT (traditional Grad-CAM, native attention maps, and enhanced Grad-CAM) and three for ResNeSt (specialized Grad-CAM, CNN attention, and input-based Grad-CAM). Baseline results revealed an initial superiority of ResNeSt (72.41% vs. 64.00% mean accuracy); however, after optimization, this hierarchy was completely reversed, with ViT outperforming ResNeSt (80.79% vs. 78.63%). ViT demonstrated greater responsiveness to optimization techniques (+16.79% average gain vs. +6.22% for ResNeSt), achieving a best accuracy of 87.50% on the four-class dataset. The optimization procedures provided substantial improvements in overall performance (+11.51%), a significant reduction in overfitting (training–validation gap reduced from 37.18% to 19.82%), and excellent validation–test agreement (R² = 0.9988). XAI analysis revealed consistent temporal evolution of explanations and correspondence between model attention and relevant histopathological features, with ViT showing a global focus while ResNeSt emphasized local details. Clinical validation of the explanations confirmed correct identification of stromal invasion regions in carcinomas, epithelial alterations in dysplasias, and tissue thickening in hyperplasias. It is concluded that ViT, when properly optimized, surpasses specialized convolutional architectures in histological classification, offering both high performance and clinical interpretability, thus establishing a foundation for the clinical translation of explainable artificial intelligence in oral pathology applications. |
| Keywords: | Vision Transformer ResNeSt Classificação Histológica Displasia Oral Inteligência Artificial Explicável |
| Area (s) of CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| Language: | por |
| Country: | Brasil |
| Publisher: | Universidade Federal de Uberlândia |
| Quote: | GUIMARÃES, Rafael Henrique. Inteligência Artificial Explicável: Classificação de Lesões da Cavidade Oral com Modelos de Aprendizagem Profunda. 2025. 96 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de Uberlândia, Uberlândia, 2025. |
| URI: | https://repositorio.ufu.br/handle/123456789/47641 |
| Date of defense: | 24-Sep-2025 |
| Appears in Collections: | TCC - Ciência da Computação |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Inteligência Artificial Explicável.pdf | Trabalho de Conclusão de Curso | 31.09 MB | Adobe PDF | ![]() View/Open |
This item is licensed under a Creative Commons License
