Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/38593
ORCID:  http://orcid.org/0009-0008-0582-6035
Document type: Trabalho de Conclusão de Curso
Access type: Acesso Aberto
Title: Investigação de técnicas de aumento de dados para classificação de lesões da cavidade oral
Alternate title (s): Investigation of data augmentation techniques for oral cavity lesion classification
Author: Jesus, Diego Rodrigues de
First Advisor: Nascimento, Marcelo Zanchetta do
First member of the Committee: Gabriel, Paulo Henrique Ribeiro
Second member of the Committee: Silva, Adriano Barbosa
Summary: O diagnóstico precoce de câncer oral é fundamental na determinação do prognóstico do paciente, pois permite que profissionais de saúde adotem medidas preventivas, reduzindo o risco de evolução para estágios mais avançados da doença. No entanto, a avaliação de lesões da cavidade oral depende da interpretação por especialistas das características clínicas, o que pode levar a diferenças de opiniões e dificuldades no diagnóstico. O uso de sistemas de apoio ao diagnóstico pode ser aplicado como ferramenta para auxiliar e aprimorar a classificação e decisão do especialista, porém esses sistemas ainda possuem uma forte dependência de conjuntos robustos de dados para treinamento e a obtenção de imagens histológicas apresenta várias dificuldades e desafios. Com o objetivo de aprimorar o processo de diagnóstico de lesões da cavidade oral, este trabalho propõe o estudo de técnicas de aumento de dados como alternativa ao problema de escassez de imagens histológicas para etapa de classificação das lesões. São investigadas as técnicas de aumento de dados por transformações geométricas e Mixup, que consiste na combinação de duas ou mais amostras do conjunto de dados de treinamento para criar uma nova amostra aumentada. Para classificação foram utilizados os modelos CNNs ResNet50 e DenseNet201. A combinação das técnicas de aumento de dados por transformações geométricas e Mixup apresentaram os melhores resultados e maior capacidade de generalização. A estratégia obteve acurácia de 90,6% para o conjunto de displasia oral nos dois modelos de aumento de dados e, para o conjunto de saudáveis e carcinoma, apresentou valores de F1-Score de 91,7% com o modelo ResNet50 e 94,9% com o modelo DenseNet201. A investigação mostrou que a técnica Mixup não substitui técnicas convencionais de aumento de dados, no entanto pode complementa-las para o avanço na classificação.
Abstract: The early diagnosis of oral cancer is crucial in determining the patient's prognosis, as it allows healthcare professionals to take preventive measures, reducing the risk of progression to advanced stages of the disease. However, the evaluation of oral cavity lesions relies on the interpretation of clinical features by specialists, which can lead to differences in opinions and diagnostic challenges. The use of diagnostic support systems can be applied as a tool to assist and improve the classification and decision-making process of specialists. However, these systems still heavily depend on robust training datasets, and obtaining histological images poses several difficulties and challenges. To enhance the diagnostic process of oral cavity lesions, this study proposes the investigation of data augmentation techniques as an alternative to address the scarcity of histological images for the lesion classification stage. Data augmentation techniques involving geometric transformations and Mixup, which combines two or more samples from the training dataset to create a new augmented sample, are explored. For classification, the CNN models ResNet50 and DenseNet201 are utilized. The combination of data augmentation techniques involving geometric transformations and Mixup yielded the best results and demonstrated higher generalization capacity. The strategy achieved an accuracy of 90.6% for the oral dysplasia dataset using both data augmentation models. For the healthy and carcinoma dataset, it achieved F1-scores of 91.7% with the ResNet50 model and 94.9% with the DenseNet201 model. The investigation revealed that the Mixup technique does not replace conventional data augmentation techniques; however, it can complement them for advancements in classification.
Keywords: Redes neurais convolucionais
Lesões da cavidade oral
Aumento de dados
Imagens histológicas
Mixup
Displasia
Convolutional neural networks
Oral cavity lesions
Data augmentation
Histological images
Dysplasia
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Quote: JESUS, Diego Rodrigues de. Investigação de técnicas de aumento de dados para classificação de lesões da cavidade oral. 2023. 57 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Uberlândia, 2023.
URI: https://repositorio.ufu.br/handle/123456789/38593
Date of defense: 6-Jul-2023
Appears in Collections:TCC - Sistemas de Informação (Uberlândia)

Files in This Item:
File Description SizeFormat 
InvestigacaoTecnicasAumento.pdfTrabalho de Conclusão de Curso22.12 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons