Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/45883
ORCID:  http://orcid.org/0009-0003-9854-8524
Document type: Trabalho de Conclusão de Curso
Access type: Acesso Aberto
Title: Geração e Aperfeiçoamento de Logotipos via Ajuste Fino no Stable Diffusion XL
Author: Duarte, Henrique Tornelli
First Advisor: Franklin, Dino Rogério Coinete
First member of the Committee: Sendin, Ivan da Silva
Second member of the Committee: Soares, Alexsandro Santos
Summary: Esta dissertação avalia técnicas de ajuste fino (fine-tuning) aplicadas ao Stable Diffusion XL (SDXL), versão de alta resolução do modelo de difusão latente, com foco na adaptação leve oferecida pelo LoRA—Low-Rank Adaptation, inserção de matrizes de baixa dimensão que exige bem menos parâmetros. Prepararam-se seis conjuntos de dados específicos (datasets): estrutura tipográfica (wordmark), símbolo gráfico (iconic) e estilização (minimalistic, vintage e cartoon). Cada conjunto foi treinado durante 10 épocas (epoch: ciclo completo em que o modelo percorre todo o conjunto de treinamento), empregando taxas de aprendizado distintas para o modulador de texto (encoder CLIP-Text) e para a U-Net responsável pela imagem. A fase experimental gerou 8 640 amostras, combinando sistematicamente a escala de orientação CFG (Classifier-Free Guidance), o número de etapas de denoising (Steps) e algoritmo de amostragem (sampler). As métricas adotadas incluíram similaridade CLIP (aderência semântica), acurácia OCR (legibilidade do texto) e avaliação humana. Os resultados mostram que o ajuste fino via LoRA guia a difusão para um espaço de soluções mais restrito e coerente, reduzindo ruído visual e variações indesejadas. A legibilidade textual saltou de 37% no modelo base para 88% após o ajuste, superando 92% quando se aplicou o pós-processamento de correção de texto (fix-text). A análise qualitativa confirma que a abordagem conserva o estilo desejado, melhora a precisão do nome da marca e permite diminuir o número total de etapas de amostragem. Conclui-se que o LoRA, aliado a curadoria criteriosa de dados e ajuste fino de hiperparâmetros, é a alternativa mais eficaz para especializar o SDXL na geração automática de logomarcas.
Abstract: This dissertation assesses fine-tuning techniques applied to Stable Diffusion XL (SDXL)—the high-resolution variant of the latent-diffusion model—with special emphasis on the lightweight approach offered by LoRA (Low-Rank Adaptation), which inserts low-dimensional matrices and therefore adds far fewer parameters. Six dedicated data sets were prepared: typographic structure (wordmark), graphic symbol (iconic), and three style filters (minimalistic, vintage, cartoon). Each set was trained for 10 epochs (an epoch is one complete pass through the entire training set), using different learning rates for the text modulator (CLIP-Text encoder) and for the image-generating U-Net. The experimental phase produced 8,640 samples, systematically combining the Classifier-Free Guidance scale (CFG), the number of denoising steps (Steps), and the sampling algorithm (sampler). Performance was measured with CLIP similarity (semantic adherence), OCR accuracy (text legibility), and human evaluation. Results show that LoRA fine-tuning steers diffusion toward a narrower, more coherent solution space, reducing visual noise and unwanted variation. Text legibility rose from 37 % in the base model to 88 % after adjustment, and exceeded 92 % when an optional text-correction post-process (fix-text) was applied. Qualitative analysis confirms that the procedure preserves the intended style, improves brand-name accuracy, and allows a reduction in the total number of sampling steps. The study concludes that LoRA—coupled with careful data curation and fine hyper-parameter tuning—is the most effective alternative for specializing SDXL in automatic logo generation.
Keywords: Geração de imagens
Stable Diffusion XL
LoRA
Logomarcas
Ajuste fino
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Quote: DUARTE, Henrique Tornelli. Geração e Aperfeiçoamento de Logotipos via Ajuste Fino no Stable Diffusion XL. 2025. 55 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Uberlândia, 2025.
URI: https://repositorio.ufu.br/handle/123456789/45883
Date of defense: 12-May-2025
Appears in Collections:TCC - Sistemas de Informação (Uberlândia)

Files in This Item:
File Description SizeFormat 
GeraçãoAperfeiçoamentoLogotipos.pdfTCC34.38 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.