Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufu.br/handle/123456789/45883
Registro completo de metadatos
Campo DCValorLengua/Idioma
dc.creatorDuarte, Henrique Tornelli-
dc.date.accessioned2025-05-27T15:05:32Z-
dc.date.available2025-05-27T15:05:32Z-
dc.date.issued2025-05-12-
dc.identifier.citationDUARTE, Henrique Tornelli. Geração e Aperfeiçoamento de Logotipos via Ajuste Fino no Stable Diffusion XL. 2025. 55 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Uberlândia, 2025.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/45883-
dc.description.abstractThis dissertation assesses fine-tuning techniques applied to Stable Diffusion XL (SDXL)—the high-resolution variant of the latent-diffusion model—with special emphasis on the lightweight approach offered by LoRA (Low-Rank Adaptation), which inserts low-dimensional matrices and therefore adds far fewer parameters. Six dedicated data sets were prepared: typographic structure (wordmark), graphic symbol (iconic), and three style filters (minimalistic, vintage, cartoon). Each set was trained for 10 epochs (an epoch is one complete pass through the entire training set), using different learning rates for the text modulator (CLIP-Text encoder) and for the image-generating U-Net. The experimental phase produced 8,640 samples, systematically combining the Classifier-Free Guidance scale (CFG), the number of denoising steps (Steps), and the sampling algorithm (sampler). Performance was measured with CLIP similarity (semantic adherence), OCR accuracy (text legibility), and human evaluation. Results show that LoRA fine-tuning steers diffusion toward a narrower, more coherent solution space, reducing visual noise and unwanted variation. Text legibility rose from 37 % in the base model to 88 % after adjustment, and exceeded 92 % when an optional text-correction post-process (fix-text) was applied. Qualitative analysis confirms that the procedure preserves the intended style, improves brand-name accuracy, and allows a reduction in the total number of sampling steps. The study concludes that LoRA—coupled with careful data curation and fine hyper-parameter tuning—is the most effective alternative for specializing SDXL in automatic logo generation.pt_BR
dc.description.sponsorshipPesquisa sem auxílio de agências de fomentopt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectGeração de imagenspt_BR
dc.subjectStable Diffusion XLpt_BR
dc.subjectLoRApt_BR
dc.subjectLogomarcaspt_BR
dc.subjectAjuste finopt_BR
dc.titleGeração e Aperfeiçoamento de Logotipos via Ajuste Fino no Stable Diffusion XLpt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.contributor.advisor1Franklin, Dino Rogério Coinete-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/7261645723214792pt_BR
dc.contributor.referee1Sendin, Ivan da Silva-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/3974513105953302pt_BR
dc.contributor.referee2Soares, Alexsandro Santos-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/8559724221713699pt_BR
dc.description.degreenameTrabalho de Conclusão de Curso (Graduação)pt_BR
dc.description.resumoEsta dissertação avalia técnicas de ajuste fino (fine-tuning) aplicadas ao Stable Diffusion XL (SDXL), versão de alta resolução do modelo de difusão latente, com foco na adaptação leve oferecida pelo LoRA—Low-Rank Adaptation, inserção de matrizes de baixa dimensão que exige bem menos parâmetros. Prepararam-se seis conjuntos de dados específicos (datasets): estrutura tipográfica (wordmark), símbolo gráfico (iconic) e estilização (minimalistic, vintage e cartoon). Cada conjunto foi treinado durante 10 épocas (epoch: ciclo completo em que o modelo percorre todo o conjunto de treinamento), empregando taxas de aprendizado distintas para o modulador de texto (encoder CLIP-Text) e para a U-Net responsável pela imagem. A fase experimental gerou 8 640 amostras, combinando sistematicamente a escala de orientação CFG (Classifier-Free Guidance), o número de etapas de denoising (Steps) e algoritmo de amostragem (sampler). As métricas adotadas incluíram similaridade CLIP (aderência semântica), acurácia OCR (legibilidade do texto) e avaliação humana. Os resultados mostram que o ajuste fino via LoRA guia a difusão para um espaço de soluções mais restrito e coerente, reduzindo ruído visual e variações indesejadas. A legibilidade textual saltou de 37% no modelo base para 88% após o ajuste, superando 92% quando se aplicou o pós-processamento de correção de texto (fix-text). A análise qualitativa confirma que a abordagem conserva o estilo desejado, melhora a precisão do nome da marca e permite diminuir o número total de etapas de amostragem. Conclui-se que o LoRA, aliado a curadoria criteriosa de dados e ajuste fino de hiperparâmetros, é a alternativa mais eficaz para especializar o SDXL na geração automática de logomarcas.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.courseSistemas de Informaçãopt_BR
dc.sizeorduration55pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.orcid.putcode184905304-
Aparece en las colecciones:TCC - Sistemas de Informação (Uberlândia)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
GeraçãoAperfeiçoamentoLogotipos.pdfTCC34.38 MBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.