Entre rimas e algoritmos: uma investigação sobre tradução automática poética

Borges, Beatriz Ribeiro

Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/48296

Full metadata record

DC Field	Value	Language
dc.creator	Borges, Beatriz Ribeiro	-
dc.date.accessioned	2026-02-13T13:28:37Z	-
dc.date.available	2026-02-13T13:28:37Z	-
dc.date.issued	2026-02-11	-
dc.identifier.citation	BORGES, Beatriz Ribeiro. Entre rimas e algoritmos: uma investigação sobre tradução automática poética. 2026. 120 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2026. DOI http://doi.org/10.14393/ufu.di.2026.110.	pt_BR
dc.identifier.uri	https://repositorio.ufu.br/handle/123456789/48296	-
dc.description.abstract	Poetry translation is a complex task that extends beyond semantic transfer, requiring the preservation of rhythm, rhyme, imagery, stylistic elements, and cultural nuances. Despite advances in neural machine translation, these systems still show limitations in literary and poetic contexts. This work investigates the capabilities of automatic translation systems across six language pairs (Portuguese–English, English–Portuguese, Portuguese–French, French–Portuguese, English–French, and French–English), comparing specialized machine translation (MT) models, such as Google Translate, MarianMT, mBART, and OpenNMT (RNN), including fine-tuned versions trained on poetic and music lyrics corpora, with large language models (LLMs) such as ChatGPT and Maritaca AI. A three-phase evaluation pipeline was implemented, combining (i) automatic metrics (BLEU, METEOR, BERTScore, BARTScore) to assess lexical and semantic similarity, (ii) topic modeling with BERTopic to evaluate thematic preservation, and (iii) expert human evaluation focusing on poetic structure, style, fluency, and meaning. Results indicate that LLMs, and also Google Translate, consistently outperform traditional MT models, while OpenNMT with Recurrent Neural Network (RNN) performed worst. Prompt design influenced LLM performance: ChatGPT favored general prompts for higher semantic fidelity, whereas Maritaca AI better integrated explicit poetic instructions in portuguese. Human evaluation confirmed superior scores for LLMs in fluency and meaning preservation, though all models struggled with poetic Structure and stylistic. Topic modeling showed that top-performing models better preserved thematic consistency, often aligning more closely with human reference translations than with original poems. Fine-tuning effects were architecture-dependent: mBART benefited from poems and song lyrics, while MarianMT and OpenNMT (RNN) showed limited gains.	pt_BR
dc.description.sponsorship	CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior	pt_BR
dc.language	eng	pt_BR
dc.publisher	Universidade Federal de Uberlândia	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	*
dc.subject	Tradução de Poesia	pt_BR
dc.subject	Poetry Translation	pt_BR
dc.subject	Tradução Automática Neural	pt_BR
dc.subject	Neural Machine Translation	pt_BR
dc.subject	Modelos de Linguagem de Grande Escala	pt_BR
dc.subject	Large Language Models	pt_BR
dc.subject	Processamento de Linguagem Natural	pt_BR
dc.subject	Natural Language Processing	pt_BR
dc.title	Entre rimas e algoritmos: uma investigação sobre tradução automática poética	pt_BR
dc.title.alternative	Between rhymes and algorithms: an investigation into poetic machine translation	pt_BR
dc.type	Dissertação	pt_BR
dc.contributor.advisor-co1	Gabriel, Paulo Henrique Ribeiro	-
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/3181954061121790	pt_BR
dc.contributor.advisor1	Paiva, Elaine Ribeiro de Faria	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/8238524390290386	pt_BR
dc.contributor.referee1	Carneiro, Murillo Guimarães	-
dc.contributor.referee1Lattes	http://lattes.cnpq.br/8158868389973535	pt_BR
dc.contributor.referee2	Marcacini, Ricardo Marcondes	-
dc.contributor.referee2Lattes	http://lattes.cnpq.br/3272611282260295	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/4183941256471858	pt_BR
dc.description.degreename	Dissertação (Mestrado)	pt_BR
dc.description.resumo	A tradução poética é uma tarefa complexa que vai além da simples transferência semântica, exigindo a preservação de ritmo, rima, imagens, elementos estilísticos e nuances culturais. Apesar dos avanços na tradução automática, esses sistemas ainda apresentam limitações em contextos literários e poéticos. Este trabalho investiga as capacidades de modelos de tradução automática (TA) em seis pares de línguas (Português–Inglês, Inglês–Português, Português–Francês, Francês–Português, Inglês–Francês e Francês–Inglês), comparando modelos de tradução especializados, como Google Translate, MarianMT, mBART e OpenNMT usando Rede Recorrente Neural (RNN), incluindo fine-tuning com corpora de poemas e letras de música, com grandes modelos de linguagem (LLMs) como ChatGPT e Maritaca AI. Foi implementado um pipeline de avaliação em três fases, combinando (i) métricas automáticas (BLEU, METEOR, BERTScore, BARTScore) para medir similaridade lexical e semântica, (ii) modelagem de tópicos com BERTopic para avaliar a preservação temática, e (iii) avaliação humana especializada focada em estrutura poética, estilo, fluência e significado. Os resultados indicam que os LLMs e o Google Translate, superam consistentemente os modelos tradicionais de TA, enquanto o OpenNMT (RNN) apresentou desempenho inferior. O uso do prompt influenciou o desempenho dos LLMs: ChatGPT obteve maior fidelidade semântica com prompts gerais, enquanto Maritaca AI integrou melhor instruções poéticas explícitas em português. A avaliação humana confirmou melhores pontuações para LLMs em fluência e preservação do significado, embora todos os modelos tenham dificuldades em estrutura e estilo Poético. A modelagem de tópicos confirmou que esses modelos preservam melhor a consistência temática, muitas vezes alinhando-se mais às traduções humanas de referência do que aos poemas originais. Os efeitos do fine-tuning foram dependentes da arquitetura: mBART se beneficiou de poemas e letras de música, ao contrário do MarianMT e OpenNMT (RNN).	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Programa de Pós-graduação em Ciência da Computação	pt_BR
dc.sizeorduration	120	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
dc.identifier.doi	http://doi.org/10.14393/ufu.di.2026.110	pt_BR
dc.orcid.putcode	205680375	-
dc.crossref.doibatchid	8e947aab-8a04-4d87-9c9f-f80fa4ae6e7d	-
dc.subject.autorizado	Computação	pt_BR
dc.subject.ods	ODS::ODS 9. Indústria, Inovação e infraestrutura - Construir infraestrutura resiliente, promover a industrialização inclusiva e sustentável, e fomentar a inovação.	pt_BR
Appears in Collections:	DISSERTAÇÃO - Ciência da Computação

Files in This Item:

File	Description	Size	Format
EntreRimasAlgoritmos.pdf	Dissertação	7.79 MB	Adobe PDF	View/Open

Show simple item record

This item is licensed under a Creative Commons License