Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/47698
ORCID:  http://orcid.org/0009-0002-2937-982X
Document type: Trabalho de Conclusão de Curso
Access type: Acesso Aberto
Title: Desenvolvimento e avaliação de chatbot pedagógico open source com RAG para educação online
Alternate title (s): Development and evaluation of an open source pedagogical chatbot with RAG for online education
Author: Borges, Jonathan Martins
First Advisor: Araújo, Rafael Dias
First member of the Committee: Pereira, Fabíola Souza Fernandes
Second member of the Committee: Escarpinati, Mauricio Cunha
Summary: Este trabalho detalha uma metodologia abrangente para o desenvolvimento e avaliação de um chatbot pedagógico em plataformas educacionais, priorizando a acessibilidade e reprodutibilidade com ferramentas open source. O processo iniciou-se com a construção de um dataset detalhado do curso CS50, empregando técnicas de web scraping e processamento de texto para estruturar a base de conhecimento. Com base neste dataset, geraram-se dados sintéticos de Perguntas e Respostas (QA) ricos e diversificados, formulados segundo os níveis cognitivos da Taxonomia de Bloom. A qualidade destes dados foi rigorosamente avaliada por meio de métricas automáticas do framework RAGAS, tais como Faithfulness, Question Quality (via Simple Criteria Score) e Response Relevancy. Esta abordagem foi complementada por supervisão humana, e a análise subsequente revelou correlações moderadas, mas estatisticamente significativas, entre as métricas automáticas e as avaliações humanas, validando a utilidade do RAGAS. A etapa seguinte consistiu na avaliação do chatbot pedagógico, implementado com o software OpenWebUI e alimentado pela base de conhecimento do CS50. Compararam-se os modelos Gemini-2.0-Flash (proprietário) e GPT-OSS-20B (open-weight) na geração de respostas. Os resultados não apontaram diferença estatisticamente significativa na métrica Factual Correctness entre o modelo proprietário e o open-weight. Este achado reforça a viabilidade técnica de soluções open source para fornecer suporte pedagógico factualmente correto, mitigando custos e promovendo um cenário educacional mais inclusivo e equitativo.
Abstract: This paper details a comprehensive methodology for the development and evaluation of a pedagogical chatbot for educational platforms, prioritizing accessibility and reproducibility with open-source tools. The process began with the construction of a detailed dataset from the CS50 course, employing web scraping and text processing techniques to structure the knowledge base. Based on this dataset, rich and diverse synthetic Question-Answer (QA) data were generated, formulated according to the cognitive levels of Bloom's Taxonomy. The quality of this data was rigorously evaluated using automated metrics from the RAGAS framework, such as Faithfulness, Question Quality (via Simple Criteria Score), and Response Relevancy. This approach was complemented by human supervision, and the subsequent analysis revealed moderate, yet statistically significant, correlations between the automated metrics and human assessments, thereby validating the utility of RAGAS. The next stage consisted of evaluating the pedagogical chatbot, implemented with the OpenWebUI software and powered by the CS50 knowledge base. A comparison was made between the Gemini-2.0-Flash (proprietary) and GPT-OSS-20B (open-weight) models in response generation. The results indicated no statistically significant difference in the Factual Correctness metric between the proprietary and the open-weight models. This finding reinforces the technical viability of open-source solutions for providing factually correct pedagogical support, mitigating costs and promoting a more inclusive and equitable educational landscape.
Keywords: Inteligência artificial na educação
Artificial Intelligence in education
LLMs
Chatbots pedagógicos
Pedagogical chatbots
RAG
Open source
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Quote: BORGES, Jonathan Martins. Desenvolvimento e avaliação de chatbot pedagógico open source com RAG para educação online. 2025. 96 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Uberlândia, 2025.
URI: https://repositorio.ufu.br/handle/123456789/47698
Date of defense: 3-Oct-2025
Appears in Collections:TCC - Sistemas de Informação (Monte Carmelo)

Files in This Item:
File Description SizeFormat 
DesenvolvimentoAvaliacaoChatbot.pdf4.8 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons