Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/43880
ORCID: | http://orcid.org/0009-0007-9037-6720 |
Document type: | Trabalho de Conclusão de Curso |
Access type: | Acesso Aberto |
Title: | Aprendizado de máquina aplicado a um estudo de caso de classificação de qualidade de maçãs |
Author: | Oliva, Julia Caratta |
First Advisor: | Altino, Sarah Arvelos |
First member of the Committee: | Gedraite, Rubens |
Second member of the Committee: | Bezerra, Thaylane da Rocha |
Summary: | O uso de aprendizado de máquina, do inglês Machine Learning (ML), tem se destacado por suas contribuições significativas em diversas áreas, incluindo a Engenharia Química, ao possibilitar a análise de grandes volumes de dados e a extração de padrões complexos. Modelos de classificação, em particular, têm sido amplamente aplicados para prever resultados em processos industriais, permitindo a automação de decisões e a melhoria da eficiência. Este estudo teve como foco a aplicação de diferentes técnicas ensemble em modelos de árvores de decisão, com o objetivo de investigar o desempenho dessas abordagens em problemas de classificação. Técnicas ensemble, como bagging e boosting, combinam múltiplos modelos para melhorar a performance geral, especialmente em cenários onde modelos individuais podem apresentar limitações em termos de precisão e robustez. A investigação visou avaliar o desempenho das técnicas de ensemble em comparação com modelos isolados, considerando métricas de performance como acurácia, precisão, recall e F1-score. Além disso, foram utilizadas técnicas de interpretabilidade de modelos, como o SHAP (Shapley Additive Explanations), para entender o impacto de cada variável nas previsões e garantir que os resultados fossem interpretáveis e aplicáveis a contextos industriais. A interpretabilidade é uma questão crítica, especialmente em áreas como a Engenharia Química, onde a compreensão das decisões do modelo pode ser tão importante quanto sua precisão. Os resultados demonstraram que ambas as técnicas de ensemble, bagging e boosting, tiveram bom desempenho, com alta acurácia e robustez na maioria das tarefas. No entanto, o boosting apresentou uma capacidade superior de ajuste dos erros, ao minimizar de forma mais eficaz os vieses presentes nos dados. Essa técnica mostrou-se particularmente eficiente em melhorar a performance em casos onde os modelos de árvore de decisão isolados enfrentaram dificuldades em lidar com outliers ou padrões complexos nos dados. As conclusões deste trabalho reforçam a importância de explorar diferentes técnicas de aprendizado de máquina e avaliar seu desempenho de forma criteriosa, considerando não apenas as métricas tradicionais, mas também a interpretabilidade dos modelos. Técnicas como boosting oferecem soluções promissoras para problemas complexos, garantindo que os modelos não apenas tenham boa performance, mas também possam ser compreendidos e aplicados de forma prática em ambientes reais. |
Abstract: | The use of machine learning (ML) has become prominent for its significant contributions across various fields, including Chemical Engineering, by enabling the analysis of large data volumes and extracting complex patterns. Classification models, in particular, have been widely applied to predict outcomes in industrial processes, allowing decision automation and efficiency improvements. This study focused on applying different ensemble techniques to decision tree models, aiming to investigate the performance of these approaches in classification problems. ensemble techniques, such as bagging and boosting, combine multiple models to improve overall performance, especially in scenarios where individual models may have limitations in terms of accuracy and robustness. The research aimed to evaluate the performance of ensemble techniques compared to standalone models, considering performance metrics such as accuracy, precision, recall, and F1-score. Additionally, model interpretability techniques, such as SHAP (Shapley Additive Explanations), were used to understand the impact of each variable on predictions and ensure that the results were interpretable and applicable to industrial contexts. Interpretability is a critical issue, especially in fields like Chemical Engineering, where understanding the model’s decisions can be as important as its accuracy. The results showed that both ensemble techniques, bagging and boosting, performed well, with high accuracy and robustness in most tasks. However, boosting exhibited a superior ability to adjust errors, effectively minimizing biases in the data. This technique proved particularly efficient in improving performance in cases where standalone decision tree models struggled with outliers or complex data patterns. The conclusions of this study reinforce the importance of exploring different machine learning techniques and evaluating their performance carefully, considering not only traditional metrics but also the interpretability of the models. Techniques like boosting offer promising solutions for complex problems, ensuring that models not only perform well but can also be understood and practically applied in real-world environments. |
Keywords: | Aprendizado de Máquina; Algoritmo; Engenharia Química; Modelo. Machine Learning; Algorithm; Chemical Engineering; Model. |
Area (s) of CNPq: | CNPQ::ENGENHARIAS::ENGENHARIA QUIMICA::TECNOLOGIA QUIMICA |
Language: | por |
Country: | Brasil |
Publisher: | Universidade Federal de Uberlândia |
Quote: | OLIVA, Julia Caratta. Aprendizado de máquina aplicado a um estudo de caso de classificação de qualidade de maçãs. 2024. 46 f. Trabalho de Conclusão de Curso (Graduação em Engenharia Química) - Universidade Federal de Uberlândia - 2024. |
URI: | https://repositorio.ufu.br/handle/123456789/43880 |
Date of defense: | 1-Nov-2024 |
Appears in Collections: | TCC - Engenharia Química |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TCC_JuliaCaratta_corrigido.pdf | 1.45 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.