Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/48089
ORCID:  http://orcid.org/0009-0000-9815-3176
Document type: Dissertação
Access type: Acesso Aberto
Title: Aplicação de algoritmos de machine learning para análise e predição de desfechos clínicos em pacientes com covid-19
Alternate title (s): Application of machine learning algorithms for the analysis and prediction of clinical outcomes in patients with COVID-19
Author: Rezende, Bruno Fonseca
First Advisor: Amaral, Laurence Rodrigues
First member of the Committee: Borges, Lucio Campos
Second member of the Committee: Bertarini, Pedro Luiz Lima
Summary: A pandemia de COVID-19 impôs desafios significativos aos sistemas de saúde, especialmente pela rápida evolução clínica e pela necessidade de decisões imediatas sobre suporte ventilatório e internação em UTI, revelando a lacuna no uso de ferramentas objetivas capazes de auxiliar a estratificação precoce do risco e a previsão de prognóstico em pacientes hospitalizados. Nesse contexto, modelos de Aprendizado de Máquina (ML), como árvores de decisão, apresentam potencial para apoiar a tomada de decisão clínica por permitirem analisar múltiplas variáveis simultaneamente e gerar resultados interpretáveis. O objetivo deste estudo foi aplicar algoritmos de ML a dados clínicos de pacientes com COVID-19 a fim de prever desfechos relevantes e identificar fatores associados à gravidade da doença. Trata-se de um estudo retrospectivo e quantitativo, baseado em dados secundários provenientes do banco público de Síndrome Respiratória Aguda Grave (SRAG) da cidade de Londrina (Paraná), contendo inicialmente 15.655 registros de pacientes hospitalizados entre janeiro de 2021 e fevereiro de 2022. Após filtragem e organização das variáveis, foram utilizados 5.704 registros no modelo de desfecho e 7.182 nos modelos complementares. As análises foram realizadas no software WEKA (v.3.8.6), utilizando o algoritmo J48 com validação cruzada, após seleção e eliminação de atributos incompletos. Os modelos desenvolvidos alcançaram acurácia aproximada de 80% na classificação dos casos. O tipo de suporte ventilatório emergiu como principal preditor tanto na etapa de triagem quanto na previsão do desfecho final, seguido por internação em UTI, presença de doença cardíaca, idade e tipo de hospital. Os resultados demonstraram que a ventilação mecânica invasiva e a internação em UTI estiveram fortemente associadas ao óbito, enquanto o uso de ventilação não invasiva e a ausência de suporte ventilatório relacionaram-se à cura. A idade avançada intensificou o risco de mortalidade nos pacientes sob ventilação invasiva, e o tipo de hospital influenciou o prognóstico entre os pacientes não admitidos em UTI, com maior mortalidade em hospitais públicos. Conclui-se que as árvores de decisão mostraram-se eficazes na identificação de fatores preditores de gravidade em pacientes hospitalizados com COVID-19, oferecendo modelos de fácil interpretação clínica e potencial aplicação na estratificação de risco, no direcionamento de recursos e na organização do cuidado em ambiente hospitalar, especialmente em situações de sobrecarga assistencial como a vivenciada durante a pandemia.
Abstract: The COVID-19 pandemic imposed substantial challenges on healthcare systems worldwide, particularly due to the rapid clinical deterioration observed in many patients and the urgent need to allocate ventilatory support and intensive care resources efficiently, highlighting a gap in objective tools capable of assisting early risk stratification and outcome prediction. In this context, Machine Learning (ML) models, such as decision trees, offer the potential to support clinical decision-making by analyzing multiple variables simultaneously and generating easily interpretable predictive structures. This study aimed to apply ML algorithms to clinical data from hospitalized patients with COVID-19 to predict relevant clinical outcomes and identify factors associated with disease severity. This retrospective, quantitative study used secondary data from the public Severe Acute Respiratory Infection (SARI) database of Londrina, Paraná, Brazil, which initially contained 15,655 records of hospitalized patients between January 2021 and February 2022. After data cleaning and preprocessing, 5,704 records were used for the outcome prediction model and 7,182 for complementary analyses. Data were analyzed using the WEKA software (v.3.8.6) with the J48 decision tree algorithm and cross-validation, following attribute selection and removal of redundant or incomplete variables. The generated models achieved approximately 80% accuracy. Type of ventilatory support emerged as the most relevant predictor across analyses, followed by ICU admission, preexisting heart disease, age, and hospital type. Results showed that invasive mechanical ventilation and ICU admission were strongly associated with mortality, whereas non-invasive ventilation or absence of ventilatory support were associated with recovery. Advanced age substantially increased mortality risk among patients receiving invasive ventilation, and hospital type influenced outcomes among those not admitted to the ICU, with higher mortality in public hospitals. The study concludes that decision tree models are effective for identifying predictors of severity in hospitalized COVID-19 patients, providing clinically interpretable structures with potential application for risk stratification, resource allocation, and management of critical care pathways, especially in contexts of healthcare overload such as that experienced during the pandemic.
Keywords: aprendizado de máquina
árvore de decisão
COVID-19
predição de desfechos clínicos
UTI
ventilação mecânica
Area (s) of CNPq: CNPQ::CIENCIAS DA SAUDE
Subject: Biotecnologia
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Program: Programa de Pós-graduação em Biotecnologia
Quote: REZENDE, Bruno Fonseca. Aplicação de algoritmos de machine learning para análise e predição de desfechos clínicos em pacientes com COVID-19. 2025. Dissertação (Mestrado em Biotecnologia) – Universidade Federal de Uberlândia, Patos de Minas, 2026. DOI http://doi.org/10.14393/ufu.di.2026.12.
Document identifier: http://doi.org/10.14393/ufu.di.2026.12
URI: https://repositorio.ufu.br/handle/123456789/48089
Date of defense: 18-Dec-2025
Sustainable Development Goals SDGs: ODS::ODS 3. Saúde e bem-estar - Assegurar uma vida saudável e promover o bem-estar para todos, em todas as idades.
Appears in Collections:DISSERTAÇÃO - Biotecnologia (Patos de Minas)

Files in This Item:
File Description SizeFormat 
AplicaçãoAlgoritmosMachine.pdfDissertação815.43 kBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons