Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/48385
ORCID:  http://orcid.org/0000-0001-8568-666X
Document type: Dissertação
Access type: Acesso Embargado
Embargo Date: 2028-02-23
Title: Metabolômica integrada ao aprendizado de máquina para o diagnóstico e predição da progressão da doença renal crônica
Alternate title (s): Metabolomics integrated with machine learning for the diagnosis and prediction of chronic kidney disease progression.
Author: Sousa, Letícia Cristina Machado de
First Advisor: Silva, Luciana Saraiva da
First coorientator: Picolo, Bianca Uliana
First member of the Committee: Santos, Lucilene Delazari dos
Second member of the Committee: Pádua Netto, Marcus Vinícius de
Summary: INTRODUÇÃO: A doença renal crônica (DRC) é um problema de saúde pública em escala global e as abordagens terapêuticas atualmente disponíveis têm efeito limitado. Com isso, torna-se evidente a necessidade de novas estratégias voltadas tanto ao diagnóstico precoce quanto à redução da progressão da DRC, com destaque à utilização das abordagens ômicas, em especial a metabolômica, integrada ao machine learning (ML). Essa integração pode auxiliar na construção de modelos para diagnóstico, prognóstico e monitoramento da progressão da DRC, além de superar as limitações inerentes aos métodos convencionais. OBJETIVO: Caracterizar o perfil metabolômico sérico utilizando cromatografia líquida de alta eficiência acoplada à espectrometria de massas em tandem (LC-MS/MS) e desenvolver modelos baseados em ML para o diagnóstico e a predição da progressão da DRC. MÉTODOS: Participaram do estudo indivíduos sem DRC (grupo controle); indivíduos com DRC (entre os estágios 2 e 4) em tratamento conservador (grupo intermediário); e indivíduos em hemodiálise (grupo HD). Um total de 148 participantes foram incluídos: grupo controle (n=55), grupo intermediário (n=32) e grupo HD (n=61). Foram avaliadas variáveis sociodemográficas, fatores comportamentais, parâmetros clínicos, medidas antropométricas e dados bioquímicos. As análises foram realizadas em um equipamento de cromatografia líquida de alta eficiência acoplado a um espectrômetro de massa de alta resolução. As análises estatísticas foram realizadas por meio dos softwares Orange (Versão 3.37.0), STATA (versão 15.1) e MetaboAnalyst 6.0. Um valor de p < 0,05 foi considerado estatisticamente significativo. Após a identificação dos metabólitos diferencialmente expressos, algoritmos de ML foram empregados para diferenciar indivíduos com DRC de participantes saudáveis. Os algoritmos empregados foram Logistic Regression (LG), Support Vector Machine (SVM), Gradient Boosting (GB), Neural Network (NN) e Random Forest (RF). O desempenho foi avaliado por meio da análise da curva ROC (Receiver Operating Characteristic), cálculos da área sob a curva (AUC), escore F1, acurácia, precisão e coeficiente de correlação de Matthews (MCC). Após o treinamento em diferentes algoritmos, todos os modelos diagnósticos e de predição da progressão da DRC foram submetidos à validação externa. Para interpretar os modelos de ML, foram aplicadas as Explicações Aditivas de Shapley (Shapley Additive Explanations) (SHAP). RESULTADOS: Um total de 759 metabólitos foram identificados. A análise de expressão diferencial identificou 41 metabólitos distintos para predição diagnóstica e 29 para predição da progressão. Esses metabólitos diferenciais foram usados para treinar modelos de ML empregando os algoritmos. Após o treinamento, foi realizada uma validação externa utilizando os algoritmos previamente treinados. Os resultados demonstraram que os modelos SVM e NN parecem ter sido os mais eficazes tanto para o diagnóstico quanto para predição da progressão da DRC. CONCLUSÃO: Nossos achados mostraram que os modelos de ML aplicados aos dados metabolômicos apresentaram desempenho elevado, especialmente nos modelos SVM e NN. Portanto, a combinação da metabolômica sérica e ML mostrou-se uma estratégia robusta para melhorar a identificação precoce e o acompanhamento da doença.
Abstract: INTRODUCTION: Chronic kidney disease (CKD) is a global public health problem, and currently available therapeutic approaches have limited effectiveness. This highlights the need for new strategies aimed at both early diagnosis and reducing CKD progression, particularly the use of omics approaches, especially metabolomics, integrated with machine learning (ML). This integration can aid in building models for diagnosis, prognosis, and monitoring of CKD progression, as well as overcoming the limitations inherent in conventional methods. OBJECTIVE: To characterize the serum metabolomic profile using high-performance liquid chromatography coupled to tandem mass spectrometry (LC-MS/MS) and to develop ML-based models for the diagnosis and prediction of CKD progression. METHODS: The study included individuals without CKD (control group); individuals with CKD (between stages 2 and 4) undergoing conservative treatment (intermediate group); and individuals on hemodialysis (HD group). A total of 148 participants were included: control group (n=55), intermediate group (n=32), and HD group (n=61). Sociodemographic variables, behavioral factors, clinical parameters, anthropometric measurements, and biochemical data were evaluated. Analyses were performed using a high-performance liquid chromatography-mass spectrometer. Statistical analyses were performed using Orange (Version 3.37.0), STATA (version 15.1), and MetaboAnalyst 6.0 software. A p-value < 0.05 was considered statistically significant. After identifying differentially expressed metabolites, machine learning (ML) algorithms were employed to differentiate individuals with chronic kidney disease (CKD) from healthy participants. The algorithms used were Logistic Regression (LG), Support Vector Machine (SVM), Gradient Boosting (GB), Neural Network (NN), and Random Forest (RF). Performance was evaluated through ROC (Receiver Operating Characteristic) curve analysis, area under the curve (AUC) calculations, F1 score, accuracy, precision, and Matthews correlation coefficient (MCC). After training on different algorithms, all diagnostic and CKD progression prediction models underwent external validation. Shapley Additive Explanations (SHAP) were applied to interpret the ML models. RESULTS: A total of 759 metabolites were identified. Differential expression analysis identified 41 distinct metabolites for diagnostic prediction and 29 for progression prediction. These differential metabolites were used to train ML models employing the algorithms. After training, external validation was performed using the previously trained algorithms. The results demonstrated that the SVM and NN models appear to have been the most effective for both diagnosis and progression prediction of CKD. CONCLUSION: Our findings show that the ML models applied to metabolomic data exhibited high performance, especially the SVM and NN models. Therefore, the combination of serum metabolomics and ML proved to be a robust strategy to improve early identification and monitoring of the disease.
Keywords: Doença Renal Crônica
Metabolômica
Machine Learning
Chronic Kidney Disease
Metabolomics
Area (s) of CNPq: CNPQ::CIENCIAS DA SAUDE
Subject: Ciências médicas
Insuficiência renal crônica
Glândulas supra-renais - Doenças
Metabólitos
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Program: Programa de Pós-graduação em Ciências da Saúde
Quote: SOUSA, Letícia Cristina Machado de. Metabolômica integrada ao aprendizado de máquina para o diagnóstico e predição da progressão da doença renal crônica. 2026. 69 f. Dissertação (Mestrado em Ciências da Saúde) - Universidade Federal de Uberlândia, Uberlândia, 2026. DOI http://doi.org/10.14393/ufu.di.2026.5038.
Document identifier: http://doi.org/10.14393/ufu.di.2026.5038
URI: https://repositorio.ufu.br/handle/123456789/48385
Date of defense: 5-Feb-2026
Sustainable Development Goals SDGs: ODS::ODS 3. Saúde e bem-estar - Assegurar uma vida saudável e promover o bem-estar para todos, em todas as idades.
Appears in Collections:DISSERTAÇÃO - Ciências da Saúde

Files in This Item:
File Description SizeFormat 
MetabolomicaIntegradaAprendizado.pdf
  Until 2028-02-23
Dissertação1.29 MBAdobe PDFView/Open    Request a copy


This item is licensed under a Creative Commons License Creative Commons