Metabolômica integrada ao aprendizado de máquina para o diagnóstico e predição da progressão da doença renal crônica

Sousa, Letícia Cristina Machado de

Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufu.br/handle/123456789/48385

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.creator	Sousa, Letícia Cristina Machado de	-
dc.date.accessioned	2026-02-24T18:09:59Z	-
dc.date.available	2026-02-24T18:09:59Z	-
dc.date.issued	2026-02-05	-
dc.identifier.citation	SOUSA, Letícia Cristina Machado de. Metabolômica integrada ao aprendizado de máquina para o diagnóstico e predição da progressão da doença renal crônica. 2026. 69 f. Dissertação (Mestrado em Ciências da Saúde) - Universidade Federal de Uberlândia, Uberlândia, 2026. DOI http://doi.org/10.14393/ufu.di.2026.5038.	pt_BR
dc.identifier.uri	https://repositorio.ufu.br/handle/123456789/48385	-
dc.description.abstract	INTRODUCTION: Chronic kidney disease (CKD) is a global public health problem, and currently available therapeutic approaches have limited effectiveness. This highlights the need for new strategies aimed at both early diagnosis and reducing CKD progression, particularly the use of omics approaches, especially metabolomics, integrated with machine learning (ML). This integration can aid in building models for diagnosis, prognosis, and monitoring of CKD progression, as well as overcoming the limitations inherent in conventional methods. OBJECTIVE: To characterize the serum metabolomic profile using high-performance liquid chromatography coupled to tandem mass spectrometry (LC-MS/MS) and to develop ML-based models for the diagnosis and prediction of CKD progression. METHODS: The study included individuals without CKD (control group); individuals with CKD (between stages 2 and 4) undergoing conservative treatment (intermediate group); and individuals on hemodialysis (HD group). A total of 148 participants were included: control group (n=55), intermediate group (n=32), and HD group (n=61). Sociodemographic variables, behavioral factors, clinical parameters, anthropometric measurements, and biochemical data were evaluated. Analyses were performed using a high-performance liquid chromatography-mass spectrometer. Statistical analyses were performed using Orange (Version 3.37.0), STATA (version 15.1), and MetaboAnalyst 6.0 software. A p-value < 0.05 was considered statistically significant. After identifying differentially expressed metabolites, machine learning (ML) algorithms were employed to differentiate individuals with chronic kidney disease (CKD) from healthy participants. The algorithms used were Logistic Regression (LG), Support Vector Machine (SVM), Gradient Boosting (GB), Neural Network (NN), and Random Forest (RF). Performance was evaluated through ROC (Receiver Operating Characteristic) curve analysis, area under the curve (AUC) calculations, F1 score, accuracy, precision, and Matthews correlation coefficient (MCC). After training on different algorithms, all diagnostic and CKD progression prediction models underwent external validation. Shapley Additive Explanations (SHAP) were applied to interpret the ML models. RESULTS: A total of 759 metabolites were identified. Differential expression analysis identified 41 distinct metabolites for diagnostic prediction and 29 for progression prediction. These differential metabolites were used to train ML models employing the algorithms. After training, external validation was performed using the previously trained algorithms. The results demonstrated that the SVM and NN models appear to have been the most effective for both diagnosis and progression prediction of CKD. CONCLUSION: Our findings show that the ML models applied to metabolomic data exhibited high performance, especially the SVM and NN models. Therefore, the combination of serum metabolomics and ML proved to be a robust strategy to improve early identification and monitoring of the disease.	pt_BR
dc.description.sponsorship	CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Federal de Uberlândia	pt_BR
dc.rights	Acesso Embargado	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	*
dc.subject	Doença Renal Crônica	pt_BR
dc.subject	Metabolômica	pt_BR
dc.subject	Machine Learning	pt_BR
dc.subject	Chronic Kidney Disease	pt_BR
dc.subject	Metabolomics	pt_BR
dc.title	Metabolômica integrada ao aprendizado de máquina para o diagnóstico e predição da progressão da doença renal crônica	pt_BR
dc.title.alternative	Metabolomics integrated with machine learning for the diagnosis and prediction of chronic kidney disease progression.	pt_BR
dc.type	Dissertação	pt_BR
dc.contributor.advisor-co1	Picolo, Bianca Uliana	-
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/2153480737478290	pt_BR
dc.contributor.advisor1	Silva, Luciana Saraiva da	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/0289479620415641	pt_BR
dc.contributor.referee1	Santos, Lucilene Delazari dos	-
dc.contributor.referee1Lattes	http://lattes.cnpq.br/3368404126695911	pt_BR
dc.contributor.referee2	Pádua Netto, Marcus Vinícius de	-
dc.contributor.referee2Lattes	http://lattes.cnpq.br/0853119429254827	pt_BR
dc.creator.Lattes	https://lattes.cnpq.br/8153740070580893	pt_BR
dc.description.degreename	Dissertação (Mestrado)	pt_BR
dc.description.resumo	INTRODUÇÃO: A doença renal crônica (DRC) é um problema de saúde pública em escala global e as abordagens terapêuticas atualmente disponíveis têm efeito limitado. Com isso, torna-se evidente a necessidade de novas estratégias voltadas tanto ao diagnóstico precoce quanto à redução da progressão da DRC, com destaque à utilização das abordagens ômicas, em especial a metabolômica, integrada ao machine learning (ML). Essa integração pode auxiliar na construção de modelos para diagnóstico, prognóstico e monitoramento da progressão da DRC, além de superar as limitações inerentes aos métodos convencionais. OBJETIVO: Caracterizar o perfil metabolômico sérico utilizando cromatografia líquida de alta eficiência acoplada à espectrometria de massas em tandem (LC-MS/MS) e desenvolver modelos baseados em ML para o diagnóstico e a predição da progressão da DRC. MÉTODOS: Participaram do estudo indivíduos sem DRC (grupo controle); indivíduos com DRC (entre os estágios 2 e 4) em tratamento conservador (grupo intermediário); e indivíduos em hemodiálise (grupo HD). Um total de 148 participantes foram incluídos: grupo controle (n=55), grupo intermediário (n=32) e grupo HD (n=61). Foram avaliadas variáveis sociodemográficas, fatores comportamentais, parâmetros clínicos, medidas antropométricas e dados bioquímicos. As análises foram realizadas em um equipamento de cromatografia líquida de alta eficiência acoplado a um espectrômetro de massa de alta resolução. As análises estatísticas foram realizadas por meio dos softwares Orange (Versão 3.37.0), STATA (versão 15.1) e MetaboAnalyst 6.0. Um valor de p < 0,05 foi considerado estatisticamente significativo. Após a identificação dos metabólitos diferencialmente expressos, algoritmos de ML foram empregados para diferenciar indivíduos com DRC de participantes saudáveis. Os algoritmos empregados foram Logistic Regression (LG), Support Vector Machine (SVM), Gradient Boosting (GB), Neural Network (NN) e Random Forest (RF). O desempenho foi avaliado por meio da análise da curva ROC (Receiver Operating Characteristic), cálculos da área sob a curva (AUC), escore F1, acurácia, precisão e coeficiente de correlação de Matthews (MCC). Após o treinamento em diferentes algoritmos, todos os modelos diagnósticos e de predição da progressão da DRC foram submetidos à validação externa. Para interpretar os modelos de ML, foram aplicadas as Explicações Aditivas de Shapley (Shapley Additive Explanations) (SHAP). RESULTADOS: Um total de 759 metabólitos foram identificados. A análise de expressão diferencial identificou 41 metabólitos distintos para predição diagnóstica e 29 para predição da progressão. Esses metabólitos diferenciais foram usados para treinar modelos de ML empregando os algoritmos. Após o treinamento, foi realizada uma validação externa utilizando os algoritmos previamente treinados. Os resultados demonstraram que os modelos SVM e NN parecem ter sido os mais eficazes tanto para o diagnóstico quanto para predição da progressão da DRC. CONCLUSÃO: Nossos achados mostraram que os modelos de ML aplicados aos dados metabolômicos apresentaram desempenho elevado, especialmente nos modelos SVM e NN. Portanto, a combinação da metabolômica sérica e ML mostrou-se uma estratégia robusta para melhorar a identificação precoce e o acompanhamento da doença.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Programa de Pós-graduação em Ciências da Saúde	pt_BR
dc.sizeorduration	69	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS DA SAUDE	pt_BR
dc.embargo.terms	Publicação em periódico.	pt_BR
dc.identifier.doi	http://doi.org/10.14393/ufu.di.2026.5038	pt_BR
dc.orcid.putcode	206654853	-
dc.crossref.doibatchid	7059e057-b9a0-46ea-ba8a-45aa3676b2c3	-
dc.subject.autorizado	Ciências médicas	pt_BR
dc.subject.autorizado	Insuficiência renal crônica	pt_BR
dc.subject.autorizado	Glândulas supra-renais - Doenças	pt_BR
dc.subject.autorizado	Metabólitos	pt_BR
dc.description.embargo	2028-02-23	-
dc.subject.ods	ODS::ODS 3. Saúde e bem-estar - Assegurar uma vida saudável e promover o bem-estar para todos, em todas as idades.	pt_BR
Aparece en las colecciones:	DISSERTAÇÃO - Ciências da Saúde

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
MetabolomicaIntegradaAprendizado.pdf Hasta 2028-02-23	Dissertação	1.29 MB	Adobe PDF	Visualizar/Abrir Request a copy

Mostrar el registro sencillo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons