Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/48385
Full metadata record
DC FieldValueLanguage
dc.creatorSousa, Letícia Cristina Machado de-
dc.date.accessioned2026-02-24T18:09:59Z-
dc.date.available2026-02-24T18:09:59Z-
dc.date.issued2026-02-05-
dc.identifier.citationSOUSA, Letícia Cristina Machado de. Metabolômica integrada ao aprendizado de máquina para o diagnóstico e predição da progressão da doença renal crônica. 2026. 69 f. Dissertação (Mestrado em Ciências da Saúde) - Universidade Federal de Uberlândia, Uberlândia, 2026. DOI http://doi.org/10.14393/ufu.di.2026.5038.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/48385-
dc.description.abstractINTRODUCTION: Chronic kidney disease (CKD) is a global public health problem, and currently available therapeutic approaches have limited effectiveness. This highlights the need for new strategies aimed at both early diagnosis and reducing CKD progression, particularly the use of omics approaches, especially metabolomics, integrated with machine learning (ML). This integration can aid in building models for diagnosis, prognosis, and monitoring of CKD progression, as well as overcoming the limitations inherent in conventional methods. OBJECTIVE: To characterize the serum metabolomic profile using high-performance liquid chromatography coupled to tandem mass spectrometry (LC-MS/MS) and to develop ML-based models for the diagnosis and prediction of CKD progression. METHODS: The study included individuals without CKD (control group); individuals with CKD (between stages 2 and 4) undergoing conservative treatment (intermediate group); and individuals on hemodialysis (HD group). A total of 148 participants were included: control group (n=55), intermediate group (n=32), and HD group (n=61). Sociodemographic variables, behavioral factors, clinical parameters, anthropometric measurements, and biochemical data were evaluated. Analyses were performed using a high-performance liquid chromatography-mass spectrometer. Statistical analyses were performed using Orange (Version 3.37.0), STATA (version 15.1), and MetaboAnalyst 6.0 software. A p-value < 0.05 was considered statistically significant. After identifying differentially expressed metabolites, machine learning (ML) algorithms were employed to differentiate individuals with chronic kidney disease (CKD) from healthy participants. The algorithms used were Logistic Regression (LG), Support Vector Machine (SVM), Gradient Boosting (GB), Neural Network (NN), and Random Forest (RF). Performance was evaluated through ROC (Receiver Operating Characteristic) curve analysis, area under the curve (AUC) calculations, F1 score, accuracy, precision, and Matthews correlation coefficient (MCC). After training on different algorithms, all diagnostic and CKD progression prediction models underwent external validation. Shapley Additive Explanations (SHAP) were applied to interpret the ML models. RESULTS: A total of 759 metabolites were identified. Differential expression analysis identified 41 distinct metabolites for diagnostic prediction and 29 for progression prediction. These differential metabolites were used to train ML models employing the algorithms. After training, external validation was performed using the previously trained algorithms. The results demonstrated that the SVM and NN models appear to have been the most effective for both diagnosis and progression prediction of CKD. CONCLUSION: Our findings show that the ML models applied to metabolomic data exhibited high performance, especially the SVM and NN models. Therefore, the combination of serum metabolomics and ML proved to be a robust strategy to improve early identification and monitoring of the disease.pt_BR
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Embargadopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectDoença Renal Crônicapt_BR
dc.subjectMetabolômicapt_BR
dc.subjectMachine Learningpt_BR
dc.subjectChronic Kidney Diseasept_BR
dc.subjectMetabolomicspt_BR
dc.titleMetabolômica integrada ao aprendizado de máquina para o diagnóstico e predição da progressão da doença renal crônicapt_BR
dc.title.alternativeMetabolomics integrated with machine learning for the diagnosis and prediction of chronic kidney disease progression.pt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor-co1Picolo, Bianca Uliana-
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/2153480737478290pt_BR
dc.contributor.advisor1Silva, Luciana Saraiva da-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0289479620415641pt_BR
dc.contributor.referee1Santos, Lucilene Delazari dos-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/3368404126695911pt_BR
dc.contributor.referee2Pádua Netto, Marcus Vinícius de-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/0853119429254827pt_BR
dc.creator.Latteshttps://lattes.cnpq.br/8153740070580893pt_BR
dc.description.degreenameDissertação (Mestrado)pt_BR
dc.description.resumoINTRODUÇÃO: A doença renal crônica (DRC) é um problema de saúde pública em escala global e as abordagens terapêuticas atualmente disponíveis têm efeito limitado. Com isso, torna-se evidente a necessidade de novas estratégias voltadas tanto ao diagnóstico precoce quanto à redução da progressão da DRC, com destaque à utilização das abordagens ômicas, em especial a metabolômica, integrada ao machine learning (ML). Essa integração pode auxiliar na construção de modelos para diagnóstico, prognóstico e monitoramento da progressão da DRC, além de superar as limitações inerentes aos métodos convencionais. OBJETIVO: Caracterizar o perfil metabolômico sérico utilizando cromatografia líquida de alta eficiência acoplada à espectrometria de massas em tandem (LC-MS/MS) e desenvolver modelos baseados em ML para o diagnóstico e a predição da progressão da DRC. MÉTODOS: Participaram do estudo indivíduos sem DRC (grupo controle); indivíduos com DRC (entre os estágios 2 e 4) em tratamento conservador (grupo intermediário); e indivíduos em hemodiálise (grupo HD). Um total de 148 participantes foram incluídos: grupo controle (n=55), grupo intermediário (n=32) e grupo HD (n=61). Foram avaliadas variáveis sociodemográficas, fatores comportamentais, parâmetros clínicos, medidas antropométricas e dados bioquímicos. As análises foram realizadas em um equipamento de cromatografia líquida de alta eficiência acoplado a um espectrômetro de massa de alta resolução. As análises estatísticas foram realizadas por meio dos softwares Orange (Versão 3.37.0), STATA (versão 15.1) e MetaboAnalyst 6.0. Um valor de p < 0,05 foi considerado estatisticamente significativo. Após a identificação dos metabólitos diferencialmente expressos, algoritmos de ML foram empregados para diferenciar indivíduos com DRC de participantes saudáveis. Os algoritmos empregados foram Logistic Regression (LG), Support Vector Machine (SVM), Gradient Boosting (GB), Neural Network (NN) e Random Forest (RF). O desempenho foi avaliado por meio da análise da curva ROC (Receiver Operating Characteristic), cálculos da área sob a curva (AUC), escore F1, acurácia, precisão e coeficiente de correlação de Matthews (MCC). Após o treinamento em diferentes algoritmos, todos os modelos diagnósticos e de predição da progressão da DRC foram submetidos à validação externa. Para interpretar os modelos de ML, foram aplicadas as Explicações Aditivas de Shapley (Shapley Additive Explanations) (SHAP). RESULTADOS: Um total de 759 metabólitos foram identificados. A análise de expressão diferencial identificou 41 metabólitos distintos para predição diagnóstica e 29 para predição da progressão. Esses metabólitos diferenciais foram usados para treinar modelos de ML empregando os algoritmos. Após o treinamento, foi realizada uma validação externa utilizando os algoritmos previamente treinados. Os resultados demonstraram que os modelos SVM e NN parecem ter sido os mais eficazes tanto para o diagnóstico quanto para predição da progressão da DRC. CONCLUSÃO: Nossos achados mostraram que os modelos de ML aplicados aos dados metabolômicos apresentaram desempenho elevado, especialmente nos modelos SVM e NN. Portanto, a combinação da metabolômica sérica e ML mostrou-se uma estratégia robusta para melhorar a identificação precoce e o acompanhamento da doença.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciências da Saúdept_BR
dc.sizeorduration69pt_BR
dc.subject.cnpqCNPQ::CIENCIAS DA SAUDEpt_BR
dc.embargo.termsPublicação em periódico.pt_BR
dc.identifier.doihttp://doi.org/10.14393/ufu.di.2026.5038pt_BR
dc.orcid.putcode206654853-
dc.crossref.doibatchid7059e057-b9a0-46ea-ba8a-45aa3676b2c3-
dc.subject.autorizadoCiências médicaspt_BR
dc.subject.autorizadoInsuficiência renal crônicapt_BR
dc.subject.autorizadoGlândulas supra-renais - Doençaspt_BR
dc.subject.autorizadoMetabólitospt_BR
dc.description.embargo2028-02-23-
dc.subject.odsODS::ODS 3. Saúde e bem-estar - Assegurar uma vida saudável e promover o bem-estar para todos, em todas as idades.pt_BR
Appears in Collections:DISSERTAÇÃO - Ciências da Saúde

Files in This Item:
File Description SizeFormat 
MetabolomicaIntegradaAprendizado.pdf
  Until 2028-02-23
Dissertação1.29 MBAdobe PDFView/Open    Request a copy


This item is licensed under a Creative Commons License Creative Commons