Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/46635
Full metadata record
DC FieldValueLanguage
dc.creatorVilla, Thacyo Euqueres De-
dc.date.accessioned2025-08-19T17:55:50Z-
dc.date.available2025-08-19T17:55:50Z-
dc.date.issued2025-07-10-
dc.identifier.citationVILLA, Thacyo Euqueres De. Bioj48: adaptando o método J48 para classificação de dados biológicos desbalanceados. 2025. 53 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2025. DOI http://doi.org/10.14393/ufu.di.2025.5552.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/46635-
dc.description.abstractDecision tree-based classification models are widely used in Machine Learning (ML) due to their high interpretability and accuracy. However, traditional decision tree algorithms, such as J48 (an implementation of C4.5), face challenges when applied to imbalanced biological datasets, where the number of records per class varies significantly. This imbalance can lead to misleading performance metrics, as models tend to favor the majority class while neglecting the minority class, which is often crucial in medical and biological applications. This study proposes modifications to the J48 algorithm to improve its sensitivity and specificity when classifying imbalanced biological data. The research explores adjustments in information gain calculation, aiming to enhance the algorithm’s performance without compromising interpretability. Various evaluation metrics are analyzed to ensure a more balanced classification approach. The research methodology involves the implementation and testing of the modified J48, named bioJ48, on real biological datasets with different degrees of class imbalance. Comparative experiments between traditional J48 and bioJ48 are conducted, evaluating their predictive effectiveness based on key performance metrics such as accuracy, precision, recall, and F1-score. The expected results include an improved classification model that better identifies minority classes in biological datasets, providing a more reliable evaluation of performance through diversified metrics. The proposed modifications aim to contribute to the field of ML by offering a practical solution to class imbalance issues in biological data analysis.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectBioJ48pt_BR
dc.subjectJ48pt_BR
dc.subjectC4.5pt_BR
dc.subjectClassificaçãopt_BR
dc.subjectClassificationpt_BR
dc.subjectDesbalanceamento de Classespt_BR
dc.subjectClass Imbalancept_BR
dc.subjectAprendizado de Máquinapt_BR
dc.subjectMachine Learningpt_BR
dc.subjectDados Biológicospt_BR
dc.subjectBiological Datapt_BR
dc.subjectInteligência Artificialpt_BR
dc.subjectArtificial Intelligencept_BR
dc.titleBioJ48: adaptando o método J48 para mlassificação de dados biológicos desbalanceadospt_BR
dc.title.alternativeBioJ48: adapting the J48 method for classification of imbalanced biological datapt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor1Amaral, Laurence Rodrigues do-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6978567037098928pt_BR
dc.contributor.referee1Tavares, Marcelo-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/4142478901587907pt_BR
dc.contributor.referee2Braga, Leticia da Conceição-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/9979493696239511pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/4928968151899667pt_BR
dc.description.degreenameDissertação (Mestrado)pt_BR
dc.description.resumoModelos de classificação baseados em árvores de decisão são amplamente utilizados em Machine Learning (ML) devido à sua alta interpretabilidade e precisão. No entanto, algoritmos tradicionais de árvores de decisão, como o J48 (uma implementação do C4.5), enfrentam desafios quando aplicados a conjuntos de dados biológicos desbalanceados, nos quais a quantidade de registros por classe varia significativamente. Esse desbalanceamento pode levar a métricas de desempenho enganosas, pois os modelos tendem a favorecer a classe majoritária, negligenciando a classe minoritária, que muitas vezes é crucial em aplicações médicas e biológicas. Este estudo propõe modificações no algoritmo J48 para melhorar sua sensibilidade e especificidade na classificação de dados biológicos desbalanceados. A pesquisa explora ajustes no cálculo de ganho de informação, visando aprimorar o desempenho do algoritmo sem comprometer sua interpretabilidade. Diversas métricas de avaliação são analisadas para garantir uma abordagem de classificação mais equilibrada. A metodologia envolve a implementação e teste do J48 modificado, chamado bioJ48, em conjuntos de dados biológicos reais com diferentes graus de desbalanceamento. Experimentos comparativos entre o J48 tradicional e o bioJ48 são conduzidos, avaliando a eficácia preditiva com base em métricas como acurácia, precisão, recall e F1-score. Os resultados esperados incluem um modelo de classificação aprimorado, capaz de identificar melhor as classes minoritárias em dados biológicos, proporcionando uma avaliação de desempenho mais confiável por meio de métricas diversificadas. As modificações propostas visam contribuir para o campo de ML, oferecendo uma solução prática para o problema do desbalanceamento de classes na análise de dados biológicos.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computaçãopt_BR
dc.sizeorduration53pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.identifier.doihttp://doi.org/10.14393/ufu.di.2025.5552pt_BR
dc.orcid.putcode190151224-
dc.crossref.doibatchid34b8d410-4153-4671-b551-03b70ad7a13e-
dc.subject.autorizadoComputaçãopt_BR
dc.subject.autorizadoInteligência artificialpt_BR
dc.subject.autorizadoAprendizado do computadorpt_BR
dc.subject.autorizadoAlgoritmos computacionaispt_BR
dc.subject.odsODS::ODS 3. Saúde e bem-estar - Assegurar uma vida saudável e promover o bem-estar para todos, em todas as idades.pt_BR
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
BioJ48AdaptandoMétodo.pdfDissertação ou Tese2.02 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons