Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/31262
Document type: Dissertação
Access type: Acesso Aberto
Title: Utilização de rede neural para predição de proteínas de bactérias secretadas por vias não clássicas
Alternate title (s): Use of neural network for prediction of bacteria proteins secreted by non-classic pathways
Author: Oliveira, Luiz Gustavo de Sousa
First Advisor: Santos, Anderson Rodrigues dos
First member of the Committee: Gabriel, Paulo Henrique Ribeiro
Second member of the Committee: Siqueira Neto, José Lopes de
Summary: Apresentamos uma metodologia de predição de proteínas advindas de secreção bacteriana não clássica utilizando redes neurais artificiais. Nosso objetivo é contribuir para a elaboração de vacinas e diagnósticos de doenças a partir de proteínas bacterianas secretada por vias não clássicas. Para esse objetivo, compilamos uma lista de proteínas bacterianas conhecidas advindas de organismos procariotos secretadas pelas vias não clássicas. Essas proteínas foram catalogadas permitindo a criação de um conjunto de treinamento e validação da rede neural artificial. Realizamos uma pesquisa bibliográfica para identificar prováveis descritores e características sinalizadoras deste tipo de secreção bacteriana. Elaboramos uma rede neural supervisionada pelo software WEKA. Diversos modelos foram treinados a fim de determinar o melhor grupo de características para a predição de proteínas. Avaliamos o método proposto com a predição de proteínas que não foram utilizadas no grupo de treinamento e comparando com outros dois preditores estudados em literatura correlata, PeNGaRoo (ZHANG et al., 2020) e SecretomeP 2.0 (BENDTSEN et al., 2005). Consideramos nossos resultados satisfatórios, pois apresentaram uma rede neural com acurácia média de 93%. Nosso modelo preditor de proteínas secretadas por vias não clássicas foi superior ao SecretomeP em todos os cenários de validação. Com relação ao PeNGaRoo, o estado da arte para este propósito, nosso preditor igualou o seu desempenho na maior parte dos cenários de validação e conseguiu acurácia melhor em alguns cenários. Dessa forma, nosso trabalho demonstrou a possibilidade da obtenção de um classificador eficaz e mais eficiente que o estado da arte, através da utilização de redes neurais artificiais e um conjunto adequado de descritores para proteínas de bactérias secretadas por vias não clássicas.
Abstract: We present a methodology of predicting proteins from the non-classic bacterial secretion from artificial neural networks to contribute to vaccines’ elaboration and diseases’ diagnosis. We compiled a list of bacterial proteins from prokaryotic organisms secreted by the currently known non-classic pathways for training. These proteins were cataloged, allowing the creation of a set of training and validation for neural network training. We carried out bibliographic research to identify probable descriptors and signaling characteristics of this type of secretion by non-classic pathway. We developed a supervised neural network using the WEKA software, training it to determine the best group of features for prediction. We evaluated our proposed method submitting proteins not used in the training group and comparing the developed predictor against two other predictors studied in related literature, PeNGaRoo (ZHANG et al., 2020) and SecretomeP 2.0 (BENDTSEN et al., 2005). We considered our results satisfactory, as they presented a balanced neural network accuracy of 93% in the classification performance. We outperformed SecretomeP 2.0 for all validation scenarios. In the majority, our results were similar to PeNGaRoo, but for some case studies, we outperformed it. Therefore, we demonstrated the possibility of obtaining a compelling classifier by using our selected set of descriptors.
Keywords: Redes neurais
Proteínas bacterianas
Secreção por via não clássica
Neural Networks
Non-classical Secretory Pathway
Bacterial Proteins
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Subject: Computação
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Program: Programa de Pós-graduação em Ciência da Computação
Quote: OLIVEIRA, Luiz Gustavo de Sousa. Utilização de rede neural para predição de proteínas de bactérias secretadas por vias não clássicas. 2020. 87 f. Dissertação (Mestrado em Ciência da computação) - Universidade Federal de Uberlândia, Uberlândia, 2021. DOI http://doi.org/10.14393/ufu.di.2021.34
Document identifier: http://doi.org/10.14393/ufu.di.2021.34
URI: https://repositorio.ufu.br/handle/123456789/31262
Date of defense: 21-Dec-2020
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
UtilizaçãoRedeNeural.pdf5.84 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons