Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/31186
ORCID:  http://orcid.org/0000-0001-8778-7886
Document type: Trabalho de Conclusão de Curso
Access type: Acesso Aberto
Title: Predição de proteínas exportadas por meio de redes neurais artificiais
Alternate title (s): Prediction of exported proteins using artificial neural network
Author: Tiago, Vitor Hugo Honorato
First Advisor: Santos, Anderson Rodrigues dos
First member of the Committee: Fernandes, Marcia Aparecida
Second member of the Committee: Lima, Maria Adriana Vidigal de
Summary: Uma das principais formas de combate a doenças é a vacinação. Dentre as etapas da produção de uma vacina é necessária a escolha de proteínas que farão parte da mesma. O objetivo central do trabalho é identificar proteínas exportadas. Essas possuem maior chance de serem efetivas quando utilizadas em vacinas contra bactérias patogênicas. Assim, utilizamos técnicas de Inteligência Artificial, em especial Redes Neurais Artificiais para a classificação de proteínas em exportadas e não exportadas. Para alcançar tal objetivo, primeiramente construimos uma base de dados com proteínas extraídas dos genomas de 35 espécies de bactérias patogênicas, utilizada posteriormente para treinamento da rede neural. Em uma segunda etapa, implementamos uma rede neural utilizando-se do algoritmo backpropagation para treinamento, capaz de classificar essa base de dados. Com isso, realizamos várias execuções com diferentes arquiteturas de rede e diversos parâmetros de treinamento. Comparamos os resultados obtidos das execuções da rede implementada com os resultados do Weka. Utilizamos dez indíces de propensão (PARJ860101, JOND750101, EISD840101, JURD98010, Base, Ácido, Polar, Não Polar, Massa e Massa Molar). Com isso, a rede neural obteve uma taxa de acerto de 82.1%, enquanto o Weka atingiu uma taxa de acerto de 87.2%. Os resultados são promissores, visto que a rede neural implementada teve taxa de acerto próxima ao Weka e ainda, mesmo sem otimizações, conseguiu finalizar seu treinamento em um tempo menor que o algoritmo do Weka em algumas execuções, demorando 4.7% menos tempo para realizar o treinamento. Implementamos a rede neural utilizando a linguagem de programação C e essa está disponível para visualização em https://github.com/tiagohugovitor/Rede-Neural-TCC.
Abstract: One of the main ways of fighting diseases is vaccination. One of the phases for producing a vaccine consists of choosing some proteins that will compose them. The central objective of this paper is to identify exported proteins. These proteins have more chances to be effective when utilized on vaccines against pathogenic bacteria. We utilized Artificial Intelligence techniques like Artificial Neural Networks to classify the proteins in exported or not exported. To achieve that goal, we constructed a database of proteins extracted from the genomes of 35 species of pathogenic bacteria, utilized to train the network. After that, we implemented an Artificial Neural Network with training by the backpropagation algorithm to classify the proteins database. We prepared multiple executions with differents architectures of the network and diverse training parameters. We compared the results of these executions from the implemented network with the results of Weka. We employed ten propensity indexes (PARJ860101, JOND750101, EISD840101, JURD98010, Basic, Acid, Polar, NonPolar, Mass and Molar mass). Then, the network had a hit rate of 82.1%; meanwhile, Weka had a hit rate of 87.2%. The results were promissory, analyzing that the artificial neural network implemented had an accuracy close to the Weka. Even without optimization, the network finalized it is training on time shorter than Weka's algorithm on some executions, taking 4.7% less time to train. We implemented the artificial neural network using the language C, and the code is available on https://github.com/tiagohugovitor/Rede-Neural-TCC.
Keywords: RNA’s
backpropagation
proteínas
vacinas
Weka
exportadas
vaccines
ANN’s
proteins
exported
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Quote: TIAGO, Vitor Hugo Honorato. Predição de proteínas exportadas por meio de Redes Neurais Artificiais. 2020. 46 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de Uberlândia, Uberlândia, Uberlândia, 2021.
URI: https://repositorio.ufu.br/handle/123456789/31186
Date of defense: 14-Dec-2020
Appears in Collections:TCC - Ciência da Computação

Files in This Item:
File Description SizeFormat 
PredicaoDeProteinas.pdf660.58 kBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons