Use este identificador para citar ou linkar para este item:
https://repositorio.ufu.br/handle/123456789/32702
ORCID: | http://orcid.org/0000-0003-4306-4453 |
Tipo do documento: | Dissertação |
Tipo de acesso: | Acesso Aberto Attribution-NonCommercial-NoDerivs 3.0 United States |
Título: | GenPPI: um software autônomo para predição ab initio de redes de interação entre proteínas bacterianas |
Título(s) alternativo(s): | GenPPI: a standalone software for ab initio prediction of interaction networks between bacterial proteins |
Autor(es): | Anjos, William Ferreira dos |
Primeiro orientador: | Santos, Anderson Rodrigues dos |
Primeiro membro da banca: | Amaral, Laurence Rodrigues do |
Segundo membro da banca: | Santos, Marcos Augusto dos |
Resumo: | As interações proteína-proteína (do inglês, Protein-Protein Interactions – PPI) desempenham um papel fundamental na determinação do resultado da maioria dos processos celulares. Identificar corretamente as interações de proteínas e as redes de PPI que elas compreendem, é de fundamental importância para o entendimento dos mecanismos moleculares dentro da célula. Isso pode fornecer informações úteis na realização de tarefas críticas como a fabricação de drogas e vacinas contra doenças causadas por agentes infecciosos. Abordagens computacionais são utilizadas combinando várias fontes de dados biológicos, a fim de prever interações de proteínas com níveis satisfatórios de confiabilidade. Neste trabalho, propõe-se um novo software autônomo de bioinformática (GenPPI) para predição ab initio de redes de interação entre proteínas bacterianas. A solução proposta analisa genomas buscando por evidências de eventos evolutivos que indicam interações de proteínas. A saber, eventos de vizinhança gênica conservada, fusão gênica e perfil filogenético conservado. Este trabalho também introduz uma nova heurística para comparação par-a-par de sequências de aminoácidos de proteínas. Como resultados, primeiramente demonstra-se a eficácia da heurística proposta comparando sua exatidão com o BLASTp, o principal algoritmo heurístico para comparação de sequências proteicas. A exatidão do dois algoritmos heurísticos é estimada verificando qual se aproxima mais do algoritmo exato Needleman-Wunsh, utilizado para comparação de sequências biológicas. A heurística proposta superou o BLASTp apresentando maior exatidão na comparação par-a-par de proteínas e menor tempo de processamento. Posteriormente, a confiabilidade biológica das predições computacionais realizadas, é verificada. Para tanto, foram feitas análises de filogenia a partir de dados gerados pelo programa, após processar genomas de gêneros bacterianos selecionados como estudos de caso. Foram analisados 28 genomas do gênero Dietzia, 45 de Rhodococcus, 50 de Corynebacterium e 81 de Aeromonas. As análises de filogenia realizadas demonstram correção e confiabilidade biológica para as redes de interação proteica preditas pelo software desenvolvido. Por final, compara-se a qualidade de redes de interação geradas pelo GenPPI com uma rede do STRING, a principal ferramenta do estado da arte deste trabalho. Tal comparação mostra que a solução proposta é capaz de gerar redes de tão boa qualidade quanto as redes do STRING. Vale mencionar que, com essa solução, é suprida uma deficiência identificada no estado da arte, a indisponibilidade de ferramentas computacionais para prever PPIs sem negligenciar proteínas inéditas. O software desenvolvido encontra-se disponível para download no site: <https://genppi.facom.ufu.br/> ou no repositório: <https://github.com/santosardr/genppi>, onde também contém um guia do usuário. |
Abstract: | Protein-protein interactions play a key role in determining the outcome of most cellular processes. Correctly identifying protein interactions and the PPI networks they comprise is of fundamental importance for understanding the molecular mechanisms within the cell. This can provide useful insights in performing critical tasks such as manufacturing drugs and vaccines against diseases caused by infectious agents. Computational approaches are used combining various sources of biological data in order to predict protein interactions with satisfactory levels of reliability. In this work, we propose a new autonomous bioinformatics software (GenPPI) for ab initio prediction of interaction networks between bacterial proteins. The proposed solution analyzes genomes looking for evidence of evolutionary events that indicate protein interactions. Namely, conserved gene neighborhood events, gene fusion and conserved phylogenetic profile. This work also introduces a new heuristic for pairwise comparison of protein amino acid sequences. As a result, we first demonstrate the effectiveness of the proposed heuristic by comparing its accuracy with BLASTp, the main heuristic algorithm for comparing protein sequences. The accuracy of the two heuristic algorithms is estimated by checking which one is closest to the exact Needleman-Wunsh algorithm used for comparing biological sequences. The proposed heuristic surpassed BLASTp, presenting greater accuracy in the pair-by-pair comparison of proteins and shorter processing time. Subsequently, the biological reliability of the computational predictions performed is verified. Therefore, phylogeny analyzes were performed using data generated by the program, after processing genomes of bacterial genera selected as case studies. 28 genomes of the genus Dietzia, 45 of Rhodococcus, 50 of Corynebacterium and 81 of Aeromonas were analyzed. The phylogeny analyzes performed demonstrate correctness and biological reliability for the protein interaction networks predicted by the developed software. Finally, the quality of interaction networks generated by GenPPI is compared with a STRING network, the main state-of-the-art tool of this work. This comparison shows that the proposed solution is capable of generating networks of as good quality as the STRING networks. It is worth mentioning that, with this solution, a deficiency identified in the state of the art, the unavailability of computational tools to predict PPIs without neglecting new proteins, is addressed. The developed software is available for download on the site: <https://genppi.facom.ufu.br/> or on the repository: <https://github.com/santosardr/genppi>, where also contains a user guide. |
Palavras-chave: | Biologia Computacional Bioinformática Predição ab initio de Redes de PPI Redes Complexas Heurísticas Para Comparação de Sequências de Proteínas Computational Biology Bioinformatics Ab Initio Prediction of PPI Networks Complex Networks Heuristics for Protein Sequence Comparison Computação |
Área(s) do CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Assunto: | Computação Bioinformática |
Idioma: | por |
País: | Brasil |
Editora: | Universidade Federal de Uberlândia |
Programa: | Programa de Pós-graduação em Ciência da Computação |
Referência: | ANJOS, William Ferreira dos. GenPPI: Um Software Autônomo Para Predição Ab Initio de Redes de Interação Entre Proteínas Bacterianas. 2021. 172 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2021. DOI http://doi.org/10.14393/ufu.di.2021.365. |
Identificador do documento: | http://doi.org/10.14393/ufu.di.2021.365 |
URI: | https://repositorio.ufu.br/handle/123456789/32702 |
Data de defesa: | 30-Jun-2021 |
Aparece nas coleções: | DISSERTAÇÃO - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
GenppiSoftwareAutonomo.pdf | Dissertação | 29.03 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons