Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufu.br/handle/123456789/32702
ORCID:  http://orcid.org/0000-0003-4306-4453
Tipo de documento: Dissertação
Tipo de acceso: Acesso Aberto
Attribution-NonCommercial-NoDerivs 3.0 United States
Título: GenPPI: um software autônomo para predição ab initio de redes de interação entre proteínas bacterianas
Título (s) alternativo (s): GenPPI: a standalone software for ab initio prediction of interaction networks between bacterial proteins
Autor: Anjos, William Ferreira dos
Primer orientador: Santos, Anderson Rodrigues dos
Primer miembro de la banca: Amaral, Laurence Rodrigues do
Segundo miembro de la banca: Santos, Marcos Augusto dos
Resumen: As interações proteína-proteína (do inglês, Protein-Protein Interactions – PPI) desempenham um papel fundamental na determinação do resultado da maioria dos processos celulares. Identificar corretamente as interações de proteínas e as redes de PPI que elas compreendem, é de fundamental importância para o entendimento dos mecanismos moleculares dentro da célula. Isso pode fornecer informações úteis na realização de tarefas críticas como a fabricação de drogas e vacinas contra doenças causadas por agentes infecciosos. Abordagens computacionais são utilizadas combinando várias fontes de dados biológicos, a fim de prever interações de proteínas com níveis satisfatórios de confiabilidade. Neste trabalho, propõe-se um novo software autônomo de bioinformática (GenPPI) para predição ab initio de redes de interação entre proteínas bacterianas. A solução proposta analisa genomas buscando por evidências de eventos evolutivos que indicam interações de proteínas. A saber, eventos de vizinhança gênica conservada, fusão gênica e perfil filogenético conservado. Este trabalho também introduz uma nova heurística para comparação par-a-par de sequências de aminoácidos de proteínas. Como resultados, primeiramente demonstra-se a eficácia da heurística proposta comparando sua exatidão com o BLASTp, o principal algoritmo heurístico para comparação de sequências proteicas. A exatidão do dois algoritmos heurísticos é estimada verificando qual se aproxima mais do algoritmo exato Needleman-Wunsh, utilizado para comparação de sequências biológicas. A heurística proposta superou o BLASTp apresentando maior exatidão na comparação par-a-par de proteínas e menor tempo de processamento. Posteriormente, a confiabilidade biológica das predições computacionais realizadas, é verificada. Para tanto, foram feitas análises de filogenia a partir de dados gerados pelo programa, após processar genomas de gêneros bacterianos selecionados como estudos de caso. Foram analisados 28 genomas do gênero Dietzia, 45 de Rhodococcus, 50 de Corynebacterium e 81 de Aeromonas. As análises de filogenia realizadas demonstram correção e confiabilidade biológica para as redes de interação proteica preditas pelo software desenvolvido. Por final, compara-se a qualidade de redes de interação geradas pelo GenPPI com uma rede do STRING, a principal ferramenta do estado da arte deste trabalho. Tal comparação mostra que a solução proposta é capaz de gerar redes de tão boa qualidade quanto as redes do STRING. Vale mencionar que, com essa solução, é suprida uma deficiência identificada no estado da arte, a indisponibilidade de ferramentas computacionais para prever PPIs sem negligenciar proteínas inéditas. O software desenvolvido encontra-se disponível para download no site: <https://genppi.facom.ufu.br/> ou no repositório: <https://github.com/santosardr/genppi>, onde também contém um guia do usuário.
Abstract: Protein-protein interactions play a key role in determining the outcome of most cellular processes. Correctly identifying protein interactions and the PPI networks they comprise is of fundamental importance for understanding the molecular mechanisms within the cell. This can provide useful insights in performing critical tasks such as manufacturing drugs and vaccines against diseases caused by infectious agents. Computational approaches are used combining various sources of biological data in order to predict protein interactions with satisfactory levels of reliability. In this work, we propose a new autonomous bioinformatics software (GenPPI) for ab initio prediction of interaction networks between bacterial proteins. The proposed solution analyzes genomes looking for evidence of evolutionary events that indicate protein interactions. Namely, conserved gene neighborhood events, gene fusion and conserved phylogenetic profile. This work also introduces a new heuristic for pairwise comparison of protein amino acid sequences. As a result, we first demonstrate the effectiveness of the proposed heuristic by comparing its accuracy with BLASTp, the main heuristic algorithm for comparing protein sequences. The accuracy of the two heuristic algorithms is estimated by checking which one is closest to the exact Needleman-Wunsh algorithm used for comparing biological sequences. The proposed heuristic surpassed BLASTp, presenting greater accuracy in the pair-by-pair comparison of proteins and shorter processing time. Subsequently, the biological reliability of the computational predictions performed is verified. Therefore, phylogeny analyzes were performed using data generated by the program, after processing genomes of bacterial genera selected as case studies. 28 genomes of the genus Dietzia, 45 of Rhodococcus, 50 of Corynebacterium and 81 of Aeromonas were analyzed. The phylogeny analyzes performed demonstrate correctness and biological reliability for the protein interaction networks predicted by the developed software. Finally, the quality of interaction networks generated by GenPPI is compared with a STRING network, the main state-of-the-art tool of this work. This comparison shows that the proposed solution is capable of generating networks of as good quality as the STRING networks. It is worth mentioning that, with this solution, a deficiency identified in the state of the art, the unavailability of computational tools to predict PPIs without neglecting new proteins, is addressed. The developed software is available for download on the site: <https://genppi.facom.ufu.br/> or on the repository: <https://github.com/santosardr/genppi>, where also contains a user guide.
Palabras clave: Biologia Computacional
Bioinformática
Predição ab initio de Redes de PPI
Redes Complexas
Heurísticas Para Comparação de Sequências de Proteínas
Computational Biology
Bioinformatics
Ab Initio Prediction of PPI Networks
Complex Networks
Heuristics for Protein Sequence Comparison
Computação
Área (s) del CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Tema: Computação
Bioinformática
Idioma: por
País: Brasil
Editora: Universidade Federal de Uberlândia
Programa: Programa de Pós-graduação em Ciência da Computação
Cita: ANJOS, William Ferreira dos. GenPPI: Um Software Autônomo Para Predição Ab Initio de Redes de Interação Entre Proteínas Bacterianas. 2021. 172 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2021. DOI http://doi.org/10.14393/ufu.di.2021.365.
Identificador del documento: http://doi.org/10.14393/ufu.di.2021.365
URI: https://repositorio.ufu.br/handle/123456789/32702
Fecha de defensa: 30-jun-2021
Aparece en las colecciones:DISSERTAÇÃO - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
GenppiSoftwareAutonomo.pdfDissertação29.03 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons