Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/32702
Full metadata record
DC FieldValueLanguage
dc.creatorAnjos, William Ferreira dos-
dc.date.accessioned2021-09-06T14:55:23Z-
dc.date.available2021-09-06T14:55:23Z-
dc.date.issued2021-06-30-
dc.identifier.citationANJOS, William Ferreira dos. GenPPI: Um Software Autônomo Para Predição Ab Initio de Redes de Interação Entre Proteínas Bacterianas. 2021. 172 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2021. DOI http://doi.org/10.14393/ufu.di.2021.365.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/32702-
dc.description.abstractProtein-protein interactions play a key role in determining the outcome of most cellular processes. Correctly identifying protein interactions and the PPI networks they comprise is of fundamental importance for understanding the molecular mechanisms within the cell. This can provide useful insights in performing critical tasks such as manufacturing drugs and vaccines against diseases caused by infectious agents. Computational approaches are used combining various sources of biological data in order to predict protein interactions with satisfactory levels of reliability. In this work, we propose a new autonomous bioinformatics software (GenPPI) for ab initio prediction of interaction networks between bacterial proteins. The proposed solution analyzes genomes looking for evidence of evolutionary events that indicate protein interactions. Namely, conserved gene neighborhood events, gene fusion and conserved phylogenetic profile. This work also introduces a new heuristic for pairwise comparison of protein amino acid sequences. As a result, we first demonstrate the effectiveness of the proposed heuristic by comparing its accuracy with BLASTp, the main heuristic algorithm for comparing protein sequences. The accuracy of the two heuristic algorithms is estimated by checking which one is closest to the exact Needleman-Wunsh algorithm used for comparing biological sequences. The proposed heuristic surpassed BLASTp, presenting greater accuracy in the pair-by-pair comparison of proteins and shorter processing time. Subsequently, the biological reliability of the computational predictions performed is verified. Therefore, phylogeny analyzes were performed using data generated by the program, after processing genomes of bacterial genera selected as case studies. 28 genomes of the genus Dietzia, 45 of Rhodococcus, 50 of Corynebacterium and 81 of Aeromonas were analyzed. The phylogeny analyzes performed demonstrate correctness and biological reliability for the protein interaction networks predicted by the developed software. Finally, the quality of interaction networks generated by GenPPI is compared with a STRING network, the main state-of-the-art tool of this work. This comparison shows that the proposed solution is capable of generating networks of as good quality as the STRING networks. It is worth mentioning that, with this solution, a deficiency identified in the state of the art, the unavailability of computational tools to predict PPIs without neglecting new proteins, is addressed. The developed software is available for download on the site: <https://genppi.facom.ufu.br/> or on the repository: <https://github.com/santosardr/genppi>, where also contains a user guide.pt_BR
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectBiologia Computacionalpt_BR
dc.subjectBioinformáticapt_BR
dc.subjectPredição ab initio de Redes de PPIpt_BR
dc.subjectRedes Complexaspt_BR
dc.subjectHeurísticas Para Comparação de Sequências de Proteínaspt_BR
dc.subjectComputational Biologypt_BR
dc.subjectBioinformaticspt_BR
dc.subjectAb Initio Prediction of PPI Networkspt_BR
dc.subjectComplex Networkspt_BR
dc.subjectHeuristics for Protein Sequence Comparisonpt_BR
dc.subjectComputaçãopt_BR
dc.titleGenPPI: um software autônomo para predição ab initio de redes de interação entre proteínas bacterianaspt_BR
dc.title.alternativeGenPPI: a standalone software for ab initio prediction of interaction networks between bacterial proteinspt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor1Santos, Anderson Rodrigues dos-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3752226356973936pt_BR
dc.contributor.referee1Amaral, Laurence Rodrigues do-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/6978567037098928pt_BR
dc.contributor.referee2Santos, Marcos Augusto dos-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/7251716819215153pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/1681545994304438pt_BR
dc.description.degreenameDissertação (Mestrado)pt_BR
dc.description.resumoAs interações proteína-proteína (do inglês, Protein-Protein Interactions – PPI) desempenham um papel fundamental na determinação do resultado da maioria dos processos celulares. Identificar corretamente as interações de proteínas e as redes de PPI que elas compreendem, é de fundamental importância para o entendimento dos mecanismos moleculares dentro da célula. Isso pode fornecer informações úteis na realização de tarefas críticas como a fabricação de drogas e vacinas contra doenças causadas por agentes infecciosos. Abordagens computacionais são utilizadas combinando várias fontes de dados biológicos, a fim de prever interações de proteínas com níveis satisfatórios de confiabilidade. Neste trabalho, propõe-se um novo software autônomo de bioinformática (GenPPI) para predição ab initio de redes de interação entre proteínas bacterianas. A solução proposta analisa genomas buscando por evidências de eventos evolutivos que indicam interações de proteínas. A saber, eventos de vizinhança gênica conservada, fusão gênica e perfil filogenético conservado. Este trabalho também introduz uma nova heurística para comparação par-a-par de sequências de aminoácidos de proteínas. Como resultados, primeiramente demonstra-se a eficácia da heurística proposta comparando sua exatidão com o BLASTp, o principal algoritmo heurístico para comparação de sequências proteicas. A exatidão do dois algoritmos heurísticos é estimada verificando qual se aproxima mais do algoritmo exato Needleman-Wunsh, utilizado para comparação de sequências biológicas. A heurística proposta superou o BLASTp apresentando maior exatidão na comparação par-a-par de proteínas e menor tempo de processamento. Posteriormente, a confiabilidade biológica das predições computacionais realizadas, é verificada. Para tanto, foram feitas análises de filogenia a partir de dados gerados pelo programa, após processar genomas de gêneros bacterianos selecionados como estudos de caso. Foram analisados 28 genomas do gênero Dietzia, 45 de Rhodococcus, 50 de Corynebacterium e 81 de Aeromonas. As análises de filogenia realizadas demonstram correção e confiabilidade biológica para as redes de interação proteica preditas pelo software desenvolvido. Por final, compara-se a qualidade de redes de interação geradas pelo GenPPI com uma rede do STRING, a principal ferramenta do estado da arte deste trabalho. Tal comparação mostra que a solução proposta é capaz de gerar redes de tão boa qualidade quanto as redes do STRING. Vale mencionar que, com essa solução, é suprida uma deficiência identificada no estado da arte, a indisponibilidade de ferramentas computacionais para prever PPIs sem negligenciar proteínas inéditas. O software desenvolvido encontra-se disponível para download no site: <https://genppi.facom.ufu.br/> ou no repositório: <https://github.com/santosardr/genppi>, onde também contém um guia do usuário.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computaçãopt_BR
dc.sizeorduration172pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.identifier.doihttp://doi.org/10.14393/ufu.di.2021.365pt_BR
dc.orcid.putcode99552626-
dc.crossref.doibatchid02c8900a-827d-4476-be07-258cba8c046c-
dc.subject.autorizadoComputaçãopt_BR
dc.subject.autorizadoBioinformáticapt_BR
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
GenppiSoftwareAutonomo.pdfDissertação29.03 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons