Análise das redes proteína proteína do STRING - lmigueel/Bioinformatica GitHub Wiki
STRING (https://string-db.org/) é um banco de dados de interações proteína-proteína conhecidas e preditas. As interações incluem associações diretas (físicas) e indiretas (funcionais). Elas derivam da predição computacional, da transferência de conhecimento entre organismos e de interações agregadas de outros bancos de dados (primários). O legal é que essas interações possuem um score associado. Este score varia de 0 até 1000 (ou de 0 até 1). E ele é provido de diversas fontes, sendo elas: vizinhança do gene, fusão gênica, coocorrência de genes, coexpressão gênica, experimentos/bioquímica, vias anotadas e mineração de texto. Por default, o score de corte para gerar a rede proteína-proteína, neste caso interações com um valor menor que o cutoff são descartadas, é de 0.400 ou 400. No site, ao gerar o interactoma, você pode alterar este valor. O STRING é composto por 14094 organismos (acesso em 09/06/22) e mais de 67 milhões de interações. O top5 organismos com mais interações são, nesta ordem, Homo sapiens, Mus musculus, Arabidopsis thaliana, Saccharomyces cerevisiae e Escherichia coli. Neste artigo iremos abordar algumas métricas sobre os interactomas (redes proteína-proteína) presentes no STRING para todos os domínios presentes nele (Bacteria, Archaea, and Eukarya). Discutiremos métricas e selecionaremos os 10 organismos com maior volume de dados (nós+arestas) para análises topológicas de redes.
Acesse os resultados na postagem do Linkedin AQUI
Acesse os resultados no RG AQUI.