Enriquecimento GO definição e ferramentas - lmigueel/Bioinformatica GitHub Wiki
1. O QUE SÃO OS TERMOS DE GO?
Os termos GO fornecem um vocabulário padronizado para descrever genes e produtos gênicos de diferentes espécies. Os termos GO nos permitem atribuir funcionalidade aos genes. As seguintes propriedades são descritas para produtos genéticos:
- componente celular (CC), descreve onde em uma célula um gene atua, de qual unidade celular o gene faz parte
- função molecular (MF - molecular function), descreve a função desempenhada pelo gene, como ligação ou catálise;
- processo biológico (BP - biological process), conjunto de funções moleculares, com início e fim definidos, constitui um processo biológico. Isso descreve fenômenos biológicos como a replicação do DNA.
Todos os termos GO têm um ID que se parece com GO:0006260 e um nome como replicação de DNA.
Todos os termos GO possuem uma lista de genes que pertencem a esse termo específico.
Os termos GO são hierárquicos, consistindo em termos GO pai mais amplos e termos GO filho mais restritos. Por exemplo, o processo de replicação do DNA é filho do termo GO de processo metabólico celular. A replicação do DNA tem termos filhos GO, como regulação da replicação do DNA, alongamento da fita.
Os processos GO podem ser encontrados AQUI.
2. O QUE É ENRIQUECIMENTO DE GO?
O enriquecimento GO é uma forma de resumir as FUNÇÕES E TIPOS de genes que são expressos diferencialmente.
3. O CLÁSSICO ENRIQUECIMENTO DE GO
Você pode acessar o teste matemático em um outro post bem AQUI.
Entrada:
A. Número total de genes que estamos olhando (**todos os genes**).
B. Número de genes de interesse, ou seja, em nossa lista DEG (**DEG**).
C. Número total de genes no termo GO
D. Número de genes de nossos genes de interesse (DEG) que também estão no termo GO.
Teste de enriquecimento:
se a "lista DEG" contém mais representantes de uma determinada categoria GO do que o esperado por acaso (teste exato de Fisher, hipergeométrico ou semelhante).
Se o número de genes de nossa lista que pertencem ao termo GO GO:0001 (D) for significativo em comparação com o número total de genes nesse termo GO (C) e o número total de genes em nosso experimento (A), consideramos que o termo GO seja enriquecido em nossos dados.
4. ENRIQUECIMENTO GO BASEADO EM RANK
Entrada:
Para evitar a imposição de cortes arbitrários, insira todos os genes, classificados por algo (como foldchange, pvalue).
Teste de enriquecimento:
se uma categoria GO é significativamente enriquecida com genes de primeira linha.
5. O QUE ISSO SIGNIFICA PARA NÓS?
Muitos genes podem estar mudando, mas todos podem estar ligados a processos biológicos semelhantes. De uma lista de genes mutáveis -> lista de processos biológicos afetados. Podemos elucidar melhor os eventos biológicos representados por nossa descoberta diferencial de genes.
Também reduzimos o conjunto de dados consideravelmente - de um grande número de genes para um número menor de funções/processos.
Vamos de genes regulados para cima e para baixo entre duas condições para processos regulados para cima e para baixo entre duas condições. Por isso é importante, em uma análise de Transcriptômica, fazer o enriquecimento dos genes up-regulated e down-regulated.
6. FERRAMENTAS DISPONÍVEIS PARA ENRIQUECIMENTO DE GO / PATHWAY
Ferramenta baseada na web para enriquecimento GO: Gorilla, DAVID, Panther e GSEA.
Ferramenta baseada na web para enriquecimento de pathways/GO: Enrichr e GSEA.
veja o nosso post sobre o GSEA AQUI.