Enriquecimento GO definição e ferramentas - lmigueel/Bioinformatica GitHub Wiki

1. O QUE SÃO OS TERMOS DE GO?

Os termos GO fornecem um vocabulário padronizado para descrever genes e produtos gênicos de diferentes espécies. Os termos GO nos permitem atribuir funcionalidade aos genes. As seguintes propriedades são descritas para produtos genéticos:

  • componente celular (CC), descreve onde em uma célula um gene atua, de qual unidade celular o gene faz parte
  • função molecular (MF - molecular function), descreve a função desempenhada pelo gene, como ligação ou catálise;
  • processo biológico (BP - biological process), conjunto de funções moleculares, com início e fim definidos, constitui um processo biológico. Isso descreve fenômenos biológicos como a replicação do DNA.

Todos os termos GO têm um ID que se parece com GO:0006260 e um nome como replicação de DNA.

Todos os termos GO possuem uma lista de genes que pertencem a esse termo específico.

Os termos GO são hierárquicos, consistindo em termos GO pai mais amplos e termos GO filho mais restritos. Por exemplo, o processo de replicação do DNA é filho do termo GO de processo metabólico celular. A replicação do DNA tem termos filhos GO, como regulação da replicação do DNA, alongamento da fita.

Os processos GO podem ser encontrados AQUI.

logo

2. O QUE É ENRIQUECIMENTO DE GO?

O enriquecimento GO é uma forma de resumir as FUNÇÕES E TIPOS de genes que são expressos diferencialmente.

3. O CLÁSSICO ENRIQUECIMENTO DE GO

Você pode acessar o teste matemático em um outro post bem AQUI.

Entrada:

A. Número total de genes que estamos olhando (**todos os genes**).
B. Número de genes de interesse, ou seja, em nossa lista DEG (**DEG**).

C. Número total de genes no termo GO
D. Número de genes de nossos genes de interesse (DEG) que também estão no termo GO.

Teste de enriquecimento:

se a "lista DEG" contém mais representantes de uma determinada categoria GO do que o esperado por acaso (teste exato de Fisher, hipergeométrico ou semelhante).

Se o número de genes de nossa lista que pertencem ao termo GO GO:0001 (D) for significativo em comparação com o número total de genes nesse termo GO (C) e o número total de genes em nosso experimento (A), consideramos que o termo GO seja enriquecido em nossos dados.

4. ENRIQUECIMENTO GO BASEADO EM RANK

Entrada:

Para evitar a imposição de cortes arbitrários, insira todos os genes, classificados por algo (como foldchange, pvalue).

Teste de enriquecimento:

se uma categoria GO é significativamente enriquecida com genes de primeira linha.

5. O QUE ISSO SIGNIFICA PARA NÓS?

Muitos genes podem estar mudando, mas todos podem estar ligados a processos biológicos semelhantes. De uma lista de genes mutáveis ​​-> lista de processos biológicos afetados. Podemos elucidar melhor os eventos biológicos representados por nossa descoberta diferencial de genes.

Também reduzimos o conjunto de dados consideravelmente - de um grande número de genes para um número menor de funções/processos.

Vamos de genes regulados para cima e para baixo entre duas condições para processos regulados para cima e para baixo entre duas condições. Por isso é importante, em uma análise de Transcriptômica, fazer o enriquecimento dos genes up-regulated e down-regulated.

6. FERRAMENTAS DISPONÍVEIS PARA ENRIQUECIMENTO DE GO / PATHWAY

Pacote R: GOSeq e topGO

Ferramenta baseada na web para enriquecimento GO: Gorilla, DAVID, Panther e GSEA.

Ferramenta baseada na web para enriquecimento de pathways/GO: Enrichr e GSEA.

veja o nosso post sobre o GSEA AQUI.