ex10 - nibb-gitc/gitc2018july-rnaseq GitHub Wiki

ex10: Gene set testing

ex10-1

ヒト培養細胞を使ってある薬剤の処理の有無でトランスクリプトーム解析を行い、薬剤処理によって発現が有意に上昇する遺伝子を481個同定した。それらの遺伝子のうち、Y染色体にコードされる遺伝子が18個あった。Y染色体の遺伝子が統計的に有意に多くこのDEGのリストに含まれるといえるだろうか。

ヒトの全遺伝子数は20412, Y染色体に座乗する遺伝子は71として計算せよ。

Ans

全遺伝子中Y染色体に座乗する遺伝子は、71/20412 = 0.003478346 (0.34%)。一方、DEGうちY染色体遺伝子は 18/481 = 0.03742 (3.74%)。0.34% vs 3.74% なので、DEGにおいてY染色体遺伝子の割合が多いのは確かである。統計的に有意だろうか。

Yes.

> mat <- matrix(c(18, 71 - 18, 481 - 18, 20412 - 481 - (71 - 18)), 2, byrow=F)

     [,1]  [,2]
[1,]   18   463
[2,]   53 19878
Y non-Y sum
DE 18 463 481
non-DE 53 19878 19931
total 71 20341 20412
> fisher.test(mat, alternative="greater")

	Fisher's Exact Test for Count Data

data:  mat
p-value = 3.599e-14
alternative hypothesis: true odds ratio is greater than 1
95 percent confidence interval:
 8.770868      Inf
sample estimates:
odds ratio 
  14.56866 
⚠️ **GitHub.com Fallback** ⚠️