ex10 - nibb-gitc/gitc2018july-rnaseq GitHub Wiki
ヒト培養細胞を使ってある薬剤の処理の有無でトランスクリプトーム解析を行い、薬剤処理によって発現が有意に上昇する遺伝子を481個同定した。それらの遺伝子のうち、Y染色体にコードされる遺伝子が18個あった。Y染色体の遺伝子が統計的に有意に多くこのDEGのリストに含まれるといえるだろうか。
ヒトの全遺伝子数は20412, Y染色体に座乗する遺伝子は71として計算せよ。
全遺伝子中Y染色体に座乗する遺伝子は、71/20412 = 0.003478346 (0.34%)。一方、DEGうちY染色体遺伝子は 18/481 = 0.03742 (3.74%)。0.34% vs 3.74% なので、DEGにおいてY染色体遺伝子の割合が多いのは確かである。統計的に有意だろうか。
Yes.
> mat <- matrix(c(18, 71 - 18, 481 - 18, 20412 - 481 - (71 - 18)), 2, byrow=F)
[,1] [,2]
[1,] 18 463
[2,] 53 19878
Y | non-Y | sum | |
DE | 18 | 463 | 481 |
non-DE | 53 | 19878 | 19931 |
total | 71 | 20341 | 20412 |
> fisher.test(mat, alternative="greater")
Fisher's Exact Test for Count Data
data: mat
p-value = 3.599e-14
alternative hypothesis: true odds ratio is greater than 1
95 percent confidence interval:
8.770868 Inf
sample estimates:
odds ratio
14.56866