Ngsplot_data_integration - suimye/NGS_handson2015 GitHub Wiki

# Ngsplotの出力データからの統合化プロセス

Ngsplotを行うと、zipファイルで出力されますので、解凍すると中にheatmapを作成する時に利用したRデータがそのまま保存されています。このデータを利用して、heatmapで割り当てたgenebody-ChIPpeakの関係を抽出することが可能です。

## NGSplotデータを作成する

list.txtを作成  

echo 'Ctrl.drm.blst.rmsk.bam -1 "Ctrl"'>K9K14list.txt
echo 'TSA1.drm.blst.rmsk.bam -1 "TSA1"'>>K9K14list.txt
echo 'SAHA1.drm.blst.rmsk.bam -1 "SAHA1"'>>K9K14list.txt
ngs.plot.r -G hg19 -R genebody -C K9K14list.txt -O H3K9K14Acpeaks -L 4000 -FL 200
   H3K4K14Acpeaks.zipが生成されているので解凍  

#H3K4K14Acpeaks.zipを解凍  
unzip H3K4K14Acpeaks.zip
```  
[![https://gyazo.com/b03cdeffb4ff3b477c10400cfe0d5899](https://i.gyazo.com/b03cdeffb4ff3b477c10400cfe0d5899.png)](https://gyazo.com/b03cdeffb4ff3b477c10400cfe0d5899)


R起動して、このなかにあるheatmap.Rデータを読み込む  
  
```  

#dataオブジェクトにどんなものがあるかを確認
> ls()
 [1] "bam.pair"     "color.distr"  "color.scale"  "ctg.tbl"      "enrichList"  
 [6] "flood.frac"   "font.size"    "go.algo"      "go.list"      "go.paras"    
[11] "hm.color"     "low.count"    "ng.list"      "pts"          "reg.list"    
[16] "rr"           "uniq.reg"     "unit.width"   "v.lib.size"   "v.low.cutoff"
[21] "xticks"



#enrichListの中身をstrで眺めてみる
> str(enrichList)
List of 3
 $ : num [1:20239, 1:101] 0.1644 0.0411 0.0411 0 0.1644 ...
  ..- attr(*, "dimnames")=List of 2
  .. ..$ : chr [1:20239] "A1BG:ENST00000263100" "A1CF:ENST00000374001" "A2M:ENST00000318602" "A2ML1:ENST00000299698" ...
  .. ..$ : NULL
 $ : num [1:20239, 1:101] 0.2205 0.0441 0.0441 0 0.2205 ...
  ..- attr(*, "dimnames")=List of 2
  .. ..$ : chr [1:20239] "A1BG:ENST00000263100" "A1CF:ENST00000374001" "A2M:ENST00000318602" "A2ML1:ENST00000299698" ...
  .. ..$ : NULL
 $ : num [1:20239, 1:101] 0.137 0.137 0 0 0.228 ...
  ..- attr(*, "dimnames")=List of 2
  .. ..$ : chr [1:20239] "A1BG:ENST00000263100" "A1CF:ENST00000374001" "A2M:ENST00000318602" "A2ML1:ENST00000299698" ...
  .. ..$ : NULL
  
#classの確認   

class(enrichList[1](/suimye/NGS_handson2015/wiki/1))
[1] "matrix"

#3つのリストにmatrixが入っている


> dim(a)
[1] 20239   101

#101binある。50-51binがTSS
#bin sizeは200bp
#total 400bpだけ残す。

#rownamesがフラフラしないように、あらかじめ順序を規定するために名前を取得しておき
namae <- rownames(enrichList[1](/suimye/NGS_handson2015/wiki/1))

#ぶっかける
H3K9K14Ac <- cbind(rowSums(enrichList[1](/suimye/NGS_handson2015/wiki/1)[namae,50:51]),rowSums(enrichList[2](/suimye/NGS_handson2015/wiki/2)[namae,50:51]),rowSums(enrichList[3](/suimye/NGS_handson2015/wiki/3)[namae,50:51]))


[1] 20239     3
> head(H3K9K14Ac)
                              [,1]       [,2]       [,3]
A1BG:ENST00000263100    0.53437555 0.40966635 0.27396889
A1CF:ENST00000374001    0.08220356 0.08820424 0.31975468
A2M:ENST00000318602     0.16440671 0.08820424 0.04567924
A2ML1:ENST00000299698   0.24660448 0.04410212 0.09135848
A3GALT2:ENST00000442999 0.04110168 0.22051059 0.22839620
A4GALT:ENST00000465765  0.04110168 0.08820423 0.09135848
> 

#データの順番はこちらをみてみると
> ctg.tbl
                      cov glist title fraglen color
1  Ctrl.drm.blst.rmsk.bam    -1  Ctrl     200    NA
2  TSA.drm.blst.rmsk.bam    -1  TSA     200    NA
3 SAHA.drm.blst.rmsk.bam    -1 SAHA     200    NA

colnames(H3K9K14Ac) <- c("Ctrl","TSA","SAHA")

#完成