Ngsplot_data_integration - suimye/NGS_handson2015 GitHub Wiki
# Ngsplotの出力データからの統合化プロセス
Ngsplotを行うと、zipファイルで出力されますので、解凍すると中にheatmapを作成する時に利用したRデータがそのまま保存されています。このデータを利用して、heatmapで割り当てたgenebody-ChIPpeakの関係を抽出することが可能です。
## NGSplotデータを作成する
list.txtを作成
echo 'Ctrl.drm.blst.rmsk.bam -1 "Ctrl"'>K9K14list.txt
echo 'TSA1.drm.blst.rmsk.bam -1 "TSA1"'>>K9K14list.txt
echo 'SAHA1.drm.blst.rmsk.bam -1 "SAHA1"'>>K9K14list.txt
ngs.plot.r -G hg19 -R genebody -C K9K14list.txt -O H3K9K14Acpeaks -L 4000 -FL 200
H3K4K14Acpeaks.zipが生成されているので解凍
#H3K4K14Acpeaks.zipを解凍
unzip H3K4K14Acpeaks.zip
```
[](https://gyazo.com/b03cdeffb4ff3b477c10400cfe0d5899)
R起動して、このなかにあるheatmap.Rデータを読み込む
```
#dataオブジェクトにどんなものがあるかを確認
> ls()
[1] "bam.pair" "color.distr" "color.scale" "ctg.tbl" "enrichList"
[6] "flood.frac" "font.size" "go.algo" "go.list" "go.paras"
[11] "hm.color" "low.count" "ng.list" "pts" "reg.list"
[16] "rr" "uniq.reg" "unit.width" "v.lib.size" "v.low.cutoff"
[21] "xticks"
#enrichListの中身をstrで眺めてみる
> str(enrichList)
List of 3
$ : num [1:20239, 1:101] 0.1644 0.0411 0.0411 0 0.1644 ...
..- attr(*, "dimnames")=List of 2
.. ..$ : chr [1:20239] "A1BG:ENST00000263100" "A1CF:ENST00000374001" "A2M:ENST00000318602" "A2ML1:ENST00000299698" ...
.. ..$ : NULL
$ : num [1:20239, 1:101] 0.2205 0.0441 0.0441 0 0.2205 ...
..- attr(*, "dimnames")=List of 2
.. ..$ : chr [1:20239] "A1BG:ENST00000263100" "A1CF:ENST00000374001" "A2M:ENST00000318602" "A2ML1:ENST00000299698" ...
.. ..$ : NULL
$ : num [1:20239, 1:101] 0.137 0.137 0 0 0.228 ...
..- attr(*, "dimnames")=List of 2
.. ..$ : chr [1:20239] "A1BG:ENST00000263100" "A1CF:ENST00000374001" "A2M:ENST00000318602" "A2ML1:ENST00000299698" ...
.. ..$ : NULL
#classの確認
class(enrichList[1](/suimye/NGS_handson2015/wiki/1))
[1] "matrix"
#3つのリストにmatrixが入っている
> dim(a)
[1] 20239 101
#101binある。50-51binがTSS
#bin sizeは200bp
#total 400bpだけ残す。
#rownamesがフラフラしないように、あらかじめ順序を規定するために名前を取得しておき
namae <- rownames(enrichList[1](/suimye/NGS_handson2015/wiki/1))
#ぶっかける
H3K9K14Ac <- cbind(rowSums(enrichList[1](/suimye/NGS_handson2015/wiki/1)[namae,50:51]),rowSums(enrichList[2](/suimye/NGS_handson2015/wiki/2)[namae,50:51]),rowSums(enrichList[3](/suimye/NGS_handson2015/wiki/3)[namae,50:51]))
[1] 20239 3
> head(H3K9K14Ac)
[,1] [,2] [,3]
A1BG:ENST00000263100 0.53437555 0.40966635 0.27396889
A1CF:ENST00000374001 0.08220356 0.08820424 0.31975468
A2M:ENST00000318602 0.16440671 0.08820424 0.04567924
A2ML1:ENST00000299698 0.24660448 0.04410212 0.09135848
A3GALT2:ENST00000442999 0.04110168 0.22051059 0.22839620
A4GALT:ENST00000465765 0.04110168 0.08820423 0.09135848
>
#データの順番はこちらをみてみると
> ctg.tbl
cov glist title fraglen color
1 Ctrl.drm.blst.rmsk.bam -1 Ctrl 200 NA
2 TSA.drm.blst.rmsk.bam -1 TSA 200 NA
3 SAHA.drm.blst.rmsk.bam -1 SAHA 200 NA
colnames(H3K9K14Ac) <- c("Ctrl","TSA","SAHA")
#完成