ex204 - nibb-gitc/gitc2025mar-rnaseq GitHub Wiki
ex204 メチル化callingデータの描画
pacbio社やOxford nanopore社の1分子シーケンサーは塩基のメチル化状態を解析でき、その情報を含んだbamファイルを結果として出力できる。
ここでは、pabcio社からの公開データとして、以下にGenome in a Bottle (GIAB)プロジェクトサンプルでの結果がある。
Genome in a Bottle (GIAB)プロジェクトでは、ヒトゲノムのトリオデータとしてHG002が子供、HG003が父親、HG004が母親として定義されている。
https://downloads.pacbcloud.com/public/revio/2022Q4
今回はこの中
https://downloads.pacbcloud.com/public/revio/2022Q4/HG002-rep1/analysis/
にある、以下を
wgetコマンドでダウンロードした。
wget https://downloads.pacbcloud.com/public/revio/2022Q4/HG002-rep1/analysis/HG002.m84011_220902_175841_s1.GRCh38.bam
wget https://downloads.pacbcloud.com/public/revio/2022Q4/HG002-rep1/analysis/HG002.m84011_220902_175841_s1.GRCh38.bam.bai
このままではトレーニングコースのデータとして大きすぎるので、今回はそこから以下コマンドでchr21のみのbamファイルとindexを作製したものを用意した。
samtools view -b HG002.m84011_220902_175841_s1.GRCh38.bam chr21 > HG002.m84011_220902_175841_s1.GRCh38_only_chr21.bam
samtools index HG002.m84011_220902_175841_s1.GRCh38_only_chr21.bam
課題
このHG002.m84011_220902_175841_s1.GRCh38_only_chr21.bamをIGVに読み込み、シトシン塩基のメチル化状況を確認せよ。
Data
Input reads
(ファイルは、~/gitc/data/KY/IGV/ex204 にある)
- HG002.m84011_220902_175841_s1.GRCh38_only_chr21.bam
- HG002.m84011_220902_175841_s1.GRCh38_only_chr21.bam.bai
Software
- IGV (local computer)
- Human(GRCh38/hg38)を選択、chr21に移動。
- File → Load from fileからHG002.m84011_220902_175841_s1.GRCh38_only_chr21.bamを読み込む
- トラックを右クリック→Color alignmets by → base modification (5mC)を選択。
- メチル化確率によって赤色が濃くなって表示される。遺伝子名への対応も可能、例えばDYRK1Aと入力すると、その遺伝子領域が拡大される。
(DYRK1Aはダウン症候群・自閉症スペクトラム症候群をはじめとする、様々な精神神経系疾患の原因となるタンパク質キナーゼをコード)