ex204 - nibb-gitc/gitc2025mar-rnaseq GitHub Wiki

ex204 メチル化callingデータの描画

pacbio社やOxford nanopore社の1分子シーケンサーは塩基のメチル化状態を解析でき、その情報を含んだbamファイルを結果として出力できる。

ここでは、pabcio社からの公開データとして、以下にGenome in a Bottle (GIAB)プロジェクトサンプルでの結果がある。

Genome in a Bottle (GIAB)プロジェクトでは、ヒトゲノムのトリオデータとしてHG002が子供、HG003が父親、HG004が母親として定義されている。

https://downloads.pacbcloud.com/public/revio/2022Q4

今回はこの中

https://downloads.pacbcloud.com/public/revio/2022Q4/HG002-rep1/analysis/

にある、以下を

https://downloads.pacbcloud.com//public/revio/2022Q4/HG002-rep1/analysis/HG002.m84011_220902_175841_s1.GRCh38.bam

wgetコマンドでダウンロードした。

wget https://downloads.pacbcloud.com/public/revio/2022Q4/HG002-rep1/analysis/HG002.m84011_220902_175841_s1.GRCh38.bam
wget https://downloads.pacbcloud.com/public/revio/2022Q4/HG002-rep1/analysis/HG002.m84011_220902_175841_s1.GRCh38.bam.bai

このままではトレーニングコースのデータとして大きすぎるので、今回はそこから以下コマンドでchr21のみのbamファイルとindexを作製したものを用意した。

samtools view -b HG002.m84011_220902_175841_s1.GRCh38.bam chr21 > HG002.m84011_220902_175841_s1.GRCh38_only_chr21.bam
samtools index HG002.m84011_220902_175841_s1.GRCh38_only_chr21.bam

課題

このHG002.m84011_220902_175841_s1.GRCh38_only_chr21.bamをIGVに読み込み、シトシン塩基のメチル化状況を確認せよ。

Data

Input reads

(ファイルは、~/gitc/data/KY/IGV/ex204 にある)

  • HG002.m84011_220902_175841_s1.GRCh38_only_chr21.bam
  • HG002.m84011_220902_175841_s1.GRCh38_only_chr21.bam.bai

Software

  • IGV (local computer)
  1. Human(GRCh38/hg38)を選択、chr21に移動。 WSB000018
  2. File → Load from fileからHG002.m84011_220902_175841_s1.GRCh38_only_chr21.bamを読み込む
  3. トラックを右クリック→Color alignmets by → base modification (5mC)を選択。 WSB000019
  4. メチル化確率によって赤色が濃くなって表示される。遺伝子名への対応も可能、例えばDYRK1Aと入力すると、その遺伝子領域が拡大される。 (DYRK1Aはダウン症候群・自閉症スペクトラム症候群をはじめとする、様々な精神神経系疾患の原因となるタンパク質キナーゼをコード) WSB000020