ex1 igv - kuratanicde/20200617-nibb-omics GitHub Wiki

ex1

シロイヌナズナ Arabidopsis thaliana のRNA-seqを題材に、IGVでトランスクリプトームデータを可視化する。

RNA-seqライブラリは2D sample (2days dark conditionで生育させた黄色芽生え)と2D2L sample (その後さらに2days light conditionで生育させた緑化芽生え)の2種類。実際は、biological replicatesを3つとった実験であるが、ここでは練習のためにそれぞれの条件のライブラリから1つずつ、Illumina MiSeqでシーケンスしたデータを用意した。得られたFASTQフォーマットのシーケンスデータをArabidopsis thaliana TAIR10のリファレンスゲノムにHiSat2を使ってアライメントした。その結果はSAMフォーマットで出力された。さらに、samtoolsで、BAMフォーマットへ変換、座標でソート、インデクシングまで行った結果がここに用意してある。

課題 Arabidopsis thaliana のRNA-seqを題材に、IGVでトランスクリプトームデータを可視化する。例として、splice variant geneとして知られているAT1G02840 locusに注目する。

Data

(data.tar.gzをダウンロードして解凍しておいてくださいしてください)

Input reads

(ファイルは、data/IGV_AT にある)

  • 2D2L_rep1.sorted.bam
  • 2D2L_rep1.sorted.bam.bai
  • 2D_rep1.sorted.bam
  • 2D_rep1.sorted.bam.bai

Software

  • IGV

IGVのインストール

開発者HPからダウンロード。

自分のマシンに合わせて、IGV Mac Appもしくは、 IGV for Windows を選択。インストーラーの指示に従ってインストール。

TAIR10のゲノムデータをロード。

  1. IGVを起動。

  2. リファレンスゲノムのロード:左上のrefrence指定ボックス右の下矢印をクリックし、More > A.thaliana(TAIR10)を選択

RNA-seqデータの可視化

  1. File > Load from File ... で作製した.sort.bamを読み込む 適当にズームアップする。

ここではsplice variantが知られている、splicing factor SRP34(AT1G02840)のgene locusを見てみる。tool barのsearch boxにAT1G02840と入力してリターンすると、そのローカスが表示される。

alignmentトラックの他に、自動で計算される、coverageトラックやjunctionトラックも確認しよう。表示されていない場合は、右クリックでpop-upするメニューで表示させる。

Sashimi-Plot

Sashimi-Plotを描画してみる。

https://software.broadinstitute.org/software/igv/Sashimi

Sashimi-Plotはゲノム座標とgtf情報に沿ったアライメントデータから、複数のサンプルのスプライスジャンクションを視覚化できる。サンプルごとのスプライスバリアントの可視化に適している

ここではsplice variantが知られている、splicing factor SRP34(AT1G02840)のgene locusのSashimi-Plotを見てみる。

junction trackを右クリックし、ポップアップからSashimi-Plotを選択する。

エキソン連結数などが表示された結果が得られることを確認。

イントロン-エクソンの関係が一目瞭然である。それだけでなく、(今回のデータだけではデータ量不足で確定的なことは言えないが)TAIR10にアノテーションされていないエキソンが存在してそうなこともわかる。

Tips

View > PreferencesのalignmetsタブのVisibility range threshold(kb)を上げると広い領域でアライメントの描画が可能。

Tips

データ量が大きくなると、メモリー不足の警告が出ることがある。その場合はメモリの割り当てを増やすと良い。Windows版の場合、起動時のbatファイル(igv.bat)でjavaのヒープメモリー最大値を設定できる(-Xmx 16gとすれば16g割り当て)。Mac版の場合は、IGV_2.7.2.app/Contents/MacOS/IGV にjavaの起動オプションが記載してある。