ex2 igv - kuratanicde/20200617-nibb-omics GitHub Wiki

ex2

IGVに用意されていないゲノムを、リファレンスゲノムの構築からやってみよう。例としてアブラムシ共生細菌Buchnera aphidicola のゲノムリシーケンスの結果を可視化する。

課題

  1. Buchnera aphidicola (Tokyo strain) のゲノムシーケンスとアノテーションをIGVにインポートする。
  2. Buchnera aphidicolaのApL(札幌系統)とLSR(ニューヨーク州系統)のリシーケンスのマッピングデータをロードしてSNPを可視化する。
  3. GC含量のplotをIGVで可視化する。

Data

(data.tar.gzをダウンロードして解凍しておいてくださいしてください)

(ファイルは, data/Buc の下 にある)

Reference genome

  • buc.genome.fasta
  • buc.gtf

NGS data

  • illumina_ex_B2_Read_bowtie2.mate.sort.bam
  • illumina_ex_B2_Read_bowtie2.mate.sort.bam.bai
  • illumina_ex_B4_Read_bowtie2.mate.sort.bam
  • illumina_ex_B4_Read_bowtie2.mate.sort.bam.bai

Pre-calculated genomic data

  • buc_cg.wig -- %GC plot (50bp window)

Software

  • IGV

IGVのインストール

ex1-igv で完了してるものとする。

BuchneraゲノムリファレンスをIGVへインポート

  1. IGVを起動。

  2. リファレンスゲノムのインポート:

Menu:Genomes > Create .genome File.

  • Unique identifier: (任意)例:Buchnera
  • Descriptive name: (任意): Buchnera
  • FASTA file: buc.genome.fasta のパスを指定。
  • Gene file: buc.gtf のパスを指定

Gene track が表示されることを確認。適当にズームイン、ズームアウト、左右の移動など、操作に慣れる。

リシーケンスデータの可視化

Menu: File > Load from File ... で, illumina_ex_B2_Read_bowtie2.mate.sort.bam, illumina_ex_B4_Read_bowtie2.mate.sort.bam を読み込む

illumina read の表示を確認する。

数値データの可視化(wigフォーマット%GC plot)

buc_cg.wig を軽量なフォーマットに変換する。

Menu: Tools -> Run igvtools

  • Command = toTDF
  • Input File = buc_cg.wig
  • Output FIle = buc_cg.wig.tdf

buc_cg.wig.tdf を IGV に読み込む

  • Menu: File > Load from file

表示形式を整える。trackを右クリックしてメニューを表示

  • Type of Graph -> Line Plot
  • Windowing Function -> Set Data Range
    • min 0
    • mid 50
    • max 100

多型の可視化

リードのトラックは、defaultでは、多型箇所が色付きで表示される。

VCFファイルを読み込んで表示させてみよう。

  • Files: bowtie2_B2_var.flt.vcf, bowtie2_B4_var.flt.vcf

Menu: Tools > Run igvtools

  • Command = Index
  • Input File = bowtie2_B*_var.flt.vcf

bowtie2_B*_var.flt.vcf.idx が生成される。

Menu: File > Load from File