ex2 igv - kuratanicde/20200617-nibb-omics GitHub Wiki
ex2
IGVに用意されていないゲノムを、リファレンスゲノムの構築からやってみよう。例としてアブラムシ共生細菌Buchnera aphidicola のゲノムリシーケンスの結果を可視化する。
課題
- Buchnera aphidicola (Tokyo strain) のゲノムシーケンスとアノテーションをIGVにインポートする。
- Buchnera aphidicolaのApL(札幌系統)とLSR(ニューヨーク州系統)のリシーケンスのマッピングデータをロードしてSNPを可視化する。
- GC含量のplotをIGVで可視化する。
Data
(data.tar.gzをダウンロードして解凍しておいてくださいしてください)
(ファイルは, data/Buc の下 にある)
Reference genome
- buc.genome.fasta
- buc.gtf
NGS data
- illumina_ex_B2_Read_bowtie2.mate.sort.bam
- illumina_ex_B2_Read_bowtie2.mate.sort.bam.bai
- illumina_ex_B4_Read_bowtie2.mate.sort.bam
- illumina_ex_B4_Read_bowtie2.mate.sort.bam.bai
Pre-calculated genomic data
- buc_cg.wig -- %GC plot (50bp window)
Software
- IGV
IGVのインストール
ex1-igv で完了してるものとする。
BuchneraゲノムリファレンスをIGVへインポート
-
IGVを起動。
-
リファレンスゲノムのインポート:
Menu:Genomes > Create .genome File.
- Unique identifier: (任意)例:Buchnera
- Descriptive name: (任意): Buchnera
- FASTA file: buc.genome.fasta のパスを指定。
- Gene file: buc.gtf のパスを指定
Gene track が表示されることを確認。適当にズームイン、ズームアウト、左右の移動など、操作に慣れる。
リシーケンスデータの可視化
Menu: File > Load from File ... で, illumina_ex_B2_Read_bowtie2.mate.sort.bam, illumina_ex_B4_Read_bowtie2.mate.sort.bam を読み込む
illumina read の表示を確認する。
数値データの可視化(wigフォーマット%GC plot)
buc_cg.wig を軽量なフォーマットに変換する。
Menu: Tools -> Run igvtools
- Command = toTDF
- Input File = buc_cg.wig
- Output FIle = buc_cg.wig.tdf
buc_cg.wig.tdf を IGV に読み込む
- Menu: File > Load from file
表示形式を整える。trackを右クリックしてメニューを表示
- Type of Graph -> Line Plot
- Windowing Function -> Set Data Range
- min 0
- mid 50
- max 100
多型の可視化
リードのトラックは、defaultでは、多型箇所が色付きで表示される。
VCFファイルを読み込んで表示させてみよう。
- Files: bowtie2_B2_var.flt.vcf, bowtie2_B4_var.flt.vcf
Menu: Tools > Run igvtools
- Command = Index
- Input File = bowtie2_B*_var.flt.vcf
bowtie2_B*_var.flt.vcf.idx が生成される。
Menu: File > Load from File