sample_sheet_template - ncc-gap/GCATWorkflow GitHub Wiki
# --------------------------
# 1. 入力データのマッピング
# --------------------------
# 1-1. fastq --> bam
[fastq]
# sample,R1,R2の順に , 区切りで記述する
tumor1,/path/to/tumor1/R1.fastq,/path/to/tumor1/R2.fastq
# シーケンスデータが分割されている場合, ; で区切る
tumor2,/path/to/tumor2/R1_1.fq;/path/to/tumor2/R1_2.fq,/path/to/tumor2/R2_1.fq;/path/to/tumor2/R2_2.fq
# 1-2. bam --> fastq --> bam
[bam_tofastq]
# sample,bamの順に , 区切りで記述する
tumor3,/path/to/tumor3/tumor3.markdup.cram
# 1-3. bam (そのまま使用)
[bam_import]
# sample,bamの順に , 区切りで記述する
tumor4,/path/to/tumor4/tumor4.markdup.cram
# --------------------------
# 2. データ解析
# --------------------------
# 解析したい sample を解析したいアルゴリズムの下に列挙する
[collect_wgs_metrics]
tumor1
tumor2
tumor3
tumor4
[collect_multiple_metrics]
tumor1
[manta]
tumor1
[gridss]
tumor1
[melt]
tumor1
# ------------------------------------
# 3. データ解析 (HaplotypeCaller)
# ------------------------------------
# HaplotypeCaller を実行する場合はサンプル毎に別途リードグループファイルを用意し
# [readgroup] に記載する
[haplotypecaller_parabricks]
tumor1
tumor2
[readgroup]
tumor1,/path/to/tumor1.metadata.txt
tumor2,/path/to/tumor2.metadata.txt
リードグループファイルの記載例
bwa mem
コマンドの -R
オプションに使用できる形式で記載すること
複数行入力可能
@RG\tID:tumor1\tPL:na\tLB:ILLUMINA\tSM:tumor1\tPU:na
# --------------------------
# 1. 入力データのマッピング
# --------------------------
[fastq]
tumor1,/path/to/tumor1/R1.fastq,/path/to/tumor1/R2.fastq
normal1,/path/to/normal1/R1.fastq,/path/to/normal1/R2.fastq
pool1,/path/to/pool1/R1_1.fq;/path/to/pool1/R1_2.fq,/path/to/pool1/R2_1.fq;/path/to/pool1/R2_2.fq
[bam_tofastq]
pool2,/path/to/pool2/pool2.markdup.cram
[bam_import]
pool3,/path/to/pool3/pool3.markdup.cram
# --------------------------
# 2. データ解析
# --------------------------
[collect_wgs_metrics]
tumor1
[collect_multiple_metrics]
tumor1
[manta]
# tumor,controlの順に , 区切りで記述する
tumor1,normal1
[gridss]
# tumor,controlの順に , 区切りで記述する
tumor1,normal1
[genomon_mutation_call]
# tumor,controlの順に , 区切りで記述する
tumor1,normal1
[genomon_sv]
# tumor,controlの順に , 区切りで記述する
tumor1,normal1
# ------------------------------------
# 3. データ解析 (MutectCaller)
# ------------------------------------
# MutectCaller を実行する場合はサンプル毎に別途リードグループファイルを用意し
# [readgroup] に記載する
[mutectcaller_parabricks]
# tumor,controlの順に , 区切りで記述する
tumor1,normal1
[readgroup]
tumor1,/path/to/tumor1.metadata.txt
normal1,/path/to/normal1.metadata.txt
リードグループファイルの記載例
bwa mem
コマンドの -R
オプションに使用できる形式で記載すること
複数行入力可能
@RG\tID:tumor1\tPL:na\tLB:ILLUMINA\tSM:tumor1\tPU:na
# --------------------------
# 1. 入力データのマッピング
# --------------------------
[fastq]
# ペアリードの場合
# sample,R1,R2の順に , 区切りで記述する
tumor1,/path/to/tumor1/R1.fastq,/path/to/tumor1/R2.fastq
# シングルリードの場合
# sample,R1の順に , 区切りで記述する
tumor2,/path/to/tumor2/R1.fastq
# シーケンスデータが分割されている場合, ; で区切る
pool1,/path/to/pool1/R1_1.fq;/path/to/pool1/R1_2.fq,/path/to/pool1/R2_1.fq;/path/to/pool1/R2_2.fq
[bam_tofastq]
pool2,/path/to/pool2/pool2.Aligned.sortedByCoord.out.bam
[bam_import]
pool3,/path/to/pool3/pool3.Aligned.sortedByCoord.out.bam
# SRA から取得する場合、RUNIDを記載する
[sra_fastq_dump]
sampleA,DRR123456
# --------------------------
# 2. データ解析
# --------------------------
[expression]
tumor1
[star_fusion]
tumor1
[intron_retention]
tumor1
[iravnet]
tumor1
[juncmut]
tumor1
[kallisto]
tumor1
[fusionfusion]
# tumor,コントロールパネルの順に , 区切りで記述する
tumor1,list1
# コントロールパネルが存在しない場合
tumor2,None
# --------------------------
# 3. コントロールパネル
# -------------------------
[controlpanel]
list1,pool1,pool2,pool3