sample_sheet_template - ncc-gap/GCATWorkflow GitHub Wiki

サンプルシートテンプレート

germline

# --------------------------
# 1. 入力データのマッピング
# --------------------------
# 1-1. fastq --> bam
[fastq]
# sample,R1,R2の順に , 区切りで記述する
tumor1,/path/to/tumor1/R1.fastq,/path/to/tumor1/R2.fastq
# シーケンスデータが分割されている場合, ; で区切る
tumor2,/path/to/tumor2/R1_1.fq;/path/to/tumor2/R1_2.fq,/path/to/tumor2/R2_1.fq;/path/to/tumor2/R2_2.fq

# 1-2. bam --> fastq --> bam
[bam_tofastq]
# sample,bamの順に , 区切りで記述する
tumor3,/path/to/tumor3/tumor3.markdup.cram

# 1-3. bam (そのまま使用)
[bam_import]
# sample,bamの順に , 区切りで記述する
tumor4,/path/to/tumor4/tumor4.markdup.cram

# --------------------------
# 2. データ解析
# --------------------------
# 解析したい sample を解析したいアルゴリズムの下に列挙する

[collect_wgs_metrics]
tumor1
tumor2
tumor3
tumor4

[collect_multiple_metrics]
tumor1

[manta]
tumor1

[gridss]
tumor1

[melt]
tumor1

# ------------------------------------
# 3. データ解析 (HaplotypeCaller)
# ------------------------------------
# HaplotypeCaller を実行する場合はサンプル毎に別途リードグループファイルを用意し
# [readgroup] に記載する

[haplotypecaller_parabricks]
tumor1
tumor2

[readgroup]
tumor1,/path/to/tumor1.metadata.txt
tumor2,/path/to/tumor2.metadata.txt

リードグループファイルの記載例

bwa mem コマンドの -R オプションに使用できる形式で記載すること
複数行入力可能

@RG\tID:tumor1\tPL:na\tLB:ILLUMINA\tSM:tumor1\tPU:na

somatic

# --------------------------
# 1. 入力データのマッピング
# --------------------------
[fastq]
tumor1,/path/to/tumor1/R1.fastq,/path/to/tumor1/R2.fastq
normal1,/path/to/normal1/R1.fastq,/path/to/normal1/R2.fastq
pool1,/path/to/pool1/R1_1.fq;/path/to/pool1/R1_2.fq,/path/to/pool1/R2_1.fq;/path/to/pool1/R2_2.fq

[bam_tofastq]
pool2,/path/to/pool2/pool2.markdup.cram

[bam_import]
pool3,/path/to/pool3/pool3.markdup.cram

# --------------------------
# 2. データ解析
# --------------------------
[collect_wgs_metrics]
tumor1

[collect_multiple_metrics]
tumor1

[manta]
# tumor,controlの順に , 区切りで記述する
tumor1,normal1

[gridss]
# tumor,controlの順に , 区切りで記述する
tumor1,normal1

[genomon_mutation_call]
# tumor,controlの順に , 区切りで記述する
tumor1,normal1

[genomon_sv]
# tumor,controlの順に , 区切りで記述する
tumor1,normal1

# ------------------------------------
# 3. データ解析 (MutectCaller)
# ------------------------------------
# MutectCaller を実行する場合はサンプル毎に別途リードグループファイルを用意し
# [readgroup] に記載する

[mutectcaller_parabricks]
# tumor,controlの順に , 区切りで記述する
tumor1,normal1

[readgroup]
tumor1,/path/to/tumor1.metadata.txt
normal1,/path/to/normal1.metadata.txt

リードグループファイルの記載例

bwa mem コマンドの -R オプションに使用できる形式で記載すること
複数行入力可能

@RG\tID:tumor1\tPL:na\tLB:ILLUMINA\tSM:tumor1\tPU:na

rna

# --------------------------
# 1. 入力データのマッピング
# --------------------------
[fastq]
# ペアリードの場合
# sample,R1,R2の順に , 区切りで記述する
tumor1,/path/to/tumor1/R1.fastq,/path/to/tumor1/R2.fastq

# シングルリードの場合
# sample,R1の順に , 区切りで記述する
tumor2,/path/to/tumor2/R1.fastq

# シーケンスデータが分割されている場合, ; で区切る
pool1,/path/to/pool1/R1_1.fq;/path/to/pool1/R1_2.fq,/path/to/pool1/R2_1.fq;/path/to/pool1/R2_2.fq

[bam_tofastq]
pool2,/path/to/pool2/pool2.Aligned.sortedByCoord.out.bam

[bam_import]
pool3,/path/to/pool3/pool3.Aligned.sortedByCoord.out.bam

# SRA から取得する場合、RUNIDを記載する
[sra_fastq_dump]
sampleA,DRR123456

# --------------------------
# 2. データ解析
# --------------------------

[expression]
tumor1

[star_fusion]
tumor1

[intron_retention]
tumor1

[iravnet]
tumor1

[juncmut]
tumor1

[kallisto]
tumor1

[fusionfusion]
# tumor,コントロールパネルの順に , 区切りで記述する
tumor1,list1
# コントロールパネルが存在しない場合
tumor2,None

# --------------------------
# 3. コントロールパネル
# -------------------------
[controlpanel]
list1,pool1,pool2,pool3
⚠️ **GitHub.com Fallback** ⚠️