Genome Assembly - Lavadav/EPP531_AGA GitHub Wiki

Data For Class

Cherokee Rose Subset Dataset

mkdir Raw_Data, Analysis, Results

cp /work/pbgg8900/instructor_data/Genome_Assembly_Data/Pacbio_Data/subset_SRR29286022.fastq .

ln -s path_to_raw_Data/ .

ml hifiasm/0.25.0
hifiasm -o Hifiasm_output --hg-size 50m subset_SRR29286022.fastq

ml hifiasm/0.25.0
hifiasm -o Hifiasm_output_Hi-C --hg-size 50m --h1 subset_HiC_R1.fastq.gz --h2 subset_HiC_R2.fastq.gz subset_SRR29286022.fastq

awk '/^S/{print ">"$2;print $3}' Hifiasm_output.bp.p_ctg.gfa > Hifiasm_output.bp.p_ctg.fasta

ml BBMap/39.19-GCC-13.3.0
stats.sh Hifiasm_output.bp.p_ctg.fasta > Hifiasm_output.bp.p_ctg.stats.txt