一款用于鉴定三代长reads(HiFi, ONT, CLR)的软件。经作者检验,其准确度高于pbsv, svim, sniffles。
安装
conda create -n cutesv -c bioconda cutesv
简单使用
cuteSV <sorted.bam> <reference.fa> <output.vcf> <work_dir>
# work_dir 用于存储运行过程中的中间中间,最终都会删除
当然,对于不同类型的long reads,给定了不同的默认参数
> For PacBio CLR data:
--max_cluster_bias_INS 100
--diff_ratio_merging_INS 0.3
--max_cluster_bias_DEL 200
--diff_ratio_merging_DEL 0.5
> For PacBio CCS(HIFI) data:
--max_cluster_bias_INS 1000
--diff_ratio_merging_INS 0.9
--max_cluster_bias_DEL 1000
--diff_ratio_merging_DEL 0.5
> For ONT data:
--max_cluster_bias_INS 100
--diff_ratio_merging_INS 0.3
--max_cluster_bias_DEL 100
--diff_ratio_merging_DEL 0.3
其中,long reads 比对到参考基因组,可以使用minimap2或者NGMLR.
参考
- https://github.com/tjiangHIT/cuteSV
- Jiang, T. et al. Long-read-based human genomic structural variation detection with cuteSV. Genome Biol. 21, 1–24 (2020).