Trimmomatic
优势:
1、可使用参数更多,如滑窗剪切,可以直接选择使用内置的接头序列等等;
2、默认可生成paired和unpaired两种文件,更利于下游分析。
劣势:
1、代码非常长,而且容易写错,最好写在一个脚本里;
2、参数比较难记,像ILLUMINACLIP中的几个数字分别代表什么必须要对照说明书才能看懂;
3、运行时间较长;
4、只适用于illumina测序得到的数据,不适用与其他测序平台。
Trim_galore
优势:
1、安装和使用都非常简单;
2、代码较短
3、参数更直观,不用去死记硬背
4、默认下不区分paired和unpaired,运行速度较快
劣势:
可调参数较少
trim_galore参数:
参数说明:
--quality:设定Phred quality score阈值,默认为20。
--phred33::选择-phred33或者-phred64,表示测序平台使用的Phred quality score。
--adapter:输入adapter序列。也可以不输入,Trim Galore!会自动寻找可能性最高的平台对应的adapter。自动搜选的平台三个,也直接显式输入这三种平台,即--illumina、--nextera和--small_rna。
--stringency:设定可以忍受的前后adapter重叠的碱基数,默认为1(非常苛刻)。可以适度放宽,因为后一个adapter几乎不可能被测序仪读到。
--length:设定输出reads长度阈值,小于设定值会被抛弃。
--paired:对于双端测序结果,一对reads中,如果有一个被剔除,那么另一个会被同样抛弃,而不管是否达到标准。
--retain_unpaired:对于双端测序结果,一对reads中,如果一个read达到标准,但是对应的另一个要被抛弃,达到标准的read会被单独保存为一个文件。
--gzip和--dont_gzip:清洗后的数据zip打包或者不打包。
--output_dir:输入目录。需要提前建立目录,否则运行会报错。
-- trim-n : 移除read一端的reads
对于单端测序数据,基本用法如下
trim_galore --quality 20 -a AGATCGGAAGAGC --length 20 -o out_dir input.fq
对于双端测序数据,基本用法如下
trim_galore --paired --quality 20 -a AGATCGGAAGAGC -a2 AGATCGGAAGAGC --length 20 -o out_dir R1.fq.gz R2.fq.gz
也可不指定接头序列,Trim galore是可以自动检测adapter的!
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------I am a line !--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
参考链接:https://blog.csdn.net/lazymark2/article/details/119224606