之前都是用 fastqc+trimmomatic进行数据质控和过滤,但是fastp更方便也更快,而且可以一次完成质控过滤和出图。
1. Fastp 软件安装
可以直接用conda安装
conda install fastp
2.使用参数
2.1 快速处理
单端测序single end(SE)
fastp -i in.fq -o out.fq
双端测序paired end(PE)
fastp -i in.R1.fq.gz -I in.R2.fq.gz -o our.R1.fq.gz -O out.R2.fq.gz
参数设定:
-w 8 设置进程数8,默认2,max=16,或者是--thread 8
-z 5 设置gzip压缩级别,默认4,1~9 1快-9小
--json 设置输出json文件名
--html 设置输出html文件名
2.2 使用循环批量处理
注意:一定要修改默认的输出文件名,不然后面的输出会覆盖前面的默认文件名
#!/bin/bash
for i in 71 72 75 76 78 79;do
{
fastp -i ~/RNAseq/SRR190242${i}_1.fastq.gz -o SRR190242${i}_1.fastq.gz -I ~/RNAseq/SRR190242${i}_2.fastq.gz -O SRR190242${i}_2.fastq.gz -w 8 --html ${i}.html --json ${i}.json
}
done