一、思路分析:
百度一下,看看有没有没有现成的批量下载方法
二、查到的一种比较简介的可以直接下载fastq文件的方法
- 从ncbi下载sra数据的几种种方式用的是prefetch方法,但是好像用不了。
- 然后下面还有几种方法
echo SRR1553608 > sra.ids
echo SRR1553605 >> sra.ids
# 利用sed和bash
cat sra.ids|sed 's/SRR/fastq-dump --split-files SRR/'|bash
三、根据项目编号下载整个项目的fastq文件
- 到NCBI下载runinfo信息(更简单的方法是使用通过EDirect获取runinfo,但是发现这个安装总是不成功,所以用笨方法)
- 导出后的runinfo信息,放到服务器中, 获取所有样本的SRR号
运行:
nohup cat sra.ids|sed 's/SRR/fastq-dump --split-files SRR/'|bash 2>&1 >log &
其实还能用多线程
运行:
time for i in SRR*; do pfastq-dump --split-3 --threads 12 -O pfastq_dump_result -s $i ; done