##===============参考基因组hg19、hg38下载=================####
#对应的版本可参考http://www.bio-info-trainee.com/1469.html https://blog.csdn.net/leadingsci/article/details/82947869
================ 下载USCS版本的hg19====================
$ mkdir -p ~/reference/genome
$ cd ~/reference/genome
$ nohup wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz &
# 解压,得到所有染色体的信息
================检测文件完整性===============
# 打开码文件
cat md5sum.txt
## 将chromFa.tar.gz的码写入一个新文件
echo "ec3c974949f87e6c88795c17985141d3 chromFa.tar.gz" > check_md5sum.txt
## 检测
md5sum -c check_md5sum.txt
##显示 chromFa.tar.gz: OK
===============查看染色体,看染色体命名规律=============
cat hg19.chrom.sizes |head -n 25
===============解压参考基因组,显示所有染色体单个文件======
$ tar -zxvf chromFa.tar.gz
===============将不要的染色体,移动到暂存的文件夹=========
mv chrUn_gl0002* chr*_random.fa chr*ctg* chr*apd* chr*cox* chr*hap* temp
===============将需要的染色体进行合并,并移动到单个fa文件暂存文件夹======
for i in chr1.fa chr2.fa chr3.fa chr4.fa chr5.fa chr6.fa chr7.fa chr8.fa chr9.fa chr10.fa chr11.fa chr12.fa chr13.fa chr14.fa chr15.fa chr16.fa chr17.fa chr18.fa chr19.fa chr20.fa chr21.fa chr22.fa chrX.fa chrY.fa chrM.fa
do
echo $i;
#cat $i >> hg19.fa
mv $i chrfa
done
==============bwa进行索引构建===========================
bwa index -a bwtsw -p hg19.fa hg19.fa
#mkdir chrfa
#mv chromFa.tar.gz chrfa/
=============fai结尾======================
samtools faidx hg19.fa
## 显示生成 hg19.fa.fai
samtools faidx hg38.fa
=============dict结尾===================
gatk CreateSequenceDictionary -R hg19.fa -O hg19.dict
欢迎同行一起交流讨论
微信 forensic_JS
QQ1956238898