前段时间,接了老师一个等位基因特异性表达的任务,前后再加上其他的分析带着做,再捋流程,拖拖拉拉也用了小一个月,终于从原始测序数据,得到了最终的那张table,具体的内容基本已经都发出来了,这篇帖子系统整理一下流程,如何从RNA-seq的fastqc到最后的ASE table。
输入数据
- 后代的RNA-seq测序数据,fastqc.zip
- 亲本的参考基因组 .fa
流程
1.测序数据质控
测序质量分析 —— FastQC - 简书 (jianshu.com)
2.下载基因组数据,及gff格式转换
gff格式与gtf格式转换——gffread - 简书 (jianshu.com)
gff格式与gtf格式转换——NBISweden / AGAT - 简书 (jianshu.com)
3.序列比对
序列比对 —— Hisat2 - 简书 (jianshu.com)
4.变异检测
sam文件转换为bam文件——SAMtools - 简书 (jianshu.com)
SAMtools——bam文件排序 - 简书 (jianshu.com)
SAMtools——bam文件去重 - 简书 (jianshu.com)
picard——修改BAM文件的Read Group - 简书 (jianshu.com)
GATK4 —— Variant Calling (SNP+indel) - 简书 (jianshu.com)
5.提取SNP
GATK4——gVCF转VCF - 简书 (jianshu.com)
GATK4 SelectVariants ——vcf文件提取SNP和indel - 简书 (jianshu.com)
VCF文件质控 —— VariantFiltration - 简书 (jianshu.com)
6.ASE计数
SAMtools——bam文件合并 - 简书 (jianshu.com)
ASE (等位基因特异性表达)—— ASEReadCounter - 简书 (jianshu.com)
7.ASE检验
GeneiASE —— ASE检验 - 简书 (jianshu.com)
引用转载请注明出处,如有错误敬请指出。