之前用hisat2尝试处理RNA-seq数据,这里使用tophat2
1.使用前建立index
使用bowtie2建立index
bowtie2-build genome.fa bowtie2index/genome
genome.fa是基因组fasta文件
bowtie2index 是index存储目录
genome是index的前缀、
注意:程序运行完后genome.fa文件要放在bowtie2index目录中,tophat2软件才能正确运行。
2.将readmapping到参考基因组
tophat2 -p 8 -G genes.gtf -o . bowtie2index/genome ${i}.QC.1.fq.gz ${i}.QC.2.fq.gz | samtools view -h -q 10 -@ 20 | samtools sort -@ 20 -m 1G -o q10.bam
-p :指定线程数
-G :指定已有的基因组注释信息,gtf或gff文件;
-o :指定输出目录,默认为”./tophat_out“;
后面加上索引文件:与前面的bowtie2建立的索引相对应,只取前缀名。
最后加上fastq文件:filename.fq;如果是双端测序则是filename_1.fq和filename_2.fq 两个文件。
3.我喜欢用featurecount计算count数目
featureCounts -p -t exon -g gene_id -M -T 8 -a genes.gtf -o featurecounts.txt q10.bam
4.差异表达使用DESeq2 流程见RNA-seq数据分析 09:DESeq2差异表达分析 - 知乎 (zhihu.com)
参考:
[转载]RNAseq: TopHat2 + Cufflinks分析流程 - 简书 (jianshu.com)
RNA-seq数据分析 09:DESeq2差异表达分析 - 知乎 (zhihu.com)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。