转录组测序是最常用的组学实验,对全谱基因定量,找到差异表达基因。RNAseq涉及到原始数据,数据质控,基因组比对,差异基因鉴定,差异基因功能富集分析,重要基因如转录因子激酶的靶基因预测等,我们用10讲的时间,全面讲解转录组测序报告,及在上百个项目中遇到的近百个常见问题。
上一期视频基因表达定量中,我们讨论了在cleandata数据比对至参考基因组后,获得各基因上测序序列的覆盖度,并进而将其定量为基因表达信息。在上一节中,我们基于所有基因表达的FPKM值,对样本进行主成分分析后发现,不同处理组间的样本区分明显,并能看出这种差异比同组不同重复之间更加容易识别。我们可知,肯定存在一些基因在两组间的表达水平差异很大,导致在PCA图中的两组样本的分区。结合实验设计,推测这些显著改变的基因与特定功能密切相关。
那么后续,如何根据基因表达值在不同分组间进行比较,获得处理组相对于对照组中表达值显著改变的基因,以便后续将基因表达与功能结合起来呢?本期视频继续讲解转录组测序中的关键环节,差异表达基因分析。
本节内容要点包括:
(1)RNAsq中常用的鉴定差异基因的统计学方法有哪些;
(2)为什么通常使用负二项分布模型计算差异表达,而不使用常规的T检验或者是方差分析;
(3)差异倍数fold change值指的什么;
(4)差异表达的基因是基于阈值筛选出来的,阈值选择的标准有哪些;
(5)与阈值接近的,可不可以算为差异基因;
(6)不使用p调整值,而直接使用p值选择选择差异基因,是否可行;
(7)通常样本重复数在多少是合适的;
(8)为什么有时候qPCR结果和RNA-seq结果中,差异基因表达特征不一致,是RNA-seq不准吗;
(9)常见图表解读,包括散点图、火山图、热图、韦恩图、时间趋势折线图等。
视频教程:
bilibili超清视频链接:https://www.bilibili.com/video/BV1eK411p7y6