作者,Evil Genius
外显子的分析课程还是要好好准备的
今日参考文章
超过一半的基因产生的转录本在3'UTR长度上存在差异,但目前的单细胞/空间分析pipeline只量化了mRNA转录本的数量,而不是长度。3 ' UTR长度由3 '端切割位点(CS)决定.
mRNA丰度和mRNA长度是两个很大程度上独立的基因调控轴,它们共同决定了蛋白质合成的数量和空间组织。
知识积累
在mRNA中,3 '非翻译区(3 ' UTR)位于编码序列终止密码子和poly(A)尾部之间。mRNA和3'UTR长度由mRNA前切割和聚腺苷化(CPA)决定,CPA机制在识别聚腺苷化信号(PAS)后启动。大约一半的人类基因使用选择性裂解和聚腺苷酸化(APA)来产生mRNA同种异构体,它们的3 ' UTR不同,但编码相同的蛋白质。此外,约25%的基因利用内含子聚腺苷酸化(IPA)信号产生具有不同最后外显子的mRNA亚型,从而产生不同的蛋白质亚型。APA是一种普遍存在的疾病失调现象。3'UTR长度的改变会影响microRNAs和RNA-binding结合蛋白结合位点的存在,并能调节mRNA的稳定性和翻译。最近,3 ' UTR已成为亚细胞质定位翻译和mRNA依赖的共翻译蛋白复合物组装的重要调节因子。
APA最初被认为是一种基因表达调控模式,其中3'UTR异构体比例的改变会导致整体基因表达的变化。然而,转录组范围内的APA研究报道,不到20%的3'UTR变化调节mRNA或蛋白质的丰度。这表明mRNA丰度和3'UTR长度可能是独立的基因输出。
- 尽管差异基因表达分析已被广泛应用,但由于一些技术障碍,对3'UTR长度的研究仍然非常有限。
- 基于3 '标签的单细胞RNA测序(scRNA-seq)方案可用于量化差异的3 ' UTR。
基因和3'UTR表达定量
- 原始scRNAseq数据中开发基因和3'UTR异构体定量的计算pipeline。
scUTRquant和scUTRboot提供了从scRNA-seq数据进行3'UTR分析的工作流程
基因表达数据 + 3'UTR异构体计数
将基因分为单UTR基因和多UTR基因
在所有被归类为多UTR基因的基因中,发现其中五分之一的基因仅在少数细胞类型中以10%或更高的速率表达多于一个3'UTR异构体。这表明一些CS可能主要产生低表达的亚型。