学习资料:陈巍学基因:https://www.bilibili.com/video/av79295678?from=search&seid=11730831477922519685
https://www.bilibili.com/video/av79301729?from=search&seid=11347525676144926676
https://www.jianshu.com/p/eeb61add2ac6
https://www.jianshu.com/p/70dcddd2084e
原理解读:三种主流单细胞RNAseq的建库策略
单细胞RNA需要解决两个难题
1、单细胞中RNA含量非常少。一个人类细胞中总RNA的含量为10pg,而其中rRNA占95%左右,而mRNA占2%-3%,大概是0.2pg,而测序对于核酸量的需求为ug级别,因此需要通过PCR等方法将核酸扩增百万倍。如何在扩增中不引入过多的PCR偏差,则是一个大问题。PCR偏差是指PCR过程中只扩增序列特异的序列
2、如何可以尽可能高效得到mRNA文库。
技术介绍
1、Smart-seq2
是由clonetech公司开发,全名为switching mechanism at 5‘ end of RNA template,其核心技术是两个特殊引物加MMLV逆转录酶
逆转录起始引物:一段通用序列(用于PCR扩增的引物识别序列)+dT+V(A/G/C)+N(A/G/T/C),其中dT保证了其可以捕获mRNA,而V保证了序列可以结合mRNA3’ployA的末端,即从非A的位置开始扩增,N保证了序列可以完成所有mRNA的扩增。 这样就可以保证该引物引起的逆转录反应起始于mRNA 3‘的序列终止位置
MMLV逆转录酶:进行逆转录反应,同时在转录到mRNA5’末端时会产生几个ployC,这样保证了可以获得完整的mRNA序列,同时方便上游引物的结合。
上游引物:3‘端存在几个非脱氧的G碱基,即RNA的G碱基,可以与上述过程新合成的ployC末端进行互补,之后重新发挥MMLV逆转录酶的作用,将序列逆转录,获得左右添加了PCR序列的完整的序列。这条cDNA序列可以通过正常的PCR扩增进行建库。
技术特点:
1、先用一个定位引物(起始引物),保证cDNA的合成是从mRNA的3’末端开始的,同时让合成的cDNA加上通用PCR引物序列
2、利用MMLV逆转录酶在新合成的cDNA的3‘端,多加几个C的特点,再用含有3个G的上游引物进行第二链的合成,这就保证了只有完整的第一链的cDNA才能合成第二链,即只有完整的cDNA才能合成第二链。
3、保证了PCR效率的一致性。由于5’和3‘引入了同一PCR序列(每个序列都相同),这样就减少了PCR自身的偏好性。
下图为smart-seq2的原理图,是smart-seq的改进版,但基本原理不变。具体过程参考上述链接
2、10X genomics 单细胞转录组分析
是由10X genomics公司开发的一项基于油包水乳浊液酶反应原理的分子生物学分析系统,它把微珠加DNA标签、微滴反应、酶反应和高通量测序等过程结合,目前该系统可以做两件事情:1、可以做一群细胞中每个单细胞的RNA表达情况的定量分析;2、可以做染色体的单倍体长片段的组装
一张芯片是4X8共32个孔,一次可处理8个样本,从下到上依次为油孔、样本孔、微珠孔和回收乳浊液的孔。
工作原理
1、预制微珠的构成:微珠+read1+10xbarcode(16bp,共400万种,相当于微珠的身份证,每个barcode差至少存在两个碱基的不同)+UMI(unique multiplex index,10bp,每一个DNA分子理论对应一个UMI,可以通过对UMI种类的计数,排除PCR bias,相当于DNA的身份证)+dT +VN(捕获mRNA)
2、油包水模型:微珠(水平)+ 细胞和酶(垂直1)+油(垂直2),排放到油相环境中,形成外油内水的小液滴,每个小液滴理论上由一个微珠+细胞(0/1/2)+酶体系构成,包含细胞的个数服从泊松分布
3、液滴中细胞破裂,释放RNA,并在酶环境下与珠子上的引物结合发生逆转录反应,产生cDNA,并带上上述标签
4、水相全部抽出,混合后加测序接头,高通量测序
5、一个样本细胞悬液细胞数在一万以下,效果最好(防止产生多细胞入一个珠子的情况)
6、一般来说,每个细胞检测的read数目达到300k左右,即饱和,每个细胞的umi数目在40k到80k比较合理。