[注] 本指南翻译自 addgene,如有不妥之处,请指出以改进,谢谢!
另:如果希望转载本文,请注明出处,谢谢
CRISPR/Cas9总概
成簇规律间隔的短回文重复序列(Clustered Regularly Interspaced Short Palindromic Repeats,即CRISPR)II型系统是细菌免疫系统,现已被改造用于基因工程。在CRISPR/Cas9广泛应用之前,像锌指核酸酶(ZFNs)或转录激活因子类效应核酸酶(TALENs)等基因工程技术,都需要使用定制的DNA结合蛋白核酸酶,这需要科学家为每个基因靶标设计和生产新的核酸酶对(nuclease-pair)。(相比而言,)CRISPR主要因其简单性和适应性,已迅速成为基因工程中最受欢迎的方法之一。
CRISPR包括两个部分:一个向导RNA(gRNA)和一个非特异性CRISPR结合核酸内切酶(CRISPR-associated endonumclease即Cas9)。向导RNA是一个短的合成RNA,由一段结合Cas9必需的scaffold序列和特定的约20nt的空载(spacer)或靶向(targeting)序列(靶位点)组成,其中靶向序列决定了用于修饰的基因靶标。因此我们只需改变gRNA上的靶向序列即可改变Cas9的基因靶标。CRISPR最初用于敲除各种细胞类型或生物体的靶向基因,但对Cas9酶的改造已经将CRISPR的应用扩展到选择性激活或抑制靶向基因或纯化特定的DNA区域,甚至可以和荧光显微结合用于展现活细胞中的DNA。而且,产生gRNAs的便捷促使CRISPR成为了最具扩展性的基因编辑技术之一,近来已被应用于基因组水平的筛查。
这篇指南将提供CRISPR/Cas9生物学方面的概览,介绍CRISPR的不同应用,帮助诸位在各自领域上开展CRISPR/Cas9的研究。
使用CRISPR/Cas9进行敲除
通过靶向基因特异的gRNA和核酸内切酶Cas9的共表达,CRSIPR/Cas9可用于产生敲除细胞或敲除动物。** 基因靶位点可以是任何满足以下两点条件的约20nt的DNA序列:**
- 该序列在基因组中是特异存在的。
- 靶位点紧邻着PAM(Protospacer Adjacent Motif)区并位于PAM区上游。
PAM序列是结合靶标必不可少的,具体序列取决于Cas9的种类(酿脓链球菌Cas9 5’NGG3’)。我们将关注酿脓链球菌Cas9,因其目前广泛使用于基因工程。一旦表达,Cas9蛋白和gRNA将形成一个核糖体蛋白复合物,这个复合物是通过gRNA的scaffold区域和Cas9上表面暴露带正电荷的沟糟相互作用形成的。Cas9与gRNA的结合后构象发生了改变,分子由无活性的非DNA结合构象转变为有活性的DNA结合构象。更重要的是gRNA上的靶位点序列仍未和靶标DNA发生相互作用。Cas9-gRNA复合体将任意地结合基因组上的PAM序列,但是只有gRNA靶位点序列与靶标DNA配对时,Cas9才能进行切割(这段靶标DNA)。一旦Cas9-gRNA复合物结合到一段认定的DNA靶标,在gRNA靶向序列3’端的“种子”序列开始使靶标DNA退火。如果种子序列与靶标DNA序列配对,gRNA将持续的沿3’到5’端方向使靶标DNA退火。
只有当gRNA靶位点序列与靶基因有足够的同源性存在时,Cas9才会作用切割靶基因。拉链式的退火机制可能解释了为什么靶标上3’端种子序列上的错配会完全破坏对靶标的切割,而5’端的错配有可能会对靶标进行切割。Cas9核酸酶有两个功能性内切酶区:RuvC和HNH。当Cas9与靶基因位点结合时发生了第二次构象变化,核酸酶功能区对靶标DNA的反向链进行定位切割。Cas9介导的DNA切割最后结果是目标DNA(PAM序列上游约3~4nt)的双链断裂(double strand break,DSB)。
双链断裂后由以下两种常规的修复途径进行修复:
- 有效但易错的非同源末端连接途径(NHEJ)
- 低效但高保真的同源性修复途径(HDR)
NHEJ修复途径是最活跃的修复机制,能快速的修复双链断裂,但通常会在双链断裂位点产生小的插入缺失。NHEJ介导的双链断裂修复的随机性具有重要的实用意义,因为Cas9和gRNA在细胞群体中的表达,将产生多种不同的突变。大多数情况下,NHEJ引起的靶标DNA上的小InDels,会导致阅读框内的氨基酸插入缺失,或者移码突变引起的目标基因上ORF提前终止。理想情况下,在靶标基因内形成功能缺失性的突变。然而,对特定的突变细胞表型的敲除能力最终取决于残存的基因功能的剂量。
用Cas9的切口酶提高特异性
当gRNAs设计准确时,CRISPR/Cas9具有很高的特异性,但是特异性依然是一个主要的关注点,特别是当CRISPR应用于临床时。CRISPR系统的特异性主要取决于gRNA靶向序列特异性如何,即基因靶标相比于基因组其余部分的情况。理想状态下,gRNA靶向序列与靶标DNA具有高度同源,而与基因组上其它位置没有同源性。(但)现实是,在基因组上,会有另外的位点与指定的gRNA靶向序列部分同源。这些位点被称为“脱靶”,你在设计gRNA时需要考虑到这些位点。
为了优化gRNA的设计,CRISPR的特异性可以通过改造Cas9自身来得到提升。如先前讨论那样,Cas9通过两个核酸酶功能区域,RuvC和HNH,的结合活性来形成双链断裂。每个核酸酶结构域上精确的氨基酸残基是已知的,这些残基序列对内切酶的活性至关重要(在酿脓链球菌Cas9中D10A对HNH和H840A对RuvC),Cas9酶的修正版已生成,它仅包含一个催化活性功能域(称为“Cas9 nickase”)。Cas9切口酶依然基于gRNA的特异性来结合DNA,但切口酶仅能切开DNA的一条链,形成一个切口“nick”,或使单链断开,而不是双链断裂。使用完好的互补链作为模板,DNA上的切口迅速地被HDR途径(同源性修复途径)修复。因此需要使用两个切口酶来切割靶标DNA的两条链以形成双链断裂(这种通常被称为“double nick”或者“dual nickase”CRISPR系统)。这种需求迅猛地增加了靶特异性,因为这和在足够近的范围内双链断裂产生的两个脱靶的nicks的方式截然不同。因此,如果特异性或者减少脱靶的影响是考虑的关键因素,那么就采用双切口酶方法来产生两个nick引起的双链断裂。为了获得高特异性的基因编辑,切口酶系统也可以联合HDR(同源性修复途径)介导的基因编辑一起使用。
使用HDR进行精确的改造
NHEJ介导的双链断裂修复不够完美,通常会导致基因ORF阅读框的中断,HDR能用于产生特异性的核苷酸改变(这也是人们所说的基因“编辑”),这种改变小到单核苷酸改变大到大片段插入(例如,添加一个荧光基团或者tag)。
为了利用HDR进行基因编辑,一段DNA”修复模板”序列需要和gRNA+Cas9蛋白/Cas9n蛋白一同转入研究者感兴趣的细胞中。修复模板必须包含所需编辑位点以及紧邻靶标的上下游同源序列(称作左右同源臂)。每条同源臂的长度以及结合位点取决于想要进行的改变的大小。修复模板可以是一个单链寡核苷酸/双链寡核苷酸/双链DNA质粒,这因不同的应用而不同。值得一提的是,修复模板在基因组DNA不能带有PAM序列,否则修复模板将成为Cas9切割的合适目标。例如,PAM序列可以进行突变处理,以至于不再出现,但是基因编码区不受影响(也即,沉默突变)
即使在表达Cas9、gRNA和外源性修复模板的细胞中,HDR效率通常也比较低(低于修饰等位基因的10%)。因此,一些实验室人为地尝试加强HDR,有的是在HDR起作用时同步化细胞周期,有的是通过化学的或遗传学的抑制基因来参与NHEJ。HDR的低效性有许多重要的实用意义。首先,因为Cas9的切割效率相对较高,而HDR效率相对较低,一部分Cas9引导的双链断裂被NHEJ修复。也就是说,最后细胞群体中会包含一些野生型等位基因,NHEJ修复的等位基因,和/或一些所需的HDR编辑等位基因。因此,需要通过实验来验证所需的编辑是否存在,如必要的话,对所需编辑的克隆进行分离。