作者:马可菠萝
审稿:童蒙
编辑:angelica
多细胞生物仅仅由单个细胞发育而来的整个生物学过程令人震撼。经典的谱系追踪实验已经用于追踪线虫单细胞到多细胞的发育过程,并发现了细胞谱系和表型方面的差异。但更复杂的生物体是如何精妙地调控细胞的发育过程仍不清楚。
背景介绍
线虫作为一种模式生物,其细胞发育的过程已经被研究地较为透彻,但高等生物尤其是哺乳动物中细胞的发育过程异常复杂,没有很好的工具来记录细胞发育的大跨度发育过程。
目前,以CRISPR-Cas9为基础的技术已被用于记录细胞谱系发生,整合scRNA测序技术揭开了胚胎发育神秘的面纱。然而这些研究的barcode缺乏多样性,很大程度上限制了在其他生命体中的应用。
为了进一步揭开哺乳动物早期胚胎发育过程,作者基于CRISPR-Cas9技术开发了一套细胞谱系追踪记录器,为小鼠原肠胚发育过程的研究提供了可用的工具。
分子追踪器的设计原理
理想的多细胞生物发育分子追踪器需要满足以下要求:
对细胞表型方面的影响要降到最低
能够记录数以万计细胞的高通量信息
能够同时分析单细胞的功能信息
可记录大尺度时间线上的变化
在整个实验过程中连续产生多样性用于研究
01.追踪器模型
首先设计包含荧光蛋白的分子追踪器模型,验证追踪器模型的可行性。
靶点设计
a. 合成的靶点包含3个切割位点
b. 包含8 bp整合的barcode
c. 连接于荧光蛋白的3`非编码区
sgRNAs
使用Cas9产生双链断裂修复后造成可遗传的插入或者缺失突变。用于记录信息的是包含3个切割位点以及8碱基对的“整合条码”205个碱基对的合成DNA。该合成DNA序列被嵌入组成型转录的荧光蛋白3`非翻译区,从而能够通过荧光从转录组中分析实验结果。另外一个cassette编码了三个guide RNA,可用来记录多种信号。
02.分子追踪器评估
基于构建好的分子追踪器模型来进行切割实验和性能验证。
此基因编辑系统能够产生大量的可遗传修复结果和目标位点,并且可以通过整合条码对这些序列进行区分。
为了筛选能够控制突变比例的序列,用于长期时间的试验切割,链接GPF报告基因,通过对含报告基因的细胞的比例进行统计(20天的大跨度)。
sgRNA中的突变(单和双突变)设计在了前间区序列邻近基序(PAM)的附近,这些guide RNA是作者通过筛选得到的,使用GFP报告基因在超过20天的时间对guide RNA靶标的活性进行监控,从而筛选具有广泛动态变化范围的序列。
03.构建Cas9-GFP载体
分子追踪器模型验证有效后,进行载体构建和单细胞培养实验。
开展小鼠细胞实验,将多个靶点整合到基因组中之后,又将组成型的Cas9-GFP编码的精子释放到卵母细胞之中启动切割,收集E8.5-E9.5胚胎用于下游分析。
04.建库测序流程
基于10x Genomics平台的建库测序流程示意图:
为了证明该技术的谱系追踪能力,他们对于胎盘、卵黄囊以及胚胎局部组织(3小份)中的靶点进行扩增,并且通过插入、缺失标记的相似性来研究这三者之间的关系,从而评估该技术的实用性。
05.分配细胞表型
基于细胞表型数据对单细胞进行分配,得到组织层面的单细胞分类结果。
通过细胞形态表达特征分配细胞,只展示第2号胚胎(1 of 7),共注释了22,264细胞,能将细胞进行很好的分类。
06.组织maker基因
基于已知的maker基因对单细胞进行分类和注释。
该图展示了典型的组织marker基因,按照不同的胚层进行分类(marker阳性细胞减少),但是特异性较高。
点的大小代表marker基因阳性的细胞比例,颜色代表归一化的表达量(cluster mean值)。
Ecto:胚胎外胚层;EEcto:胚外外胚层;EEndo:胚外内胚层;endo:胚胎内胚层;meso:胚外中层; EMeso: 胚外中胚层; PGC: 原始生殖细胞; NMPs: neuromesodermal progenitors。
07.单细胞谱系重建
基于插入、缺失标记多态性构建细胞谱系的进化树,来构建细胞发育的过程。
(1)谱系进化树的构建
基于InDel加权log-likelihoods值,构建谱系进化树,并将细胞类型信息叠加进行标记,从进化树的根部到分支可以发现细胞类型是逐渐特化的。其中,每一个分支代表一个InDel生成事件。
(2)单细胞排序策略
通常来说轨迹分析常用于细胞排序,本文使用改良后的汉明距离来评估成对细胞间的谱系距离。
基于单细胞测序结果建立系统发育树后发现,细胞谱系发育距离越近,转录谱的相似度越高,该结果与细胞在发育过程中逐渐分化成特化的细胞类型相一致。
08.单细胞状态和谱系不一致
经过分析,部分单细胞的真实来源与谱系分析结果并不一致。
胚外内胚层 (EEndo)和胚胎内胚层 (Endo)分别起源于下胚层和上胚层,但祖源打分很高。
Endo和EEndo祖源打分很高说明两组细胞很来源一致,但是其真正起源却截然不同。原因是部分Endo细胞被分配给了EEndo分支。
EEndo:胚外内胚层;Endo:胚胎内胚层. n: 细胞数目
分离Endo胚胎内胚层谱系细胞,绘制谱系树,发现部分细胞中Trap1a和Rhox5(EEndo标记基因)高表达。其他的胚胎中均发现这个现象。
09.细胞图谱定量
对不同类型的胚胎组织细胞进行谱系追踪溯源和比例计算,从而对细胞发育图谱过程中各种细胞类型进行定量。
图a:起源于多能祖细胞的组织分布比例,多能细胞形成所有的胚层,但对不同的细胞命运表现出不对称的倾向。(灰色的为node,星号标记,生成原始生殖细胞),横轴是谱系(n为细胞数目)图b:灰点代表胚胎,连线连接着相同胚胎的估计。
Epi:上胚层;TE:滋养内胚层;全能性细胞发育成胚胎的所有细胞,包括TE、EEndo、Epi。从左到右为发育过程。
10.全文总结
一、开发了基于CRISPR-Cas9的工具用于追踪细胞发育进程
二、实现了哺乳动物原肠胚形成过程细胞命运谱系示踪
三、实现较长时间跨度下各发育阶段的细胞状态追踪和定量
四、可用于构建哺乳动物整个发育时期细胞命运图谱
参考文献
Chan, M.M., Smith, Z.D., Grosswendt, S. et al. Molecular recording of mammalian embryogenesis. Nature 570, 77–82 (2019). https://doi.org/10.1038/s41586-019-1184-5