揭示基因表达的时空模式对于理解从胚胎发生到疾病的核心生物学原理至关重要。来自澳大利亚和美国的研究团队在《communications biology》发表综述,探讨了目前用于阐明空间表达的技术,解释了准确地定量捕捉空间基因表达数据的能力。此类技术为在空间和定量方面对基因表达水平进行无偏倚且详尽的再现,促进对发育缺陷的分子起源的理解和改善医学诊断铺平了道路。
基于成像的基因表达空间解析方法
以往空间模式是通过对目标基因进行直接或原位染色来捕获的。原位杂交(ISH)技术用于研究空间复杂性。虽然原位杂交解决了对空间分辨数据的需要,但使用这种方法通常很难实现基因表达的精确量化,因此需要进一步分析。
提高灵敏度和准确性
精确定量测量原位基因表达的进一步进展包括空间基因组分析流程(SGA),它整合了顺序单分子荧光原位杂交和杂交链式反应(HCR)的结果。HCR使用两个互补的DNA探针,形成荧光标记的扩增聚合物,能够相对定量mRNA的表达。此外,由于集成了单细胞成像技术,该技术实现了更高的空间分辨率。RNAscope提供了定性和定量方法的进一步整合,探针杂交和信号放大在原位进行,允许单分子分辨率的空间相关分析。然而,由于SGA的产量受到可分辨染料数量的限制,分析仅限于少数目标基因。
ClampFISH被开发以提高在FISH中的效率和由此产生的弱信号响应。ClampFISH可以检测独特的核酸分子,并允许使用挂锁式探针,而无需酶的支持。
最近在ISH方面的进展引入了一种改进信号检测的新方法。单分子荧光原位杂交(smFISH)依赖于使用许多短探针,这些探针针对mRNA转录物的多个区域。虽然smFISH不能评估非编码RNA,如许多调控功能所需的RNA,因为它的目标是核糖体/mRNA的相互作用,但它可以通过直接成像单个RNA分子在单细胞中提供RNA表达的空间定位。通量受限于单细胞中可同时测量的RNA种类数量。
osmFISH依赖于一种非条形码方法,专注于设计能够处理大组织区域和广泛数据集的图像处理工具。smFISH比scRNA-seq更有效地检测RNA,osmFISH结合了较短的杂交时间和背景降低来获得高信噪比,从而进一步提高了RNA检测的灵敏度。osmFISH已被优化用于薄组织切片。
提高通量和分辨率
MERFISH对smFISH进行复用,并将条形码分配给单个RNA种类,这些RNA种类可以依次成像,从而实现单细胞转录组分析。bDNA扩增大幅提高了MERFISH的检测效率,而不增加单个转录物的荧光斑大小,现在可以用这种方法研究短RNA。这种方法可产生原位转录组分析,检测RNA种类>1000种,并对>100种RNA进行误差校正。
数字空间分析是Nanostring的一个新平台,可以对蛋白质或RNA进行多重分析(分别为~100倍和~1000倍),能够进行单细胞分辨率分析。早期测试表明,这将是了解肿瘤微环境和识别独特的、预后性患者生物标志物的强大新工具。
传统的空间测绘依赖于荧光光学显微镜或直接的物理记录。而DNA microscopy涉及化学反应,其中转录分子被随机核苷酸原位标记,每一个都被唯一地标记。第二个反应是放大这些标记的分子,连接拷贝,并添加新的随机核苷酸。虽然高信号强度是荧光成像技术的一个缺点,但增加了信号密度对DNA microscopy 十分有利。DNA microscopy 可以作为一种相当于光学分析的成像介质,是研究生物系统复杂化学动力学的重要新兴手段。
seqFISH+连续重组单个载玻片以生成多个图像,这些图像可以通过计算合并并分析为一个完整的转录文库,减少光学拥挤的影响。与来自smFISH的60个基因比较,seqFISH+的检测效率为49%,与scRNA-seq相比具有较高的灵敏度。
总之,空间基因表达的原位图谱既能捕获RNA数量,又能捕获位置。它已经克服了挑战,以保持效率,信号强度和准确性,同时扩展到大的基因数量。然而,这些方法在其通量和准确测量基因表达水平的能力方面仍然有限。
基于下一代测序的基因表达空间解析方法
虽然在高通量下测量精确基因表达水平的定量方法已经被开发出来,但是当分离的细胞在空间上与原生组织错位时,转录本就失去了空间背景。为了实现从空间和定量方法获得的数据中获益的分析,需要将这两个数据集结合起来。
自动化的混合方法
数学模型通过将“标志性”内参基因与转录计数联系起来,允许空间和定量结果的整合。例如,Seurat是一种算法,通过整合scRNA-seq数据和原位表达模式来推断细胞定位。
最近的一种方法分析了84个特征良好的原位基因标记,结合高通量、定量的Drop-Seq生成基于计算的算法DistMap,能够有把握地解析6期果蝇胚胎中87%的细胞。
STARmap方法有望在单细胞分辨率条件下在三维空间中进行基因表达检测。STARmap使用条形码挂锁探针,与靶标杂交,但通过添加第二个引物,针对挂锁探针旁边的位点,避免了逆转录(RT)步骤。这种方法避免了cDNA转换的效率障碍,并通过增加第二个杂交步骤来降低噪音。
基于组织切片的高通量方法
Tomo-seq自动产生空间分辨率相当于原位杂交与RNA-seq的定量强度,将感兴趣的组织在三个不同的方向(前后、背腹和外侧平面)进行冷冻切片,然后对每个切片进行批量RNA-seq。自动应用RNA-tomography算法,估计三个切片交汇处的基因表达水平,创建整个胚胎的数字三维表达模式。Tomo-seq有必要使用相同的样品,以便在多个轴上准确地叠加切片。
一种补充方法即Geo-seq,仅在一个方向上对感兴趣的器官或组织进行冷冻切片。每个切片都是通过激光捕获显微解剖取样,产生细胞簇(每个细胞簇约10个细胞),然后对其进行大量RNA-seq。
Spatial transcriptomics是从片段中捕获空间基因表达的最小偏差方法。这种方法无需进行细胞分离,能够检测到低水平的转录物表达,比激光捕获显微解剖捕获到更多的基因和转录物,与Tomo-seq和Geo-seq相比,灵敏度和分辨率更高。
Slide-seq使用DNA条形码珠结合到3毫米的载玻片上,并将其暴露于释放mRNA的新鲜组织切片中,从该组织切片中可以通过寡核苷酸连接和检测进行测序来确定条形码序列。在Slide-seq方法发表后不久,另一种使用更小的条形码珠子的技术发布,命名为高分辨率空间转录组技术(HDST),它采用2μm的空间条形码,并允许组织学分析。
解析空间基因表达的计算方法
整合空间和表达信息
利用非负矩阵分解回归(NMFreg)将scRNA-seq数据映射到Slide-seq数据上,将Slide-seq表达重建为scRNA-seq的细胞类型特征组合。LIGER是一种从原位转录组数据中对存在于scRNA-seq数据中的细胞进行空间定位的计算方法,从而提高原位数据的分辨率。Harmony算法将细胞投射到一个共享的嵌入中,在这个嵌入中,细胞按照细胞类型而不是数据集特定条件进行分组,该算法被证明是高效和准确的。SpaOTsc利用基因与空间测量来推断scRNA-seq数据的空间特性。Giotto是一个用户友好的工作空间,利用细胞类型特异性基因签名推断细胞类型富集分数,用于下游分析,具有整合空间信息的能力。
仅用于表达数据的从头空间位置预测
novoSpaRc是一种最新的基因表达制图技术,它利用概率优化技术,根据组织切片上的基因表达情况进行制图。然而,由于缺乏参考图谱,精确性可能低于标准,并且需要一组具有已知表达模式的先验标记基因。coMAP是另一种无参考的技术,它将表达数据在空间上整合到虚拟的潜在空间中。在单细胞分辨率水平上,CSOmap算法可以部分重建基于配体-受体相互作用的组织空间。
高通量 native 单细胞方法
novoSpaRc是一个新的计算框架,它允许对单细胞基因表达进行新的空间重建。novoSpaRc不需要先验知识,因为该方法将从分离细胞测序的单细胞转录组图谱作为输入,然后返回所选形状的虚拟组织,可以查询数据中量化的所有基因的表达。
NASC-seq是一种新兴的颠覆性技术,它通过对4-硫尿嘧啶(4sU)标记反应的T-C化学转换进行测序,同时监测新合成的和已存在的RNA。这可以通过序列分析,在计算上分离、新旧RNA转录物,提供单细胞水平的空间和时间监测。
数据可视化和管理
对空间解析转录组数据的公共存储库有很高的需求,它允许比较和整合多种来源和分析输出的分辨率数据。三维可视化细胞图集的发展超越了管理数据库的范畴,为详细的空间数据建模将在研究和医学应用中提供最大的益处。一些应用程序允许高保真成像数据集与定量数据集成以进行完全交互分析,例如Virtual Fly Brain、结合空间转录组学和scRNA-seq的人类胚胎心脏图谱等。来自DistMap的结果被用来生成果蝇虚拟表达资源管理器(DVEX),该数据库是一个在线的可浏览数据库,它生成了能够预测第6阶段胚胎空间分辨表达模式的虚拟ISHs。其他3D可视化工具,如MorphoNet,将有助于整合来自不同平台或来源的定量信息在同一三维对象上。
数据管理标准
为了促进可重复性,迫切需要数据存储、分析和交换的标准,因为与更成熟的测序技术(如RNA-seq、scRNA-seq)相比,空间转录组学目前缺乏数据管理的共同准则。目前空间转录组学的大部分分析工具都在GitHub上公开提供,如https://github.com/10XGenomics,https://github.com/SpatialTranscriptomicsResearch。此外,公开预印本已成为研究界的标准做法(如BioRXiv.org,MedRXiv.org),可以快速传播方法和结果,可以从系统生物学标准中吸取经验。
目前,已有多项单细胞图谱项目公共资源,为许多模式生物提供了宝贵的信息来源,包括人类细胞图谱和单细胞斑马鱼转录组图谱等。空间分辨的转录组学将是为这些单细胞图谱项目增加空间坐标的最重要因素。整合时间表达数据集将提高对空间转录组学的理解。随着临床组织学和病理学对高效分析流程的需求日益增加,高通量空间转录组学正成为临床和床旁医学的重要组成部分,其最终目标是生成空间组学数据,其中单个样本可以进行无损分析,以同时揭示时间、空间和定量数据。
首发公号:国家基因库大数据平台
参考文献
Waylen, L.N., Nim, H.T., Martelotto, L.G. et al. From whole-mount to single-cell spatial assessment of gene expression in 3D. Commun Biol 3, 602 (2020).
图片均来源于参考文献,如有侵权请联系删除。