hello,又是一周,周二了,最近事情很多,所以祝大家生活快乐,我们来继续看一下10X单细胞空间联合分析的内容,参考文献在Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution,于2022年5月16日在线发表于国际知名学术期刊Nature Methods,文中系统性评估了16种空间转录组和单细胞转录组数据整合算法在预测基因或细胞类型空间分布方面的性能。
大家也可以参考我之前的一篇文章10X单细胞空间联合分析方法汇总及算法总结
细胞在组织器官内所处的空间位置对于它发挥特异性功能至关重要。近年来,研究者开发了多种空间转录组技术可以在保留细胞精确空间定位的同时,检测细胞内全转录组的表达,以此来研究在发育或疾病发生发展过程中起关键性作用的细胞亚群及其分子机制。然而,现有的空间转录组学技术存在两个不足:1.基于测序的空间转录组技术无法实现真正意义上的单细胞分辨率;2.基于成像空间转录组的技术能检测到的基因通量有限。为了突破技术的局限性,生物信息学家设计了多种算法整合空间转录组与单细胞转录组数据,预测细胞类型的空间分布和/或单个细胞的完整转录组信息。这些算法大大加深了我们对空间转录组学数据及相关生物学和病理过程的理解。然而,由于不同算法的工作原理和适用范围存在显著差异,使得研究者很难选择最佳算法用来预测细胞类型和基因表达的空间分布。
瞿昆教授课题组长期致力于开发生物大数据分析算法和软件。在此项研究中,课题组收集了45对同一组织来源的空间转录组与单细胞转录组数据集,和32个模拟数据集,并设计了多种指标,从准确性、鲁棒性、计算资源耗时等多维度系统性评估了16种整合算法的性能。
结果显示,Cell2location、SpatialDWLS和RCTD算法能更加准确的预测细胞类型的空间分布;Tangram、gimVI和SpaGE算法是预测基因表达空间分布的最佳算法。Tangram、Seurat和LIGER计算效率相对较高,适合处理大规模数据集。该研究工作总结了每种算法的属性、性能和适用性,总结了高效算法的优势,为研究人员进一步提升算法性能提供了参考;并在github上提供了整合空间转录组和单细胞转录组数据的分析流程,以帮助研究人员为处理自己的数据选择最佳的分析工具。
单细胞空间联合的方法(这些整合方法使研究人员能够预测未检测到的转录本的空间分布)
联合方法 | 特点 |
---|---|
gimVI | employs a deep generative model to infer the likely spatial distribution of undetected transcripts |
SpaGE | uses the domain adaptation algorithm PRECISE and k-nearest-neighbor regression to predict the spatial distribution of undetected transcripts |
Tangram | uses non-convex optimization and a deep learning framework to learn a spatial alignment for scRNA-seq data |
Seurat | applies canonical correlation analysis to embed spatial and scRNA-seq data into a common latent space, and projects cells from scRNA-seq data to the spots of the spatial transcriptomics data |
LIGER | uses both integrative non-negative matrix factorization and shared factor neighborhood graphs to predict gene expression levels in space |
novoSpaRc and SpaOTsc | use optimal transport methods to construct spatial metrics of cells on the basis of scRNA-seq data |
stPlus | ombines the auto-encoder and weighted k-nearest-neighbor methods to predict spatial gene expression |
此外,Seurat、Tangram、novoSpaRc 和 SpaOTsc 能够将 scRNA-seq 数据中的细胞分配到组织切片中的空间位置;这对于提高使用空间转录组学方法(如 ST 或 10X Visium)生成的空间转录组学数据的分辨率非常有用。
联合方法 | 特点 |
---|---|
Cell2location | uses the gene expression signature of the cell subpopulations in scRNA-seq data to estimate the abundance of each cell type at each spot |
RCTD | applies cell type profiles learned from scRNA-seq data and supervised learning to decompose cell type mixtures |
SpatialDWLS | adopts the weighted-least-squares approach to infer cell type composition |
Stereoscope | leverages the model-based probabilistic method and scRNA-seq data to deconvolve the cell mixtures in spatial data |
SPOTlight | applies the seeded non-negative matrix factorization for the deconvolution of spots |
DSTG | deconvolutes spatial transcriptomics data using graph-based convolutional networks |
STRIDE | uses the topic profiles trained from scRNA-seq data to decompose cell types from spatial mixtures |
DestVI | adopts the variational inference and latent variable models to delineate cell type proportions |
这些整合方法使研究人员能够预测组织切片中spot的细胞类型组成
这些整合方法的出现无疑加深了对空间转录组学数据及相关生物学和病理过程的理解。然而,没有独立研究全面比较这些整合方法在预测转录物空间分布或组织切片中斑点的细胞类型去卷积方面的性能。在这里,使用多个指标系统地对 16 种集成方法的性能进行基准测试,这些方法可以预测未检测到的转录物的空间分布,或组织切片中斑点的细胞类型组成,基于对包含空间转录组学数据的 45 个配对数据集的处理和 scRNA-seq 数据和 32 个模拟数据集。评估了每种整合方法在预测转录本空间分布方面的准确性,包括从原始数据集中下采样的稀疏空间转录组学数据。还根据数据集的模拟评估了组织切片中斑点的细胞类型去卷积的整合方法的准确性,其中每个斑点可以包含多个不同类型的细胞。最后,评估了每种集成方法消耗的计算资源。研究结果可以帮助研究人员为他们的数据集选择合适的集成方法,并且他们提出了一些有趣的问题,即各种处理和数据集特定属性如何影响这些工具在空间转录组学研究中的集成性能。
生活很好,有你更好