Nature Methods | 空间组学整合分析利器:Squidpy
原创 风不止步 图灵基因
收录于话题#前沿生物大数据分析
撰文:风不止步
IF=28.547
推荐度:⭐⭐⭐⭐⭐
亮点:
文章提出一个Python框架,汇集来自全局学和图像分析的工具,以实现对空间分子数据的可扩展描述。提供基础设施和分析工具来识别组织中的空间模式,具有技术上的独立性,并为旨在量化组织空间组织的下游分析工具提供基础设施。
2022年1月31日,德国慕尼黑亥姆霍兹中心的Fabian J. Theis博士等人在《Nature Methods》上发表了一篇“Squidpy: a scalable framework for spatial omics analysis”的文章,提出了一个Python框架Squidpy提供高效的基础设施和大量的分析方法,可有效存储、操作和交互式地可视化空间全能数据。Squidpy是可扩展的,可以与现有的各种库对接,以便对空间全息数据进行可扩展的分析。
分析空间分子数据的一个关键问题是描述和量化整个组织的空间模式和细胞邻域。Squidpy能够对空间全能学数据中的大型图像进行分析和可视化。空间全息技术额外捕获的高分辨率显微镜图像代表了丰富的形态学信息,可以提供关于组织结构和细胞变化的关键生物学见解。
(图1:Squidpy是一个用于分析空间全息数据的软件框架)
Squidpy引入一个新的数据对象--ImageContainer,它以基于xArray和Dask的磁盘/内存切换来有效地存储图像。该对象提供像素坐标和分子轮廓之间的一般映射,使分析人员能够将图像层面的观察结果与全能测量联系起来。也提供与napari的无缝整合,从而使存储在Anndata对象中的分析结果与直接来自Jupyter笔记本的高分辨率图像交互式可视化。还能对组织区域进行交互式手动裁剪,并对Anndata中的观察结果进行自动注解。由于napari是Python中的图像查看器,所有上述功能也可以交互式执行,无需额外要求。按照基于图像的标准分析技术,Squidpy实现了一个基于Dask Image和Scikit-image的管道,用于预处理和分割图像,提取形态学、纹理和深度学习驱动的特征(图3a)。利用懒惰加载、图像平铺和多处理能够有效地处理非常大的图像。在处理过程中使用图像平铺时,重叠的裁剪被用来减轻边界效应。可以从原始组织图像裁剪中提取特征,也可以使用Squidpy的分割模块来提取分割对象(细胞核或细胞)的数量、大小或分割掩码水平的一般图像特征。
(图2:使用Squidpy分析不同实验技术的空间全息数据集)
Squidpy中包含的基于图像的特征包括内置的摘要、直方图和纹理特征以及更高级的特征,如基于深度学习的或由外部软件包提供的CellProfiler通道。图像特征也可以在斑点水平上进行计算,从而将几个细胞聚集在一起,或在每个细胞的个体水平上计算。使用多路离子束飞行时间成像(MIBI-TOF)数据集与先前计算的细胞分割,计算出原始图像中包含的两个标记物的平均强度特征。计算出的平均强度与相关分子轮廓中包含的相关平均强度值有很高的相关性。结果强调明确分析图像层面的信息如何导致有洞察力的验证,但也可能是新的假设。
(图3:用Squidpy进行图像分析并将图像与分子轮廓联系起来)
Squidpy的工作流程能够对空间转录组学数据进行综合分析。在分子和形态学水平上对组织的空间模式进行比较和联合分析。如前所述,应用空间可变特征选择来识别显示明显空间模式的基因。Moran's I空间相关统计确定Mobp和Nrgn(图4a,b)是空间可变的;这两个基因显示出明显的空间表达模式,似乎包含了几个细胞群的定位。Squidpy提供的各种空间变量基因识别工具,通过对基因空间分布的深入了解,增强了基于集群的标准基因表达特征。Squidpy提供了CellphoneDB方法的快速重新实现,还利用Omnipath数据库进行配体-受体注释。应用于同一数据集,它突出了"海马"集群和两个"锥体层"集群之间的不同配体-受体对。基于排列组合的配体-受体相互作用识别测试是否能够准确定位细胞通讯和通路活动是一个开放的问题。然而,用对集群共现性的定量理解来告知这种结果是有用的。Squidpy应用于Visium数据集,突出了先前描述的集群之间的预期直接关系。
(图4:用Squidpy分析小鼠大脑Visium数据集)
Squidpy的特征提取管道能够直接比较和联合分析图像和全息图谱数据。基因表达和图像数据的综合分析增强了模式的发现,并能对从形态学和分子数据中获得的信息进行联合解释。Squidpy图像处理工具允许快速验证这种发现的稳健性,通过细化选择与检测到的组织区域完全重叠的斑点来消除潜在的假阳性。因此,核密度和形态学信息代表了有价值的信息,可以分解空间转录组学数据中的变异来源,并允许科学家对感兴趣的生物系统产生额外的见解。可以从图像数据中推断出类似的组织标志,并可用于解释基因表达的变化,包括血管、组织边界和纤维化区域。Squidpy的综合分析工作流程利用空间背景和大型显微镜图像,在空间转录组学数据中产生新的假设类,从而将病理学中典型的样本的组织层面特征与空间转录组学产生的新的高分辨率基因表达特征联系起来。
教授介绍
Fabian J. Theis博士
目前就职于德国慕尼黑亥姆霍兹中心,分别在2000年和2002年在雷根斯堡大学获得数学和物理学硕士学位以及物理学博士学位,并于2003年在格拉纳达大学获得计算机科学博士学位。曾在西班牙格拉纳达大学建筑和计算机技术系、FAMU-FSU(佛罗里达州立大学,塔拉哈西)和日本东京TUAT的信号和图像处理实验室担任客座研究员,并在德国雷根斯堡生物物理研究所领导信号处理和信息理论组。2006年,成为伯恩斯坦研究员,在德国哥廷根的马克斯-普朗克动力学和自组织研究所伯恩斯坦计算神经科学中心领导一个初级研究小组。2007年夏天,成为德国慕尼黑亥姆霍兹中心生物信息学和系统生物学研究所生物学计算模型组的负责人。2009年春,成为慕尼黑大学数学系系统生物学数学的副教授。他的研究兴趣包括基因调控和动态建模、生物统计学和网络分析、统计信号处理和生物医学数据分析。
参考文献
Giovanni Palla, Hannah Spitzer et al.Squidpy: ascalable framework for spatial omics analysis(2022)