ClusterMap:用于空间基因表达的多尺度聚类分析 | 空间转录组分析工具推荐

在空间背景下量化RNA是了解复杂组织中基因表达和调控的关键。原位转录组方法可以在完整的组织中产生空间分辨率的RNA图谱。然而,目前还缺乏一个统一的计算工具来综合分析原位转录组数据。2021年10月,Nature Communications发表了一个无监督和无注释的计算工具:ClusterMap,其在二维和三维空间将RNA精确地聚类到亚细胞结构、细胞体和组织区域中,并在不同的组织类型(包括小鼠大脑、胎盘、肠道和人类心脏器官)中表现稳定。ClusterMap广泛适用于各种原位转录组技术,从高维转录组图谱图像中揭示基因表达模式、细胞生态位和组织结构原理。

为了绘制细胞和组织中基因表达的空间异质性,已经开发了大量基于图像的原位转录组学方法(例如STARmap、Fiseq、ISS、MERFISH、seqFISH、osmFISH等),提供了完整组织中亚细胞RNA定位的图谱。然而,从高维空间转录组数据中直接提取生物模式的低维表示仍然具有挑战性。


ClusterMap是什么?

ClusterMap是基于两个关键的生物学现象。首先,细胞内RNA分子的密度高于细胞外;其次,不同基因编码的细胞RNA在不同的亚细胞位置、细胞类型和组织区域富集。因此,开发团队推断,通过对RNA的物理密度和基因身份进行联合聚类,可以直接从原位转录组数据中确定有生物学意义的模式和结构。随后,根据基因身份和空间尺度对空间聚类进行解析,以表示亚细胞定位、细胞分割和区域识别。

ClusterMap从基于原位转录组数据的预处理成像开始,原始荧光图像被转换成具有物理3D位置和基因身份的离散RNA点。开发团队引入了一个高维向量,称为邻域基因组成(NGC),它是通过考虑每个RNA点上圆形窗口的基因表达谱来计算的。每个RNA点的NGC坐标和物理坐标通过计算整合成每个点上的联合物理和NGC(P-NGC)坐标。接下来的目标是在P-NGC坐标系中对RNA进行聚类,以便进行下游分割。开发团队选择了密度峰值聚类算法(DPC)来计算两个变量:P-NGC联合空间中每个点的局部密度ρ和距离δ。然后将这两个变量的乘积γ按照递减的顺序进行排序,以找到真正的具有高数量级γ值的集群。


ClusterMap的性能评估

与此前的方法相比,ClusterMap在模拟数据集和生物数据集中均表现出稳定的高性能。此外,ClusterMap广泛适用于各种实验方法,包括但不限于STARmap、MERFISH、ISS和osmFISH。结果表明ClusterMap从不同组织样本的原位转录组数据中准确地创建了RNA注释的亚细胞和细胞图谱,这些组织样本具有不同的RNA定位、细胞密度、形态和连接。


开发团队在五个模拟聚类基准数据集和一个由STARmap收集的代表性原位转录组数据中测试了ClusterMap的性能。与以前的方法相比,即使在斑点分布包含不规则的边界、不同的物理密度以及不同形状和大小的情况下ClusterMap在所有六个数据集中均表现出稳定的性能。


ClusterMap在小鼠初级皮质(V1)生成细胞类型和组织区域图:即使是密集的小鼠V1皮质细胞,细胞分割也清晰可见;与人工注释的分割标签相比,ClusterMap细胞标签的准确率达到80~90%;在小鼠V1皮层数据集中,ClusterMap确定了与之前报告中表达特征和组织定位都相匹配的细胞类型;ClusterMap准确地检测到皮质分层,从而可以对每个皮质层的细胞类型组成进行量化。综上,ClusterMap可以有效、准确、自动地进行细胞分割、细胞分型和组织区域识别。


ClusterMap在小鼠胎盘中生成细胞类型和组织区域图:鉴定了多达7224个细胞,通过使用Louvain算法将其聚类为12种细胞类型,其标记基因与scRNA-seq定义的细胞类型一致;ClusterMap根据细胞类型图确定了五个组织区域。


ClusterMap揭示胎盘中的细胞生态位和细胞-细胞邻接图。


开发团队分析了来自四种具有代表性的原位转录组学方法的小鼠大脑数据,验证了ClusterMap对不同实验方法的普遍适用性。


ClusterMap支持3D原位转录组学分析:在3D心脏类器官样本中,分层聚类将细胞分为三类,其具有不同的分子特征;100μm厚的小鼠V1样本包括所有六个皮质层和胼胝体,其中鉴定出多达24000个细胞,3D聚集成11种细胞类型,其结果显示了与先前发表的结果相似的空间分布。


ClusterMap将显著地扩展科研人员对从亚细胞器到器官的细胞类型图谱的所有尺度细胞组织的知识,并使单个细胞的局部微环境的进一步表征成为可能。

除了空间转录组数据外,ClusterMap还可以被推广应用于其他二维和三维映射的高维离散信号(如蛋白质或活细胞成像数据)。在未来,预计ClusterMap还可以通过结合其他类型的生物特征(如亚细胞器、细胞形状等)进行扩展,以揭示基因表达如何塑造细胞结构和组织形态的基本原理。

ClusterMap工具将在如下链接更新和维护:

https://github.com/wanglab-broad/ClusterMap

https:// github.com/LiuLab-Bioelectronics-Harvard/ClusterMap    


首发公号:国家基因库大数据平台


参考文献

He, Y., Tang, X., Huang, J. et al. ClusterMap for multi-scale clustering analysis of spatial gene expression.Nat Commun 12, 5909 (2021). https://doi.org/10.1038/s41467-021-26044-x

图片来源于NC官网和参考文献,如有侵权请联系删除。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,271评论 5 466
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,725评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,252评论 0 328
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,634评论 1 270
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,549评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 47,985评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,471评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,128评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,257评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,233评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,235评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,940评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,528评论 3 302
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,623评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,858评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,245评论 2 344
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,790评论 2 339

推荐阅读更多精彩内容