Science | OpenCell:人类细胞蛋白质组的系统级描述
原创 图灵基因 图灵基因 2022-04-06 14:09
收录于话题#前沿分子生物学机制
如果你想了解机器的工作原理,你需要的不仅仅是一份零件清单。你需要知道所有的部件都在哪里,以及它们是如何组合在一起的,尤其是如果你试图理解一台复杂的机器——例如人体细胞。好吧,一段时间以来,我们已经有了详细的、蛋白质水平的人体细胞零件清单。这些零件清单或蛋白质组图谱有其用途,但当我们试图追踪构成生命过程基础的质量、能量和信息传递时,它们提供的指导很少。
为了有效地绘制细胞的技术图纸或插图,来自Chan-Zuckerberg Biohub(CZ Biohub)的科学家们将内源性标记、活细胞成像和相互作用蛋白质组学相结合。用他们的话来说,这种三管齐下的方法使科学家们能够“对活细胞中每种蛋白质的定位以及给定靶标与细胞内其他蛋白质之间的相互作用进行成像。”由Manuel D.Leonetti博士领导的科学家们断言,他们的工作将有助于对人类蛋白质组的组织进行系统级描述。
这项研究的详细内容发表在《Science》杂志上的一篇题为“OpenCell: Endogenous tagging for the cartography of human cellular organization”的文章中。
“利用高通量CRISPR介导的基因组编辑,我们构建了一个包含1310个荧光标记的(HEK293T)细胞系的文库。”该文章的作者写道,“通过使用该库执行配对[免疫纯化-质谱 (IP-MS)]和活细胞成像,我们生成了一个大型数据集,该数据集映射了相应的1310个蛋白质的细胞定位和物理相互作用。将无监督聚类和机器学习相结合应用于图像分析,使我们能够客观地识别具有空间或相互作用特征的蛋白质。”
除了引入用于高通量细胞生物学的综合实验管道外,科学家们还推出了OpenCell,这是一个蛋白质定位和相互作用测量的开源集合。该集合包括当前研究中的测量数据,可通过opencell.czbiohub.org上的交互式Web界面轻松访问。
科学家们还描述了他们如何进行图像分析。他们将无监督聚类和机器学习相结合,以深入了解单个蛋白质的功能,并推导出人类细胞组织的一些一般原理。
“特别是,我们发现结合RNA的蛋白质形成了一个由特定定位和相互作用特征定义的独立亚群。”科学家们指出,“我们还表明,特定蛋白质的精确空间分布与其细胞功能密切相关,因此可以从影像数据分析中获得精细的分子见解。”
科学家们承认,使用内源性荧光标记有一定的局限性。例如,这些标签的大小与普通人类蛋白质差不多,因此它们的插入可以改变目标蛋白质的表达、定位、功能或降解速率。此外,标记可能不允许对蛋白质异构体(包括翻译后修饰的变体)进行区分。最后,内源性标记可能会遗漏低丰度蛋白质。
“总的来说,”科学家们说,“对人类细胞结构的完整描述仍然是一项艰巨的挑战,需要并行应用互补的方法。”剑桥大学科学家编写并发表在《Molecular& Cellular Proteomics》上的一篇评论(“Subcellular Transcriptomics and Proteomics: A Comparative Methods Review”)中也提出了类似的观点。
“研究人员可以选择几种方法来解决与蛋白质和转录物的亚细胞定位和运输有关的生物学问题。”评论者指出,“然而,技术挑战仍然是巨大的,并且在转录组学和蛋白质组学以及生物系统和手头的问题之间存在差异,这就是缺乏一刀切的方法的内在原因。”
尽管如此,评论者们也发出了乐观的声音:“组学与定位研究的耦合在很大程度上仍处于初级阶段,但由于样品制备策略和设备的进步,以及单分子追踪、测序和当前的质谱技术达到了顶峰,因此正在迅速发展。亚细胞组学技术不仅有助于我们深入了解全球空间组织(例如HPA细胞图谱)、生物过程(例如细胞周期和胚胎发育)和病理学(例如癌症生物学),而且还出现在患者的诊断应用中。”
就其本身而言,CZ Biohub 团队相信其方法可以识别“来自光学显微镜图像的复杂但确定的特征”,从而为“深度表型分析和功能基因组学开辟了令人兴奋的途径”。该团队补充说,由于光学显微镜易于扩展,可以实时进行,并且能够在单细胞水平上进行测量,因此该方法应该“为正常生理学和疾病中细胞多样性的全面定量描述提供丰富的机会。”
以下是Leonetti博士的简短问答:
CZ Biohub是否正在努力将已识别蛋白质的数量扩大到当前文章中引用的1300种以上?
是的。例如,到目前为止,OpenCell覆盖了整个蛋白质组的大约7%。我们正在利用机器人技术和软件对我们的实验管道进行改造和自动化,以提高我们的通量。我们的目标是显著扩大蛋白质组的覆盖范围。一个令人兴奋的途径是探测不同细胞类型中的蛋白质(并非所有蛋白质都在所有细胞中表达)。我们可以先在干细胞中构建标记库,然后可以将其分化为不同的细胞类型。
与其他空间生物学方法相比,CZ Biohub的方法有哪些优点/缺点?它如何补充其他方法?
我们的显微镜方法的一个重要优势是我们可以分析活细胞。这将是解锁细胞动力学的关键。一个缺点是,由于我们依赖内源性表达,所以以低拷贝数表达的蛋白质很难检测到(我们可以通过设计更亮的荧光探针来解决这个问题)。另一个缺点是,因为我们修改了基因,所以无法轻易区分从相同基因表达的所有蛋白质异构体。例如,翻译后修饰的蛋白质无法被追踪。免疫荧光是一个很好的补充工具。
我们的图像分析工作表明,仅在蛋白质定位图像中就可以提取出许多特定的、精细的信息。该领域很有吸引力,看看我们通常从转录组学中提取的信息中有多少可以直接从图像(细胞类型、细胞状态等)中提取。现在仍处于早期阶段,但文献中出现的论文表明答案将是:实际上有相当多的信息!
除了空间维度,CZ Biohub的方法是否也考虑了时间维度?
这绝对是我们关注的焦点。高通量光片显微镜(Biohub community在其中非常活跃——例如PMID 31061492)的开发将非常有助于这项工作。