说在前面
相信很多小伙伴在分析单细胞数据做差异基因分析时都有这样的经历:发现往往差异最明显的都是那些什么RPL/RPS打头的核糖体基因。每当这时很多人的第一反应(小编也是这样)就是觉得他们很累赘,但是不敢随意筛出,因此不知道如何处理这些基因,这感觉就像如鲠在喉。
然而,Immugent最近刚看到一篇文献,就是专门做核糖体基因的,而且是早在2020年就发表在Nucleic Acids Res(IF:16.97)杂志上了,顿时打开了思路。这项研究的篇名为:Tissue- and development-stage–specific mRNA and heterogeneous CNV signatures of human ribosomal proteins in normal and cancer samples。
看到这,就想到有句老话说的很在理,存在的就是合理的。更体会到发高分文章其实不难,只要脑洞够大,知识储备够丰富。那么接下来Immugent就来和大家一起学习一下这位大神如何将鸡肋变鸡腿的吧。
主要研究内容
故事的开头就是作者发现不同的组织表达的核糖体基因不同,可以通过这些基因将不同组织很好的聚类(妙啊~)。当然这里提一下作者这是用的GTEx的bulk数据,可能是因为作者最开始考虑到单细胞数据测序深度不够吧,所以找出问题所在得要求测得的核糖体基因要足够多。
挖掘了GTEx数据库后,那么接下来大家会想到哪个?TCGA?
没错,你猜对了!接下来作者就挖掘了TCGA的数据库,发现可以使用核糖体基因将不同癌型的肿瘤患者进行很好的分开聚类(妙啊~)。这个就厉害了,建立了全文的一大类疾病模型--癌症。只在正常组织中进行分析其实意义没有那么大,只有和疾病相关联,才会赋予研究真正的医学应用价值。
紧接着作者为了确定组织特异性核糖体mRNA水平差异(代表转录而非翻译的核糖体mRNA库),是否与这些mRNA库在核糖体中翻译的水平相对应,作者还分析了来自人类、小鼠和大鼠的各种组织和细胞培养的匹配样本中RNA-Seq(代表转录水平)的mRNA表达数据和核糖体表达数据(妙啊~)。
最后,为了测试组织特异性核糖体RNA不仅表现在mRNA水平,同时也表现在蛋白质水平。作者进一步分析了从最近的研究获得组织学正常的17个成人组织,7个胎儿,以及6个主要造血细胞类型纯化的样本上77核糖体基因的蛋白表达数据(妙啊~)。结果表明,通过核糖体图谱测定的核糖体基因翻译水平与核糖体蛋白水平相似,也表现出发育阶段组织类型的特异性。
当然,全文总共有8副图,Immuegnt这里只展示了一部分,感兴趣的小伙伴可以去看一下原文,会有更多的收获呦!
展望
好啦,说到这,全文就大致看完了。Immugent在这里就对文章最初的立意做一个大胆的推测,这项研究的作者应该是在分析单细胞数据时发现了这个问题,但是在单细胞数据集里分析时没有得到很好的结果,然后作者考虑到这可能是因为单细胞测序深度不足的原因,于是进一步挖掘了bulk的数据。
这项研究给我们很多提示,特别是这篇文章的立意值得我们学习。就是在日常科研生活中会遇到很多意想不到的结果,我们往往第一反应都是认为是实验失败了,将得到的数据丢掉。然而,有很多新发现就是在意外中产生的,如青霉素的发现。因此,我们应该抱有一颗好奇之心,去探索这些结果背后的成因,那么很有可能你就做出了中国的下一个医学诺贝尔奖。