最近更新频率很慢,因为我忙于课题,没有很多大块的时间进行学习。现在深刻的体会到实验室的氛围如果很好的话(这里的氛围指的是同学以及老板),做起实验来也是充满动力的,而且心情也会很好,每天都感觉充满希望。虽然没有大块时间学习,但是日常的小技能还是经常会get到一些,今天要分享的就是如何查询NCBI里基因信息的历史版本。
在NCBI里查询某个基因的信息时,我们经常能看到这样的注释:
网站会告诉你关于这个基因的信息最近的更新时间。那么我就在想,那之前的记录还可以查看吗?如果有的话,应该去哪儿查询呢?
这项技能非常的easy,NCBI官方有一个网页就是介绍如何查询sequence revision history:
https://www.ncbi.nlm.nih.gov/genbank/sequencerevisionhistory/
现在举个例子:
比如上面截图里显示的基因,首先我们先要找到它的Accesion ID。点击页面右侧的RefSeq:
这时会自动跳转到该基因所有已知的isoforms,比如这个基因,就有3个isoforms(见下图),选择你想要查看的isoform,这里我就用第一个作为例子。实际上这个NM和NP开头的数字就分别是核酸和蛋白的ACCESSION,但这里要注意的是,你要使用小数点前面的内容来进行查找。比如这里,如果你想查看该基因核酸序列所有历史版本,你需要的ACCESSION ID是NM_001252313:
重点来了,现在复制这个网址(如果你要查询其他基因,把链接里的问号前ACCESSION ID改一下就行):
https://www.ncbi.nlm.nih.gov/nuccore/NM_001252313?report=girevhist
这时页面出现:
这是该基因自从被NCBI收录以来所有的更新记录,可以看到最近的一次更新是今年的6月22日。你可以任意查看以往的记录。对于这个基因来说,一共有几十次更新记录。在页面的最下方,还会告诉你这个基因第一次被收录的时间(哇塞好巧,这日期恰好是我生日):
在这个页面里,你可以任选两个版本进行比较,比如这里我想比较最新的和3月16日更新的版本的差别,这里你可以选择比较FASTA或者选择blast,FASTA比较就是只告诉你基因序列有没有区别,但是不会显示细节:
如果你选择BLAST,再点击Compare,小窗口中会出现该两个版本里基因序列的blast比较结果:
另外如果你随便点击一个早期的历史版本,其中会告诉你这个版本的信息是什么时候更新的,并且会提示你这个记录已经有更新,还有最新版本的链接: