我们知道小鼠是一个研究很多的模式生物,有很多生物学研究,以及一些临床研究都是在小鼠上做的。那么小鼠里面研究的这个基因在人里面有没有,对应的具体又是一个什么基因,这是我们经常需要面临的一个问题。
今天小编就来跟大家探讨一下如何快速查找物种间对应的同源基因。这里给大家介绍两种方法。我们以人和小鼠之间的同源基因举例,其他物种依次类推。
方法一、直接查找NCBI的homologene
https://www.ncbi.nlm.nih.gov/homologene
我们以TP53这个基因为例,在搜索框中输入需要查找的基因名字,这我们搜人的TP53在其他物种里面的同源基因
点击search之后会得到下面这张表,你会找到TP53在大鼠,小鼠以及其他一些物种里面的同源基因的名字
方法二、使用R包homologene
上面提到的方法仅支持少数几个基因的检索,如果你手上有成百上千个基因需要查找同源基因,显然一个一个去查就不现实了。下面我们用R代码来批量做
#安装homologene这个R包
install.packages('homologene')
#加载homologene这个R包
library(homologene)
#这里以小鼠的三个基因为例
#更多基因方法是一样的
genelist<-c("Acadm","Eno2","Acadvl")
#使用homologene函进行转换
#@genelist是要转换的基因列表
#@inTax是输入的基因列表所属的物种号,10090是小鼠
#@outTax是要转换成的物种号,9606是人
homologene(genelist, inTax = 10090, outTax = 9606)
我们可以得到如下结果,后面两列对应的是Entrez gene ID
有人可能会问,我怎么知道每个物种的物种号是多少?别急,这个包有个函数可以输出支持的物种号列表
#输出homologene支持的物种号
homologene::taxData
是不是很贴心,基本上常见的一些物种都是支持的
对于像小鼠和人这种经常用的物种,甚至拥有自己的函数
mouse2human(genelist)
会得到相同的结果,都不需要知道物种号了
反之亦然
human2mouse(c("ACADM","ENO2","ACADVL"))