准备资料
- eggNOG 数据库
- 蛋白序列文件
- 用于比对、注释的脚本:emapper.py
- 用于提取注释信息的脚本:gene2anno.py
运行步骤
第0步:新建一个文件夹
mkdir work928 cd work928
第一步:拷贝蛋白序列文件和注释脚本到该新建文件夹下:
cp ../目录/蛋白文件.faa ./
cp ../目录/memapper.py ./
cp ../目录/gene2anno.py ./
第二步:运行 emapper.py 进行比对和注释
emapper.py -i [蛋白文件.faa] --output [输出文件名] --database bact --data_dir /bioinfo/database/eggNOG/eggnogdb.embl.de/download/emapperdb-4.5.1 --cpu 2(增加cpu数目可以加快程序运行)
#如果比对时间长,可以使用nohop 命令行 &进入后台运行
第三步: 提取所需注释信息:
gene2anno.py -table 蛋白文件.emapper.annotations -colGeneID 1 -colAnno 6 -output xxx;
gene2anno.py -table 蛋白文件.emapperll.annotations -colGeneID 1 -colAnno 7 -output xxx;
查看输出文件内容