使用egg-nog进行非模式生物的基因注释——以昆虫为例

为什么写这个文章,其实是自己在安装和运行的过程中遇到了两个关于软件安装版本的问题,和一个路径问题(1)软件安装的版本不是最新的。(2)安装上新版本了,但是内部涵盖的软件本身的版本过于落后,导致调用不成功。路径问题是使用hmmer 比对的时候,按照之前网上的教程,路径一直报错。

安装eggnog-mapper的本地版

根据官方的指导教程,目前有三种方法去安装软件,我首选的是使用conda去安装软件,因为这是常见的最省心和最快的方法

conda create -n testemapperinstall python=3.7
conda activate testemapperinstall
conda install -c bioconda eggnog-mapper

会提示需要安装如下的包

package                    |            build
---------------------------|-----------------
biopython-1.78             |   py37h7f8727e_0         2.1 MB
boost-1.67.0               |           py37_4          11 KB
diamond-0.9.24             |       ha87ae23_0         734 KB  bioconda
icu-58.2                   |       he6710b0_3        10.5 MB
libboost-1.67.0            |       h46d08c1_4        13.0 MB
mkl-service-2.4.0          |   py37h7f8727e_0          56 KB
mkl_fft-1.3.1              |   py37hd3c417c_0         172 KB
mkl_random-1.2.2           |   py37h51133e4_0         287 KB
numpy-1.21.5               |   py37h6c91a56_3          10 KB
numpy-base-1.21.5          |   py37ha15fc14_3         4.8 MB
psutil-5.9.0               |   py37h5eee18b_0         328 KB
py-boost-1.67.0            |   py37h04863e7_4         278 KB
------------------------------------------------------------
                                       Total:        32.3 MB

但是这里踩了一个坑,使用conda安装的版本eggnog-mapper 的版本并不是最新的2.1.10,而是2.1.3,在通过指定版本安装conda install -c bioconda eggnog-mapper=2.1.10的情况下依然安装不上最新的版本。并且使用conda安装的diamond version是 0.9.24,是不符合eggnog-mapper需要的版本的,后面如果使用diamond进行比对会一直报错Error running diamond: Error: Invalid option: iterate

所以只能采用使用 pip install的方式去安装,然后检查安装文件可以看到已经安装成功了,并且diamond的版本也是正确的Diamond version found: diamond version 2.0.11

conda create -n testemapperinstall python=3.7
conda activate testemapperinstall
(testemapperinstall) user@vm-9c70-cfc9f5802384:~$ pip install eggnog-mapper
(testemapperinstall) user@vm-9c70-cfc9f5802384:~$ emapper.py --version
There was an error retrieving eggnog-mapper DB data: not a valid file "/home/data/t040403/miniconda3/envs/testemapperinstall/lib/python3.7/site-packages/data/eggnog.db"
Maybe you need to run download_eggnog_data.py
emapper-2.1.10 / Expected eggNOG DB version: 5.0.2 / Installed eggNOG DB version: unknown / Diamond version found: diamond version 2.0.11 / MMseqs2 version found: 113e3212c137d026e297c7540e1fcd039f6812b1

前期准备

下载eggnog注释文件

目前数据库提供非常多的datasets,如果只需要基础注释,那么直接运行下载脚本就可以了,如果想使用hmmer针对特定的datasets进行注释,需要下载相应的taxID的datasets。
Diamond DB是可选的。我们也可以决定执行HMMER或MMseqs2搜索,也可以创建特定于某个分类范围的Diamond或MMseqs2 DB。为此,可以使用download_eggnog_data.py——help(用于下载HMMER数据库或整个Diamond或MMseqs2数据库),并检查create_db .py——help(用于创建特定于分类的Diamond/MMseqs2数据库)。此外,可以下载PFAM数据库,以便能够使用——pfam_realign realign或——pfam_realign denovo以运行PFAM realignemts

# 针对基础注释下载数据 
# 这将下载eggNOG注释数据库(以及分类库数据库)和用于Diamond搜索的eggNOG蛋白质数据库。
python download_eggnog_data.py 

# 针对有hmmer需求的注释,以昆虫为例
python download_eggnog_data.py -P -H -d 50557

# 查看其它的参数
download_eggnog_data.py -h
``` shell 

## 开始进行注释
### 基础注释
目前从v2.1.5-2.1.10的版本,默认的注释方式使用的是`diamond blastp`,而不是之前的hmmer,目前网上的其他教程使用的默认的注释方式还是基于hmmer的,而不是diamond的。用diamond的好处就是很快。

nohup emapper.py -i myprotein.fa -o test_diamond --cpu 60 > diamondtest.out 2>&1 &

会生成4个文件

diamondtest.out
test_diamond.emapper.annotations
test_diamond.emapper.hits
test_diamond.emapper.seed_orthologs

查看.out文件中运行的时间

Total hits processed: 13334
Total time: 1155 secs

diamond的速度还是比较快的,基本输入17000+的序列,20分钟左右就给出了结果


**但是如果在NCBI上近缘物种收录比较少的物种,选择diamond比对的注释率通常会比较低,这类物种最好使用hmmer比对。比如昆虫,可能做你这种虫子的实验室也就没有几家,并且也没有很好的基因组注释,那么,也就是本文非常实用的方式,自己下载一个本地版的eggnog-mapper进行比对,使用网页版的eggnong进行比对,也不会提供使用hmmer比对的选项。**

## 使用hmmer进行注释
hmmer注释有两个参数 `-i`和`-d`是必须要给出的,`-d`针对的就是我们之前下载好的物种的taxID。hmmer的比对一般需要的时间比较长,基本跑上了以后过夜孵育就行了。
***按照之前刘永鑫和徐洲更两位大佬写的教程(当时版本的eggnog还是以hmmer作为默认的比对方式,而不是diamond),-d需要指定到文件夹下面的.hmm文件的位置,但是目前最新的版本只需要指定到taxID就可以了,否则一直会报错 `Could not find ./hmmer/50557/50557.hmm among eggnog databases. Skipping seed ortholog detection.Could not find hits to annotate.`,只会生成最后的一个.hits文件,并不会生成annotation文件。***
```shell
nohup emapper.py -i myprotein.fa -m hmmer --output anno_hmm1 -d 50557 --num_servers 60 --cpu 60 --override > test_hmm1.out 2>&1 &

#同样生成4个文件
test_hmm1.out
anno_hmm1.emapper.annotations
anno_hmm1.emapper.hits
anno_hmm1.emapper.seed_orthologs

两种方式的比较

查看两个文件分别有多少条序列被注释上了

grep queries test_diamond.emapper.annotations 
## 13334 queries scanned

grep queries test_hmm1.emapper.annotations 
## 13870 queries scanned

我们可以看出来hmmer的结果从数量上来说是要多一点的:
diamond的比对结果
13334 queries scanned
hmmer的比对结果
13870 queries scanned


结果查看

其实我们需要的文件是.annotation结尾的文件,这个文件中含有KEGG 和GO富集分析需要的GO号和KO号,还有每个基因对应的kegg map号等。这也是我认为使用eggnog最方便的地方,可以方便的获得基因和对应的通路的关系*有了这些对应关系,可以构建自己物种的orgdb,这样我们就可以很轻松的调用clusterprofiler包进行富集分析,这对于做湿实验的同学们来说实在是太友好了。
关于怎么调用R包进行分析,网上的教程很多,可以通过本地的代码实现,也可以通过CJ大神开发的TBTOOLS进行点点点的操作实现。

      5 #query  seed_ortholog   evalue  score   eggNOG_OGs      max_annot_lvl   COG_category    Description     Preferred_name  GOs     EC      KEGG_ko KEGG_Pathway    KEGG_Module     KEGG_Reaction   KEGG_rclass     BRITE   KEGG_TC CAZy    BiGG_Reaction   PFAMs
      6 LOCMI17628      7070.TC008471-PA        4.9e-28 90.3    2BMX3@1|root,2S1MZ@2759|Eukaryota,3A4DF@33154|Opisthokonta,3BRPH@33208|Metazoa,3D8I6@33213|Bilateria,41ZR4@6656|Arthropoda,3SMR4@50557|Insecta  33208|Metazoa   S       juvenile hormone acid methyltransfera>
      7 LOCMI16654      34740.HMEL012631-PA     8e-42   135.1   2BMX3@1|root,2S1MZ@2759|Eukaryota,3A4DF@33154|Opisthokonta,3BRPH@33208|Metazoa,3D8I6@33213|Bilateria,41ZR4@6656|Arthropoda,3SMR4@50557|Insecta,44678@7088|Lepidoptera   33208|Metazoa   S       juvenile horm>
      8 LOCMI17615      34740.HMEL012631-PA     4.9e-56 181.6   2BMX3@1|root,2S1MZ@2759|Eukaryota,3A4DF@33154|Opisthokonta,3BRPH@33208|Metazoa,3D8I6@33213|Bilateria,41ZR4@6656|Arthropoda,3SMR4@50557|Insecta,44678@7088|Lepidoptera   33208|Metazoa   S       juvenile horm>
      9 LOCMI17599      103372.F4WC68   2.2e-281        926.2   KOG1052@1|root,KOG1052@2759|Eukaryota,398K1@33154|Opisthokonta,3BNW3@33208|Metazoa,3CVS4@33213|Bilateria,41VAJ@6656|Arthropoda,3SK34@50557|Insecta,46JMS@7399|Hymenoptera       33208|Metazoa   EPT     Ligat>
     10 LOCMI02434      7370.XP_005179564.1     4e-28   90.6    2BMX3@1|root,2S1MZ@2759|Eukaryota,3A4DF@33154|Opisthokonta,3BRPH@33208|Metazoa,3D8I6@33213|Bilateria,41ZR4@6656|Arthropoda,3SMR4@50557|Insecta,44XEH@7147|Diptera       33208|Metazoa   S       ubiE/COQ5 met>
     11 LOCMI05868      136037.KDR22438 0.0     1208.8  COG2940@1|root,KOG1080@2759|Eukaryota,38F3T@33154|Opisthokonta,3BEIA@33208|Metazoa,3CUGA@33213|Bilateria,41WY3@6656|Arthropoda,3SIT0@50557|Insecta      33208|Metazoa   BK      nucleic acid binding    SETD1B  GO:00>
     12 LOCMI15917      136037.KDR22439 2.8e-33 105.1   KOG4763@1|root,KOG4763@2759|Eukaryota,3A8K9@33154|Opisthokonta,3BUDH@33208|Metazoa,3DAQE@33213|Bilateria,420Z4@6656|Arthropoda,3SPHF@50557|Insecta      33208|Metazoa   C       This is a component of the ubiquinol->
     13 LOCMI08045      136037.KDR22980 0.0     1479.5  COG2940@1|root,KOG1079@2759|Eukaryota,38DMC@33154|Opisthokonta,3BB21@33208|Metazoa,3CR6U@33213|Bilateria,41W11@6656|Arthropoda,3SGNZ@50557|Insecta      33208|Metazoa   K       chromatin binding       EZH1    GO:00>
     14 LOCMI09053      136037.KDR13022 0.0     1893.9  COG2940@1|root,KOG1083@2759|Eukaryota,38HZ1@33154|Opisthokonta,3BECC@33208|Metazoa,3CXS0@33213|Bilateria,41XBC@6656|Arthropoda,3SJF5@50557|Insecta      33208|Metazoa   K       Histone-lysine N-methyltransferase   >
     15 LOCMI09054      7091.BGIBMGA001177-TA   1e-63   205.0   2A2VB@1|root,2RY3V@2759|Eukaryota,3A0K8@33154|Opisthokonta,3BPKW@33208|Metazoa,3D6WU@33213|Bilateria,42ARU@6656|Arthropoda,3T053@50557|Insecta,442UM@7088|Lepidoptera   33208|Metazoa   S       Cyclic nucleo>
     16 LOCMI09055      136037.KDR16130 0.0     1191.2  COG5290@1|root,KOG1920@2759|Eukaryota,39DM9@33154|Opisthokonta,3BD96@33208|Metazoa,3CYHV@33213|Bilateria,41TKU@6656|Arthropoda,3SGJG@50557|Insecta      33208|Metazoa   K       Acts as subunit of the RNA polymerase>
     17 LOCMI11490      136037.KDR14736 2.2e-215        707.8   COG1112@1|root,KOG1804@2759|Eukaryota,38EBX@33154|Opisthokonta,3BCJJ@33208|Metazoa,3CUUD@33213|Bilateria,41YM5@6656|Arthropoda,3SJ4J@50557|Insecta      33208|Metazoa   L       Metal ion binding       -    >
     18 LOCMI11492      136037.KDR16129 2.8e-84 272.3   COG0564@1|root,KOG1919@2759|Eukaryota,39XWM@33154|Opisthokonta,3BN3R@33208|Metazoa,3CXH8@33213|Bilateria,420TK@6656|Arthropoda,3SNB1@50557|Insecta      33208|Metazoa   A       tRNA pseudouridine synthesis    RPUSD>
     19 LOCMI11493      34740.HMEL017808-PA     9.5e-24 74.5    2E4YM@1|root,2SBTE@2759|Eukaryota,3ADYP@33154|Opisthokonta,3BVFK@33208|Metazoa,3DCJ4@33213|Bilateria,421M6@6656|Arthropoda,3SPZ6@50557|Insecta  33208|Metazoa   J       Structural constituent of ribosome. I>
     20 LOCMI17453      136037.KDR11401 6.1e-33 106.1   2E3WB@1|root,2SAW0@2759|Eukaryota,3AAWY@33154|Opisthokonta,3BV83@33208|Metazoa,3DBSZ@33213|Bilateria,420XA@6656|Arthropoda,3SP8J@50557|Insecta  33208|Metazoa   I       It is involved in the biological process desc>
     21 LOCMI17626      7425.NV22361-PA 1.5e-24 78.3    KOG1052@1|root,KOG1052@2759|Eukaryota,KOG1054@2759|Eukaryota,3AFER@33154|Opisthokonta,3BZ5Y@33208|Metazoa,3DEEA@33213|Bilateria,4224C@6656|Arthropoda,3SQN7@50557|Insecta,46KH2@7399|Hymenoptera        33208|Metazoa>
     22 LOCMI10022      7213.XP_004536791.1     5.9e-69 223.7   KOG4294@1|root,KOG4294@2759|Eukaryota,39RAP@33154|Opisthokonta,3BAZ1@33208|Metazoa,3D37I@33213|Bilateria,41WQC@6656|Arthropoda,3SKIR@50557|Insecta,451US@7147|Diptera   33208|Metazoa   P       Belongs to th>
     23 LOCMI16746      7370.XP_005183710.1     1.8e-181        595.5   KOG0589@1|root,KOG0589@2759|Eukaryota,38EV9@33154|Opisthokonta,3BCJC@33208|Metazoa,3CX7R@33213|Bilateria,41YG0@6656|Arthropoda,3SICK@50557|Insecta,452HC@7147|Diptera   33208|Metazoa   T       prote>
     24 LOCMI17629      13037.EHJ69280  1.4e-08 26.2    2E3WB@1|root,2SAW0@2759|Eukaryota,3AAWY@33154|Opisthokonta,3BV83@33208|Metazoa,3DBSZ@33213|Bilateria,420XA@6656|Arthropoda,3SP8J@50557|Insecta,448M1@7088|Lepidoptera   33208|Metazoa   I       7tm Odorant receptor >
     25 LOCMI04705      69319.XP_008558251.1    0.0     2407.1  KOG2993@1|root,KOG2993@2759|Eukaryota,38BHV@33154|Opisthokonta,3BCCB@33208|Metazoa,3CSFT@33213|Bilateria,41YBC@6656|Arthropoda,3SIVQ@50557|Insecta,46JN2@7399|Hymenoptera       33208|Metazoa   U       Autop>
     26 LOCMI03117      136037.KDR11973 9.1e-299        984.9   COG2940@1|root,KOG1082@2759|Eukaryota,38GXX@33154|Opisthokonta,3BA3A@33208|Metazoa,3D0GH@33213|Bilateria,41UJY@6656|Arthropoda,3SG11@50557|Insecta      33208|Metazoa   B       It is involved in the biologi>
     27 LOCMI17602      34740.HMEL012631-PA     9.9e-38 122.0   2BMX3@1|root,2S1MZ@2759|Eukaryota,3A4DF@33154|Opisthokonta,3BRPH@33208|Metazoa,3D8I6@33213|Bilateria,41ZR4@6656|Arthropoda,3SMR4@50557|Insecta,44678@7088|Lepidoptera   33208|Metazoa   S       juvenile horm>
     28 LOCMI02868      7165.AGAP005256-PA      3.1e-28 90.8    2BMX3@1|root,2S1MZ@2759|Eukaryota,3A4DF@33154|Opisthokonta,3BRPH@33208|Metazoa,3D8I6@33213|Bilateria,41ZR4@6656|Arthropoda,3SMR4@50557|Insecta,44XEH@7147|Diptera,45H05@7148|Nematocera 33208|Metazoa   H    >
     29 LOCMI05251      136037.KDR19483 8.8e-10 30.9    2E3WB@1|root,2SAW0@2759|Eukaryota,3AAWY@33154|Opisthokonta,3BV83@33208|Metazoa,3DBSZ@33213|Bilateria,420XA@6656|Arthropoda,3SP8J@50557|Insecta  33208|Metazoa   I       It is involved in the biological process desc>
     30 LOCMI17595      7070.TC000731-PA        6.1e-16 49.7    2D59G@1|root,2S54D@2759|Eukaryota,3A71H@33154|Opisthokonta,3BTS5@33208|Metazoa,3D9HU@33213|Bilateria,420P1@6656|Arthropoda,3SP33@50557|Insecta  33208|Metazoa   T       Odorant receptor        -       -    >
     31 LOCMI17560      13249.RPRC005040-PA     2.7e-46 148.0   KOG4015@1|root,KOG4015@2759|Eukaryota,3A4HC@33154|Opisthokonta,3BTCU@33208|Metazoa,3D6FA@33213|Bilateria,4205Y@6656|Arthropoda,3SN3G@50557|Insecta,3EB1T@33342|Paraneoptera     33208|Metazoa   I       Lipoc>
     32 LOCMI17623      7070.TC005681-PA        1.5e-12 39.7    2E3WB@1|root,2SAW0@2759|Eukaryota,3AAWY@33154|Opisthokonta,3BV83@33208|Metazoa,3DBSZ@33213|Bilateria,420XA@6656|Arthropoda,3SP8J@50557|Insecta  33208|Metazoa   I       It is involved in the biological proc>
     33 LOCMI17613      121225.PHUM350920-PA    1.4e-36 118.2   2BMX3@1|root,2S1MZ@2759|Eukaryota,3A4DF@33154|Opisthokonta,3BRPH@33208|Metazoa,3D8I6@33213|Bilateria,41ZR4@6656|Arthropoda,3SMR4@50557|Insecta,3EDHB@33342|Paraneoptera 33208|Metazoa   S       Methyltransfe>
     34 LOCMI17612      7460.GB53122-PA 1.8e-261        858.1   KOG1052@1|root,KOG1052@2759|Eukaryota,38BIY@33154|Opisthokonta,3B9S8@33208|Metazoa,3CTGU@33213|Bilateria,41VGM@6656|Arthropoda,3SJ9C@50557|Insecta,46JMM@7399|Hymenoptera       33208|Metazoa   EPT     Gluta>
     35 LOCMI03525      136037.KDR15518 1.8e-249        820.7   COG5141@1|root,KOG0958@2759|Eukaryota,38EFF@33154|Opisthokonta,3B95Z@33208|Metazoa,3CUR9@33213|Bilateria,41W2U@6656|Arthropoda,3SHTC@50557|Insecta      33208|Metazoa   L       Metal ion binding       KDM4B>
     36 LOCMI17143      34740.HMEL012631-PA     9.3e-56 181.1   2BMX3@1|root,2S1MZ@2759|Eukaryota,3A4DF@33154|Opisthokonta,3BRPH@33208|Metazoa,3D8I6@33213|Bilateria,41ZR4@6656|Arthropoda,3SMR4@50557|Insecta,44678@7088|Lepidoptera   33208|Metazoa   S       juvenile horm>
     37 LOCMI17582      136037.KDR08645 1e-46   149.0   2E4BR@1|root,2SB93@2759|Eukaryota,3A95W@33154|Opisthokonta,3BTXB@33208|Metazoa,3DBPZ@33213|Bilateria,420YH@6656|Arthropoda,3SPE3@50557|Insecta  33208|Metazoa   S       cardioactive    CCAP    GO:0001664,GO:0002027>
     38 LOCMI06751      121225.PHUM220050-PA    4.5e-07 19.7    COG3040@1|root,KOG4824@2759|Eukaryota,3A66P@33154|Opisthokonta,3BTUH@33208|Metazoa,3D97V@33213|Bilateria,420IB@6656|Arthropoda,3SP3F@50557|Insecta,3EB8Z@33342|Paraneoptera     33208|Metazoa   M       Lipoc>
     39 LOCMI06752      136037.KDR17861 2.3e-131        427.7   KOG1476@1|root,KOG1476@2759|Eukaryota,39SHE@33154|Opisthokonta,3BP2V@33208|Metazoa,3CVE7@33213|Bilateria,41WT8@6656|Arthropoda,3SHIC@50557|Insecta      33208|Metazoa   G       Belongs to the glycosyltransf>
     40 LOCMI11338      136037.KDR11088 4.4e-178        582.4   KOG2177@1|root,KOG2177@2759|Eukaryota,39SUM@33154|Opisthokonta,3BAVQ@33208|Metazoa,3CYHK@33213|Bilateria,41UCU@6656|Arthropoda,3SJ3A@50557|Insecta      33208|Metazoa   O       B-box zinc finger       RNF20>
     41 LOCMI11339      136037.KDR21413 2.4e-34 106.1   2CE6E@1|root,2S3FZ@2759|Eukaryota,3A4EU@33154|Opisthokonta,3BRJX@33208|Metazoa,3D8E2@33213|Bilateria,42086@6656|Arthropoda,3SP3Z@50557|Insecta  33208|Metazoa   S       Domain of unknown function (DUF4802)    -    >
     42 LOCMI11340      136037.KDR12536 7.2e-290        952.9   COG0017@1|root,KOG0556@2759|Eukaryota,38CRQ@33154|Opisthokonta,3BACR@33208|Metazoa,3CR95@33213|Bilateria,41TJH@6656|Arthropoda,3SJGE@50557|Insecta      33208|Metazoa   J       It is involved in the biologi>
     43 LOCMI11341      136037.KDR12543 1e-184  605.8   KOG1413@1|root,KOG1413@2759|Eukaryota,38PAJ@33154|Opisthokonta,3BJM1@33208|Metazoa,3CTXT@33213|Bilateria,41U3R@6656|Arthropoda,3SJY6@50557|Insecta      33208|Metazoa   G       Acetylglucosaminyltransferase activit>
     44 LOCMI17358      7070.TC030318-PA        7e-25   79.8    2E3WB@1|root,2SAW0@2759|Eukaryota,3AAWY@33154|Opisthokonta,3BV83@33208|Metazoa,3DBSZ@33213|Bilateria,420XA@6656|Arthropoda,3SP8J@50557|Insecta  33208|Metazoa   I       It is involved in the biological proc>
     45 LOCMI16699      7370.XP_005179565.1     1.2e-38 125.1   2BMX3@1|root,2S1MZ@2759|Eukaryota,3A4DF@33154|Opisthokonta,3BRPH@33208|Metazoa,3D8I6@33213|Bilateria,41ZR4@6656|Arthropoda,3SMR4@50557|Insecta,44XEH@7147|Diptera       33208|Metazoa   S       ubiE/COQ5 met>
     46 LOCMI11421      69319.XP_008543547.1    1.9e-25 78.7    28MBS@1|root,2QTV5@2759|Eukaryota,39RH1@33154|Opisthokonta,3BIVB@33208|Metazoa,3CW9C@33213|Bilateria,421IJ@6656|Arthropoda,3SPTU@50557|Insecta,46MXY@7399|Hymenoptera   33208|Metazoa   L       DNA double-st>
     47 LOCMI11422      136037.KDR20973 1.1e-237        780.0   COG0554@1|root,KOG0728@2759|Eukaryota,38EAQ@33154|Opisthokonta,3BA1Z@33208|Metazoa,3CZPQ@33213|Bilateria,41V3V@6656|Arthropoda,3SGQT@50557|Insecta      33208|Metazoa   O       Belongs to the AAA ATPase fam>
     48 LOCMI11423      136037.KDR16972 5.3e-257        844.7   COG0369@1|root,KOG1159@2759|Eukaryota,38DM1@33154|Opisthokonta,3BE84@33208|Metazoa,3CRQ3@33213|Bilateria,41U4D@6656|Arthropoda,3SI9X@50557|Insecta      33208|Metazoa   C       Component of the cytosolic ir>
     49 LOCMI11424      7165.AGAP009786-PA      0.0     1700.1  COG0151@1|root,COG0299@1|root,KOG0237@2759|Eukaryota,KOG3076@2759|Eukaryota,38BPB@33154|Opisthokonta,3BDXA@33208|Metazoa,3CXAA@33213|Bilateria,41VJ7@6656|Arthropoda,3SGZ3@50557|Insecta,44XCN@7147|Diptera,4>
     50 LOCMI11425      136037.KDR12435 4.2e-107        349.3   KOG0568@1|root,KOG0568@2759|Eukaryota,38G8X@33154|Opisthokonta,3BGHV@33208|Metazoa,3CZQ5@33213|Bilateria,41UEF@6656|Arthropoda,3SJGU@50557|Insecta      33208|Metazoa   O       homolog subfamily C member   >
:


Reference

[1] eggNOG-mapper v2: functional annotation, orthology assignments, and domain
prediction at the metagenomic scale. Carlos P. Cantalapiedra,
Ana Hernandez-Plaza, Ivica Letunic, Peer Bork, Jaime Huerta-Cepas. 2021.
Molecular Biology and Evolution, msab293, https://doi.org/10.1093/molbev/msab293

[2] eggNOG 5.0: a hierarchical, functionally and phylogenetically annotated
orthology resource based on 5090 organisms and 2502 viruses. Jaime
Huerta-Cepas, Damian Szklarczyk, Davide Heller, Ana Hernandez-Plaza,
Sofia K Forslund, Helen Cook, Daniel R Mende, Ivica Letunic, Thomas
Rattei, Lars J Jensen, Christian von Mering and Peer Bork. Nucleic Acids
Research, Volume 47, Issue D1, 8 January 2019, Pages D309-D314,
https://doi.org/10.1093/nar/gky1085

[3] Sensitive protein alignments at tree-of-life scale using DIAMOND.
Buchfink B, Reuter K, Drost HG. 2021.
Nature Methods 18, 366–368 (2021). https://doi.org/10.1038/s41592-021-01101-x

官方的操作手册

https://github.com/eggnogdb/eggnog-mapper/wiki/eggNOG-mapper-v2.1.5-to-v2.1.10

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容