VIRGO网站:https://virgo.igs.umaryland.edu/
VIRGO 是人类阴道微生物群落的非冗余基因目录。它是用宏基因组和尿源分离基因组序列的组合构建的。VIRGO可以用来描述阴道宏基因组和宏转录组数据集的分类和功能组成。可用的功能注释包括:KEGG、COG、eggNOG、CDD、GO、Pfam、TIGRfam、EC number。
VOG 是由一种新的jaccard聚类方法定义的阴道微生物群同源基因的集合,该氨基酸序列互补数据库可用于阴道同源蛋白家族的功能注释、比较基因组学和进化。
1.依赖的工具:
BLAST 2.2.3+
Bowtie 1.1.2+
GNU Awk 3.1+
seqtk 1.0+
2.数据库结构:
testrun:包含测试数据集和结果
0_db:包含可搜索的数据库文件和序列
VIRGO Bowtie 1 database
VIRGO Bowtie 2 database
VIRGO BLASTN database
VIRGO BLASTP database
1_VIRGO :包含了基因的注释文件
0.geneLength 包含bp基因长度
1.taxon.table 包含分类信息
2.A.proteinFamily.txt 包含来自17个源的注释,每行一个源
2.B.proteinFamily.txt 包含来自17个源的注释,每行一个基因
3.eggnog.txt 包含 eggNOG 注释
4.GC.txt 包含高或低基因计数信息,指示基因是否对高或低基因计数群体有偏好(>95%)
5.EC.txt 包含酶学委员会编号(EC 编号)
6.product.txt 包含基因产物注释
7.rxn.txt 包含 KEGG 反应注释
8.A.kegg.ortholog.txt 包含 KEGG 直向同源注释
8.B.kegg.module.txt 包含 KEGG 模块注释
8.C.kegg.pathway.txt 包含 KEGG 通路注释
2_VOG_annotation :包含 VOG 序列和 VIRGO 基因的链接器文件
0.VOG.VIRGO.tbl.txt:链接 VIRGO 和 VOG 的id
1.VOG.size.txt:VOG蛋白家族的大小
2.VOG.GC.txt:基因计数注释
3.VOG.funcat.txt:eggNOG 功能类
4.VOG.taxonomy.txt:共识分类法
5.VOG.alignmentScore.txt:蛋白质家族的比对分数
3_fungal_phage:包含10908个真菌和15965个噬菌体基因的注释
4_run_VIRGO:包含用于分析宏基因组和元转录组数据集的脚本
5_Jaccard_index_clustering:包含用于执行 jaccard 聚类以识别 VOG 的脚本