编译|mummer2circos画环状细菌基因组圈图

mummer2circos 是一个用于绘制细菌基因组的圈图(circos图)的工具。它基于 BLAST 或 NUCMER/PROMER 的比对结果,生成 SVG 和 PNG 格式的图像,可以直观地展示基因组的结构和特征。

安装

方法一: 用conda

先下载yaml文件,发现直接装conda直接conda装不行,因为依赖于blast等,测试环境windows,在wsl2上经过多次尝试,耗费时间很久,能docker还是docker


许久还在转圈。。。
conda install -c bioconda -c conda-forge mummer2circos

方法二:Docker或类似的Singularity等容器方法

# Docker
windows下先根据官方说明安装docker desktop,然后打开,发现登陆账户由于国内网络原因很折腾,直接wsl命令行进行。
sudo docker pull metagenlab/mummer2circos:1.4.2
# Singularity
# 准备镜像
singularity build mummer2circos.simg docker://metagenlab/mummer2circos:1.4.2
# 运行
singularity exec mummer2circos.simg mummer2circos -r <reference.fna> -q <query.fna>  -l

比对方法

  • 全基因组比对可以使用三种不同的方法完成:Megablast、Nucmer 或 Promer
  • 使用参数 -a 指示要使用的方法。Nucmer 是默认选项。
    mummer2circos -l -a promer ...

简单图

  • -r 参考 fasta
  • -q 其他 fasta 与参考 fasta 进行比较
  • -l 建造圆形地块的修补选项
    基因组轨迹根据输入查询 FASTA 文件的顺序进行排序
sudo docker run --rm -v /home/:/data -it metagenlab/mummer2circos:1.4.2
(base) mambauser@8561c1b8f8de:/data$ mummer2circos -l -r source/mummer2circos/examples/genomes/NZ_CP008827.fna -q source/mummer2circos/examples/genomes/*fna -f
14:07:36 INFO Genomes will be aligned with:     nucmer
14:07:36 INFO Reference genome: source/mummer2circos/examples/genomes/NZ_CP008827.fna
14:07:36 INFO running nucmer: nucmer -b 200 -c 65 -g 90 -l 20 -p circos_tmp/CP006659 source/mummer2circos/examples/genomes/NZ_CP008827.fna source/mummer2circos/examples/genomes/CP006659.fna
...
14:09:08 INFO Query genome 10/10: source/mummer2circos/examples/genomes/NZ_FO834906.fna
14:09:08 INFO Track file list ['CP006659.heat', 'KpFR_13.heat', 'NZ_CP008827.heat', 'NZ_CP008929.heat', 'NZ_CP012426.heat', 'NZ_CP012745.heat', 'NZ_CP014647.heat', 'NZ_CP015822.heat', 'NZ_CP016811.heat', 'NZ_FO834906.heat']
14:09:08 INFO Plotting heatmap type plot...
14:09:27 INFO Circos plot generated sucessfully, see nucmer2circos.svg & nucmer2circos.png
14:09:27 INFO Circos files saved in circos_data:
        - main configuration file:              circos.config
        - Contigs definition:                   circos_contigs.txt
        - GC skew:                              circos_GC_skew.txt
        - GC content:                           circos_GC_content.txt
        - Heatmap track 1:                      CP006659.heat
        - Heatmap track 2:                      KpFR_13.heat
        - Heatmap track 3:                      NZ_CP008827.heat
        - Heatmap track 4:                      NZ_CP008929.heat
        - Heatmap track 5:                      NZ_CP012426.heat
        - Heatmap track 6:                      NZ_CP012745.heat
        - Heatmap track 7:                      NZ_CP014647.heat
        - Heatmap track 8:                      NZ_CP015822.heat
        - Heatmap track 9:                      NZ_CP016811.heat
        - Heatmap track 10:                     NZ_FO834906.heat
14:09:27 INFO The plot can be modified (to change color scales, remove or add tracks...) by modifining the file "circos.config" and excuting the command "circos -conf circos.config"

工作目录下,3种格式的图片已经生成啦!



  • -c 更紧实的环


加上基因轨

参考 Fasta 文件染色体(和最终质粒)的标题应与 GenBank 文件的位点加入相同。请参阅示例文件 NZ_CP008828.fna。
LOCUS NZ_CP008828 15096 bp DNA CON 16-AUG-2015

mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk

标记特定基因

  • 给定感兴趣的蛋白质的 FASTA 文件,在圆形图上标记每个氨基酸序列的 BBH
  • fasta 标头用作标签(请参阅示例文件 VF.faa)
mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk -b VF.faa 

# 显示沿染色体(和质粒)的映射深度

  • 深度文件可以使用SamTools Depth从BAM文件生成
  • .depth 文件中使用的标签应与 Fasta 标头相同(请参阅示例文件)
  • 深度大于中位数 2 倍的区域被裁剪到该限制并着色为绿色(处理高度重复的序列)。
  • 深度低于中位深度一半的区域以红色着色。
mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk -b VF.faa -s GCF_000281535.depth

根据坐标文件添加标签

  • 结构:LOCUS启动停止标签(见labels.txt)
  • 标签不能包含空格
mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/NZ_FO834906.fna -gb GCF_000281535_merged.gbk -b VF.faa -s GCF_000281535.depth -lf labels.txt

显示两个基因组之间的联系

mummer2circos -r genomes/NZ_CP012745.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk -b VF.faa -s GCF_000281535.depth -lf labels.txt

One More Thing

P.S.豆豆小编表示软件里的这个脚本mummer2circos/GC.py非常实用,计算GC和GC skew 这两个在比较基因组中经常使用,之前使用bedtools计算的,非常值得学习!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 193,812评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,626评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,144评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,052评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,925评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,035评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,461评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,150评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,413评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,501评论 2 307
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,277评论 1 325
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,159评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,528评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,868评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,143评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,407评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,615评论 2 335

推荐阅读更多精彩内容