用mecat2组装基因组

背景介绍

mecat2可以说是比较早的一批可以用于三代测序平台的基因组组装软件了,2017年刚上硕士的时候就有接触到过。当然还有WTDBG2也是差不多同时期的软件。

软件安装

这次没法无脑conda了,得从源码开始编译。就当忆苦思甜吧,见识一下如果没有conda加持,软件安装是一个什么样的过程。不过mecat2的安装已经是比较新手友好型的了。

git clone https://github.com/xiaochuanle/MECAT2.git
cd MECAT2
make

记得把MECAT/Linux-amd64/bin的路径加入环境变量以便全局调用哦。

软件运行

1. 生成输入文件

把多个测序文件的存储路径写入fastq.list

ls /path/to/rawData/pacbio/*.gz > fastq.list

2. 生成config文件

再用mecat2.pl生成一个config文件

mecat.pl config > test.config

有的时候你会遇到软件输出这么一句:

Smartmatch is experimental at /path/to/MECAT2/Linux-amd64/bin/Plgd/Project.pm line 232.

这只是一个warning,不用管他。它实际上说的内容也不过是告诉你一下Project.pm这个程序的232行所使用的Smartmatch这个功能是一个实验性功能。没了。你就当无事发生过就好。
接下来根据你的需求去修改config文件即可。

PROJECT=test
RAWREADS=/path/to/04mecat2/fastq.list
GENOME_SIZE=xxxxxxxxx
THREADS=80
MIN_READ_LENGTH=2000
CNS_OVLP_OPTIONS="-kmer_size 13"
CNS_PCAN_OPTIONS="-p 100000 -k 100"
CNS_OPTIONS=""
CNS_OUTPUT_COVERAGE=30
TRIM_OVLP_OPTIONS="-skip_overhang"
TRIM_PM4_OPTIONS="-p 100000 -k 100"
TRIM_LCR_OPTIONS=""
TRIM_SR_OPTIONS=""
ASM_OVLP_OPTIONS="-n 100 -z 10 -b 2000 -e 0.5 -j 1 -u 0 -a 400"
FSA_OL_FILTER_OPTIONS="--max_overhang=-1 --min_identity=-1"
FSA_ASSEMBLE_OPTIONS=""
CLEANUP=0
USE_GRID=true

注意这里的GENOME_SIZE只能识别bp为单位的数字大小,所以不要设置成3.2g之类的,软件识别不了。
其他参数就根据GitHub上的介绍或者我下面列出的洲更学长的帖子去设置就可以了。

3. 运行

直接nohup挂后台运行就可以了。

nohup mecat.pl assemble turtle.config &

参考资料

GitHub地址:https://github.com/xiaochuanle/MECAT2#S-input-format

洲更学长的教程贴:https://zhuanlan.zhihu.com/p/81172953

文章:https://www.nature.com/articles/nmeth.4432

萌哥碎碎念

  1. 基本这篇就是基因组组装软件的最后一篇了,下个阶段开始更新用10x genomics数据辅助scaffolding的内容。
  2. 如果你手上的是ONT的数据,那么可以试试necathttps://github.com/xiaochuanle/NECAT)同样是肖老师组开发的,专为ONT数据设计,国内的一些测序公司指定使用的ONT数据组装软件,你值得try try。
  3. 最近刷扣扣群看到未来组的胡江博士提到肖老师组又开发了一个新的组装软件叫pecathttps://github.com/lemene/PECAT)现在还处在活跃地开发中。

PECAT is a phased error correction and assembly tool for long reads. It includes a haplotype-aware correction method and an efficient diploid assembly method.

这个软件的目标是组装出单倍体级别的基因组,在necat和mecat的技术积累上,基因组组装软件也朝着更精细更准确更完善的方向发展着。真好啊。

我本来想测试一下看看效果,但是挂在了第一步的软件安装上。不过看起来作者们有在积极地更新,期待最终成果。

pecat的文章:https://www.biorxiv.org/content/10.1101/2022.09.25.509436v1

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 193,495评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,469评论 2 369
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 140,825评论 0 318
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 51,974评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,849评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 45,990评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,415评论 3 380
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,125评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,351评论 1 288
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,474评论 2 307
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,249评论 1 324
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,119评论 3 310
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,496评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,838评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,118评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,366评论 2 340
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,573评论 2 335

推荐阅读更多精彩内容