IQ-TREE的使用 - 超快速用极大似然法构建进化树

写在前面

我知道IQ-tree已经有很长一段时间了。不过我一直并没有使用它。主要原因是,常用的快速构建ML树的软件是FastTree,如果要求准确,我会在服务器上使用RaxML。所以是用不到。不过,使用IQ-tree可能最大的好处是,他支持直接估算替代模型。确实会省事许多。由于最近相对有多一点时间,那么我就查阅并记录一下IQ-tree的文档。

程序下载位置

IQ-tree官方现在似乎只提供多线程版本....

http://www.iqtree.org/#download

如果你赶时间,那么直接翻到最后

简单构建进化树

iqtree -s example.phy

其中-s参数跟的是输入的多序列比对结果。运行这个命令会产生两个输出文件
example.phy.iqtree记录相对具体的进化树构建信息。
example.phy.treefile记录构建成的进化树的newick文本,这个应该是最重要的输出文件
example.phy.log主要用于给软件作者debug。

作者在文档里提到

从版本1.5.4开始,默认自动估算最优替代模型

这是一个非常机智的操作....

IQ-tree运行过程会保存每一步成功运行的结果,或者说他是运行中断并从断点重新开始的。这个对于大数据集是有很大好处的。不过有时候,我们就是想从头开始,那么需要加上参数-redo

iqtree -s example.phy -redo

默认情况下IQ-tree的输出文件名字以输入的alignment文件为前缀。我们可以对其进行修改,使用-pre参数

iqtree -s example.phy -pre myprefix

不过事实上,我觉得完全没必要。除非你要不断的调整建树的参数。

选择合适的替代模型

IQ-tree支持多种不同输入数据的替代模型选择,包括

  • DNA
  • protein
  • codon
  • binary
  • morphological

通过设置参数-m MFP使其自动测试并选择最优替代模型

iqtree -s example.phy -m MFP

这个参数其实已经可以不用给了,上述说过,会默认执行。
一旦执行最优替代模型的预测,那么就会多输出一个文件,
example.phy.model记录了所有模型的似然信息。
事实上,最优替代模型的信息会记录 example.phy.iqtree中。如果是完全相同的多序列比对结果,那么最优替代模型也是相同的。如果并没有改变过,那么完全可以指定替代模型,比如已知最优替代模型为TIM2+I+G。那么可以执行下述命令

iqtree -s example.phy -m TIM2+I+G

当然,有时候,你只是想看看最优替代模型是啥,而不想构建进化树,毕竟后者相对耗时。那么可以执行

iqtree -s example.phy -m MF

如果计算资源允许,那么最好的方式是增加参数-mtree,这样会检查所有可用模型

iqtree -s example.phy -m MF -mtree

如果你的输入数据是SNP数据,那么需要加上+ASC

iqtree -s SNP_data.phy -m MFP+ASC

当然,基于传言和个人经验,在SNP数据上,似乎NJ法的表现就是由于ML法。

使用超快bootstrap法评估分支支持度

真实的进化信息只有一个,而我们总是拿着有限的序列信息,希望去获得他。能否获得他,是一个问题。而我们使用的序列信息是否能真实且稳定地反应一个进化信息,那么是另外一个事情。bootstrap法常用的,尤其是ML法构建进化树上,分支可靠性检验方法。但是这个计算逻辑最大的问题在于,抽样重新跑,抽样再重新跑,不断重复,直到收敛或者是到指定的比如1000次。计算量大,耗时长。IQ-tree的作者团队在前述提出了一个快速的BS方法,最后整合到IQ-tree中。使用的方式是

iqtree -s example.phy -m TIM2+I+G -bb 1000

注意到:

  1. -m TIM2+I+G 是因为已经指定了替代模型
  2. -bb 1000 指定了要用快速BS法做1000次

在这些参数下,输出文件example.phy.iqtree中会增加一个MAXIMUM LIKELIHOOD TREE部分,其中记录了具体BS结果。对应的newick文本则可以在example.phy.treefile中找到。
此外,会增加三个输出文件

  1. example.phy.contree记录了一致树,我个人认为这个用处不到,事实上,一致树我觉得主要是好看....
  2. example.phy.splits....
  3. example.phy.splits.nex... 与第2个文件具体信息类同

作者提醒到

快速BS法的具体解读与常规的BS法有不同,用户需要知晓。

我个人事实上在很早的时候,其实试过IQ-tree,但是两三套数据下来,自认为其表现不如RaxML,于是没有使用。作者在文档中提到,模型冲突的情况下,快速BS会高估BS值,推荐加上参数-bnni。于是,命令是

iqtree -s example.phy -m TIM2+I+G -bb 1000 -bnni

当然,作者仍然提供正常的BS参数,也就是不要-bb,而只用-b。或许我们不赶时间的情况下,可以使用

iqtree -s example.phy -m TIM2+I+G -b 100

此外,IQ-tree还支持其他的支持度估算方法
SH-like

iqtree -s example.phy -m TIM2+I+G -alrt 1000

你甚至可以同时进行两种分支支持度的计算,

iqtree -s example.phy -m TIM2+I+G -alrt 1000 -bb 1000

嗯,作为一个基本不怎么做进化分析的,我似乎觉得有BS就足够了,毕竟这个似乎才是最多人care的。

使用多线程

Emm... 我以为iqtree本身是直接支持多线程,但是似乎从文档来看,是需要另外的一个iqtree版本,iqtree-omp

iqtree -omp -s example.phy -m TIM2+I+G -nt 2

注意到,只有在长的比对结果下,使用多线程才会更有效。最好的方式是让IQtree自行定夺

iqtree -omp -s example.phy -m TIM2+I+G -nt AUTO

不过目前应该是官方就有编译的支持多线程的。

写在后面

总结,使用IQ-tree构建进化树的一步法,可能是

iqtree -s example.phy -m MFP -bb 1000  -bnni  -redo

最后查看结果文件example.phy.treefile
如果你担心快速BS效果不好,那么考虑使用

iqtree -s example.phy -m MFP -b 1000  -redo

如果你的序列足够长,那么文档建议增加-cmax,默认是10,这主要是计算资源的问题。

iqtree -s example.phy -m MFP -bb 1000  -bnni -cmax 15  -redo

当然,很多时候是需要增加多线程支持参数,如下

iqtree -s example.phy -m MFP -bb 1000  -bnni  -nt AUTO  -cmax 15  -redo 
# 或者 
iqtree -s example.phy -m MFP -b 1000  -nt AUTO  -cmax 15  -redo 
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 201,468评论 5 473
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,620评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 148,427评论 0 334
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,160评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,197评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,334评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,775评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,444评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,628评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,459评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,508评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,210评论 3 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,767评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,850评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,076评论 1 258
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,627评论 2 348
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,196评论 2 341

推荐阅读更多精彩内容