利用MegaX构建系统发育树

Hi,大家好。对于做实验的小伙伴来说,我们经常需要构建进化树,那么很多人应该都会选择MEGA(Molecular Evolutionary Genetic Analysis)这款软件。MEGA软件的目标是从进化的角度出发,为探索、发现和分析DNA和蛋白质序列提供工具。从1993年第一个版本问世到今天为止,MEGA已经更新了8个版本,目前最新的版本为MEGAX。

今天我们就来介绍一下MEGAX在图形界面(GUI)下如何构建系统发育树。系统发育树又称演化树或者进化树,是一种呈现不同物种或者是同物种不同族群的个体之间的亲缘关系树状图,可应用于亲缘分支分类方法、流行病学以及生态学等等[1]

第一步:下载MEGA软件
MEGA支持包括Windows,MacOS和LINUX多系统运行,可以说非常友好了。这里我下载的是macOS版本

MEGA的网址(https://www.megasoftware.net),选好所需版本,点击DOWNLOAD,按照要求填写所需信息下载即可。

image.jpeg

第二步:准备自己要比对的序列
这里我们准备的fasta格式的文件: example.fasta

image.jpeg

第三步:进行多序列比对

首先选择序列比对方法,MegaX提供了ClustalW和Muscle两种比对方法。其中ClustalW的原理是首先对序列进行两两比对,根据两两比对结果计算两两距离矩阵,是一种经典的比对方法。Muscle的功能只针对多序列比对,它的最大优势是速度快,而且序列数越多速度的差别越大。方法可以通过点击图中上方Alignment-Align by MUSCLE或者下方的图标
image.jpeg

image.jpeg

来选择。


image.jpeg

比对完成之后,点击Data-Export Aligment-MEGA Format,将比对结果保存为example.meg格式文件

第四步:构建系统发育树

将上一步保存的example.meg文件打开,就可以点击
image.jpeg

来选择建树方法。构建系统发育树有三种主要的建树方法,分别是距离法、最大简约法(maximum parsimony, MP),最大似然法(maximum likelihood,ML) 和贝叶斯法(Bayesian)。其中基于距离法的算法主要包括UPGMA、ME(Minimum Evolution,最小进化法)和NJ(Neighbor-Joining,邻接法)等。距离法是考察数据组中所有序列的两两比对结果,通过序列两两之间的差异决定进化树的拓扑结构和树枝长度,其中NJ法通过确定距离最近(或相邻)的成对分类单位来使系统树的总距离达到最小。它的特点是重建的树相对准确,假设少,计算速度快,只得到一棵树。其缺点主要表现在将序列上的所有位点同等对待,且所分析序列的进化距离不能太大。故NJ法适用于进化距离不大,信息位点少的短序列;最大简约法是考察数据组中序列的多重比对结果,优化出的进化树能够利用最少的离散步骤去解释多重比对中的碱基差异,该方法基于进化过程中所需核苷酸(或氨基酸)替代数目最少的假说,对所有可能正确的拓扑结构进行计算并挑选出所需替代数最小的拓扑结构作为最优系统树,也就是通过比较所有可能树,选择其中长度最小的树作为最终的系统发生树,即最大简约树;最大似然法主要考察数据组中序列的多重比对结果,对所有可能的系统发育树都计算似然函数,似然函数值最大的那棵树即为最可能的系统发育树,ML法是与进化事实吻合最好的建树算法。其缺点是计算强度非常大,极为耗时;贝叶斯法是一种新的利用贝叶斯演绎法预测种系发生史的系统进化分析方法,根据多种分子进化模型,利用马尔科夫链的蒙特卡洛方法产生所有参数的后验概率(posterior probability)估计值,这些参数包括拓扑结构、分支长度和替代模型各参数的估计。该方法不仅可以对模型的参数进行直接量化,而且可以分析很大的数据集,因其以后验概率来表示各分支的可信性而不需用自引导法(bootstrap)进行检验。

对进化树评估一般会采用Bootstrap 进行检验。Bootstrap检验,自举法检验,也叫自展,自助法。其实就是放回式抽样统计法的一种,通过对数据集多次重复取样,构建多个进化树,用来检查给定树的分枝可信度,默认自检次数为1000次。

平时一般推荐用两种不同的方法进行建树,如果得到的进化树类似,则结果较为可靠。这里我们先选择Neighbor-Joining法建树。本人亲自验证过NJ法建树几秒搞定,使用ML法,8线程足足运行了2个多小时。

image.jpeg

进化树构建完毕后,将进化树的文本文件也保存一下。点击File中的Export Current Tree(Newick),将结果保存为Newick格式。便于之后在iTOL等工具中进行进一步的美化。

1.维基百科

2.Glen Stecher, Koichiro Tamura, and Sudhir Kumar (2020) Molecular Evolutionary Genetics Analysis (MEGA) for macOS. Molecular Biology and Evolution (https://doi.org/10.1093/molbev/msz312)

3.http://blog.sina.com.cn/s/blog_6c0267490102wgxn.html,三大系统进化树法则:邻接法,最大简约法,最大似然法

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容