选择压力（dn/ds）计算

dn/ds又叫ka/ks，具体的概念，意义百度上都有。现主要介绍最近用到的三种计算途径，分别是maga7，datamonkey，paml。

做选择压力分析的序列文件，需要先clustal和剔除终止密码子，这步可以在MAGA里完成。

1.MAGA7

MAGA7，是通过分别求取dn，ds的值，然后得到dn/ds。

将fasta格式的序列文件导入MAGA, 然后选择Distance——computer overall mean distance进入图一页面：仔细看下面的选项卡，在substitutions type 中选择 Syn-Nonsynonymous；Genetic code table 按照自己的序列选择；modle/method 选择 Nei-Gojobori method (No. of Differences)；Substitutions to include 选择要计算的dn或者ds。下一步，就能得到dn或者ds，两者相比得到结果。

如果在distance——computer pairwise#####，然后按照后面步骤操作，结果会得到一个两两比较的矩阵（三角），我还不知道这个要怎么用。

如果只计算dn/ds，第一种应该够用了。

图一

2.Datamonkey

官网：https://www.datamonkey.org/

三种方式，按照你的序列条件选择其中一种。以FEL为例：

图二

在method and tool 里选择适合的方式，如FEL，选择文件导入sqe序列，选择genetic code。 RUN~ 选择select all —— save branch selection 运行

图三

图四

得到结果后，前面两行表示的是positive和negative的位点数，以及p值。向下滑，最后的表格的左下角是dn/ds的结果。更多的结果都在这个结果页面和export的annalyze log里。

图五

图六

3.PAML-codeml

杨子恒教授开发并免费提供的一个软件。paml现在已经开发到4.9h版了，这是一个命令行软件，现在已经有图形操作界面-pamlX，但是因为命令行操作起来很简单，而且学会也不难，就没有学习pamlX。

paml官网：http://abacus.gene.ucl.ac.uk/software/paml.html#PAMLx

参照官网信息可以完成下载，安装和运行示例文件。示例文件在下载的paml4.9h的example文件夹里。这里需要注意，可以将所有的’.exe‘文件和codeml.ctl (控制文件)复制到paml 的bin的文件夹里。方便运行，减少出错。

按照要求准备序列文件和树文件（树文件可以直接用maga做），有提示序列文件需要 .phy或者.paml格式，但是实践证明用.fasta格式也可以（注意文件名中不能有空格）。

windows系统打开cmd：win+R，输入cmd，回车

输入paml4.9h所在的盘，如：d: ，回车

输入cd， cd的命令查询文件，

输入bin文件夹所在位置，回车，>后需要输入运行的程序codemL

回车就是运行的结果。

windows不区别大小写，都可以。

下面是codeml.ctl文件的设置

seqfile =aa.fas * sequence data filename

treefile =aa.nwk * tree structure file name

outfile = aa.txt * main result file name

noisy = 3 * 0,1,2,3,9: how much rubbish on the screen

verbose = 0 * 0: concise; 1: detailed, 2: too much

runmode = 0 * 0: user tree; 1: semi-automatic; 2: automatic

* 3: StepwiseAddition; (4,5):PerturbationNNI; -2: pairwise

seqtype = 1 * 1:codons; 2:AAs; 3:codons-->AAs

CodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon table

* ndata = 10

clock = 0 * 0:no clock, 1:clock; 2:local clock; 3:CombinedAnalysis

aaDist = 0 * 0:equal, +:geometric; -:linear, 1-6:G1974,Miyata,c,p,v,a

aaRatefile = dat/jones.dat * only used for aa seqs with model=empirical(_F)

* dayhoff.dat, jones.dat, wag.dat, mtmam.dat, or your own

model = 0 【这个是branch/branch-site/site的选项，site选择0，具体区别可另外检索】

* models for codons:

* 0:one, 1:b, 2:2 or more dN/dS ratios for branches

* models for AAs or codon-translated AAs:

* 0:poisson, 1:proportional, 2:Empirical, 3:Empirical+F

* 6:FromCodon, 7:AAClasses, 8:REVaa_0, 9:REVaa(nr=189)

NSsites = 0 1 2 3 7 8 【下面附上的结果解读链接里有区别，其中包含零假设和替代假设】* 0:one w;1:neutral;2:selection; 3:discrete;4:freqs;

* 5:gamma;6:2gamma;7:beta;8:beta&w;9:betaγ

* 10:beta&gamma+1; 11:beta&normal>1; 12:0&2normal>1;

* 13:3normal>0

icode = 1 【根据密码子选择】* 0:universal code; 1:mammalian mt; 2-10:see below

Mgene = 0

* codon: 0:rates, 1:separate; 2:diff pi, 3:diff kapa, 4:all diff

* AA: 0:rates, 1:separate

fix_kappa = 0 * 1: kappa fixed, 0: kappa to be estimated

kappa = 2 * initial or fixed kappa

fix_omega = 0 * 1: omega or omega_1 fixed, 0: estimate

omega = .4 * initial or fixed omega, for codons or codon-based AAs

fix_alpha = 1 * 0: estimate gamma shape parameter; 1: fix it at alpha

alpha = 0. * initial or fixed alpha, 0:infinity (constant rate)

Malpha = 0 * different alphas for genes

ncatG = 8 * # of categories in dG of NSsites models

getSE = 0 * 0: don't want them, 1: want S.E.s of estimates

RateAncestor = 1 * (0,1,2): rates (alpha>0) or ancestral states (1 or 2)

Small_Diff = .5e-6

cleandata = 1 * remove sites with ambiguity data (1:yes, 0:no)?

* fix_blength = 0 * 0: ignore, -1: random, 1: initial, 2: fixed, 3: proportional

method = 0 * Optimization method 0: simultaneous; 1: one branch a time

* Genetic codes: 0:universal, 1:mammalian mt., 2:yeast mt., 3:mold mt.,

* 4: invertebrate mt., 5: ciliate nuclear, 6: echinoderm mt.,

* 7: euplotid mt., 8: alternative yeast nu. 9: ascidian mt.,

* 10: blepharisma nu.

* These codes correspond to transl_table 1 to 11 of GENEBANK.

图七

图八

图九

ps：教程：https://www.jianshu.com/u/214b3ff96d82

B站视频教程：https://www.bilibili.com/video/av10469605 from=search&seid=4867078036525249250

如何解读结果：http://blog.sina.com.cn/s/blog_65ba09d90102x4ua.html

ps：我觉得视频教程里up主说做的是branch，然后取model=0是零假设，与我理解的有出入，我以为model=0是site，NSsite可以决定那个是零假设那个是替代假设。

另外，在对结果解读的过程中，很多文章都提到M1a，M2a，但是NSsite里没有M1a，M2a，只有M1, M2, 不解。

视频UP主是branch test ，另一种计算模型，并非两者有错误。

所有内容不保证正确，有错就改。

建议忽略NEB的输出，选用BEB的输出，BEB只在正向选择的M2/M8中存在。

最后编辑于：2019.11.21 22:17:54

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,230评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,261评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,089评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,542评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,542评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,544评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,922评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,578评论 0赞 257
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,816评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,576评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,658评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,359评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,937评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,920评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,156评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,859评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,381评论 2赞 342

选择压力（dn/ds）计算

推荐阅读更多精彩内容