分子进化与系统发育

作者:Masatoshi Nei, Sudhir Kumar
简介:

https://baike.baidu.com/item/%E5%88%86%E5%AD%90%E8%BF%9B%E5%8C%96%E4%B8%8E%E7%B3%BB%E7%BB%9F%E5%8F%91%E8%82%B2/10082116?fr=aladdin

前言:
统计学是一门用途极为广泛的学科,但有效的应用者却寥寥无几。对大多数人而言,传统的通往统计学知识之路被数学这堵令人望而生畏的高墙所阻挡。我们这里走的路就是避开这堵墙。
Efron & Tibshirani(1993)

分子水平进化方面有两门不同的学科:重建生物进化历史和研究进化的机制。近几十年来,这两门学科都取得了显著进展,主要是由于PCR和测序技术的飞速发展,使得大量DNA序列得以测定,大大加速了研究分子进化遗传学的研究速度。除此之外还有另一个原因就是数据分析的统计方法以及计算机技术的发展。

本书的目的是:为分子进化研究提供有用的统计方法,并以实际数据为例,说明如何运用这些方法。

第一章:进化的分子基础
1.1 生命的进化树
从达尔文开始,许多生物学家都想重建地球上所有生命的进化历史,并以系统树的形式描述这部历史。之前主要的研究途径有化石(零散且不完整)、形态学和生理学的比较(比较复杂,不能得出非常清晰的结论),随着分子生物学的进展,人们可以通过比较DNA来研究生物之间的进化关系。

DNA蕴藏的的信息量巨大,同时DNA的进化演变或多或少是有规律的,因此能用数学模型来描述其变化,并且可以比较亲缘关系较远的生物间的DNA。

形态性状的进化演变,即使在一段较短的进化时间,也是及其复杂的(体现在什么方面?)

系统学或分类学是生命科学中争议最多的领域之一。一些分类单元的定义常常带有主观性。相对而言,系统发育学的争论少一点,因为它主要研究的是有机体之间的进化关系,而分类的工作相对没那么重要。

分类应反映有机体的进化历史。

1.2 进化机制
进化的第一原因是基因突变(替代,indel,重组等)。然后通过遗传漂变或自然选择进行扩散,最终固定在物种中。

  当对某一类群构建了一颗有效的系统树,我们就可以找到具有此突变性状的谱系。

    通过将具有某特定形状的谱系所处的环境条件与无此性状的谱系所处的环境条件进行比较,就有可能会搞清楚该性状是由自然选择还是随机演化而决定的。

  现在一些遗传学家正在对一个基因座上的不同等位基因进行测序,来了解他们的进化历史。构建一个物种不同等位基因的系统树。

1.3 基因的结构与功能
从功能上看,基因分为两类:蛋白质编码基因和RNA编码基因。(补充基础知识而已,如蛋白质的编码方式等,密码子的简并性和偏好性)

1.4 DNA序列的突变:
转换、颠换、InDel、倒位、移码突变,提前终止突变等
同义突变,非同义突变和无义突变
短的插入缺失是由于DNA复制差错,长的插入和缺失要借助不等交换和转座。

基因转换会改变一个DNA片段,使其与另一个片段完全相同,但是不改变基因的拷贝数。,这是由于异源DNA的错配修复引起的。

1.5 密码子的使用频率:
原因:1、tRNA丰度不同导致的(高表达)
2、突变压。如不同基因组中GC含量不同,同时也影响了密码子的使用。突变压和净化选择共同影响了密码子的偏好性。

Paste_Image.png

不同的物种,碱基替换模式是不同的,主要体现在GC含量的不同,这给系统发育研究带来了困难。

动植物中,GC含量变化范围很窄,特别是脊椎动物只在40~45% 之间浮动。基因组可根据GC含量的不同分为富GC区和贫GC区,有趣的是,在同质区,GC含量与第三个密码子的GC含量很接近。

密码子用法偏倚的统计测度:
使用密码子出现的绝对次数经常会出现不便之处,因为所检验的密码子总数不一定是相同的,因此密码子用法偏倚的更有用的测度是相对同义密码子使用频率(relative synonymous codon usage,RSCU),
RSCU=Xi / X_ave
Xi:编码该氨基酸低i个密码子的观测数
X_ave:所有编码该氨基酸的密码子的平均使用次数

第二章:氨基酸序列的进化演变

1977年,DNA快速测序法发明(sanger 一代测序)之前,多数分子进化研究是基于氨基酸序列数据的,如分子钟理论的提出,。

2.1 氨基酸差异和不同氨基酸的比例
对于长度相同的序列,通过比较他们差异的氨基酸数目就可以度量序列间的分歧程度,但是当他们之间有插入或者缺失的时候没计算氨基酸差异数是没有意义的,需要将插入缺失的部分排除掉再计算。其实一般都是用比例值表示,称为p值距离。

泊松矫正:
p(差异碱基比例)与t(分化时间)呈现非线性关系的原因有重复突变和选择压力等。
令r为一个特定位点每年的氨基酸替换率,并且假设所有位点的r都相同,t年后,每个位点氨基酸替代的平均数是rt。在一个给定点氨基酸替换数k(k=0,1,2,3,4,5,6...)的发生频率遵循泊松分布:
P(k;t)=e^ -r t * ((rt)^k) /k!
因此,在某一位点氨基酸不变的概率是p(0,t)=e ^ rt
如果多肽链长度为n,不变氨基酸的期望值为ne ^(-rt)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容