2019-Feb-Week4 Intron-loss evolution of hatching enzyme genes in Teleostei
摘要
背景:孵化酶属于虾红素金属蛋白酶家族,在胚胎孵化时能降解卵膜。在所有脊椎动物的基因组中都找到了孵化酶的同源基因。最近我们发现四足动物的孵化酶基因中外显子-内含子结构序列是保守的,而硬骨鱼中孵化酶基因经常会丢失内含子。在硬骨鱼类孵化酶基因中丢失内含子是一件稀有的进化事件,因为众所周知,真核生物基因一般都有内含子且不同种生物的内含子插入位点是保守的。在这里我们做的报告是经过对硬骨鱼类孵化酶基因中外显子-内含子结构的广泛研究得出了在进化过程中丢失内含子的原因及其如何丢失的。
结果:我们对真骨鱼总目27种孵化酶基因中内含子丢失的进化途径进行了研究。低等硬骨鱼孵化酶基因来自同一种类型,一个具有9-外显子-8内含子结构的假定祖先。另一方面,骨鳔下区鱼(otocephalan)和纯真骨鱼(euteleost)有两类孵化酶基因,说明在骨鳔下区鱼(otocephalan)和纯真骨鱼(euteleost)的共同祖先中存在基因复制现象。根据系统进化分析法这种重复基因可分为两进化枝(clades I and II)。在骨鳔下区鱼(otocephalan)和纯真骨鱼(euteleost)中,clade I基因发展为特殊的系统发生结构,如8-外显子-7-内含子,5-外显子-4内含子,4-外显子-3内含子或者是内含子缺失的结构。与clade I基因相反,clades II基因的结构相对稳定,而且与祖先基因相似。表达分析显示,与持家基因相比孵化酶基因是高表达基因。比较clade I基因与clades II基因的表达水平,clade I基因的表达量高于clades II基因。
结论:孵化酶基因在进化中丢失了内含子,内含子丢失事件发生在硬骨鱼类系统发育的特殊位点。我们认为在硬骨鱼进化中高表达的孵化酶基因频繁丢失内含子,而低表达的孵化酶基因保留着祖先基因的外显子-内含子结构。
背景
真核生物的许多核心基因都是由编码序列(外显子)及散在的插入序列(内含子)组成的。外显子和内含子序列一起转录成mRNA前体,内含子通过拼接作用从mRNA前体中移除。真核生物同源基因的内含子插入位点被认为是非常保守的。然而,最近对直系同源基因内含子位置的大量比对表明内含子位置比先前预测的更具有动态多样性。在真核生物进化过程中报道有相当数量的内含子丢失和增加。线虫类有显著高比例的内含子转换。然而在脊椎动物中,被报道的直系同源的外显子-内含子结构却相对稳定。在硬骨鱼中,Venkatesh等比对了8个基因的外显子-内含子结构,展示了内含子位置的变化发生在进化的特殊位点。虽然还做了其它的研究,对于理解进化中内含子缺失和获得的机制和选择压还有许多不确定性。
我们之前的分析表明在硬骨鱼进化过程中孵化酶基因频繁丢失它们的内含子。孵化酶是一种在胚胎孵化时期降解卵膜的酶。这种酶属于虾红素金属蛋白酶家族像BMP1(骨形态发生蛋白1)和meprin(肾组织的金属肽链内切酶)。在其它脊椎动物中也找到了孵化酶直系同源物。这些四足动物是由虾红素蛋白酶结构域和额外的C-末端结构域组成的多结构域蛋白。在两栖动物中爬行动物和鸟有一个或两个C-末端CUB结构域,然而在哺乳动物中有一个未知的C-末端结构域。另一方面,硬骨鱼的孵化酶仅由蛋白酶域组成。日本鳗鲡(一种低等的硬骨鱼)和四足动物的编码前导肽和蛋白酶域的基因其外显子-内含子结构是保守的。因此,可以推断鳗鲡鱼基因保持了祖先孵化酶基因的结构。在较高等硬骨鱼中我们发现孵化酶基因会频繁丢失它们的内含子。如此频繁的内含子丢失现象仅在孵化酶直系同源基因中发现,而在平行同源基因中未发现。
真鱼骨总目是脊椎动物26000种多样化种系中的一种,并估计是由284-333百万年前分支而来。最近用全线粒体DNA序列对硬骨鱼的系统发生关系进行了广泛研究。分析结果可以阐明追溯到300MYA前的硬骨鱼基因进化。我们比较多种硬骨鱼孵化酶基因的外显子-内含子结构,发现在硬骨鱼发展史中孵化酶基因在特殊位点丢失它们的内含子。
结果和讨论
为确定真骨鱼总目孵化酶基因结构变化的进化途径,我们克隆了27种基因,其中包括15种新克隆的品种,这在材料与方法中有描述。这些实验种类都分布在真骨鱼总目中,从低等到高等,分别如下:骨舌鱼超目(Osteoglossomorpha)1类两种,海鲢总目(Elopomorpha)4类的4种,骨鳔下区鱼(Otocephala)6类的8种,纯真骨鱼总目(Euteleostei)11类的13种。
- 孵化酶基因的多样化
我们用所有实验硬骨鱼的孵化酶基因的蛋白酶域的核苷酸序构建最大似然树(图1)。这棵树分为两个分枝:海鲢总目(Elopomorpha)基因分枝和骨鳔下区鱼(Otocephala)及纯真骨鱼总目(Euteleostei)(鲱形亚部Clupeocephala)基因分枝。海鲢总目(Elopomorpha)基因通过短的分枝形成了单源分枝。另一方面,鲱形亚部(Clupeocephala)基因分枝可分成两个分枝,为clade I和clade II。每一分枝内各有两个亚分枝,分别是骨鳔下区鱼类(Otocephalan)和纯真骨鱼类(Euteleostean)亚分枝。这些结果表明在鲱形亚部(Clupeocephala)祖先的孵化酶基因中发生了复制事件(图1)。通过Notung程序可由几个家系中更多的复制事件(数据未显示)重建祖先进化地位从而为复制事件提供依据。我们目前对硬骨鱼孵化酶基因的分析显示低等硬骨鱼有单一类型的基因。当鲱形亚部(Clupeocephala)从祖先中分枝出来后,鲱形亚部(Clupeocephala)的祖先发生基因复制并且基因形成两种类型。
从实验的鲱形亚部(Clupeocephala)中克隆出clade I的基因,clade I的基因的分枝模式反映出用全线粒体DNA序列预测的分子系统进化关系。从纯真骨鱼(Euteleostean)中克隆出clade II的基因。另一方面,在骨鳔下区鱼类(Otocephalan)中,仅从clupeiform和gonorynchiform克隆出基因,没有从otophysans( cypriniform, charaiform, gymnotiform 和siluriform)得到。事实可证clade II基因并没有在斑马鱼(cypriniform)基因组序列中找到,目前只有三种clade I基因(2种ZHE1和1种ZHE2)在这个基因组中,clade II基因不存在。此外,最近我们发现只有clade I基因(ZHE1)表达出的ZHE1酶参与了斑马鱼胚胎的孵化。这些结果表明clade II基因特异地在otophysan家系中消失了。
在纯真骨鱼(Euteleostean)孵化酶的蛋白水平研究中,用青鳉和一种产于淡水的鳉科小鱼得到了两种类型的孵化酶。根据它们如何降解卵膜分别取名HCE和LCE。从其它的纯真骨鱼(Euteleostean)中克隆出HCE和LCE的直系同源基因,在目前的系统进化树中它们分别位于clade I和clade II(图1)。
- 硬骨鱼类孵化酶基因中内含子丢失的进化
如图1所画的系统树,孵化酶基因的外显子-内含子结构显示了进化过程中特征内含子丢失模式。在这个部分将描述(1)骨舌鱼超目和海鲢总目孵化酶基因,(2)鲱下区鱼clade I基因和(3)鲱下区鱼cladeII基因的外显子-内含子结构以及(4)讨论它们的进化。
图1 孵化酶基因的外显子-内含子结构和系统发生树。这最大似然树是用osteoglossiform基因(AwHE)作为外围从硬骨鱼孵化酶基因的成熟酶相应的核苷酸序列构建的。节点的数字代表靴值支持值,值低于50%的舍弃。基因名字的右边显示了外显子-内含子结构。与假定的祖先孵化酶基因对应的内含子数目显示在顶部。框里的数字代表内含子相位,黒框表示保守的内含子,白色表示丢失的内含子,灰色表示插入内含子或者是内含子与祖先基因有不同的内含子相位。
- 骨舌鱼超目(Osteoglossomorpha)和海鲢总目(Elopomorpha)基因
除了少数例外(EHE7和PeHE1),骨舌鱼超目(Osteoglossomorpha)和海鲢总目(Elopomorpha)基因的外显子-内含子结构都是保守的。基因是由8个内含子插入在9个外显子中组成的。外显子1到外显子4中间部分编码前导肽区,余下的外显子4到外显子8编码全部蛋白酶域,外显子9再加上整个3'末端仅编码终止密码子的两个核苷酸(EHE4)或者是蛋白酶域C-末端的4个添加的氨基酸(EHE7)。由于第九个外显子的序列相似性较低,经常很难直接确定它在基因组DNA中的位置。然而,鉴于5'拼接位点的共有序列“GT”的存在我们预测到第8个内含子的存在。这个“GT”在骨舌鱼超目(Osteoglossomorpha)和海鲢总目(Elopomorpha)中找到,除了BtHE基因的外显子8是由编码序列和终止密码子组成。从这些结果中我们得出这些基因中第9个外显子显然存在。这些外显子-内含子结构和四足动物基因是一样,包括内含子相位(内含子位置在密码子间或内部),这表明祖先硬骨鱼孵化酶基因有一个9-外显子-8-内含子结构。
- 鲱形亚部(Clupeocephala)clade I基因
鲱形亚部(Clupeocephala)的复制基因(clade I 和clade II基因)中,clade I基因有着与祖先基因不同的多变的外显子-内含子结构。图1表明骨鳔下区鱼(Otocephalan) clade I基因在进化中相继丢失内含子。在clupeiforms和Gonorynchiforms中,虽然它们的外显子-内含子结构与祖先基因很相似,但通常有一个内含子(祖先基因的第二个内含子)通常会丢失,它们拥有一个8-外显子-7-内含子的结构(除两个例外AcHE2 和MfHE2)。在cypriniforms中,clade I基因是5-外显子-4-内含子结构:这个结构是由于另外3个内含子(第6,7,8内含子)的丢失造成的,在外显子区域没有核苷酸的缺失和插入。Characiphysans (characiforms, gymnotiforms and siluriforms ) clade I基因又多丢失一个内含子(第1个内含子),结果得到一个4-外显子-3-内含子结构。
与骨鳔下区鱼(Otocephalan)基因相反,纯真骨鱼(Euteleostean) clade I基因除了salmoniforms 和esociforms外其它没有内含子,结果导致无内含子的结构。Salmoniforms 和esociforms有两个clade I基因。 这些(MsHCE1, RbHCE1 和PkHCE1)中的每一个都是由1个内含子插在两个外显子中组成的,结果形成了一个2-外显子-1-内含子结构,而其它的(MsHCE2, RbHCE2 和PkHCE2)显示的是内含子缺失的结构。上述基因的内含子插入位点与其它孵化酶基因不一致,这表明在纯真骨鱼(Euteleost)祖先丢失全部内含子后,salmoniforms 和esociforms的共同祖先发生了复制事件,一个内含子新插入到这两种clade I基因中的一种内。
- 鲱形亚部(Clupeocephala)clade II基因
与clade I基因不同,clade II基因的外显子-内含子结构相对稳定。骨鳔下区鱼(Otocephalan) clade II基因由9个外显子和8个内含子组成(和祖先基因相同),凤尾鱼(anchovy)基因(AcHE4和AcHE5)例外,它们的内含子缺失/获得被证实特异地发生在凤尾鱼家系中。大部分纯真骨鱼(Euteleostean)clade II基因的外显子-内含子结构与祖先基因相似,尽管观察到第8个内含子有缺失。然而Salmoniform 和esociform基因与其它基因很不同,显示了内含子缺失的结构。salmoniforms 和esociforms的共同祖先可能也发生内含子丢失的现象。
- 外显子-内含子结构变化的进化途径
孵化酶基因外显子-内含子结构变化的进化途径由用全线粒体基因序列预测的硬骨鱼分子系统发生关系为基础推断出来。骨舌鱼超目(Osteoglossomorpha)和海鲢总目(Elopomorpha)有单一类型的孵化酶基因。基因复制发生在鲱形亚部(Clupeocephala)从祖先中分支出来后,而后鲱形亚部(Clupeocephala)拥有两种基因,clade I和clade II基因。骨鳔总目(otophysan)的祖先丢失了clade II基因。在骨鳔下区鱼(Otocephalan)进化过程中,clade I基因逐步丢失内含子,如骨鳔下区鱼(Otocephalan)低等家系丢失1个内含子,骨鳔总目(otophysan)的祖先祖先再丢失3个内含子,characiphysans祖先又丢失一个额外的内含子。在纯真骨鱼(Euteleost)进化过程中,所有的内含子都从clade I基因中丢失,而在salmoniforms 和esociforms共同祖先中有一个内含子新插入到两种clade I基因的一种中。与clade I基因相反,clade II基因不用经历频繁的结构的变化;然而实验可知在纯真骨鱼(Euteleost)进化过程中有一个内含子(8th内含子)丢失,salmoniforms和esociforms的共同祖先丢失了所有内含子。
图2硬骨鱼(teleostean)孵化酶基因进化途径。鲱形亚部(Clupeocephalan)祖先的孵化酶基因发生复制事件(黑框),鲱形亚部(Clupeocephalan)拥有clade I基因(红线)和clade II基因(蓝线)。骨鳔总目(otophysan)的祖先丢失2型基因。家系中内含子丢失/插入事件由红三角(clade I基因)和蓝三角(clade II基因)表示。外显子-内含子结构在右边用相同颜色表示。硬骨鱼(teleostean)进化分支图是基于整个线粒体基因序列加一些修饰预测出的分子系统发生关系构建的。
内含子为什么会丢失?
为什么在真骨鱼总目(Teleostei)孵化酶基因进化过程中会频繁发生内含子丢失?根据以下信息我们猜测内含子丢失是为适应有效产生孵化酶。推测花费1分钟可转录1-1.5kbp序列,再用3分钟移除前mRNA序列的内含子。根据这些信息,我们目前推测了孵化酶基因具有内含子和内含子缺失的转录时间。根据孵化酶基因外显子区域的平均长度(1kbp)以及内含子的平均大小(约250bp),有8个内含子的基因大约是3kbp而内含子缺失的基因大约是1kbp。因此,含8个内含子的基因需要2-3分钟时间完成转录,另外至少需3分钟剪接内含子。另一方面,转录内含子缺失的基因花费少于1分钟。实际上,缺失内含子的基因能迅速表达是众所周知的。
我们首先对青鳉胚胎孵化酶基因是否比持家基因更有效地表达进行实验。如图3A所示,MHCE基因的表达水平比持家基因β-肌动蛋白和GAPDH高三倍,而MLCE基因的表达水平与持家基因相似。它们的表达水平并没有我们想象的高。我们进一步比较了称为孵化腺细胞(HGC)的细胞内的表达水平,这种细胞可以表达孵化酶基因。HGC分布在青鳉原始孵化胚胎的咽腔内壁或者是遮目鱼、泥鳅、鲶鱼、虹鳟鱼、鳕鱼的表面。孵化酶基因并不像持家基因,它在特定的细胞内表达,表明细胞内孵化酶基因表达水平远高于持家基因。直到立即孵化前,由酶原粒积聚成孵化酶。这些结果表明HGC为合成孵化酶提供大量资源。
接下来我们检测了几种鱼中clade I和clade II基因的表达水平。图3A表明青鳉胚胎中MHCE基因(clade I)的表达比MLCE基因(clade II)高6倍。此外,Northern分析7种鱼,显示clade I基因表达水平比clade II基因表达水平更高的趋势。这种有差别的表达反映了降解卵膜所需孵化酶的相对量。在青鳉孵化时,MHCE和MLCE一同降解卵膜:MHCE利用蛋白水解作用使卵膜膨胀,而MLCE把膨胀的卵膜完全降解。体外实验显示需要大量的MHCE来使卵膜膨胀,而仅需一小部分的MLCE足够去降解卵膜。在遮目鱼中也发现了这种关系。这些结果表明clade I基因需表达大量的蛋白质。一个基因少量的内含子对它的高表达有利,那么clade I基因在进化过程中可能丢失它们的内含子以致在HGC中有高表达。
图3孵化酶基因的表达水平和孵化腺细胞的分布。(A)用Northern杂交比较了青鳉胚胎孵化酶基因(MHCE和MLCE)和持家基因(β-肌动蛋白和GAPDH)的相对表达水平。mRNA的相对表达水平用光密度法测定,并设定β-肌动蛋白的相对强度为1。(B)用Northern杂交分析孵化酶基因的表达。基因名称在顶部一行显示,clade I基因用下划线标注。三角形标注了28S和18S rRNA的位置。(C)青鳉胚胎较低的下颚部分用甲苯胺染成蓝色。HGC(箭头)处有许多酶原颗粒。PC,咽腔。比例尺,10微米。(D-H)用全胚胎原位杂交定位遮目鱼(D),泥鳅(E),鲶鱼(F),虹鳟鱼(G)和鳕鱼(H)胚胎早期孵化中的HGC的分布。D和H是背部相,F和G是腹部相,都是头部区域,E是侧面相。比例尺,200微米。
内含子是怎么丢失的呢?
目前针对内含子丢失的机制有两种主要的模型:
- 在基因组水平上删除;
- 成熟mRNA或部分剪接的前mRNA反转录为cDNA和一个基因在基因组水平上的复制之间发生了同源重组。
第一种模型下的删除并不会经常导致一个内含子区域的精确去除。实验中的孵化酶基因,在其成熟的酶编码区域内缺失的插入位点上没有发现额外的核苷酸插入或删除。也许用牵涉到同源重组的第二种模型更好解释如此精确的内含子删除现象。然而,这种内含子删除的进化形成一定会在种系的基因表达上受限。孵化酶基因仅在胚胎发育时期表达,而且从不在生殖细胞中表达。
很难解释发生在孵化酶基因的6个内含子丢失事件仅仅是同源重组的结果,因为很难想象孵化酶基因的异常表达会如此频繁地发生在微生殖细胞内。有一些其它的内含子丢失的例子可说明这不是通过逆转录酶调节的(i.e 基因的内含子缺失表达在非生殖腺,体细胞,发生在无核酸删除或插入处)。一个关于内含子准确移除的“未知的机制”肯定存在。虽然在特殊环境下硬骨鱼类孵化酶基因内含子丢失的进化可能是一个稀有的情况,但未来对这个现象的研究应该会显示和提高对内含子丢失新机制的理解。
结论
硬骨鱼祖先孵化酶基因被认为是一种单型基因。在鲱形亚部(Clupeocephalan)从祖先中分支出来后,孵化酶基因发生了复制。所以,鲱形亚部(Clupeocephalan)拥有两种孵化酶基因,clade I和clade II基因。与clade II基因(0-1内含子缺失,一种特殊的显示为8内含子缺失)相反,clade I基因(1-8内含子缺失)频繁丢失它们的内含子。当比较表达水平时,内含子丢失的基因比内含子保守的基因有更高地表达,暗示内含子丢失的进化可能与其表达水平有关系。
方法
- 鱼
胚胎和成鱼样品从以下组织中获得:渔业研究机构宫站,资源增值国家中心的日本牙鲆稚鱼;中国科学院的细胞和有机体生物研究所的遮目鱼;北海道大学水产科学研究生院的泥鳅;千叶县渔业研究中心淡水站的鲶鱼;水产养殖国家研究所的三文鱼;东京鳟鱼孵化场的虹鳟鱼;富三县水产研究所渔业资源组的鳕鱼;东京大学气象与海洋研究所的各种鳗鱼;从商人那里买来的龙鱼和其它的鱼。
- 孵化酶cDNA的克隆以及它们的基因组序列
先前报道的硬骨鱼孵化酶基因是多拷贝基因。为了克隆所有种类的孵化酶基因,我们从克隆基因保守的区域设计了四套PCR引物。用这些引物通过RT-PCR和RACE PCR从6种孵化前胚胎的RNA中分离到孵化酶cDNA全长序列。在基因组基因分离后,我们通过对比cDNA序列检测了基因组DNA的外显子-内含子界限。
有些情况下我们不能获得胚胎,就通过PCR直接从成鱼的基因组DNA克隆出孵化酶基因。在密切相关种相似的基础上我们证实了克隆基因外显子-内含子的界限。从基因组DNA直接克隆的方法如下。五种引物,四种正向引物(F1到4)和一种反向引物(R1),是从孵化酶cDNA保守序列中设计出来的。从这些片段中我们又构建了正向和反向的基因特定引物(GSPs)。接下来,分别用正向GSP和R2引物(从克隆的cDNA 3'末端保守区设计出)或者是用反向GSP和F5引物(从克隆的cDNA 5'末端保守区设计出)来延伸3'和5'部分。F1-5和R1-2引物的序列展示在下面,它们的位置显示在附加文件2。
F1: 5′-RVMVRMTGYYTiTGGARSAARDVYBC-3′
F2: 5′-ARACMTGCATTCGYTTYRTBYCHHG-3′
F3: 5′-YRYYCAGCAYGAGMYBMDYCAYGCiCTSGG-3′
F4: 5′-HTTCYAiCAYGARCAHDYHAGRAGCGAYCG-3′
F5: 5′-TBCWRVYBCTGBTVBTBRGMHTYTCiYWRGC-3′
R1: 5′-TTCCATARTGCATSABVGARSHRTAGTCRTA-3′
R2: 5′-RCAKYYRTABAKHiKVTTGATYCYSARRATRTC-3′
像前面所述,大部分的孵化酶基因被预测为多拷贝基因,用短的基因区域形成串。因此,用GSP扩增孵化酶基因间的短基因区域。在某些情况下,基因的5'或3'区域通过ACP-PCR方法来延伸。通过结合上面的PCR方法,可克隆出包括5'-上游和3'-下游区域的基因全长。克隆出的序列包括孵化酶基因和与它们平行进化的同源基因。像之前报道的,孵化酶基因在孵化前胚胎中特异表达,而它们的平行进化同源基因则主要在成体内部器官表达。我们通过系统发生分析和全胚胎原位杂交区分孵化酶基因与它们的平行进化同源基因。克隆出的孵化酶基因的名称列在附加文件1中。
- 系统进化分析
成熟酶对应的核苷酸序列的密码子定位是用Clustal X 程序和密码子2.0程序实现的。数据被划分为第一、二、三密码子位点。GTR+I+Γ被选为最佳拟合模型。用RAxML 7.2.6 实现最大似然分析。我们重建了进化树,同时以1000次重复进行靴值分析获得最佳拓扑值。
我们使用Notung 2.6的程序匹配孵化酶基因树和硬骨鱼类进化树。Notung可标注基因的复制和丢失事件,在物种进化树分支上用简约法(parsimony method)重定位祖先的进化地位。使用全线粒体DNA序列预测其分子系统进化树,从而获得种族进化树的拓扑结构。
- 全胚胎原位杂交
全胚胎原位杂交根据前面所描述的方法进行。DIG标记的RNA探针是从遮目鱼、泥鳅、鲶鱼、鳕鱼和虹鳟鱼的孵化酶基因中合成的,在孵化前胚胎中杂交。
- Northern印迹分析
为了比较青鳉孵化酶基因(MHCE 和 MLCE)和持家基因(β-肌动蛋白和GAPDH)的表达水平,从胚胎中提取出总RNA。4微克的RNA在1%的甲醛琼脂糖凝胶上电泳,然后转移到尼龙膜上。孵化酶基因和持家基因的cDNA用于合成DIG标记的PCR探针。每个探针的大小调整到816个碱基,标记效率用斑点印迹法核对。杂交则用前面所述的流程进行。用ImageQuant软件分析影像从而对基因表达水平进行半定量评估。