花发育是被子植物生命周期中一个重要的综合发育过程,涉及无限生长向有限生长及不同发育方式的转换,包括开花诱导、信号传递、属性决定、器官发生,既受环境因子(如光周期、温度等)的诱导,又受到自身内部因素的调节,经过一系列信号转导过程,启动成花决定过程中的控制基因。在复杂的基因互作网络调控下,营养茎端分生组织(vegetative meristem,VM)转变为花序分生组织(inflorescence meristem,IM),然后在IM 的侧翼形成花分生组织(floral meristem,FM),分化出花器官。
截至目前,从拟南芥(Arabidopsis thaliana )中共有180多个参与调控开花的基因被鉴定出,并确定其中存在有6条调控开花的信号途径:即光周期途径(photoperiod pathway)、春化途径(vernalization pathway)、自主途径(autonomous pathway)、赤霉素途径(gibberellin pathway)、温敏途径(thermosensory pathway)和年龄途径(aging pathway)。表观遗传是开花信号通路中的重要机制,对开花及花器官发育产生关键调控作用。miRNAs 的表观遗传调控机制是植物分子发育生物研究的重要领域,例如miR172、miR156、miR159 参与了开花诱导的信号转导途径,共同开启花的发育过程。
本文综述了被子植物花器官发育的格式形成与分子调控机制。
1 花器官发育的ABCDE模型
通过对拟南芥和金鱼草突变体研究而提出的多种发育模型, 成功地解释了被子植物花器官突变现象。其中, 最著名的是由Bowman等及Coen和Meyerowitz提出的“ABC模型”。该模型指出, 花器官的形成和发育由A、B和C三类功能基因决定; A类基因的表达决定了第一轮萼片的形成, 包括APETALA1 (AP1)和APETALA2 (AP2)基因等; B类[APETALA3 (AP3)和PISTILLATA (PI)基因]和A类基因的组合表达决定了第二轮花瓣的发育; C类[AGAMOUS (AG)基因]和B类基因的组合表达决定了第三轮雄蕊的形成; C类基因的表达决定了第四轮雌蕊的发育。同时, A类和C类基因在功能上彼此抑制, 较好地解释了花器官的同源异型转变现象。
矮牵牛(Petunia hybrida ) D类基因FLORAL BINDING PROTEIN 7 (FBP7)和FBP11决定了胚珠的形成和发育。拟南芥D类SEEDSTICK (STK)、SHATTERPROOF1(SHP1)和SHP2三基因突变体的胚珠变成了心皮结构和叶结构。这些研究将花发育“ABC模型”拓展为“ABCD模型”。随后, 研究发现SEPALLATA (SEP)基因能与其他类型的花器官特征决定基因发生结合, 维持四轮花器官的正常发育, 定义为“E类基因”。因此, 花发育模型进一步扩展为“ABCDE”模型(图2): A类+E类基因组合调控第一轮萼片的形成和发育, A类+B类+E类基因组合决定第二轮花瓣的形成和发育; B类+C类+E类基因组合调控第三轮雄蕊的形成和发育; C类+E类基因组合决定第四轮雌蕊的形成和发育; C类+D类+E类基因组合调控胚珠的形成和发育。
2 花器官发育的四聚体模型
金鱼草GLOBOSA (GLO)、DEFICIENS (DEF)和SQUAMOSA (SQUA)蛋白形成多聚体复合物的酵母三杂交和电泳迁移率实验表明: 多聚体复合物比二聚体具有更强的结合DNA能力。随着这些同源异型蛋白相互作用研究的积累, Theissen和Saedler提出了一个更全面的花发育四聚体模型(图2): 花同源异型蛋白通过形成四聚体复合物调控花器官的形成。该模型成功地揭示了模式植物花器官的各种突变类型,很快得到了广泛认同。
在拟南芥花器官的形成过程中, 蛋白四聚体AP3-PI/SEP-SEP和AP3-PI/AG-SEP分别调控花瓣和雄蕊的形成。随后, 拟南芥SEP基因丢失部分功能后的表型与STK、SHP1和SHP2基因三突变体的表型相同; 并且酵母三杂交显示D类蛋白能与SEP3蛋白形成多聚体复合物。因此, 花发育四聚体模型包含了D类和E类蛋白相互作用, 调控胚珠的形成和发育(图2)。同时, 不同开花植物菊花、西红柿和水稻等的蛋白互作实验显示, 花的同源异型蛋白均能形成多聚体。植物体外和体内的多种实验手段均表明花发育四聚体模型在花器官发育过程中扮演重要角色。
3 核小体拟态模型
Theißen等(2016)根据花同源蛋白四聚体复合物(FQC,Floral quartet-like complex)与核小体具有高度相似性, 进一步提出了核小体拟态模型。在该模型中, 花发育四聚体复合物代表类核小体性能且序列特异的转录因子, 并在包含CArG元件的启动子上通过允许或抑制染色质修饰, 进而替代不活跃染色质靠近转录起始位点的核小体, 最终导致染色质处于一种平衡状态。核小体拟态模型为花同源四聚体复合物的功能预测提供了线索。核小体是由组蛋白构成的八聚物,是静态系统, 但是染色质会发生频繁重组。靠近转录起始位置的核小体是不稳定的,特别是基因5′端的动态核小体可能增加转录起始位点的可接触性。花同源蛋白四聚体能招募组蛋白修饰因子, 并可替代转录因子起始位点上游的标准核小体。
在拟南芥花发育过程中, AP1和SEP3蛋白会较早的结合, 随后改变染色质可接触性。研究表明SEP3蛋白扮演着先锋转录因子的角色, 通过修饰染色质的可接触性, 促使其侵入难接触的核小体关联DNA位点, 进而创造一个开放的染色质环境, 并允许非先锋转录因子结合到可接触位点。当转录因子与DNA结合时, 能有效驱除核小体, 空出结合位点, 且结合位点的距离非常接近CArG-box序列距离。虽然核小体拟态模型很好地解释了花同源蛋白四聚体复合物调控目标靶基因的分子机理, 但有待于进一步的验证。
4 调控花器官发育的MIKC型MADS-box转录因子结构和基因重复
目前, ABCDE类基因, 除了AP2基因外, 均属于MADS-box基因家族成员中的MIKC型MADS-box基因。MIKC型MADS-box基因编码的蛋白从N端到C端依次包含1个MADS(M)结构域、1个介于中间的I结构域、1个角质蛋白同源的K结构域和1个C末端结构域(图4)。其中, M结构域是一个由约60个氨基酸组成的高度保守的DNA结合域, 对MADS转录因子的核酸定位和二聚化均具有重要作用。I结构域由约35个氨基酸组成,其保守性相对较弱, 对结合DNA二聚体的形成具有选择性。K结构域由约65~70个氨基酸组成,包含疏水性和带电残基, 具有保守性, 形成两性分子的螺旋线, 涉及蛋白二聚体和多聚体复合物的形成。C结构域由约30个氨基酸组成,保守性最差, 其氨基酸序列十分多变, 涉及转录激活和多聚体复合物的形成。MADS蛋白通过二聚体结合DNA序列的CArG元件; 根据花发育的四聚体模型, 2个蛋白二聚体各自识别不同的CArG元件, 在DNA形成环状后, 这2个二聚体相互靠近, 形成蛋白四聚体, 进而调控花器官的形成和发育。
MIKC型MADS-box基因通过复制产生了SQUA (A类)、DEF/GLO (B类)、AG (C类和D类)、AGL2 (E类)四个亚家族。SQUA亚家族是一类决定花序/花分生组织和花被特征的基因, 在核心真双子叶植物起源之前, 发生2次基因重复产生euAP1、euFUL和AGL79 三个进化系。DEF/GLO亚家族产生于被子植物共同祖先的2次基因复制, 第一次基因复制发生在被子植物起源之前, 产生paleoAP3和PI进化分支; paleoAP3基因又经过第二次基因复制, 分化出TM6和euAP3两类旁系同源的进化分支。AG亚家族基因随着被子植物的演化也发生了2次主要基因重复, 第一次发生在被子植物起源之前, 通过基因重复形成了调控心皮与雄蕊发育的C类进化系和调控胚珠发育的D类进化系; C类进化系在核心真双子叶植物起源之前又发生了1次基因重复, 形成euAG和PLENA (PLE)两个进化系。AGL2亚家族基因主要参与调控花器官和花分生组织的形态分化, 通过基因重复产生了AGL2、AGL3、AGL4和 AGL9四个进化系。
5 被子植物花器官形态多样性的分子机制
一些大的被子植物类群花器官形态多样化与MIKC型MADS-box基因重复密切相关。核心真双子叶植物起源之后, 花被有明显的花瓣和萼片区分以及花器官的排列方式等特征的进化均与A类和E类基因重复相关。单子叶植物水稻(Oryza sativa )的内外稃和浆片形成与其A类基因的进化相关。被子植物花被形态多样化与B类基因重复导致的功能分化密切相关。在被子植物的基部类群和基部真双子叶植物中, B类基因往往通过一些小尺度的基因重复, 调控花瓣的形态分化。在基部真双子叶植物三叶木通(Akebia trifoliata )中, AP3同源基因通过2次小尺度的基因重复产生了3个paleoAP3型基因AktAP3_1、AktAP3_2和AktAP3_3,其中AktAP3_3 基因主要参与调控花被花瓣化。文心兰属(Oncidium )植物通过基因重复产生3个paleoAP3型基因OMADS3、OMADS5和OMADS9, 其中OMADS3在四轮花器官中均有表达,OMADS5基因主要在萼片和花瓣中表达, 而OMADS9基因主要在花瓣和唇瓣中表达; 这些转录因子可能通过PI型OMADS8形成不同的异源二聚体, 进而导致萼片、花瓣、唇瓣的形态差异。菊类植物的花瓣和雄蕊形态多样化与PI旁系同源基因的表达模式密切相关。矮牵牛的2个B类旁系同源基因(FBP1和PMADS2)在调控花瓣和雄蕊发育上是冗余的, 但是FBP1基因对于雄蕊花丝和花瓣管的融合又是必需的。耧斗菜(Aquilegia vulgaris )的退化雄蕊形成需要B类基因的参与。在单子叶植物中, 水稻和玉米(Zea mays )的PI旁系同源基因由于基因重复产生了表达模式的分歧。
MIKC型基因表达区域或模式的改变, 会引起花器官的变化。B类或C类基因表达模式的改变会引起生殖器官缺失, 形成单性花。鸭跖草科(Commelinaceae )等单子叶植物的最外轮花器官中AP3同源基因转录活性丧失或表达量很低时, 花被表现出明显的萼片和花瓣之分。楸树(Catalpa bungei ) CabuPI基因在重瓣花形成和发育的关键时期, 其表达量明显上调。唐松草叶银莲花(Thalictrum thalictroides ) ThtAG1基因的选择性拼接导致其蛋白K区丢失, 形成重瓣花。樱花(Prunus lannesiana ) PrseAG基因的外显子跳跃导致Presag-1蛋白C末端的AG基序I和II丢失, 引起雄蕊转变成花瓣, 雌蕊转变成叶状器官。在基部被子植物星花木兰(Magnolia stellate )中, MastAG基因发生选择性拼接, 形成I区和K区缺失的mastag_2蛋白和K区和C区缺失的mastag_3蛋白, 导致星花木兰的花瓣数目增加。
6 miRNAs参与被子植物花器官发育的调控
植物miRNA通过与靶基因互补位点结合, 抑制或降解靶基因mRNA的翻译; 其中, miRNA159、miRNA160、miRNA167、miRNA169、miRNA172和miRNA319等在参与调控植物花器官发育方面发挥着关键作用。拟南芥miRNA159在赤霉素途径中起着重要作用,通过降解其靶基因GAMYB, 进而抑制LEAFY基因转录和花药发育; 进一步研究发现, miRNA159作为调控开关, 在营养器官抑制其靶基因MYB33和MYB65的表达, 并将MYB33和MYB65基因限制在花药中表达。水稻miRNA159通过降解其靶基因OsGAMYB, 导致花药和花粉败育。在拟南芥中,miRNA160的3′调控区插入1个Ds转座子形成的突变体, 表现出花型不规则和花粉育性降低。拟南芥miRNA167通过降解靶基因ARF6和 ARF8的转录, 导致胚珠珠被生长停止、花药异常和花粉败育。矮牵牛BLIND (BL)基因和金鱼草FISTULATA (FIS)基因编码的miRNA169,通过降解靶基因NF-YA后, 进而抑制C类基因在外两轮花器官中的活性。在开花早期, miRNA172通过降解拟南芥内两轮花器官中AP2 mRNA, 进而调控拟南芥开花时间,此外miRNA172 是一个应答环境温度的miRNA。miRNA172 自身也受到miRNA156 的调控,miRNA156主要调控植物幼年期的生长。miRNA319通过调控TCP转录因子, 进而调控花瓣和雄蕊的发育; 同时miRNA319突变体拟南芥花瓣变得窄小, 雄蕊的花药出现缺陷。
7 花发育的转录组学研究
随着基因组测序技术的不断发展, 全基因组范围的基因表达检测水平日益提高, 极大地推动了多年生木本植物花发育分子机理的研究。大量的被子植物花发育转录组分析表明, 不同发育阶段间差异表达基因的鉴定及其表达模式的确定为综合理解复杂的分子调控网络途径提供了基础。荔枝(Litchi chinensis )花器官发育的转录组分析表明, MADS-box和激素合成相关基因在花发育过程起重要作用。Liu等通过茶树(Camellia sinensis )花发育的转录组研究, 发现花器官发育过程中WRKY、ERF、bHLH、MYB和MADS-box等转录因子基因家族显著上调(Liu等,2017)。杜鹃红山茶(Camellia azalea )花发育的转录组分析揭示了花器官发育过程中MADS-box基因家族中的SVP和AGL24-like基因显示出特异的表达模式。番荔枝(Annona squamosa )花发育的转录组研究表明, 一些关键基因FT、SOC1、CO和MADS-box等在花器官发育中扮演着重要角色。毛竹(Phyllostachys edulis )花形成和发育的转录组分析表明, MADS-box基因的表达显著上调。
8 展望
被子植物花器官发育模型多样性的研究主要源于三个不同目的: 一是更好地理解多变的花器官突变现象; 二是揭示被子植物花器官发育过程的共同特点; 三是目前的模型均无法概括所有被子植物花器官发育过程。随着大量花发育过程相关基因调控研究的积累, 花发育模型也在不断补充和发展。基于这些花同源异型突变体研究提出的多种发育模型, 成功解释了植物花突变现象。但是, 花器官发育的四聚体复合物激活或抑制特异目标基因的机制有待于进一步的揭示和验证。
MIKC型MADS-box基因重复导致不同进化系中基因的C区产生新的基序, 产生功能分化的新基因; 新基因通过改变与其他基因的结合能力, 形成不同类型蛋白四聚体或新的表达区域, 参与花器官形态分化。因此, 被子植物一些大类群的形态创新时间与MADS基因发生基因重复时间高度一致。但是, MIKC型蛋白作为转录因子, 其调控的特异靶基因依然难以确定。主要体现在两方面: 一是拟南芥基因组上存在大量与CArG-box序列相似的DNA序列元件, 几乎每一个基因都拥有一个结合MIKC型转录因子的位点, 导致难以判断MIKC型蛋白对应的特异目标基因的CArG-box基序; 二是拟南芥基因组上至少有45种不同MIKC型蛋白存在高度保守的DNA结合M结构域, 并且很多蛋白的DNA特异结合域非常相似。但是, 不同花同源异型蛋白的特异靶基因序列差异很大, 导致不同花同源异型基因的突变表型明显不同; 靶基因的CArG-box序列、结构特性和转录辅助因子在花同源蛋白四聚体复合物的靶基因识别过程中均扮演重要角色。
miRNA通过调控其靶基因, 进而对被子植物花器官的发育产生影响。这些miRNAs在调控花器官发育的同时, 也会影响到其他器官形成和发育。例如, 拟南芥miRNA159除通过其靶基因调控花药发育外, 还参与糊粉层的发育和细胞程序化死亡, 并对种子萌发产生影响。在拟南芥中,miRNA160还参与调控叶形对称、花序形成、茎和根的生长等发育进程。目前, 调控花器官发育的miRNA研究主要集中在拟南芥、水稻、金鱼草和矮牵牛等模式植物, 未来应拓宽到其他被子植物花器官发育研究领域。
模式植物花器官发育基因的功能解析, 揭示了被子植物花器官发育的机理, 但是多年生被子植物花发育的研究依然缺乏。利用同源基因克隆和表达分析的研究手段均参考了模式植物的研究成果, 因而限制了多年生植物特异基因的挖掘。高通量转录组测序极大地推动了多年生被子植物花器官的关键基因挖掘和分子调控网络研究, 提高了人们对多年生被子植物花器官发育的整体理解。因此, 随着生物技术和生物信息分析的不断发展, 被子植物花器官发育的分子调控研究将会有更大的突破, 并可为遗传改良和基因工程提供重要的理论基础。
参考文献
Bhatla, S. C. Plant Physiology, Development and Metabolism, Ch. 25, 813–817(Springer Singapore, 2018).
Theißen G, Melzer R, Rümpler F (2016). MADS-domain transcription factors and the floral quartet model of flower development: linking plant development and evolution. Development, 143(18): 3259–3271
Theissen G, Saedler H (2001). Plant biology. Floral quartets. Nature, 409(6819): 469–471
Liu F, Wang Y, Ding Z, et al (2017).Transcriptomic analysis of flower development in tea (Camellia sinensis (L.)). Gene, 631: 39–51
李巍,徐启江.被子植物开花时间和花器官发育的表观遗传调控研究进展.园艺学报,2014,41(06):1245-1256.
景丹龙,郭启高,陈薇薇,夏燕,吴頔,党江波,何桥,梁国鲁.被子植物花器官发育的模型演变和分子调控.植物生理学报, 2018, 54(03): 355-362.
蔡秀清,刘近平.植物发育生物学导论.第9章 花的发育, 139-146 (中国林业出版社, 2015).