Title:The diverse roles of DNA methylation in mammalian development and disease 链接:sci-hub
P0: Introduction
P1: Cellular functions of DNA methylation
胞嘧啶甲基化在哺乳动物基因组中是普遍存在的,但可能在不同的基因组区域执行不同的功能。此外,即使DNA甲基化与转录沉默相关,其内在机制在基因启动子、基因体或重复序列上也不一定相同。在本节中,我们将讨论DNA甲基化的基因组效应和功能机制的最新证据。
----p1-1 The writers and erasers of methylation
1)DNA甲基化有三个阶段:建立(从头DNA甲基化)、维持和去甲基化。
2)在哺乳动物中,有两种主要的DNA重新甲基化酶DNMT3A和DNMT3B
3)DNA甲基化通常不存在于活跃转录基因的富CpG启动子中。通常富集于三甲基化组蛋白H3Lys4 (H3K4me3)。(图1a)
4)这强烈表明转录和基因体DNA甲基化之间存在机制联系(图1b)。
5)然而从头DNA甲基化可以发生在任何序列环境中,只有对称的CpG甲基化在DNA复制中保持。
----p1-2 DNA methylation represses transcription
1)DNA甲基化在转录中的抑制作用长期以来被认为与DNA甲基化和基因沉默有关,基因沉默随着启动子处CpG二核苷酸密度的增加而增加。然而,这如何导致转录抑制仍然没有完全解决,因为甲基标记本身似乎并不意味着沉默。
2)接近染色质的区域通常是低甲基化或未甲基化的,这表明转录因子的结合和DNA甲基化是相互排斥的。某些转录因子对CpG甲基化敏感:最近对542个人类转录因子的调查发现,与未甲基化相比,有117个(22%)的转录因子甲基化后与基序的结合减少。通过阻止这些转录因子的结合,DNA甲基化可以因此阻碍包含序列识别基序的CGI启动子的转录激活。
3)DNA甲基化也可以通过DNMT蛋白招募染色质重构因子和修饰因子来促进异染色质的形成。
4)哺乳动物有五种MBD蛋白:MBD1-MBD4和甲基-cpg结合蛋白2 (MeCP2)。四种MBD蛋白表现出CpG结合增加和CpG甲基化增加之间的线性关系,但MBD3不偏爱甲基化胞嘧啶。所有的MBDs与核小体重构和组蛋白去乙酰化酶复合物相互作用,导致基因沉默。
----p1-3 CpG-island promoters
1)哺乳动物的基因组通常CpG较少,CpG岛(CGIs)是相对较小的基因组区域,平均约为1kb。超过三分之二的哺乳动物启动子是CGI,几乎所有的管家基因都有CGI启动子,一些发育调节的基因也有。
2)cgi很少被甲基化;它们在分裂的雄性生殖细胞中尤其未被甲基化,这解释了为什么它们在进化过程中不受脱氨作用的CpG侵蚀,以及它们显著高的CpG含量。
3)存在三大类基因:其中在体细胞组织中稳定的、终身DNA甲基化沉默(0不活跃X染色体上的基因、印记基因)和种系特异性基因。在这里,我们讨论DNA甲基化可以针对这些特定类别的CGI启动子。
--------p1-3-1 X-chromosome inactivation(XCI)
每个细胞的X染色体被非编码RNA(XIST)的顺式活性随机沉默。在XCI的这一过程中,X-连锁cgi的DNA甲基化出现的时间相对较晚,并在基因已经沉默后起到最后锁定的作用。
--------p1-3-2 Genomic imprinting
在基因组印迹中,DNA甲基化在两个亲本种系中存在差异;这些表观遗传印迹模式能够抵御在早期胚胎发生期间发生的DNA甲基化的基因组重编程。在小鼠和人类中,大约20个被称为“印迹控制区”(ICRs)的基因组区域能够经受这种重编程,并迫使邻近基因的单等位基因表达95 - 101。大多数的icr在卵母细胞中被甲基化,这些都与极度富含CpG的CGIs101相一致,而三个父系icr定位于CpG差的基因间序列。在卵母细胞生长过程中,DNMT3A在DNMT3L的辅助下甲基化了卵母细胞表达的基因体,包括其转录依赖的基因内cgi,而其余的基因组仍为低甲基化35,102 - 106(图2b)。哺乳动物卵母细胞的转录通常来自典型CGI启动子(受精后使用)上游的替代启动子,并且经常与逆转录转座子的序列相一致106 - 109。母系(以及父系)icr与配子中其他被甲基化的序列的区别在于它们在特定遗传基序(TGCCGC)中的富集,当甲基化时,会被Krüppel- associated box (KRAB)所识别锌指蛋白57 (ZFP57) 110-112(图2b)。ZFP57招募KRAB相关蛋白1 (KAP1;也被称为TIF1β)和其他沉默因子,包括dnmts111,1131,114。ZFP57-KAP1在卵母细胞中的选择性DNA结合允许ICRs在受精后胚胎中保持等位基因特异性的甲基化,这经历了全面的DNA甲基化消除和重建。值得注意的是,Zfp57的突变在小鼠中并不是完全渗透的:最近的一项研究表明,一个类似的蛋白质,ZFP445,在几乎所有的icr中与Zfp57合作,维持小鼠的甲基化印迹,并且可能比Zfp57在人类中的作用更重要115。总之,母体印迹cgi进行DNA甲基化的能力依赖于卵母细胞不寻常的转录景观和特定的遗传序列的结合
--------p1-3-3 Germline- specific genes
胚系特异性基因的CGI启动子被DNMT3B介导的DNA甲基化沉默,在胚胎植入期间体细胞分化开始27,116。种系基因对DNA甲基化缺失非常敏感,并在Dnmt三敲除小鼠ESCs117、dnmt1缺失的人类成纤维细胞118、Dnmt3B突变的小鼠胚胎27,119和与Dnmt3B突变相关的人类疾病中被抑制120。是什么让只占CGI总数5%的种系基因的CGI启动子依赖于DNA甲基化,而大多数常染色体富含CpG的启动子仍未甲基化?其中的关键可能是非典型的Polycomb抑制复合物1 (PRC1),即已知的PRC1.6,它是小鼠escs121122中种系基因抑制的调节因子。该复合物包含DNA结合蛋白123,提供序列特异性靶向,如MAX121,124, MGA121,122和E2F6(参考文献125)。此外,PRC1.6与L3MBTL2 (reFs126,127)相关,L3MBTL2与H3K9甲基转移酶G9A(也称为EHMT2)126相互作用。小鼠G9a突变的胚胎不能获得大量种系特异性基因的特异性DNA甲基化119(图2c)。PRC1.6在抑制种系特异性基因方面的许多作用尚不清楚,例如DNMT3B是如何靶向种系基因的cgi,而DNMT3A却不是。然而,与大多数CGI启动子在植入时抵抗DNA重新甲基化相反,种系CGI已经进化出特定序列的方法来招募DNA甲基化机制,以确保终身的体细胞沉默。
----p1-4 Harnessing the repetitive genome
对转座因子的基因组防御被认为是DNA甲基化进化的主要驱动因素。事实上,哺乳动物基因组中DNA甲基化的主要目标不是基因,而是转座子,特别是逆转录转座子。在小鼠和人类基因组中有数百万个逆转录转座子的拷贝,它们大约占据了基因组空间的一半130。最活跃的逆转录转座子的表达是由富含CpG的启动子控制的,而DNA甲基化对它们的表达至关重要转录沉默。这在小鼠Dnmt1敲除胚胎中得到了例证,其中脑内A粒子(IAP)逆转录转座子(构成了一类进化上仍能在啮齿动物基因组中积极调动的年轻逆转录转座子)被大量解除抑制131(图3a)。两个独立的小鼠遗传筛选最近发现了DNMT3C,这是一个先前未知的denovo DNMT,在控制逆转录转座子129,132中具有特定的作用(表1)。DNMT3C最初被注释为假基因,起源于muro总科谱系中Dnmt3B基因的串联重复鼠科啮齿动物的超科,包括小鼠和大鼠在进化过程中,DNMT3C失去了PWWP结构域,但保持了其ADD和从头甲基化活性。DNMT3A和DNMT3B在两性的不同发育环境中广泛表达,而DNMT3C的表达仅限于男性胎儿生殖细胞。尽管纯合子Dnmt3C-突变小鼠是可以存活的,但雄性的睾丸较小且不能生育(图3a)。全基因组甲基化分析显示,DNMT3C选择性地甲基化并抑制了进化年轻转座因子的启动子,这只占小鼠基因组的1% 129。Dnmt3C突变体的分子表型与种系甲基化辅助因子DNMT3L35突变体和piwi相互作用RNA通路突变体的分子表型相同;匹威- rna相互作用基因组缺乏DNMT3C基因。也许人类PWWP- less DNMT3B亚型与啮齿动物DNMT3C具有相似的功能;另外,小rna导向的DNA甲基化可能在人类中并不以同样的方式存在,相反,我们进化出了一种不同的机制来控制转座因子。除了抑制转座因子的短期效应,DNA甲基化也通过诱变脱氨促进其不可逆的基因失活。最后,DNA甲基化可能通过限制具有高度序列相似性的转座子的非等位拷贝之间的重组来支持基因组的稳定性。在各种人类癌症中,染色体重排水平升高和全基因组DNA低甲基化(主要涉及转座因子)之间的正相关支持了这种可能性140。此外,在减数分裂期间,DNA甲基化可能限制转座因子参与同源依赖的搜索和重组141。需要指出的是,DNA甲基化不仅可以通过靶向分散的转座子重复,还可以通过靶向端粒、着丝粒和着丝粒间的串联卫星重复来发挥基因组稳定性保护功能(见别处综述142)。与体内情况形成鲜明对比的是,除IAPs外,转座因子在构成性DNA甲基化缺陷的小鼠ESC模型中没有重新激活,它们的上调仅在Dnmt1敲除或Dnmt三敲除细胞中温和。然而,通过有条件地触发DNA甲基化的消融,最近的独立研究表明,包括IAPs在内的几类转座因子确实在DNA甲基化停止后被重新激活145 - 147。在这一初始反应之后,组蛋白甲基化恢复了低甲基化基因组的长期转录沉默。根据转座因子的种类,沉默涉及H3K9me3、H3K27me3或两者的结合(图3c)。矛盾的是,当Dnmt1的DNA靶向辅助因子UHRF1被移除时,Dnmt1有条件删除后的IAP重新激活的初始爆发并没有被观察到(参考146)。这种差异的基础已经从遗传学上剖析过:在Dnmt1突变体中,抑制复制后DNA甲基化的维持最初会产生过量的半甲基化DNA,短暂地延长UHRF1在DNA上的驻留时间,从而抑制组蛋白甲基转移酶(组蛋白赖氨酸N-甲基转移酶SETDB1)的募集。H3K9三甲基化和IAPs沉默的催化作用(图3d)。经过较长时间的培养和半甲基化DNA的逐渐稀释,基于uhrf1的组蛋白甲基化抑制被缓解,setdb1介导的沉默被激活。有趣的是,半甲基化DNA的积累在体内特定的发育环境中自然发生146。这是否导致IAP重新激活取决于UHRF1的核可用性,例如在小鼠胎盘中。这种情况不会发生在早期胚胎或迁移的原始生殖细胞(PGCs)中,在这些细胞中,UHRF1隔离在细胞质中,不能通过H3K9甲基化来抵消setdb1介导的抑制146
----p1-5 The puzzling case of gene bodies
基因体中DNA甲基化的富集提出了一个悖论:一方面,基因体甲基化在真核生物中高度保守,比转座因子保守的多,这表明它具有重要的功能1,2。另一方面,DNA甲基化具有诱变作用,那么为什么它在编码序列中如此突出呢?重要的是,基因体DNA甲基化与转录正相关29,148,149,因此,其作用与基因沉默无关。对于基因体中DNA甲基化的功能,人们提出了两种假说:一是它有助于转录延伸和/或共转录剪接,二是它抑制基因内隐启动子。相对于内含子(29,150),DNA甲基化在外显子上富集,并可能影响Pol II的加工能力,并通过此影响剪接。核小体在外显子上也富集,而从头DNA甲基转移酶的活性需要组蛋白结合,这可以解释在外显子上DNA甲基化富集。一些研究表明,DNA甲基化影响剪接和基因表达,而不是反之。在人类CD45基因上,CCCTC结合因子(CTCF)减缓了第5外显子的Pol II延伸率,从而促进了其包含;DNA甲基化阻止CTCF结合,从而导致外显子排除154。相比之下,在其他位点,DNA甲基化可以通过招募MeCP2促进外显子包含(reF.155),这与观察结果一致,替代外显子的平均DNA甲基化水平低于组成外显子151。此外,异染色质蛋白1可以通过将剪接因子招募到甲基化DNA156包裹的H3K9me3修饰的核小体上来调节外显子包涵体。然而,这些机制只能解释一部分可选剪接事件。第二个假设——DNA甲基化会抑制基因内启动子——有很多吸引人的原因。首先,这与DNA甲基化作为转录抑制因子是一致的。此外,如上所述(图1b), DNA从头甲基化机制通过与H3K36me3结合而被招募到DNA上,这可以防止在面包师酵母中使用隐蔽的启动子157。的确,基因内cgi的甲基化抑制了启动子的活性,在哺乳动物中,差异甲基化可以以组织特异性和细胞类型特异性的方式调控转录起始158。然而,从小鼠到人类,基因内cgi通常是保守的,而且更可能是替代启动子而不是非法的、隐秘的启动子。最近一项对小鼠ESCs的研究表明,DNMT3B介导的基因体甲基化限制了H3K36me3下游隐启动子的活性(reF.159)。虽然这一发现很吸引人,但观察到的效果,虽然在统计上很显著,只发生在细胞群中很小比例的细胞。此外,Dnmt三重敲除的ESCs并不像Dnmt3B单突变细胞那样抑制基因内隐启动子。需要更多的功能分析来确认DNA甲基化在其中的作用抑制隐藏的启动子,特别是在小鼠ESCs以外的细胞类型中,其中DNA甲基化不需要细胞活力和其他安全措施可能在基因体中。综上所述,上述两种假设都是合乎逻辑和合理的,并不必然相互排斥。在这两种情况下,DNA甲基化似乎至多是一个微调器,因为基因体甲基化的丢失不会导致剧烈的分子表型。未来的工作可能会揭示隐藏的机制和/或功能,这将有助于解释基因体中高度保守的DNA甲基化流行。
P2: Methylation patterning in development
哺乳动物发育过程中DNA甲基化重编程的发现是在30多年前。然而,直到全-亚硫酸氢基因组测序的出现,DNA甲基化模式可以评估与单核苷酸决议,,最近,使用少量的细胞(补充箱2)。随后,技术已经开发评估5 mc的氧化形式相同的精度。在本节中,我们将描述这些技术在DNA甲基化发展过程中所提供的最新微妙发现和修正的见解。
----p2-1 Early embryos and the germlines
哺乳动物表观遗传重编程的传统观点认为,在早期胚胎和种系发育期间,DNA甲基化的广泛消失。这可能是在重要的发育阶段获得表观遗传可塑性所必需的,但也限制了获得性外突变的遗传。然而,在早期胚胎发生和种系发育中,DNA甲基化重编程的机制有关键的区别,尽管在这两种情况下,目前已经清楚,该过程既不是完全的,也不是完全线性的:有限数量的序列可以抵抗DNA甲基化损失,并且在这个过程中可能发生重新的DNA甲基化。
--------p2-1-1 Global passive and active demethylation and local de novo methylation
全基因组DNA去甲基化一直是一个有争议的研究领域。在生殖系重编程中,PGCs161,162中生殖细胞身份的获得伴随着两步去甲基化。第一阶段包括作为默认路径的大部分基因组被动去甲基化163 - 165。接下来是tet1依赖和tet2依赖的去甲基化,主要影响印迹位点和种系特异性基因(图4a),与小鼠PGC核中5hmC的出现相一致164 - 166。在受精后的重编程过程中,胚胎在向多能性发展的过程中,失去了从卵母细胞和精子遗传的配子特异性DNA甲基化模式;这也发生在两个阶段。在小鼠单细胞阶段的胚胎(受精卵)中,TET3介导的5hmC和5mC缺失的共同出现表明,父基因组最初被TET3主动去甲基化(reFs167-169);随后,由于卵母细胞提供的维持酶DNMT1在随后的细胞分裂中被排除在细胞核之外,两个亲代基因组将经历一轮被动的、依赖于DNA复制的DNA甲基化稀释过程。该模型受到最近三次全基因组亚硫酸氢盐测序分析的挑战,这三次全基因组测序分析是对两个小鼠品系杂交胚胎进行的(以推断可用的单核苷酸多态性的亲本特异性),并结合全基因组5hmC定位,这表明母体甲基组在受精卵171 - 173中也经历了有限的tet3依赖性氧化。其他研究也表明,大多数合子DNA甲基化丢失独立于复制174,在父基因组,这可能通过一种不清楚的机制以tet3独立的方式发生m174,175。尽管人类的数据比较有限,但它们表明,通常情况下发生了类似的动态变化,只是有一些物种特有的差异。最初的快速去甲基化也主要影响人类胚胎的父亲基因组,但它发生在受精到双细胞阶段,而它在小鼠的单细胞阶段完成176 - 178。然后,整个基因组的DNA甲基化逐渐消失,直到囊胚期,尽管与小鼠相比,人类母体基因组的DNA甲基化水平较高179。单细胞全基因组亚硫酸氢盐测序发现,人类胚胎基因组在进行全基因组去甲基化的同时,DNA从头甲基化普遍存在:首先是单细胞阶段的父系基因组,然后是八细胞阶段的全基因组,与胚胎基因组激活相一致179,主要针对转座因子。在小鼠发育过程中,一些从头DNA甲基化也可能与胚胎或种系基因组的整体去甲基化同时发生。事实上,在父合子基因组中获得5hmC之前5mC就已经丢失174;因此,必须在这个时间窗内发生DNA重新甲基化,为TET酶氧化提供5mC。类似地,在活跃的种系去甲基化过程中,TET1可能有助于维持低甲基化状态,以应对虚假的DNA重新甲基化事件180。总之,在胚胎和种系的DNA甲基化清除过程中,TET的主要作用可能是防止异位DNA甲基化,而不是驱动主动去甲基化。
--------p1-3-1 Methylation reprogramming and the biological implications of resisting it
虽然胚胎和种系去甲基化是全局的,但在这两个过程的末尾仍存在大量的DNA甲基化。这一观察结果提出了存在代际表观遗传甚至跨代际表观遗传的有趣可能性。在植入前胚胎的内细胞群中,小鼠171和人类179中大约20%的cpg保留配子遗传的甲基化(图4a)。这些明显地映射到ICRs,正如预期的,从基因组印记的代际性质,这与序列特异性的DNA去甲基化抗性通过krabzfp招募KAP1 (refs111,1131,114)相连。然而,总的来说,icr只占基因组的很小一部分。除了这些经典的icr,有数百种“瞬时”甲基化印迹:这些主要遗传自卵母细胞,维持母体特异性DNA甲基化直到囊胚期,可能通过krabzfp依赖的保护,类似于经典的ICRs101,115,并在植入后通过DNA去甲基化或再甲基化失去它101,176,179。这一现象可能在人类中尤其普遍,在植入前,母亲基因组的DNA甲基化保存明显高于父亲基因组,植入后也是如此,只存在于胎盘组织130179。Zdbf2基因位点的瞬时印记在小鼠和人类中都是保守的,研究表明,父系等位基因的瞬时低甲基化可以通过一系列下游表观遗传变化导致长期的印记,影响出生后的大小182,183(图4b)。未来的工作将需要评估其他短暂印记是否有发展作用。囊胚中剩余配子甲基化的大部分与单拷贝序列无关,而是与转座因子有关。在小鼠中,IAP类的Y young逆转录转座子对植入前去甲基化尤其耐药。在人类囊胚中,在进化初期和潜在活跃的转座因子上也观察到最高的DNA甲基化保留,特别是人类特有的SINE- VNRT-Alu因子178。有迹象表明,DNA甲基化通过krabzfp介导的序列特异性招募KAP1 (reF.186)以类似于icr中KAP1的选择性DNA结合的方式被保留。krabzfps需要时间来匹配最近出现的转座因子187,因此最近的IAP因子通常在小鼠品系之间具有多态性,在植入前发育期间对DNA甲基化重编程不具有抗性188。与植入前发育相比,种系去甲基化波更为广泛。在小鼠胚胎发生的第13.5天,PGCs仅表现出6-8%的甲基化CpGs171(图4a)。在怀孕9周后,类似的基础水平仍保留在人类胎儿生殖细胞中189,190。与胚胎发育相反,icr在发育PGCs时发生去甲基化,这是在雄性和雌性生殖系分化过程中获得性别特异性DNA甲基化模式的先决条件。与植入前发育中的甲基化重编程类似,种系DNA甲基化的保留主要见于年轻的和潜在有害的逆转录转座子。在小鼠中,这包括内源性逆转录病毒1类逆转录转座子(ERV1)的IAPs和长末端重复元件161,191。在人类中,sin - VNRT-Alu (SV A)元素和长散布核元素(LINE)家族的人类特定元素与基因组的其他部分相比,以及与灵长类谱系中分布更广泛、因此更早的较老的LINE类型相比,仍存在部分甲基化。由于难以定位基因组中的重复元件,尚不清楚相同的反转录转座子拷贝是否同时抵抗胚胎和种系去甲基化,或者它们是否代表不同的元件集。因此,是否年轻的转座因子有助于表观遗传尚不清楚。然而,尽管非常罕见,一些单拷贝序列也逃脱了胚系DNA甲基化重编程小鼠和人类;有趣的是,这些序列在两个物种之间显示出非常低的序列水平和同位保守。更有趣的是,在胚胎甲基化重编程过程中,人类生殖系逃逸基因序列的DNA甲基化通常也不会被清除。这些稀疏序列是否可以作为表观遗传的载体是一个诱人的可能性。
----p2-2 The de novo DNA methylation programme
在PGCs中进行重编程后,性别特异性的DNA甲基化模式在男性和女性种系中建立。配子体发育结束时,精子基因组CpG甲基化率约为80%,基因组分布与体细胞相似,但DNA甲基化率略高。相比之下,卵母细胞基因组的甲基化仅为~50%,而且几乎只发生在基因体105,171,192(图4a)。卵母细胞的相对低甲基化与DNMT1的细胞质保留有关,DNMT1本身次于由STELLA193蛋白将UHRF1隔离到细胞质。在Stella-突变的卵母细胞中,DNMT1进入细胞核,导致异位DNA甲基化沉积,DNA甲基化增加两倍,导致女性不育。令人困惑的是,这表明DNMT1能够在卵母细胞中重新发生DNA甲基化,但在胚胎细胞中却不是这样33。在小鼠和人类中,卵母细胞DNA甲基化的基因体特异性与从头DNA甲基化与基因转录的紧密耦合有关106,177。然而,这两个物种之间存在着显著的差异。首先,基因体甲基化严格要求DNMT3L介导小鼠卵母细胞中DNMT3A的刺激192,而DNMT3L在人类卵母细胞中不表达177。第二,在小鼠和人类卵母细胞中,成千上万的突触区显示出不同的DNA甲基化模式。这些差异最近被发现与长末端重复反转录转座子的物种特异性插入有关,该转座子在卵子发生期间的转录水平特别高109。通过定义卵母细胞成熟过程中的新的转录单位,这些元素似乎是发育和哺乳动物进化过程中卵母细胞甲基化的重要贡献,也是新的母系印迹位点出现的潜在驱动因素(图2b)。年底胚胎重组-在老鼠胚胎4.5天囊胚的内细胞团,会形成外胚层然后胚胎组织,和trophoectoderm和原始内胚层,造成额外的形成,胚胎组织:胚胎外内胚层(ExE)和内脏内胚层。最近的两项全基因组分析研究证实,ExE和内脏内胚层相对于外胚194,195都是低甲基化的(图4a)。DNA低甲基化持续存在于分化的胎盘中,主要来源于ExE细胞196,197。低甲基化与DNMT3酶与外胚层相比表达降低,甚至逆转录转座子相对低甲基化194。相比之下,ExE和内脏内胚层中有一类特定的CGI启动子被甲基化,但外胚层中没有。与这组启动子相关的基因在发育过程中非常重要:它们的甲基化增加要么反映了在胚胎外组织中抑制它们的需要,要么表明胚胎组织有更严格的机制来防止异常的DNA甲基化和长期沉默。植入后外胚层基因组的再甲基化非常迅速:体细胞组织水平的DNA甲基化已经在小鼠胚胎第6.5天达到(reFs171,198)(图4a)。这是值得注意的,因为外胚层干细胞仍然是多能性的,所以在外胚层干细胞中建立的DNA甲基化模式有可能在所有组织中传播,并维持早期胚胎发生的表观遗传记忆。然而,对小鼠101,197和人类149,199,200的全基因组调查显示,不同成人组织之间的DNA甲基化模式存在广泛而局部的差异,这表明在组织分化过程中发生了DNA重新甲基化和去甲基化的微波处理。在小鼠中,大多数(75%)的组织特异性差异DNA甲基化区域位于增强子或其他调控元件上,这与研究显示增强子进行活跃的DNA甲基化转换有关,这可能是TET2和组织特异性转录因子201,202共同作用的结果(图4c)。在人类中,少数DNA甲基化区域(<50%)与调控元件相连;一个大的子集发现在不明确的区域,那里的功能相关性差异的DNA甲基化是不清楚的。小鼠和人类数据集之间的一些差异可能是由于人类研究的更大的测序深度199,这可能允许从数据中进行更细致入微的推断。大脑在体细胞组织中表现出一种特殊的甲基组。在小鼠和人类中,DNMT3A203-205产生的CpA甲基化在出生后出现峰值。事实上,神经组织中总CpA的甲基化水平与CpG的甲基化水平大致相当,但由于CpA是一种更为普遍的二核苷酸,mCpA的甲基化频率比mCpG低。最近的研究表明,在年轻小鼠神经元的基因体中,MBD蛋白MeCP2与mcc序列结合,并且MeCP2结合在生命后期维持了这些基因的沉默(206,207)(图4d)。这一机制可以帮助我们理解DNA甲基化,特别是非CpG甲基化在调节神经和行为特征中的作用。未来的研究有望进一步阐明生命早期缺陷DNA甲基化是如何导致神经元异常的。表观基因组编辑可能被证明是探索这些问题的有效途径208(框2)。
p3 Genetic diseases, epigenetic outcomes
在DNMT和TET基因中已经发现了疾病相关的突变。它们对DNA甲基化模式的影响是非常不同的,正如它们的组织和病理表现,从先天性的血液系统癌症的免疫缺陷综合征、生长表型或神经变性。其他表型重叠的综合征与已知的基因有关,但也与那些在DNA甲基化和去甲基化方面具有未知功能的基因有关。DNA甲基化途径中基因突变的特性极大地丰富了我们对基于DNA甲基化的基因调控的复杂性和特异性的理解。
----p3-1 DNMT1 and neurological disorders
DNMT1的杂合突变已在一系列常染色体显性形式的进行性认知和行为恶化中被确认,包括遗传性感觉自主神经病变1E伴痴呆和听力损失(HSNA1E;OMIM 614116)209和常染色体显性小脑共济失调、耳聋和嗜睡(ADAC- DN;OMIM 604121)210(表1)。HSNA1E的平均发病年龄在37岁左右,以听力和感觉丧失为最初症状,随后是认知功能下降、共济失调和脑萎缩211。平均预期寿命为50岁,痴呆症是发病率的主要驱动因素。值得注意的是,所有DNMT1突变都发生在RFTS区域,HSNA1E突变聚集在该区域的氨基端和中间部分,ADAC- DN突变明显分离到羧基端。如上所述,RFTS的正确折叠对DNMT1的功能至关重要52,53。HSNA1E或ADAC- DN患者的外周血全基因组分析表明,与未受影响的同胞相比,DNA甲基化的紊乱程度非常温和,存在基因间区域的低甲基化和部分CGIs212,213的高甲基化。这些DNA甲基化特征可能被用作可获得的细胞类型的病理生物标记,但它们可能不一定与疾病的脑特异性表现有关。有趣的是,在基于细胞的过表达分析中,DNMT1蛋白突变的RFTS结构域形成细胞质聚集物,而野生型DNMT1通常是有核的211。蛋白质聚集诱导的细胞应激可导致中枢和外周神经系统的毒性和年龄依赖性的变性。
----p3-2 DNMT3B and immunodeficiency
免疫缺陷、着丝粒不稳定和面部异常(ICF)综合征(OMIM 602900)是第一个与先天性DNA甲基化缺陷相关的遗传疾病214(表1)。ICF患者患有非典型免疫球蛋白缺乏症,会导致复发性和经常危及生命的感染。典型的ICF诊断包括多辐射染色体1、9和16的核型,与粒间粒卫星重复序列II和III的特异性低甲基化相关。ICF1是DNMT3B基因的隐性突变,占ICF病例的绝大多数。正如预期的那样,考虑到Dnmt3B功能缺失突变小鼠模型的致死率33,大多数ICF1突变导致单个氨基酸替换或缺失,并被认为导致Dnmt3B活性的降低而不是消除。尽管ICF缺乏(仅报道了70例),但它与其他三个基因的种系突变有关,其产物被认为有助于DNA甲基化:锌指和含有BTB结构域的蛋白质24 (ZBTB24;定义ICF2),细胞分裂周期相关蛋白7 (CDCA7;ICF3)和HELLS(编码LSH;ICF4) 216217。有趣的是,虽然近端粒卫星重复低甲基化是ICF的一个标志,但也有ICF类型特异性缺陷,指向DNMT3B与ZBTB14、CDCA7和LSH218之间差异基因组背景依赖的相互作用。值得注意的是,具有ICF1的个体表现出生殖系基因和X连锁基因CGI启动子的低甲基化,这与DNMT3B在小鼠发育过程中靶向这些序列的结果一致91,116,这表明该靶向可能独立于ZBTB14、CDCA7和LSH发生。ICF2、ICF3和ICF4与ICF1的区别在于,中心点α-卫星重复序列和神经基因群的低甲基化。这可能意味着ZBTB14、CDCA7和LSH在DNMT3B之外的DNMT中募集。最后,围绕着丝粒重复的全身低甲基化是如何导致免疫系统缺陷的仍不清楚。由于胚胎死亡率和/或缺乏免疫球蛋白缺陷,小鼠ICF综合征的模型信息不充分219,220。然而,最近一项对zbtb24突变斑马鱼的研究表明,胚胎发育期间的中丝粒低甲基化主要通过抑制中丝粒转录激活先天免疫系统221。这样的动物模型可能有助于完善我们对人类ICF病理的机制理解。
----p3-3 DNMT3A, cell growth and malignancies
DNMT3A的杂合子种系突变与早期产前发病的生长障碍有关,生长表型取决于突变的性质(表1)。错义,PWWP结构域的功能增益突变在患有小头畸形侏儒症m222 -的个体中发现一组表现为身体和头部严重而成比例的缩小的病理。这些是功能增益突变,它会破坏DNMT3A与H3K36me3的相互作用,并改变其染色质结合的特异性:在携带突变个体的成纤维细胞和血细胞中,DNA甲基化的异位获得在被称为DNA甲基化谷或谷223,224的大区域中观察到,代价是二价的H3K27me3和H3K4me3修饰,这些修饰通常是这些区域的特征,并调节重要的发育基因,例如Hox转录因子和形态形成基因。在小鼠中引入PWWP功能增加突变显著重现了小头畸形侏儒症患者的体型和脑重量的减少以及异位甲基化表型222,225。相比之下,杂合子DNMT3A单倍性突变是Tatton-Brown - Rahman综合征(TBRS;也被称为DNMT3Aovergrowth综合征;OMIM 602729)DNMT3A基因发生TBRS突变,包括PWWP结构域(功能获得突变的上游)、ADD结构域和MTase结构域。这些突变对DNA甲基化模式的影响尚未确定,尽管DNMT3A功能增益突变体中高甲基化的大基因组结构域在TBRS222个体中似乎没有受到影响。考虑到DNMT3A功能缺失导致小鼠各种组织中的干细胞增殖227,228,DNMT3A单倍性不足可能通过增加组织中的细胞数量,进而增加机体大小,促进TBRS的过度生长。相反,DNMT3A功能的获得可能有利于干细胞的分化而不是增殖,进而减少器官和身体的大小。在全基因组关联研究中,DNMT3A位点与自然高度变异密切相关229,指出了DNMT3A在人类体型生理学中的重要作用。最后,体细胞DNMT3A突变与未成熟骨髓细胞的增殖增强和成人血液系统恶性肿瘤的发展有关。在15-35%的急性髓系白血病(AML;OMIM 601626),绝大多数是MTase域的精氨酸882 (R882)的错义突变。R882突变对野生型DNMT3A四聚体的形成有显性的负面影响,从而在体外降低了80%的酶的甲基化活性230。因此,在AML231发病之前,CpG密集区域的特定位点观察到非常集中但全基因组范围内的低甲基化。二价CGI启动子的高甲基化也有报道,但这是AML进展的结果,而不是原因,继发于恶性髓系细胞的快速细胞增殖。有趣的是,种系R882突变也存在,并导致TBRS232患者的早发性AML。
----p3-4 Hydroxymethylation by TET2 and cancer
1)虽然DNMT3A活性的体细胞丧失在AML中相当常见,但TET2突变更常见的原因是血液系统恶性肿瘤
2)TET2功能的恢复可以逆转白血病,进一步支持该酶在疾病病因学中的致病作用。
3)5hmC修饰可能是恶性肿瘤的罪魁祸首。
4)与DNA甲基化和去甲基化因子突变相关的疾病提供了对这些蛋白质功能的微妙理解,超出了功能丧失研究所能实现的。对这些领域的持续研究有望带来癌症和遗传疾病的治疗突破。
Conclusions and future perspective
自20世纪80年代发现DNMT1以来,尽管在理解DNA甲基化机制和模式方面取得了重大进展,但仍有许多未知。随着技术的飞速发展和从不同系统的研究中获得的知识,哺乳动物DNA甲基化研究的未来有望有令人兴奋和影响深远的发现。