1. 使用SMRT测序检测真核生物基因组6mA修饰
Zhu S , Beaulaurier J , Deikus G , et al. Mapping and characterizing N6-methyladenine in eukaryotic genomes using single molecule real-time sequencing[J]. Genome Research, 2018, 28(7):gr.231068.117.
这篇文章主要是对几类研究基因组N6-mA修饰的方法进行了比较,并以单细胞真核生物绿藻和人类基因组出发,提供了一套6mA比对与特征分析的方法。
提出了一个根据你所研究的物种基因组中6mA修饰的多少来决定你的测序深度的关系,见下图。
2. 人类基因组的6mA修饰
Xiao C L , Zhu S , He M , et al. N6-Methyladenine DNA Modification in the Human Genome[J]. Molecular cell, 2018, 71(2).
第二篇文章于2018年发表在Molecular Cell上,由中山大学中山眼科中心肖传乐、广州医科大学附属第三医院晏光荣、美国费城儿童医院王凯、中国农科院谷晓峰、军事医学科学院伯晓晨等学者与北京希望组生物科技有限公司共同合作完成。
该研究从利用PacBio平台得到的“华夏一号”(HuaXia1)测序数据出发,结合6mA-IP-seq, LC-MS/MS, 6mA-IP-qPCR, 6mA-RE-qPCR等技术首次破译人类基因组中的N6-甲基腺嘌呤(6mA)修饰图谱。
简单来说,这篇文章从“华夏1号”的PacBio三代测序数据出发,前6个results介绍了PacBio测序寻找6mA修饰的精准度,并对基于二代测序的6mA-IP-seq,基于质谱的LC-MS/MS,以及基于qPCR的6mA-IP-qPCR和6mA-RE-qPCR等方法进行验证和补充说明,结论是基于二代测序的6mA-IP-seq能够得到的6mA修饰位点在SMRT的数据中都有,但是位点要显著少于SMRT测序数据能找到的6mA位点。Result-7和Result-8分别介绍了基于猜想寻找人类系统中6mA修饰的甲基化和去甲基化酶,分别是N6MT1和ALKBH1。这里主要是进行了一系列细胞水平的过表达或者干扰/敲除实验,以及体外甲基化实验。首次鉴定了人类基因组6mA修饰的甲基化酶——N6AMT1。最后两个结果9和10主要是粗略研究了一下一小部分gastric cancer 和liver cancer病人中的6mA修饰情况以及N6AMT1/ALKBH1的表达情况,得出癌组织比癌旁组织的6mA修饰少,值得注意的一点是,这篇文章当中,对癌和癌旁组织中的6mA进行检测用的方法是免疫组织化学(IHC),而不是测序的方法。并且发现6mA修饰水平和预后有关。通过对肿瘤细胞系做N6AMT1和ALKBH1过表达、沉默实验发现6mA修饰水平的高低会影响肿瘤细胞的增殖、迁移、侵袭等表型。
个人觉得这篇文章值得参考的地方是利用PacBio的测序数据去提取修饰信息的Bioinformatics分析部分。
3. 6mA修饰与胶质母细胞瘤
Cell. 2018 Nov 15;175(5):1228-1243.e20. doi: 10.1016/j.cell.2018.10.006. Epub 2018 Nov 1 N6-methyladenine DNA Modification in Glioblastoma.
2018年11月,来自加州大学圣地亚哥分校的Jeremy N. Rich 课题组与耶鲁大学Andrew Z. Xiao课题组合作在Cell上发表了该篇文章,首次证明了人类神经胶质瘤细胞的基因组中有着丰富的6mA修饰,6mA修饰参与癌症的发展,并发现靶向6mA去甲基化酶ALKBH1有望成为治疗神经胶质瘤新策略。
我个人感觉这篇文章思路比较迷(也许应该说比较丰富,所以一遍读不明白),发表于第二篇文章之后,出现很多有意思的,与第二篇文献的结论完全相反的结果。在看了Author Contribution之后我的感觉更加强烈——即这篇文章应该是两个竞争课题组后来整合成果共同发表为一篇文章的套路。(只是猜测,不一定对哈)由于相对来说这篇文章比肖传乐的文章更复杂,所以在附上完整思路整理图的同时,我对单个result进行拆分梳理如下。前三个结果主要谈论的是N6-mA修饰;后三个结果主要谈论的是ALKBH1这个基因。
首先是背景,值得一说的是为什么作者选择了神经胶质母细胞瘤(Glioblastoma)来研究DNA的6mA修饰。Glioblastoma是一种发病率很高,并且很具侵略性的原发性脑肿瘤,这个癌种被证明有广泛的表观遗传修饰失调,例如DNA 5mC的高甲基化、染色质重塑酶基因如EZH2和BMI1的表观修饰变化。然后作者们就选择了用来自病人的胶质母细胞瘤细胞对DNA 6mA修饰及其功能进行研究。
Result-1 Identification of N6-mA DNA Modifications in Human Glioblastoma
这部分主要用dot blot, MS和免疫细胞荧光(ICC)三种技术对Glioblastoma病人衍生的干细胞GSCs和两个primary tissues进行研究(primary tissues只做了dot blot),然后发现在GSCc和primary tissues中的6mA修饰都比human astrocytes (人类形形胶质细胞,作为normal control)中要高。这个结论与第二篇肖传乐等人的文章中得出的‘normal组织中的6mA修饰水平更高’刚好相反。
Result-2 Genomic Profiling and Pattern of N6-mA Glioblastoma
这个部分主要是对两个GSCs细胞系和一个primary组织进行了N6-mA DIP-seq测序。分析测序结果发现(1) 每个样本能检测到7,282-17,263个N6-mA peak,这一结果与2018-molecular cell上发表的肖传乐等人的文章中用的6mA-IP-seq在HuaXia1基因组中检测到的(21,129)差不多?(2) 每条染色体上都检测到了N6mA,其中7号染色体、19号染色体和21号染色体上最多;而关于分布的染色体的特征,肖传乐等人的文章似乎表示6mA在常染色体上的分布是比较均一的?(PS: 在文章中进行了Genome Background比较得出的这个结论,由于我是生信菜鸟,我不太懂,希望有专业人士可以指导一下~)(3) GO富集分析发现m6A修饰的基因主要富集在神经发生和神经发育通路;(4) motif分析发现6mA的常见修饰寡核苷酸是GGAAT,肖传乐等人的文章中得到的motif是[G/C]AGG[C/T]。
Result-3 N6-mA is enriched in hetrochromatin
作者提出“N6mA是一种抑制性的表观修饰”。怎么说呢,因为在Result-2中鉴定到的富含6mA修饰的DNA motif- GGAAT-是人类大部分微卫星重复序列的结构,而人类微卫星重复序列主要在异染色质区域。所以Result-3就开始探索N6mA与异染色质之间的关系。首先对Result-2部分的三个样本进行了H3K9me3,H3K27me3和H3K4me3的ChIP-seq,发现80%的N6-mA的峰能和异染色质marks,即H3K9me3, H3K27me3重合。之后又对387这个GSC做了WGBS (全基因组甲基化测序),发现有轻微差异。(小声:连显著性都没标是不是因为没有显著差异,23333)
Result-4 ALKBH1 Is a DNA N6-mA Demethylase that Actively Modulates Gene Expression in Human Glioblastoma
这个结果部分首先对ALKBH1这个基因进行体外和体内实验,均证明能影响6mA的量;最重要的是,这篇文章也做了N6AMT1这个基因,通过CRISPR构建N6AMT1敲除的细胞系的6mA修饰水平没有发生变化。体外的实验也没有变化。这里有几个地方我个人认为比较不明确:首先,做CRISPR-Cas9敲除的GSCs细胞系未告知明确是哪个;然后做dot blot的DNA用量也没有标明。因此不能和肖传乐等人的文章进行更精确的比较。
_________________________________________________________________________
还有不解的是:后面他们先是做了CRISPR敲除ALKBH1基因的细胞系,然后去做了RNAseq,得到表达变化了的差异基因;然后他们用shRNA干扰ALKBH1表达的细胞做N6-mA DIP-seq去找ALKBH1被knockdown之后N6mA修饰发生改变的位点,然后比较ALKBH1被敲除后表达下调的基因的N6-mA的修饰的变化情况。为什么不直接用ALKBH1-KO的细胞系做N6-mA DIP-seq呢???关键是他文写的还是'after ALKBH1 deleption'???感觉略混乱啊。。
________________________________________________________________________
继续‘震惊’的是,他们又做了ATAC-seq,发现ATAC-seq的峰刚好和N6-mA DIP-seq的峰呈负相关。。。这思路真(kan)清(bu)奇(dong)。。。难道前面不是已经证明了N6-mA喜欢在异染色质区域吗?异染质区域难道不是开放性弱的区域吗??那么不是理论上就是在ATAC-seq不能拉到的区域吗??
________________________________________________________________________
然后,为了搞明白ALKBH1到底是怎么去掉N6-mA修饰的,他们做了ALKBH1 pull-down实验。发现ALKBH1喜欢跑到带有N6-mA修饰的寡聚核苷酸那里去。。为了解释这种现象,他们又做了ALKBH1的ChIP-seq。。。然后发现ALKBH1 ChIP-seq的峰和N6mA的峰重叠。。然后得到的结论是:ALKBH1是一个转录因子,它跑到N6-mA富集的地方去并且移除N6-mA修饰的抑制作用。。思路绕吗??可能CNS级文章就是这样吧。。
Result-5 ALKBH1 Depletion Facilitates Heterochromatin Formation in Human Glioblastoma through N6-mA DNA Modification
第五个结果比较简单,但是到了第五个结果这里,ALKBH1, Histone modification (eg, H3K9me3), N6-mA modification和Gene expression这4者之间的关系其实相对来说似乎就明朗了。
(1) ALKBH1升高会减少N6-mA的修饰;
(2) N6-mA修饰减少会去掉基因表达的抑制性修饰,所以理论上来说正常组织中带有较多N6-mA修饰的基因在ALKBH1表达升高之后它们的表达也会升高,即ALKBH1的水平与基因表达呈正相关;
(3) N6-mA修饰与H3K9me3的修饰peaks高度重叠;
所以在第五个结果里,通过对ALKBH1 knockdown的细胞系做H3K9me3 ChIP-seq,弥补上了ALKBH1与H3K9me3的关系。本文的研究结果是:检测到ALKBH1 knockdown的细胞系基因组中有更多H3K9me3 peaks,因此认为ALKBH1可以调控组蛋白修饰的形成。
Result-6 ALKBH1 regulates hypoxia response genes
Result-7 N6-mA Is a Potential Therapeutic Target in Glioblastoma
这篇文章内容很丰富,思路很丰满,太累了。后面主要是设计了相对完整的对照实验做RNAseq等实验证明N6-mA与缺氧调控通路的关系,以及去做了个ALKBH1敲除后的肿瘤细胞表型实验等。
4. 哺乳动物胚胎干细胞ESC中的6mA修饰
Wu T P , Wang T , Seetin M G , et al. DNA methylation on N6-adenine in mammalian embryonic stem cells[J]. Nature, 2016.
这篇文章检测小鼠胚胎干细胞基因组DNA中6mA修饰的方法仅是新开发的SMRT-ChIP(H2A.X),结合LC-MS/MS进行验证。这篇文章的通讯作者同时也是2018年在Cell上发表了N6mA修饰在胶质母细胞瘤当中的作用的通讯作者之一。这篇文章在小鼠胚胎干细胞基因组中发现了6mA修饰,同时证明ALKBH1编码了一个N6mA的去甲基化酶,并且敲低ALKBH1表达的细胞中N6-mA的水平增加,某些关键基因的表达下调。最后他们发现在小鼠胚胎干细胞中,不同于以前研究的其他物种基因组,N6-mA的积累作为一个表观沉默机制发挥作用,例如控制转座子LINE-1的活性等。
5. 小鼠脑组织中的6mA修饰受到环境压力的动态调控
Yao B , Cheng Y , Wang Z , et al. DNA N6-methyladenine is dynamically regulated in the mouse brain following environmental stress[J]. Nature Communications, 2017, 8(1):1122.
这篇文章发表于第四篇文章之后,当哺乳动物细胞基因组中被报道有6mA修饰之后,亚特兰大埃默里大学医学院人类遗传学系的Peng Jin研究员发现在(1)小鼠脑组织的DNA中,6mA修饰的水平随着压力显著上升;(2)通过运用全基因组6mA图谱分析以及转录组图谱分析,他们发现6mA的动态改变与一系列神经元基因的上调及LINA1转座子表达的下调呈负相关;(3)受到6mA修饰水平改变的基因大多都是神经疾病发生相关的基因。这些结果表明6mA是一个调控脑发育及神经疾病发生相关的表观因素。这是一篇揭示慢性压力对基因组表观修饰变化以及神经疾病发生的相关性的文章~ 我个人对于精神压力等如何引起抑郁症等精神疾病比较感兴趣。
这篇文章的第二个结果,通过6mA-IP-seq测了3对stress/control鼠脑PFC区的6mA变化,得到主要变化——不论gain 6mA还是loss-of 6mA都是发生在intergenic基因间区。当关注基因内的6mA变化时,发生主要是发生在introl区。而2018-Moleculer Cell-肖传乐等人的文章的结果是6mA在基因内intragenic的修饰区域主要是在exon区。在第四个结果里,通过对RNAseq的数据进行分析,并且结合6mA-IP-seq数据,把所有基因分为以下四类:① gain-of-6mA/upregulated; ② gain-of-6mA/downregulated; ③ loss-of-6mA/upregulated; ④ loss-of-6mA/downregulated。GO分析之后发现只有第③类loss-of-6mA/upregulated的基因能够富集到与神经发育及功能相关的通路上。
6. 在斑马鱼和猪的早期胚胎发育过程中基因组DNA含有丰富的6mA修饰
Liu J , Zhu Y , Luo G Z , et al. Abundant DNA 6mA methylation during early embryogenesis of zebrafish and pig[J]. Nature Communications, 2016, 7:13052.
这篇文章来自三个单位的合作,分别是芝加哥大学霍华德·休斯医学院(何川),中国科学院动物研究所生殖生物学国家重点实验室(陈大华研究员),以及浙江大学动物科学学院(汪以真院长)。这篇文章主要以斑马鱼和猪为关注对象,研究胚胎发育的过程中基因组6mA修饰的动态变化,发现在早期胚胎发育的过程中基因组重复序列区域的6mA显著增加,约占所有A的0.1%-0.2%,随着发育完成又恢复到正常状态。
这篇文章比较短,只有7页pdf,接下来按照文章给出的result来理一下整个项目的思路。
首先第一个结果部分(1) DNA 6mA modification during early embryogenesis of zebrafish,作者主要利用UHPLC-QQQ-MS/MS超高分辨率-三重四级杆-串联质谱,以斑马鱼为模型,非常细致地研究了斑马鱼的精细胞、卵子、早期胚胎发育的各个细胞时期(受精卵、2细胞、4细胞、8细胞、16细胞、32细胞、64细胞、128细胞、256细胞、512细胞时期)以及成年斑马鱼的不同组织器官(包括脑、眼睛、心脏、卵巢、精囊、肌肉和肠)进行了6mA丰度研究,平均每一个实验组需要约10,000个细胞提取的基因组DNA。结果表明精细胞中6mA/A的比例约在0.003%,卵母细胞中约为0.015%;在32-64细胞时期6mA/A的比例达到最高,约为0.1%,之后慢慢下降,直至回归原始基因组水平。
同时成年斑马鱼的不同组织器官中6mA/A的丰度也是符合一般水平,无明显变化。
为了排除在LC-MS/MS实验中外源DNA污染导致的结果的错误,作者们在第二个结果(2) Immunostaning of 6mA in zebrafish embryonic gDNAs对斑马鱼胚胎的gDNA用anti-6mA的抗体()进行了免疫荧光染色, 荧光强度的结果与LC-MS/MS一致。
基于以上结果,作者们认为胚胎发育阶段6mA的动态变化说明了6mA具有一定的功能,于是后续他们就开始研究猪的早期胚胎发育过程中6mA的变化和功能。
(3) Quantification of DNA 6mA level in pig embros
获取足够的猪的卵母细胞和胚胎比较难,目前可行的办法是通过体外受精然后体外培养到不同的胚胎阶段。但是这一方法成功受精率很低,并且即使受精成功,胚胎也最多只能发育到囊胚时期(32细胞)。最后费了很大的劲,收到了~2500个卵母细胞、1800个4细胞时期的细胞、900个桑椹胚时期的细胞和500个囊胚时期的细胞。
所以这里有个值得注意的地方是:猪基因组DNA中6mA的修饰比斑马鱼中的高了一个数量级(0.09% v.s 0.015%)
(4) Distribution of 6mA in zebrafish embryonic gDNAs
在这个结果中,作者主要是对斑马鱼早期发育胚胎包括64-细胞、11hpf、12hpf和13hpf (hpf: hour post fertilization)时期在内的胚胎进行了6mA-IP-seq从而研究不同不同发育时期基因组6mA的分布模式。
分析结果表明,这几个研究的时期,6mA修饰都是广泛分布在基因组中,有一些些轻微富集在转录起始位点之后的区域。
我个人没有太读懂这一部分的描述哈:首先,作者说6mA修饰更多地存在于exon区,而不是intron或者intergenic以及promoter区;然后他们又表示约78-81%的6mA修饰都落在重复序列区域。我的问题是:重复序列不一般都是位于Intergenic吗?
第五个结果consensus序列那边没有太多,第六个结果(6) 6mA-IP-seq by using different anti-6mA antibody这里比较了SYSY的抗体和Abcam的抗体,结果是'the Abcam antibody possess a relatively lower affinity but slightly higher selectivity'。
哈哈,所以做一个seq,分析之后就可以发NC了呢~