视频12:甲基化测序
DNA甲基化
定义:
DNA的甲基化是在DNA的序列不变的条件下,在其中某些碱基上加上甲基的这样一个过程。
结果:
一般是使甲基化位点的下游的基因表达量变少
DNA甲基化测序
原理
-
用亚硫酸氢盐来处理DNA
1
-
用碱来处理。结合了亚硫酸氢根的非甲基化的C,就被脱氨基,并且脱亚硫酸根。然后,就被转化成U碱基。
再经过PCR,PCR新合成出来的链,U碱基的位置,就会被替换成了“T”。
如果它保持是“C”,就说明这个位置是被甲基化、或者羟甲基化了。如果测到的是“T”,就说明这个位置是没有被甲基化、或者羟甲基化。
甲基化的建库过程
-
用Illumina公司的Truseq DNA建库方法
Illumina Truseq DNA建库试剂盒当中,它所提供的接头,那么这个接头上的C碱基都是已经经过甲基化修饰了。
- 缺点:在用亚硫酸氢盐处理DNA文库的时侯,90%以上的DNA链会断掉。这样,已经建好的文库,其中90%分子会被破坏掉。也就是说文库的丰富度就会损失90%以上。
- 相应的好处:在这个建库过程当中用的PCR循环数较少。所以它PCR扩增效率不同,所引起的文库不均一程度也就较低。也就是我们通常所说的PCR bias较少。
EpiCentre公司开发了EpiGnome方法
-
第1步,亚硫酸氢盐先处理DNA,把未甲基化的C都转变成U。
第2步,把带标签1的随机引物加入,进行第一次的复制。得到第1条的复制链。
-
第3步,是消化掉过量的引物。
-
第4步,是加入带末端终止碱基、并带标签2的随机引物。这个引物的作用是让第1复制链延伸,并且加上标签2。
第5步是加入建库的PCR引物,进行PCR。通过PCR,把Index序列和成簇引物序列加入到链的两侧。得到真正的文库。
优点:丰富程度会比较高。
缺点:要做较多的PCR循环,那么有了比较多的PCR循环之后,PCR产物的扩增均一性是不太好的。也就是说PCR bias会比较大。
HiSeq2000/2500****测甲基化文库的问题、和解决方案
-
问题:
这个文库中是严重地缺少C碱基的,也就是四种碱基的比例是严重不平衡的。这样在用HiSeq 2000或2500测序仪来测甲基化文库的过程当中,文库测序得到的数据质理就较差。并且经过PF过滤得到的有效的数据产量也会较低。 -
解决方案:
在上机过程当中,是掺入大比例的基因组文库,或者PhiX文库,来补充比较多的C碱基,一般会掺30%的PhiX文库、或者基因组文库。
羟甲基化测序
难题:
甲基化和差甲化的C碱基都不能被转化成U碱基
两种办法
第一种办法
通过高钌酸钾(KRuO4)来氧化羟甲基化的C。羟甲基化的C可以被转化成甲酰化的C碱基,而甲酰化的C碱基,是可以被亚硫酸氢盐转化成U的。氧化
可以
效果:
用高钌酸钾氧化的方法来氧化羟甲基化的C,其转化效率是94%左右。
第二种区分羟甲基化C的方法
用糖基把羟甲基化的C给保护起来。然后用TET蛋白(Ten-eleven translocation methylcytosine dioxygenase 1),把甲基化的C转化成羟基化的C
效果:
92%的羟甲基化的C得到了糖基的保护,还保持了C
数据分析
问题:
因为亚硫酸氢盐处理过后,绝大部分的C都被转化成了T。这样,测出来的序列在和基因组进行对比的时侯,直接对比是对比不上的。为了要进行比对,就要把基因组的碱基做两种转变。
解决方法:
第一种转变:
把基因组上所有的C都改到T,再来和测序测到的序列来对比。这样,就可以把原来的链给对比上。
第二种转变:
把基因组上所有的G都变成A,这样才能和经过PCR得到的原样本链睥互补链对比得上。这样做的原因,是原样本链的互被链,它上面绝大部分的G,都被变成了A。所以,只有把(参考)基因组上的G,也都改成A,这样才能对比得上。比对上之后,再来看哪些碱基是没有被转化的。这样,就可以确认这些碱基的甲基化修饰情况了。
设置内参
问题:
亚硫酸氢盐对未甲基化的C的转化效率并不是100%,一般是在99%左右。
方案一:
转化实验当中加入内参对照品。一般情况下,是用甲基化酶缺陷型的大肠杆菌,所生产出来的完全没有被甲基化的λ(噬菌体)DNA,或者pUC19(质粒)DNA做内参。来看一次实验当中C的转化效率。一般情况下,实验当中是加入1%的完全没有甲基化的λ DNA做内参。
方案二:
通过用甲基化酶处理过的,CpG岛完全被甲基化的DNA,来跟踪甲基化DNA对亚硫酸氢盐转化的抵抗效果。
这个方向停止更新20200413
因为对于现阶段的我帮助不是很大,还有很多重要的事情去做,除非以后有闲暇时间再来续更。资料都是借鉴了很多其他人的资料。