ATAC-seq,全称 Assay for Transposase-Accessible Chromatin with high throughput sequencing,是 2013 年由斯坦福大学 William J. Greenleaf 和 Howard Y. Chang 实验室开发的用来研究染色质可及性(通常也理解为染色质的开放性)的方法。
真核生物的核 DNA 并不是裸露的,而是组蛋白与之结合。DNA 一圈一圈地缠绕在 8 个组蛋白上,形成核小体,每个核小体占了约 147bp 的 DNA。一个个核小体构成了串珠样的结构,然后进一步折叠、聚合,并在其他架构蛋白的协助下,形成染色体。这样就能将超长的 DNA 链,折叠成很小很小的结构,塞进小小的细胞核里。
但是在基因转录的过程中,并非需要完全解开 DNA 链的全部结构,而是只需部分解开,即表达基因的区域。这一步骤主要依赖于染色体组蛋白的修饰,尤其是乙酰化。被打开的染色质称为开放染色质(open chromatin)。一旦染色质打开,调控蛋白(例如转录因子)就有机会结合其中。染色质的可及性是指染色质打开的特性,主要由染色体组蛋白的修饰实现,因此染色质的可及性反映了调控因子与开放染色质结合的程度,与转录调控密切相关。通过研究特定细胞状态下开放的染色质区域,我们能够在 DNA 水平上了解其转录调控机制。
研究开放染色质区域的技术
传统的实验方法主要包括 MNase-seq 和 DNase-seq,它们的主要思路是:当染色质变得开放时,DNA 和组蛋白的聚集程度降低,导致一部分 DNA 暴露出来。失去蛋白质的保护后,这部分 DNA 可被 DNA 酶(如 MNase 或 DNase I)切割。随后,我们对切割后的 DNA 进行测序,并将其与已知的全基因组序列进行比较,以确定哪些序列被切割,哪些基因序列未受影响,从而确定开放的染色质区域。但是这两种方法存在明显的缺陷,主要表现在耗时费力和重复性差的问题。
还有 FAIRE-Seq,先进行超声裂解,然后用酚-氯仿富集,不依赖酶和抗体,但弊端就是检测背景高,测序信噪比低,甲醛交联时间不好把握等等。
ChIP-Seq 是揭示特定转录因子或蛋白复合物的结合区域,实际是研究 DNA 和蛋白质的相互作用,利用抗体将蛋白质和 DNA 一起富集,并对富集的 DNA 测序。
整体的分析思路一致,这些技术找富集区域,对富集区域进行功能分析。
相比起来,ATAC-seq 是用 Tn5 转座酶,操作起来也更加简单,重复性好,而且最重要的一点是实验只需要很少的细胞/组织量,出来的信号也更加漂亮,所以 ATAC-seq 目前已经是研究染色质开放性首选的技术方法。
ATAC-seq 技术
ATAC-seq 技术用到了一个转座酶 Tn5:DNA 转座是一种由 DNA 转座酶介导,把 DNA 序列从染色体的一个区域插入到另外一个区域的现象,类似于“剪切粘贴”。这个过程,也是需要插入位点的染色质是开放的,否则就会被一大坨高级结构给卡住。
转座酶可以随机结合并切割染色质开放区的 DNA,并且可同时在切割位点插入接头序列。只要将携带已知 DNA 序列标签的转座复合物(即带红色和蓝色序列标签的 Tn5 转座酶)加入到细胞核中一起孵育,再利用已知序列标签进行 PCR 扩增即可形成文库,经过测序就可以获得染色质开放区的信息。
ATAC-seq 实验流程
一般来说包括以下几个步骤:
细胞核制备
片段化及 DNA 提取
PCR 扩增
文库纯化
高通量测序
数据分析
ATAC-seq 技术的优势
所需细胞量较低,而且信噪比高、特异性强、耗时短
满足动物、植物、人等样本的要求,具有很好的物种适应性
单细胞测序技术是近几年研究的热点,通过对单个细胞的测序能够将表观遗传学研究个体化。常见的 ChIP-seq、DNase-seq、MNase-seq 等技术无法进行单细胞测序,而 ATAC-seq 经过实验验证,表明其能够进行单细胞测序
ATAC-seq 技术的应用
那么说了这么半天的 ATAC-seq 归根到底是用来干嘛呢?主要有以下应用
染色质开放性图谱绘制,表观基因组图谱
找调控生物学过程的关键转录因子
找哪个转录因子调控了研究的基因
找转录因子调控的靶基因
得到不同组织或不同条件下对应可及性区域。
得到核小体位置
生成转录因子结合区域的特征 (footprinting)
ATAC-seq 适用于机制研究,探索信号通路、表型变化、疾病等与基因调控的相关性。并以其简便高效、重复性好等优点,成为研究染色质开放区的有效技术方法。
在表观遗传研究中,ATAC-seq 能够探索表观修饰是否与研究目标有相关性,可通过 Open Chromatin 区域和 Motif 分析寻找参与基因调控的转录因子。ATAC-seq、CUT&Tag 和 RNA-seq 等方法技术能够助力科研人员进行相关研究
ATAC-seq 的技术限制
Tn5 通过插入剪断 DNA 并将测序接头连接到剪断的两个 DNA 片段的末端,因此对于一个 DNA 片段而言,其两端的接头连接是随机的,导致同一片段两端的接头有 50%的概率是同一接头。而只有连接不同接头的片段才可用于富集扩增及测序,因此一半的片段无法利用
大量剪断的 DNA 由于片段过大,无法进行 PCR 富集
Tn5 的活性受反应溶液的组成及反应条件影响,仍然需要优化以便提高剪切效果
ATAC-seq 在植物细胞存中存在细胞壁、叶绿体线粒体等细胞器污染,缺少稳定遗传的细胞系等问题
参考资料
表观遗传学研究利器——ATAC-seq 技术,高效探索染色质开放区
一文详解 ATAC-seq 原理+读图:表观遗传的秀儿
ATAC-Seq 基础分析+高级分析+多组学分析
维基百科-染色体
一文了解 ATAC-seq
单细胞 ATAC 测序
表观组学专题:ATAC-seq, 你了解多少呢
ATAC-seq
ATAC-seq 学习记录
本文使用 文章同步助手 同步