第24周 2018 — 10.28-11.3
原文链接:The chromatin accessibility landscape of primary human cancers
http://science.sciencemag.org/content/362/6413/eaav1898
DOI: 10.1126/science.aav1898
期刊:Science
发表时间:26 October 2018
导读
染色质的可及性(chromatin accessibility)通常理解为开放染色质(open chromatin),指致密的核小体结构被破坏后,启动子、增强子、绝缘子、沉默子等顺式调控元件和反式作用因子可以接近的区域,与真核生物的转录调控密切相关。
目前研究染色质的可及性的方法有DNase-Seq,MNase-Seq,FAIRE-seq和ATAC-seq。ATAC-seq是2013年由斯坦福大学William J. Greenleaf和Howard Y. Chang实验室开发的,通过Tn5转座酶切割暴露的DNA并同时连接上特异性的adapters,然后连接上adapters的DNA片段被分离出来用于二代测序。由于所需细胞量少,实验简单,可以在全基因组范围内检测染色质的开放状态,被广泛使用。
各种研究方法原理及优缺点比较:
研究方法 | 所需细胞数量 | 原理 | 靶向结合的基因组区域 | 实验要求 |
---|---|---|---|---|
DNase-seq | 10^7 | DNase I 内切酶对染色质消化,通过片段大小富集 | 开放染色质 | 所需细胞量多;样品准备复杂耗时;酶滴定繁琐;人的基因组需要20-50 million reads |
MNase-seq | 10^7 | 内切外切核酸酶MNase对染色质消化,通过片段大小富集 | 核小体 | 所需细胞量多;酶滴定繁琐;检测的是整个核糖体群体,而不仅仅是活跃的调控区域;人的基因组需要150-200 million reads |
FAIRE-seq | 10^5 ~ 10^7 | 超声裂解,然后用酚-氯仿富集 | 开放染色质 | 信噪比低,数据解释困难;结果依赖固定效率;人的基因组需要20-50 million reads |
ATAC-seq | 500 ~ 50,000 | Tn5转座酶切割暴露的DNA并同时连接上特异性的adapters,连接上adapters的DNA片段被分离出来,用于二代测序 | 开放染色质、TF和核小体区域 | 线粒体DNA的干扰;人的基因组需要60-100 million reads |
昨日(2018.10.26)ATAC-seq技术的两个主要开发者William J. Greenleaf和Howard Y. Chang作为共同通讯在Science上又发表一重大成果——人类原发性肿瘤染色质可及性图谱。
这篇文章的主要结果包括以下几方面:
- 绘制了来自410个肿瘤样本横跨23种癌症类型的796个全基因组染色质可及性图谱;
- 在这些癌症类型中共发现了562,709个DNA调控元件;
- 整合ATAC-seq与TCGA其他的多组学数据,鉴定肿瘤特异的DNA调控元件,如远端增强子具有更强的组织特异性,根据增强子元件聚类鉴定到新的肿瘤亚型;
- 通过TF足迹分析找到了关键的TF, 然后通过预测TF和DNA的相互作用模式以及基因的表达识别不同的TF活性;
- 基因表达和染色质可及性的关联分析预测到大量远端增强子与启动子间的相互作用,包括一些重要的致癌基因和肿瘤免疫治疗的靶点,如MYC,SRC, BCL2和PDL1,为免疫治疗提供了新的视觉;
- 另一个亮点是结合GWAS和WGS探索肿瘤变异的影响。结果表明在调控元件处的变异通过产生或干扰转录因子的结合位点,可能增强或抑制染色质的可及性。如位于12号染色体FGD4基因上游的单碱基突变,会产生NKX 转录因子结合的基序,增强了染色质的可及性,促进了FGD4基因的表达。
- 另一个重要的亮点是这篇文章提供了丰富的数据的资源和肿瘤研究的一个新的视觉,但是他们做的是pan-cancer 研究,只是做了初步探索,具体到每个癌症还有很多东西值得挖掘。
下面列出这篇文章包含的数据资源:
- 原始数据和三级数据都是开放的,三级数据:https://gdc.cancer.gov/about-data/publications/ATACseq-AWG,包括counts,peaks,和bigwig文件等其他中间文件。
- ATAC-SEQ原始数据和bam文件: https://portal.gdc.cancer.gov/
23种肿瘤类型:
ACC, adrenocortical carcinoma肾上腺皮质癌;
BLCA, bladder urothelial carcinoma 膀胱上皮癌;
BRCA, breast invasive carcinoma乳腺浸润性癌;
CESC, cervical squamous cell carcinoma宫颈鳞癌;
CHOL, cholangio carcinoma胆管癌;
COAD, colon adenocarcinoma结肠癌;
ESCA, esophageal carcinoma食道癌;
GBM, glioblastoma multiforme胶质母细胞瘤;
HNSC, head and neck squamous cell carcinoma头颈部鳞状细胞癌;
KIRC, kidney renal clear cell carcinoma肾透明细胞癌;
KIRP, kidney renal papillary cell carcinoma肾乳头状细胞癌;
LGG, low grade glioma低级别胶质瘤;
LIHC, liver hepatocellular carcinoma肝癌;
LUAD, lung adenocarcinoma肺腺癌;
LUSC, lung squamous cell carcinoma肺鳞状细胞癌;
MESO, mesothelioma间皮细胞瘤;
PCPG, pheochromocytoma and paraganglioma嗜铬细胞瘤和副神经节瘤;
PRAD, prostate adenocarcinoma前列腺癌;
SKCM, skin cutaneous melanoma皮肤黑色素瘤;
STAD, stomach adenocarcinoma胃腺癌;
TGCT, testicular germ cell tumors睾丸肿瘤;
THCA, thyroid carcinoma; 甲状腺癌
UCEC, uterine corpus endometrial carcinoma子宫内膜癌.