scATAC:人类基因组的染色质可及性图谱
scATAC:人类基因组的染色质可及性图谱-1
scATAC:人类基因组的染色质可及性图谱-2
scATAC:人类基因组的染色质可及性图谱-3
scATAC:人类基因组的染色质可及性图谱-4
scATAC:人类基因组的染色质可及性图谱-5
results7:Systematic interpretation of molecular functions for noncoding risk variants
对非编码风险变异的分子功能进行系统的解释
根据上述分析,许多在 cCRE 中富集的非编码遗传变异被假设为通过破坏 TF 与顺式调节元件的结合来改变疾病相关基因的表达。为了系统地解释与复杂性状相关的特定遗传变异的分子机制,我们首先应用activity-by- contact (ABC) 模型将 111 种成体细胞类型中鉴定的 cCRE 与其使用我们之前发布的启动子的目标基因从 15 个成人人体组织中捕获 Hi-C 数据。该分析揭示了跨 111 种成体细胞类型的 5,723,307 个unique的远端 cCRE 与基因的联系,中位数为 726,514 个total linkages和 6,804 个细胞类型特异性linkages(图 S8)。其次,我们使用贝叶斯精细映射确定了来自 48 个 GWAS 的变异与疾病或性状关联(关联的后验概率 [PPA])相关的概率。我们将可能的因果变异定义为 PPA > 0.1 的变异,并发现它们比 PPA 低的变异更可能存在于 cCRE 中(图 S8A)。
总体而言,我们检测到 3,096 个可能的因果变异存在于 111 种成人细胞类型中的 cCRE 中(图 7A 和 7B;表 S5),其中 2,096 个通过 ABC 模型与推定的靶基因相关(图 7A;表 S5)。第三,我们将我们最近开发的 deltaSVM 模型应用于 94 个 TF,以识别可能破坏这些调节子结合的变体。该分析揭示了 527 个 TF 结合位点预计会被可能的因果变异显着改变(图 7A;
表 S5)。这些列表的交集优先考虑了 361 种可能的因果变异,这些变异 (1) 存在于人类细胞类型 cCRE 中,(2) 显着改变了 TF 结合,以及 (3) 与一个或多个靶基因相关(图 7A 和 7B;表 S5 )。
例如,溃疡性结肠炎 (rs16940186) 的一个可能的致病变异存在于基因间 cCRE 中,仅限于胃肠道上皮细胞,特别是结肠上皮细胞、肠上皮细胞和杯状细胞(图 7C)。预测含有 rs16940186 的 cCRE 会接触 IRF8 的 TSS(ABC 评分 > 0.015),该 TSS 编码参与调节免疫细胞成熟和调节胃上皮细胞中先天免疫的 TF。 rs16940186 风险等位基因是与人结肠组织中 IRF8 表达增加相关的 eQTL,与这些发现一致,deltaSVM 模型预测该风险等位基因会为激活 TF 的 ETS 家族创建一个结合位点(图 7C),其表达于肠上皮细胞,并已被建议调节肠上皮成熟。骨关节炎的另一种优先可能的因果风险变体(rs75621460)位于主要在免疫细胞类型中可访问的 cCRE 中,预计靶向免疫抑制细胞因子基因 TGFB1,并破坏锌指 TF ERG1 的结合位点(图 7D )。