原文链接:
Tian D, Zhang R, Zhang Y, Zhu X, Ma J. MOCHI enables discovery of heterogeneous interactome modules in 3D nucleome. Genome Res. 2020 Feb;30(2):227-238. doi: 10.1101/gr.250316.119. Epub 2020 Jan 6. PMID: 31907193; PMCID: PMC7050518.
文章概要
作者在本文中提出了一个新概念: heterogeneous interactome modules (HIM)
每个HIM中包含一系列的基因位点,这些基因同时满足:
(1)在空间中接近
(2)受同一组转录因子调控
本文主要工作:
- 开发了MOCHI算法,在5种细胞系中识别HIM(Fig. 1)
- 描绘了HIM的特征:HIM中的基因分布更靠近nuclear speckle(Fig. 2)
- 证明了HIM具有重要的生物学意义:富集重要基因、super-enhancer和PPI(Fig. 3)
- HIM在不同细胞类型中具有共性也具有特异性(Fig.4, 5)
文章梳理
文章背景
要解决的问题:借助三维组学数据,构建基因调控网络
2016 Bensen et al.[1] 提出了基于motif的clustering方法
MOCHI 算法思想
- 构造 network G
- Vertex:每个vertex代表一个TF或gene loci
- Edge: network中存在两类edge
- TF - gene edge:表示TF和gene间存在调控关系(根据已发表的gene regulation network,考虑了① enhancer和promoter region的TF binding motif enrichment ② coexpression between TF and gene,没有使用TF ChIP-seq信息)
- Gene - gene edge:表示两个gene之间存在三维互作(具体而言,要求 O/E > 1 in Hi-C)
- 定义一种由 2 TF + 2 gene loci 组成的motif,要求motif同时满足:
① motif内的两个基因在空间中接近(即2个gene之间有边)
② 两个TF与两个基因间均存在调控关系(即motif内的TF和gene两两之间都存在边) (Fig. 1A) - 根据network G 构造 network GM
- Vertex: V(GM) = V(G)
- Edge:定义邻接矩阵 wi,j:网络G中同时包含i, j的motif的个数
- 对GM 进行recursive bipartition,得到一系列cluster,每个cluster对应一个HIM
文章主要实验内容
- 在5种细胞(GM12878, HeLa, HUVEC, K562, and NHEK)中识别HIM
- 概括HIM特点
- 比较不同细胞HIM间的异同
结果梳理
1. 介绍什么是HIM
作者首先展示了几个具体的HIM的例子(Fig. 1F-H)。
接下来作者概括了每种细胞中的HIM的基本特征(Supplementary S1-S2),包括:
1) # of HIM per cel
2) % of HIM sharing TF with others
3) # of genes and TF per HIM
证明HIM的概念
使用正交数据(TF ChIP-seq)证明了同一HIM的TF与gene存在调控关系
作者统计了基因TSS附近10kb内是否具有来自相同HIM的TF的ChIP-seq peak(缺乏control)
HIM的生物学意义
HIM与细胞定位的关联
通过与TSA-seq数据联合分析,作者指出位于HIM的基因多分布在细胞核中的分布具有偏向性,多数更靠近nuclear speckle而原理lamina(Fig.2)gene 功能
通过多组学联合分析,作者指出HIM内富集每种细胞的essential gene:
(1)通过与RNA-seq数据联合分析发现:① 属于HIM的gene平均表达水平更高 ② 来自同一个HIM的基因表达水平有更高的一致性
(2)与2013 Hnisz et al. 发表的super-enhancer list整合发现:HIM内富集Super-enhancer(50kb around gene in HIM)
(3)与PPI网络联合分析:属于HIM的TF间富集PPI(依据PPI network density)
HIM在细胞间的保守性
作者从多角度对5种细胞系的HIM划分结果进行比较,包括:
(1)每个gene是否被划入HIM:~30%-40% genes 在全部5种细胞中都属于HIM,只有以少部分具有细胞类型特异性,细胞特异性的基因的GO功能富集结果与细胞类型相一致
(2)HIM的空间分布
(3)HIM之间的相似性
参考文献
[1] Benson AR, Gleich DF, Leskovec J. 2016. Higher-order organization of complex networks. Science 353: 163–166. doi:10.1126/science.aad9029