文章信息
标题:Defining inflammatory cell states in rheumatoid arthritis joint synovial tissues by integrating single-cell transcriptomics and mass cytometry
期刊:NATURE IMMUNOLOGY
影响因子:23.53
日期:06 May 2019
通讯作者介绍
担任数据科学中心(BWH,HMS)的主任,并被任命为Broad Institute的准会员。此外,他还活跃于临床,并在布莱根妇女医院关节炎中心看病人。在斯坦福大学获得医学博士学位之后,Raychaudhuri继续从事内科临床培训,然后在布莱根妇女医院接受了风湿病专科培训。他同时与Mark Daly博士一起在Broad研究所完成了人类遗传学的博士后培训。自2010年加入哈佛医学院以来,他为了解类风湿关节炎和其他免疫介导的疾病的遗传基础做出了贡献。他还一直在设计统计和计算方法的最前沿,以将遗传关联信号定位到因果变体,并在功能信息的背景下解释人类遗传数据。他目前在结核病,I型糖尿病和类风湿性关节炎的人类遗传学和功能基因组学方面拥有活跃的研究计划,尤其专注于使用基因组策略来了解CD4 + T细胞生物学。
研究背景
类风湿性关节炎(RA)是一种自身免疫性疾病,在关节组织的滑膜中具有慢性炎症。这种炎症导致关节破坏,影响正常关节功能。但目前对关节滑膜组织中细胞类群状态还是不够明确的,利用单细胞测序技术可以在炎症组织中寻找关键细胞亚群及其活化状态这将为定义RA新治疗靶标提供必要的数据理论支持。之前的研究已经发现CD4 + T细胞,B细胞,单核细胞和成纤维细胞已确定与RA发病机理相关。
样本及测序简介
样本来源:滑膜组织,作者招募了36名RA患者,15名OA患者,并从超声引导下的活检中或关节置换获得滑膜组织.
实验手段包括质谱流式、Bulk RNA-seq、scRNA-seq
Bulk RNA-seq
1.对流式分选的细胞(T cells, B cells, monocytes, and synovial fibroblasts)进行转录组测序;工具:Illumina MiSeq ; 比对:Ensembl version 83 transcripts;
2.QC:(1)定义共同基因为在
95%
的样品有至少一条reads支持;(2)共同基因占比少于99%
的样本定义为低质量样本在后续分析中将被剔除;3.共获得
167
个高质量样本,包括45
fibroblast samples, 46
monocyte samples, 47
T cell samples, and 29
B cell samples;scRNA-seq
1.方法:CEL-Seq2; 工具:HiSeq 2500;Reads 通过STAR2.5.2b比对到
hg19
;2.QC:作者发现由少量reads表示的分子更可能是来自其他细胞的污染物分子,所以开发了一种简单的算法来设置每分子最小读数的阈值。We used
2
marker genes expected to be exclusively expressed in each of the four cell types: PDGFRA and ISLR
for fibroblasts, CD2 and CD3D
for T cells, CD79A and RALGPS2
for B cells, and CD14 and C1QA
for monocytes. 然后计算这些基因在该表达的细胞类型中的高于阈值的表达定义为真阳性,在不该表达的细胞类型中的高于阈值的表达定义为假阳性。遍历表达阈值分别为1-20
之间的数值,选取能够最大化真阳性/假阳性比值的值为最终阈值。然后作者进行以下条件的筛选:(1)细胞检测到的genes数>1000
;(2)线粒体相关基因的表达占比少于25%
;结合质谱流式,scRNA数据
1.作者收集6个富含白细胞、9个白细胞缺乏的RA和11个OA样品用于质谱流式分析;
2.双门控通道选定活细胞:B细胞(CD45 + CD3-CD14-CD19 +),成纤维细胞(CD45-PDPN +),单核细胞(CD45 + CD3-CD14 +)和T细胞(CD45 + CD3 + CD14-);
3.作者基于CCA分析整合转录组数据和单细胞数据,开发一种基于图的无偏聚类pipeline对单个细胞进行分析;
下游数据分析策略
(1)细胞分群及数据整合;作者利用流式对细胞进行分群后,以bulk RNA-seq作为reference point,利用CCA找到大量RNA-seq样品和scRNA-seq细胞的线性组合,以创建最大相关的基因表达谱。作者使用来自scRNA-seq的最佳标记基因与CCA结果关联,以建立每个scRNA-seq簇与每个质量细胞计数簇之间的关系;
(2)流式定义一部分RA滑膜组织中富含白细胞;组织免疫细胞浸润的变化反映了源关节中的局部疾病活动。作者计算了其它样本与OA的马氏距离(感谢微信公众号生信宝典对马氏距离的解释:马氏距离 (Mahalanobis distance)是由印度统计学家马哈拉诺比斯 (P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是,它考虑到各种特性之间的联系,并且是尺度无关的(scale-invariant),即独立于测量尺度。),引入最大OA距离作为滑膜中富含白细胞的阈值(> 4.5);为了验证炎症分类的有效性,作者评估了组织学的炎症状态,并且通过Krenn inflammation score (一种炎症评价指标) 对切片上的炎症状态进行评估;
(3)单细胞分析揭示不同细胞亚型;在5,265个细胞中发现1,142 B cells, 1,844 fibroblasts, 750 monocytes and 1529 T cells (作者在这里说明传统基于PCA的分类batch effect较为明显,所以作者采用CCA-based clustering), 作者共分出来18 cell clusters; 成纤维细胞中,鉴定了四个亚群:CD34 +亚细胞成纤维细胞,HLA-DRAhi成纤维细胞,DKK3 +成纤维细胞和CD55 +lining成纤维细胞; 在单核细胞中, 作者鉴定了IL1B +促炎单核细胞,NUPR1 +单核细胞,C1QA +单核细胞和干扰素(IFN)活化的单核细胞;在T细胞中,鉴定了三个CD4 +簇:CCR7 + T细胞,FOXP3 +调节性T细胞(Treg细胞)和PDCD1 + TPH和TFH细胞;三个CD8 +簇:GZMK + T细胞,GNLY + GZMB +细胞毒性淋巴细胞(CTL)和GZMK + GZMB + T细胞。在B细胞内,鉴定了四个细胞簇,包括幼稚IGHD + CD27-和IGHG3 + CD27 +记忆B细胞,具有高表达ITGAX(也称为CD11c)的自身免疫相关B细胞(ABC)簇和具有高免疫球蛋白基因表达和XBP1的浆母细胞簇;(作者的细胞分型是比较符合免疫分型的,大家也可以采用以上marker对免疫细胞进行亚分型,不建议完全参照某一篇文章定义所有细胞分型)
(4)由细胞因子激活和MHC II表达定义不同的滑膜成纤维细胞;在Bulk seq中,与OA相比,leukocyte-rich RA中HLA-DRAhi细胞 HLA,IL6的表达情况更为明显,且在GO富集中,与MHC classII提呈和干扰素信号通路有关;然后作者通过scRNA seq 验证了该观点。
(5)激活状态定义了滑膜单核细胞的异质性;在来自患有白细胞丰富的RA和OA的个体的大量RNA-seq单核细胞样品中,作者发现与IL1B +单核细胞相关的基因,包括NR4A2,HBEGF,PLAUR和IFN激活的基因IFITM3显着在富含白细胞的RA样品中上调。相反,与富含白细胞的RA相比,与NUPR1 +单核细胞(SC-M2)相关的标记基因下调。作者取每个单核细胞scRNA-seq子集的top标记基因(AUC> 0.7),并在bulk seq中测试gene在RA与OA RNA-seq数据中的差异表达。
作者发现富含白细胞的RA滑膜与OA相比具有更大的IL1B +单核细胞和IFN激活的单细胞丰度,但更低NUPR1 +单核细胞的丰度。这些数据表明细胞因子激活驱动活动性RA滑膜中独特单核细胞群的扩增。利用基因组富集分析(GSEA),作者测试了MSigDB(分子特征数据库)免疫基因组,发现IL1B +单核细胞(SC-M1)脂多糖反应相关基因的表达水平相对较高;(一句话,单核细胞异质性较强)
(6)滑膜CD4和CD8T细胞的异质性;作者在scRNA-seq数据中发现了三个CD4 +和三个CD8 + T细胞亚群(其实作者分出的亚群CD4比较好分,CD8多为exhausted T cell耗竭性基因的表达)鉴定了三个CD4+簇:CCR7 + T细胞,FOXP3 +调节性T细胞(Treg细胞)和PDCD1 + TPH和TFH细胞; 三个CD8 +簇:GZMK + T细胞,GNLY + GZMB +细胞毒性淋巴细胞(CTL)和GZMK + GZMB + T细胞。与OA相比,CXCL13在富含白细胞的OA的TPH细胞中上调表达; 作者通过质谱流式,鉴定出9个T cell clusters, 并通过结合bulk seq发现CXCL13, TIGIT and CTLA4在CD4+PD-1ICOS+cluster中富集;
(7)通过单细胞RNA-seq发现在RA滑膜中自身免疫相关B细胞增加;细胞分型为幼稚B细胞(SC-B1),记忆B细胞(SC-B2),ITGAX + ABC细胞(SC-B3)和浆母细胞(SC-B4);SC-B3细胞表达高水平的ITGAX和TBX21(T-bet),它们是自身免疫相关B细胞的标志物,AICDA的高表达与最近报道的来自系统性红斑狼疮(SLE)样品的外周血的CD11c + B细胞的转录组学分析一致。干扰素刺激的基因(GBP1和ISG15)也在ABCs(SC-B3)中表达并在富含白细胞的RA中上调。质谱流式分型划分10个细胞clusters,进一步分型发现CD11c +细胞内的三个亚组:IgM-IgD-HLA-DR ++ CD20 + CD11c +,CD38 + HLA-DR ++ CD20-CD11c +和IgM + IgD + CD11c +。
(8)通过单细胞分析揭示炎症途径和效应模块; 为了确定与富含白细胞的RA相关的途径,作者使用GO分析鉴定了I型干扰素反应和炎症反应(单核细胞和成纤维细胞),Fc受体信号传导(单核细胞),NF-κB信号传导 (成纤维细胞)和干扰素γ(T细胞)。富含白细胞的RA样本在成纤维细胞和单核细胞中具有显着更高的基因表达:炎症反应基因(PTGS2,PTGER3和ICAM1),干扰素应答基因(IFIT2,RSAD2,STAT1和XAF1),以及趋化因子或细胞因子基因(CCL2和CXCL9),与干扰素激活的协同趋化反应一致。 T细胞具有干扰素调节因子(IRF)的上调,包括IRF7和IRF9,并且单核细胞具有IRF7,IRF8和IRF9的上调。Toll样受体信号通路富含白细胞丰富的RA组织中的B细胞和单核细胞。
在单细胞水平,TLR10仅由活化的B细胞表达,表明TLR10在B细胞谱系中具有功能性作用。相反,TLR8在所有RA单核细胞亚群中升高。造血细胞特异性转录因子IRF8在显着部分的单核细胞和B细胞中表达,其协同调节RA滑膜中单核细胞和活化B细胞的分化。 SLAMF7由促炎单核细胞(SC-M1),IFN激活的单核细胞(SC-M4),CD8 + T细胞和浆母细胞(SC-B4)高度表达。
临床意义及借鉴点
(1)该篇文章强调可以将sublining fibroblast作为治疗RA的潜在靶点;(a major source of proinflammatory cytokines)
(2)第一次在富含白细胞的RA中发现自身免疫相关性B细胞;
(3)多维度的数据进行整合分析,开发基于CCA算法的流程,对每个细胞分群更为详细。
(4)对其他免疫系统疾病可以采取类似的实验设计方案,本篇文章具有重要借鉴意义。
(5)代码工具:https://github.com/immunogenomics/amp_phase1_ ra