生信小课堂
背景:长链非编码RNA相关免疫基因( lrRIGs )在肺腺癌( LUAD )的发生发展中起着至关重要的作用。然而,基于lrRIGs的可靠预后特征尚未确定。
方法:作者使用TCGA 数据库筛选了与LUAD预后相关的lrRIGs,然后通过生物信息学方法建立了一个由9个预后基因构成的标签。基于该基因标签的风险评分被用于将LUAD患者分为低风险和高风险组。后者被证实具有明显更差的总生存期( O.S. )。使用风险评分和其他独立预后因素开发了诺姆图,在预测LUAD患者的OS率方面表现出优异的性能。
结果:作者观察到不同免疫细胞亚型的浸润以及对免疫治疗和化疗的反应在低危组和高危组之间存在显著差异。
结论:总的来说,基于该基因特征的分层可以用于指导LUAD患者更好的治疗管理和改善预后。
****欢迎做类似的生信分析!****
研究结果
LUAD中基于lrRIGs的预后模型的开发
作者从TCGA数据库中下载了LUAD的转录组数据,包括54个正常样本和497个肿瘤样本。然后,根据Ensemble中的基因转移格式( GTF )文件对数据进行注释,使用R中的cor. test进行相关性分析,| correlation coefficient | > 0.4,P < 0.01,对lncRNA与2483个免疫相关基因进行共表达分析。共有889个被鉴定为lrRIGs,329个为差异表达的lrRIGs,其中123个下调,206个上调(图1a )。为了进一步探索329个lrRIGs在LUAD中的潜在预测价值,进行了单变量Cox回归分析。在风险比( Hazard Ratio,HR )≠1,P < 0.01时,从TCGA数据库中确定27个基因为LUAD患者发生OS的预后基因。接下来,使用具有十倍交叉验证的lasso回归,从最小偏似然偏差中获得最优lambda值,该值与27个与O.S (图1b , c)显著相关的预后基因中的15个相关。最后,作者将TCGA _ LUAD数据库作为训练集( n = 468),GSE31210数据库作为外部验证集( n = 226)。多因素Cox回归分析观察到9个基因构建了LUAD的显著预后特征:CD79A,INHA,SHC3,LIFR,TNFRSF11A,GPI,F2RL1,SEMA7A和WFDC2(图1d , e)。预后基因特征表示为risk Score = sum [基因表达量×系数]。
图 1 根据差异表达的lncRNA相关免疫基因识别预后风险基因并分析其表达情况
评估lrRIGs预后标签的性能
使用“survminer”R软件包根据IrRIGs预后特征计算TCGA_LUAD数据集中每个患者的风险评分。根据风险评分中位数将患者分为高风险组和低风险组。Kaplan-Meier分析表明,O.S.高风险组比低风险组更差(图1)。2a; P<0.05)。风险评分和存活状态的分布绘制在图1B中。2b,显示高风险患者的存活率较差。然后进行ROC曲线分析,评估lrRIGs特征的预测能力。在O.S的1年、3年和5年,lrRIGs风险特征的AUC分别为0.727、0.709和0.675(图2c)。最后,使用GSE31210数据库和由GSE11969、GSE13213、GSE41271、GSE42127、GSE50081、GSE68465和GSE72094组成的综合数据集对lrRIGs风险特征进行验证,其中包括1489例LUAD患者的生存数据。作者以上述方式对LUAD患者进行风险评分和风险分组。相同的,在低风险组比在高风险组(图2d,e,g,h; P< 0.05),生存分析观察到OS显著更长。此外,ROC曲线的分析证明该九基因标签在上述两个数据库中具有稳健的预测能力(图1B 2f,i)。
图 2 lrRIGs特征的预后性能。
预后标记基因的表达水平和预后价值的验证
作者对这九个预后标记基因进行了外部验证。GSE 31210和GSE 75037数据库分析表明,LUAD组织中INHA、TNFRSF 11 A、GPI、F2RL1、WFDC 2、CD 79 A和SEMA7A的mRNA表达水平显著高于正常肺组织(均P < 0.05)。而SHC3和LIFR在肿瘤组织中的表达水平较低。此外,通过蛋白质印迹分析,在30个匹配的临床LUAD组织(T)和邻近的非肿瘤组织(N)中进一步证实了这9个标签基因的蛋白质表达水平。此外,坐着基于人类蛋白质图谱( HPA )数据库的免疫组化数据进一步分析了预后特征基因的表达特征及其与肺腺癌的相关性。选择GPI基因进行后续的研究工作,因为GPI在9个风险基因中具有最高的HR值。结果显示,GPI在正常肺组织和癌旁组织中的表达水平相对较低,而在非小细胞肺癌( non-small cell lung cancer,NSCLC )组织和LUAD组织中有较高比例的高(非小细胞肺癌( NSCLC ) , 5 / 12 ; LUAD , 1 / 6)和中等( NSCLC , 6 / 12 ; LUAD , 4 / 6) GPI染色,主要定位于细胞质和细胞膜。随后,使用Kaplan - Meier绘图机分别通过Kaplan - Meier生存分析和log - rank检验评估这些特征基因对OS和无复发生存期( RFS )的预测作用。结果显示,INHA、GPI、F2RL1、CD79A和SEMA7A的高表达以及SHC3和LIFR的低表达与LUAD 的OS和RFS缩短有关。
lrRIGs标签与其他报道的基因标签的性能比较
为了进一步评估lrRIGs标签的预测性能,作者选择从Sun的[23]、Cao的[24]、Zhang的[25]和Li的[26]获得的四个公开的基因标签进行比较。根据这四个风险模型中对应的基因,在训练队列中使用相同的方法计算每个患者的风险评分。采用Kaplan-Meier生存分析和ROC曲线分析。作者观察到,在所有四种风险模型中,高风险组和低风险组的预后差异是显著的。然而,ROC分析显示,1年、3年和5年0.S.分别为0.727、0.709和0.675。这些AUC显著大于Sun、Cao、Zhang和Li的基因签名的AUC(图2c)。此外,作者基于lrRIG的风险模型具有最高的C指数,为0.68。此外,所有五个预后模型的RMS时间曲线进一步证明,该9-基因标签具有最大斜率,表明具有lrRIGs预后标志的LUAD存活的上级估计。
预后风险评分与临床结局相关
作者使用单变量和多变量考克斯回归分析临床参数、风险评分和OS之间的关系。(图3a、B)。结果显示,风险评分是一个独立的风险因素,风险比(HR)为1.341。 分期(HR = 1.486)和复发(HR = 1.901)显示了相似的结果。年龄和性别差异无统计学意义。
为了提高预测模型在LUAD中的准确性和可靠性作者整合了分期、复发和风险评分来建立列线图模型。表明风险评分对生存率的预测影响最大(图3c )。预测LUAD 1年、3年和5年OS的诺姆图校准图显示实际观察和诺姆图预测之间具有极好的一致性(图3d ),诺姆图模型的C指数为0.742 ( 95 % CI = 0.701 ~ 0.784 , P = 2.93e-30)。此外,诺姆图预测1、3和5年OS的AUC值大于分期、风险评分和复发,表明坐着的列线图是预测LUAD患者临床结局的重要因素(图3e - g )。
图 3 指示变量与LUAD患者预后的相关性
风险模型与肿瘤浸润免疫细胞的关联
为了研究免疫细胞特征与lrRIGs风险模型之间的关系,首先基于ESTIMATE算法计算来自TCGA_LUAD数据库的每个LUAD样本的ESTIMATE评分和免疫评分。结果显示,ESTIMATE评分(1927.23 vs. 1404.48,P < 0.05)和免疫评分(1642.43 vs. 1323.45,P <0.05),低危组较高危组显著增高(图4a、B)。接下来,作者使用通过估计RNA转录物的相对子集的细胞类型鉴定(CIBERS0RT)方法分析了每个LUAD样品中22个肿瘤浸润免疫细胞的相对比例。作者观察到高风险组和低风险组之间免疫细胞浸润的显著差异。特别地,高风险组的特征在于相对高比例的T细胞CD 4记忆激活、NK细胞静息和巨噬细胞MO,而低风险组显示相对高比例的浆细胞、T4细胞CD 4记忆静息和肥大细胞静息(图4c; P < 0.05)。随后作者使用微环境细胞群体计数(MCP-计数器)算法进一步评估了八种免疫相关细胞和两种基质细胞的丰度。与高风险组相比,低风险组中内皮细胞、中性粒细胞、髓样树突状细胞、B系、CD 8 T细胞和T细胞的丰度显著增加(图14d; P <0.05)。
图 4 由9-基因标签定义的高风险和低风险组之间的免疫微环境的比较。
风险模型与免疫疗法的关联
一些LUAD患者通过免疫治疗,特别是免疫检查点抑制剂获得了巨大的临床效益。然而,选择对免疫疗法有反应的患者仍然是一个挑战。目前,免疫检查点蛋白表达水平[27,28]、I类人类白细胞抗原(HLA)家族成员和TMB等生物标志物已显示出预测免疫治疗反应的潜力。因此,作者首先检查了免疫检查点在高风险组和低风险组之间是否有差异表达。如图5a所示,与高危组相比,低风险组IDO1、CTLA-4、LAG3、CD47、CD160、CD244、BTLA、TIGIT、ICOS的表达水平显著升高。相反,高危组CD276、ARHGEF5的表达水平较高。接下来,从TCGA数据库中下载562例LUAD患者的单核苷酸突变数据,并使用maftools包进行处理。结果显示高危组TMB显著高于低危组(7.57 vs. 5.99, P = 4.9e-4)(图5b)。
接下来,作者进一步研究了I类人白细胞抗原(HLA)家族成员的表达,因为HLA通过在细胞表面上呈递细胞内肽来负责新抗原呈递和溶细胞T细胞活性。缺乏HLA可能会损害细胞呈递新抗原的能力并导致免疫耐受。结果表明,各种HLA家族成员的表达在两个风险组之间显著不同(图5c; P < 0.05)。事实上,大多数HLA家族成员,包括HLA-J、HLA-E、HLA-DRB 6、HLA-DRB 5、HLA-DRB 1、HLA-DRA、HLADQB 1、HLA-DQB 2、HLA-DQA 1、HLA-DQA 2、HLA-DPB 1、HLA-DPB 2、HLA-DPA 1、HLA-DOA、HLA-DOB、HLA-DMA和HLA-DMB,相对于低风险组中的表达,在高风险组中显示降低的表达。另外,癌症免疫组图谱(TCIA)是基于TCGA提供全面免疫基因组学分析的数据库。在此,作者使用TCIA数据库通过免疫表型评分(IPS)评估具有不同风险评分的LUAD患者的免疫治疗应答。结果显示,低风险组中的总IPS和CTLA-4阻断剂的IPS显著高于高风险组中的IPS(图5d,e),其强烈预测具有较低风险评分的LUAD患者将具有更好的免疫疗法应答,尤其是对于CTLA-4阻断剂。相比之下,PDl pus CTLA-4阻断剂和PDl阻断剂的IPS在风险组之间没有显著差异(图5f,g)。
最后,作者尝试通过沉默与风险模型中的风险评分正相关的关键基因来验证生物信息学分析的上述结果。鉴于GPI具有图。S1I和S4E)。用shRNA沉默了CMT167细胞中的mGPI基因,并获得了稳定的细胞系。接下来研究GPI沉默是否可以影响由免疫检查点阻断产生的抗肿瘤作用。体内实验结果显示CMT167肿瘤可对抗CTLA-4抗体单一疗法产生应答。有趣的是,在CMT167细胞中由sh3mGPI介导的mGPI敲低使得细胞系在CMT167/sh3mGPI皮下肿瘤模型中对抗CTLA-4抗体[肿瘤抑制率(%)= 93.3%]比对照CMT167/shNC细胞[肿瘤抑制率(%)= 80.7%]更敏感(n= 5/组)。与抗CTLA-4治疗相比,mGPI敲减与抗CTLA-4治疗的组合显著降低肿瘤重量并抑制肿瘤生长中。在实验期间未观察到可辨别的不良事件。这些数据表明,风险基因的表达与免疫检查点阻断的功效相关。
图 5 免疫检查点、HLA和错配修复基因表达和TMB的分析。
LUAD危险模型与化疗反应的关系
鉴于化疗是临床中肿瘤治疗的关键手段之一,作者通过使用R包pRRophetic计算IC50来探索风险评分与对化疗药物的临床反应之间的关系。基于癌症基因组计划(CGP)数据库,筛选了7种化疗药物(顺铂、多西他赛、多柔比星、吉西他滨、依托泊苷、紫杉醇和阿糖胞苷)和2种靶向药物(阿昔替尼和吉非替尼),这些药物均已用于肺腺癌的临床治疗。作者观察到高风险组和低风险组的药物反应不同。在肺癌化疗药物中,多柔比星、紫杉醇、吉西他滨、依托泊苷和多西他赛在高危组具有较高的药物反应。对于肺癌的靶向药物,阿西替尼在低危组中具有良好的反应(图 6)。根据多变量Cox分析,预后风险基因中TNFRSF11A和GPI具有高风险系数,表明其表达显著影响LUAD患者的风险评分。因此,作者选择使用shRNA沉默H1299和A549细胞中的TNFRSF11A或GPI基因,以探索这些基因的表达是否影响肿瘤细胞对常用化疗药物的敏感性,如多柔比星(sc-280681 A,SANTA)和多西他赛(HY-B 0011,MCE)。用各种浓度的多柔比星(0.1、1、2.5、5、10和20 μ Μ)或多西他赛(0.1、1、10、20、50和100 μΜ)处理肿瘤细胞24小时,并在GraphPad Prism 6程序中计算抑制浓度50(IC50)值。体外实验表明,与对照A549/shNC(IC 50分别为1.531 μM,4.605 μM)和H1299/shNC(IC 50分别为2.252 μM,8.042 μM)相比,sh1GPI在A549和H1299细胞中敲低GPI使两种细胞系对多柔比星(IC 50分别为4.548 μM,8.549 μM)和多西他赛(IC 50分别为24.85 μM,30.81μM)的敏感性降低。
图 6 在TCGA数据库中预测不同风险人群中患者对靶向治疗和标准化疗的反应。
预后标志基因GPI影响LUAD患者的预后,其机制与mTORC1信号通路的激活有关
为了更深入地了解LUAD预后风险基因的潜在机制,基于TCGA _ LUAD、GSE31210、GES68465和GSE13213数据库,通过比较这些标志性基因的高表达和低表达来进行GSEA。GPI是9个预后风险基因之一;它对LUAD的OS和RFS的影响最为显著。先前的研究报道,GPI与TCGA _ LUAD、GSE31210、GES68465和GSE13213数据库的不良结果相关。GPI是9个预后风险基因之一;它对LUAD的OS和RFS的影响最为显著;GPI与LUAD、结直肠癌、肾癌、乳腺癌、子宫内膜癌的不良转移有关。然而,GPI对LUAD恶性生物学行为及下游信号转导的影响尚不清楚。因此,我们选择GPI作为进一步研究的对象。结果表明,在TCGA_LUAD、GSE31210、GES68465和GSE13213数据库中,几个参与mTORC1信号转导的重要调控基因在GPI高表达的细胞中持续富集。提示在LUAD患者中GPI表达与mTORC1信号通路呈正相关(图7a-d)。
随后,作者进行Western blot分析,检测GPI在A549、H1299、H1373、H1573和BEAS- 2B细胞系中的表达水平。与正常肺组织和BEAS-2B细胞系相比,GPI在A549和H1299细胞中明显过表达(图7e)。通过慢病毒转染靶向GPI的shRNA在A549和H1299细胞中进行内源性GPI沉默。通过菌落形成实验(图7f, g)和创面愈合实验(图7h, i),作者观察到,与对照组相比,GPI基因下调显著抑制了两种细胞系的增殖和迁移。此外,体内肺转移实验显示,与模拟对照组相比,A549/sh1GPI小鼠出现的肺转移结节更少(图7j)。此外,Western blot分析显示,GPI的下调导致了p-mTOR、p-P70S6K和p-S6的降低,它们是mTORC1信号通路的关键下游分子(图7k)。既往研究报道该通路的激活与多种肿瘤的恶性转化及肿瘤细胞的增殖转移密切相关。因此,作者进一步检测了与上皮-间充质转化(EMT)相关的关键蛋白的表达。我们观察到,在A549和H1299细胞中,GPI沉默显著降低了N-cadherin和Vimentin蛋白的表达,增加了E-cadherin和γ-catenin的水平(图7k)。这些结果提示GPI对肺腺癌细胞多种生物学特性的调控可能与mTORC1信号通路的激活有关。
图 7 探讨预后标志基因GPI影响LUAD患者预后的可能机制。
结论
本研究通过GSEA分析发现GPI的高表达与mTORC 1通路的激活密切相关。在A549和H1299细胞中,GPI敲低导致mTOR、P70 S6 K和S6的磷酸化减少,E-钙粘蛋白的表达增加,N-钙粘蛋白的表达减少。我们推测mTORC 1信号通路的激活可能是GPI过表达肿瘤进展的关键过程。当然,这项研究有一些局限性。我们的研究主要基于公共数据库和有限的LUAD临床组织标本。需要使用大规模、前瞻性和多中心临床试验进行额外的研究,以验证这种九基因签名的稳健性和可重复性。