标题:Neutrophil-to-Lymphocyte Ratio Predicts Severe Illness Patients with 2019 Novel Coronavirus in the Early Stage
分析流程:
纳入患者→收集数据→数据处理
1.纳入患者
这是一项前瞻性单中心研究,在进行前已经过伦理审查和患者知情同意。按照4版诊断标准纳入61名在北京地坛医院诊断为新冠肺炎的患者。在纳入之初,并不知患者结局如何。
2.分析流程
记录患者流行病史、基线数据、症状体征、实验室和影像检查、合并症。按照4版诊断标准,将患者分为轻、中、重症。将研究终点定义为严重疾病(包括中度和重度)的发生(severe illness developed)。
3.数据处理(重点)
3.1LASSO回归筛选严重肺炎相关因素
将基线数据、症状体征、实验室和影像检查等26个变量纳入LASSO回归,结果显示当 partial likelihood deviance最小时,年龄、NLR和高血压 是严重肺炎的预测因素(predictive factors)。当λ值是一个标准差大小时(lambda 1se),NLR是最重要的predictive factor。
3.2多因素COX回归分析
在多因素Cox回归中,年龄和NLR被确定为与严重肺炎独立相关的因素。但是,年龄的HR接近于1。因此,研究团队尝试将年龄转换为2分类资料(<50岁和≥50岁)。在此基础上再次进行多因素COX回归分析,NLR被确定为与严重肺炎相关的变量。(学会这种转换变量的方式)
3.3预测模型的建立
基于NLR(1个指标),研究团队建立了Nomogram,预测患者7天和14天未发生严重肺炎的概率。
其C指数为0.807(95% 置信区间:0.676–0.938),校准曲线如下所示。这两个指标分别反映区分度和校准度。
DCA曲线和临床影响曲线也表明预测模型表现较好,这两者展示了superior standardized net benefit and influence on the outcome of patients。
3.4比较NLR和既往评分体系
随后,研究团队比较了以NLR为基础的预测模型与既往模型的区分度。通过AUC的比较,发现NLR的AUC高于MuLBSTA及CURB-65,而NLR与CURB-65联合预测价值高于NLR单独预测(AUC见下图)。
比较了区分度,校准度是否用比较?
3.5患者危险分层
根据年龄和NLR值,将患者分为4层,NLR的cutoff为3.13,年龄cutoff为50。分层后分别进行Kaplan–Meier分析,绘制曲线。(定义的终点为患者发展为严重肺炎(中重症),因此随访时间应该是截止到严重疾病发生时。)
在图c可以看到NLR<3.13且年龄<50岁这一层里,无患者发展为严重肺炎。
总结:
1.此处选用lasso回归筛选变量,自己做时应使用zzr的方法,综合比较lasso、岭回归、弹性网络和最佳子集这几种模型;或者采用statquest的方法用循环算出最佳λ值,不要直接选用lasso回归。
2.此文章里没有验证集。
3.构建与时间相关的终点事件叫半参数模型,采用cox回归模型。
4.DCA曲线和临床影响曲线是怎么做的?
DCA是用来评价模型区分度的,在9regression model.R里有代码,讲解可见zzr:决策曲线(Decision Curve Analysis)绘制