定义
Cox 回归模型(Cox Proportional Hazards Model)是一种用于生存分析的统计方法,主要用于评估多个协变量(自变量)对生存时间(或时间到事件)的影响。它特别适合处理时间到事件数据的情况
风险(hazard):通常指的是某个事件发生的可能性,尤其是指在某个特定时间,个体经历该事件(如死亡、疾病复发等)的概率
Cox 模型通过以下形式描述风险:
数据
Cox 回归的数据通常包括:
生存时间:事件发生的时间或观察时间。
状态指示:一个二元变量,表示事件是否发生(例如,0 表示删失,1 表示事件发生)。
协变量:与生存时间相关的一个或多个自变量(定量或定性)。
例如:
优化目标
- 使用部分似然函数进行参数估计,目标是最大化部分似然函数
其中 R(ti) 是在时间 ti仍在风险中的个体。
部分似然函数只关注事件发生的个体和其相对风险。
这个函数最大化的逻辑是使得观察到的事件在给定参数下的可能性最大,从而得到最佳参数估计。
进一步理解
最大化部分似然函数的原因是,它提供了一种方法来估计模型参数,使得模型对观察到的生存数据的解释能力最强。通过最大化部分似然函数,我们可以找到最佳的参数估计,使得预测的风险与实际观察到的事件发生情况相一致。这种方法有效且计算方便,尤其适用于右删失数据的生存分析。
似然函数:给定一个统计模型和一些观察到的数据,似然函数可以用于评估不同参数值的适用性。通常被写作 L(θ∣x),其中 θ 是模型参数,x 是观察到的数据。
模型求解
使用梯度下降法等优化方法求解模型参数