一、多重线性回归分析简介
简单线性回归分析:自变量X =1 个
多重线性回归分析:自变量X >=2 个
多元线性回归分析:因变量Y >=2 个
多重线性回归模型:
Y=a+b1X1+b2X2+b3X3+b4X4+...+bnXn+E
Y:因变量
a:常数项,也就是截距
bn:第n个偏回归系数
Xn:第n个自变量
E:随机误差
同样使用最小二乘法
二、多重线性回归分析的实践
例子:研究“广告费用”“客流量”两个变量对销售额的影响。
第一步:根据预测目标,确定自变量和因变量
自变量:广告费用、客流量
因变量:销售额
第二步:绘制散点图,确定回归模型类型
展示3个变量两两之间的是否存在线性关系,用“矩阵散点图”
“广告费用”和“客流量”两个变量分别对“销售额”都存在明显的线性相关关系
且我们发现“广告费用”和“客流量”之间也存在一定的线性关系。
第三步:估计模型参数,建立线性回归模型
【统计】
估算值:估计出回归系数
模型拟合:输出调整后的R方,判定模型拟合度
【选项】
勾选“在方程中包括常量”:输出常数项,即截距a
输入:强制将所选择的变量纳入至回归模型
步进:将变量逐个引入模型中并进行统计显著性检验,显著就留下,不显著就剔除,直到没有可以剔除的不显著变量为止。
除去:根据设定条件,直接剔除一部分变量
后退:根据设定条件,每次剔除一个变量,直到不能剔除为止
前进:根据设定条件,每次纳入一个自变量,直到无法继续纳入
最常用的是“输入”和“步进”两种
第四步:对回归模型进行检验
这个表说的是:
自变量为“广告费用”和“客流量”
因变量为销售额
采用的方法是“输入”
因为是“输入”方法,强制将所有选择的变量纳入模型中,所以就没有剔除的变量。
多重线性回归模型的拟合效果主要看调整后的R方,主要用于衡量在多重线性回归模型建立过程中加入其他自变量后模型拟合效果的变化。
本例R方是0.691,也就是说“广告费用”和“客流量”两个变量合起来能解释“销售额“模型变化的69.1%。
显著性为0<0.01,因此“广告费用”“客流量”和“销售额”建立起来的线性关系具有极其显著的统计学意义。
Y=373.767+2.985X1+24.103X2
标准化系数:用来测量自变量对因变量的重要性。
本例中“广告费用”“客流量”的标准化系数分别是0.161和0.734,所以“客流量”对销售额的影响要大于“广告费用”对销售额的影响。
显著性P:偏回归系数b是否具有显著性。
b1的P是0.186,因此回归系数b1具有显著的统计学意义。
b2的p的0,因此回归系数b2极其显著的统计学意义.
第五步:利用回归模型进行预测
数据少时手动
数据多时,勾选【保存】--预测值未标准化,生成PRE-1变量自动计算结果。