13、决定系数R2
既然用相关系数R了为什么还要有R2 ?
我们很难看出r=0.7和r=0.5的两倍一样好
但是我们很容易看出r2=1.4是r2=0.5的1.4倍
计算简单
计算
如图,计算老鼠重量的均值
计算差异值:var(mean)=sum(weight for mouse i - mean)2 平方使没有负值,正负不能抵消
把横坐标换成老鼠的大小,均值不变,var(mean)不变
问题:已知老鼠大小,用重量的均值是最好预测老鼠重量的方法吗?当然不是
我们可以根据数据拟合一条直线 ,这样只要知道老鼠的大小就可以预测重量。
那么,这个直线的预测的比均值更好吗?如果好,好多少?这时候就用r2 计算
首先,计算var(mean),然后计算var(line)
例子:
1、
大小和重量的关系占81%的变化
数据中81%的变化能由大小和重量的关系解释
2、两个不相关的数据
直线的变化比均值的变化少6%
总结:
r和r2 的关系
r2 比r更好用
r2 主要思想