定义
通过对数据误差来源的分析判断不同总体的均值是否相等。分析中使用的是误差的方差,因此称为方差分析。
方差分析的基本假定
1每个总体都应服从正态分布
2各个总体的方差必须相同
3观察值独立
方差分析误差
系统误差:因素的不同水平(总体)之间观察值的差异。(若各个水平间没有差异,均值相同,则这种差异是由于随机误差引起的,即样本抽取的随机性引起的误差。若各个水平间有差异,即为不同的总体,均值不相同,则是由不同总体引起的系统误差。ps:这种情况下的误差也包含随机误差,因为随机误差是不可避免的。)
随机误差:因素同一水平(总体)之间观察值的差异。(各个水平下抽取样本值时的随机性引起的误差)
数据的误差用平方和表示,若只用误差计算,误差和为0,无法计算。
组间误差:若各个水平间没有差异,均值相同,则这种差异是由于随机误差引起的,即样本抽取的随机性引起的误差。若各个水平间有差异,即为不同的总体,均值不相同,则是由不同总体引起的系统误差。ps:这种情况下的误差也包含随机误差,因为随机误差是不可避免的。
组内误差:随机误差
方差分析
F = 组间均方 / 组内均方 = (系统误差+随机误差)/ (随机误差)
若系统误差误差为0,则F为1,所有的误差均是由随机误差引起的。即不同水平来自同一总体,不同水平间没有显著差异。
原假设:K个水平的均值完全相同。
备择假设:K个水平的均值不全相等。
【注意】拒绝原假设只表明至少有两个水平的均值是不相等的。
单因素方差分析步骤
1 提出假设
2 构造检验统计量:
F = MSA/MSE -- F(k-1,n-k)
需要计算的统计量:每个水平的均值,全部观察值的平均值,误差平方和(SSA,SSE),均方(MSA,MSE)。
【注意】均方差:各个误差平方和除去自由度,将误差平方和进行平均,从而消除观察值个数不同所带来的影响,所以选择用均方差MSA,MSE。
3 统计决策
4多重比较,T-test