基本原理
方差分析(Analysis Of Variance),记作ANOVA,实质上是采用数理统计的方法对所得结果进行分析,以鉴别各种因素对研究对象的某些特性值影响大小的一种有效方法。
方差分析的相关概念
相关概念 | 定义 |
---|---|
试验指标 | 研究对象的特性值,简称指标,常用y表示 |
因子 | 在试验中要通过改变状态加以考察的因素,常用A、B、C,…来表示 |
因子的水平 | 因子在试验中所取的不同状态,常用A₁,A₂,…,At等表示,r为因子A的水平 |
方差分析的基本思想(以单因素为例)
方差分析是基于变异分解的思想进行的,整个样本的变异可以看作:
其中,随机变量是永远存在的。
在方差分析中,代表变异大小并用来进行变异分解的指标就是离均差平方和,代表总的变异程度,记为SST 。组内变异用各组的离均差平方和之和来表示,记为SSw。组间变异大小可以用组间平方和表示,记为SSB( Sum of Squares Between Groups ╮( ̄▽ ̄")╭)。
单因子方差分析
单因子方差分析用来研究一个因子的不同水平是否对指标产生了显著影响。例如:研究不同种类的化肥对农作物的影响。
1. 基本假设
- 正态性
要求每个水平下的总体都服从正态分布。 - 方差齐性
要求每个水平下总体的方差σ²都相等 - 独立性
要求因子各水平下的总体相互独立
2. 模型建立
因子对指标是否有影响取决于指标的正态分布是否一致。如果有影响,则正态分布应该存在差异。而正态分布由均值和方差决定,假设中方差相同,因此各个水平下的正态分布均值直接决定因素是否对指标有影响。(摘自数理统计知识整理——回归分析与方差分析 )
所以,问题可以转化为假设检验,设:H₀:μ₁=μ₂=…=μr
则,H₀假设改写成:H₀: α₁=α₂=...=αr=0
3. 确定检验统计量
4. SPSS应用
步骤:分析->比较平均值->单因素ANOVA,选入需要分析的变量和因子,如图:
输出结果:
由上表可知,P=0.073>0.05,故不拒绝原假设,说明药物1对小白鼠激素水平不具有显著影响。
多因子方差分析
多因子分析用来研究两个或两个以上因素能否对指标产生显著影响,进而找到利于指标的最优组合。在多因子方差分析中,以双因子的方差分析最常用。例如:研究不同种类、不同量的化肥对农作物的影响;分析不同品牌和不同地区对一种商品销售量是否影响等……
多因子方差分析可分为无交互作用和有交互作用两种。
- 一个因子水平下的指标好坏及程度不受另一个因子不同水平的影响,则称两因子之间无交互作用,要分别判断每个因子对指标的影响。
- 一个因子水平下的指标好坏及程度与另一个因子取什么水平有关,则称两因子之间有交互作用,记作A×B。此时除了要分别考虑每个因子对指标的影响外,还要考虑两个因子的搭配对指标产生新的效应。
SPSS应用
1. 无交互作用多因子方差分析
步骤:分析->一般线性模型->单变量,将指标和影响因子选入,单击模型
按钮,选择“定制”,在构建项中选择“主效应”,再次选入因子,如图:
2. 有交互作用多因子方差分析
步骤:分析->一般线性模型->单变量,将指标和影响因子选入,单击模型
按钮,选择默认的“全因子”,如图:
结果分析:同理,当sig=P>0.05(或0.01)时不拒绝原假设,说明因子对指标影响不显著
协方差分析
是利用线性回归的方法。将那些很难人为控制的因素作为协变量,并在排除协变量对指标影响的条件下,分析可以控制的因素对指标的影响,从而更准确的对试验结果进行评价。
基本思想:指标的变异=因子的独立作用+因子的交互作用+随机误差的作用+协变量的作用
SPSS应用
步骤:分析->一般线性模型->单变量,将指标、影响因子和协变量选入,单击模型
按钮,选择默认的“全因子”,如图:
结果分析:同理,当sig=P>0.05(或0.01)时不拒绝原假设,说明因子对指标影响不显著
写在最后:
方差分析实际上需要满足各种条件。并且还有诸如多组均数的比较等等知识。在博主拿数据测试时,发现输出结果的表格F值和sig值都为空。查资料以后发现可能是由于交互性的问题。
现在总结的对于数学建模来说已经足够,以后应当仔细研究一下方差分析的进阶。