1. 方差和标准差:数据的离散情况
方差是各个数据对均值的偏离程度,但是根据(均值的性质1.1),各项减均值差的和是0,为了避免这个问题,把所有的差都做一个平方就可以了。对于一个变量X,它的方差VAR(X)是
(2.1)
而标准差就是方差的正平方根:
对于上篇里的这组数据2,4,5,8,2,3,5,6,8,2,可以求出:
分子部分就是上面说的,通过求差的平方和避免所有差的和总是0。那么除以n又是为什么呢?比如我们考虑把上面的这10个数据复制粘贴一下,现在变成2,4,5,8,2,3,5,6,8,2,2,4,5,8,2,3,5,6,8,2了。那么分子部分会变成原来的2倍对吧?不过不用担心,因为项数n也变成了原来的2倍,所以方差最后还是4.85。
所以方差相当于是消减掉项数对于方差可能的影响。而方差的分子部分:,一般也叫做sum of squares
,也就是平方的和。这个sum of squares
在方差分析的时候还会提到。
2. 方差的几个性质
还是用3,5,7这三个数据作为例子。当所有的项都加上一个常数,比如说2的时候:
因为
每一个项都加上c的时候平均值也要加上c (由1.2),于是方差还是原来的方差
(2.2)
考虑另外一种情况,当所有的项都乘以同一个常数c的时候,新的方差:
(2.3)
对标准差来说
注:本篇主要来源于《数理统计初级教程》