中心极限定理:
设从均值为μ、方差为σ2总体中抽取样本量为n的样本,当抽取次数充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布。
中心极限定理是统计学里非常伟大的定理,对于属于正态分布的指标数据,我们可以很快捷地对它进行下一步假设检验,并推算出对应的置信区间;实际应用中,很多分布往往是很杂乱的,但是根据中心极限定理,样本均值的抽样分布(取无穷次样本均值)是趋向于正态分布的(如图,点这里可以自行模拟),这个正态分布的方差(拗口的说,是样本均值的抽样分布的方差)我们可以用样本方差/n
近似估计,均值(拗口的说,是样本均值的抽样分布的均值)等于总体均值
,具体是多少我们不需要知道,因为我们的实际的样本(均值)就在这个分布里,总体均值在实际样本均值的上下某个范围m的概率 = 实际样本均值在总体均值上下某个范围m的概率 = 实际样本均值在抽样分布里样本均值的抽样分布的均值
上下某个范围m的概率,我们已经知道了这个抽样分布的标准差,就可以通过这个范围求得z 统计量(距离均值有几个标准差),所以这里我们不需要知道样本均值的抽样分布的均值或者总体均值!最终我们可以依据正态分布的检验公式进行下一步分析,得到对总体均值的近似估计,譬如标准误差,置信区间,显著性水平等。
PS:这里有个样本均值的抽样分布,对应下图的蓝色直方图。样本均值的抽样分布的均值就是蓝色直方图的均值,有点绕口。