统计学思考导论读书笔记-样本比较（二）

4.t检验分析两样本均值

除了按照上面的方法，根据两样本的方差求出两样本的期望之差外，我们还可以引入假设检验对它们的差进行检验。先前在假设性检验的时候就已经讲了H0原假设和H1备择假设，也求出了一个假设的拒绝域。同样的，我们也可以根据假设性检验的相关检验来检验两样本期望，而这里，我们假设H0为E(Xa)=E(Xb)，H1取H0反面，而标准则是以p为0.05为准，如果p小于0.05，我们接受原假设，大于则拒绝。在先前的章节中，我们又介绍了t的相关公式，比如H0为E(X)=0,那么，我们T的计算公式则为：

在R语言里，我们常用qt()函数计算t分布的分位数，比如，qt(0.975,n-1)计算的就是t分布当中自由度为n，分位为97.5%的分位数，也可表示成事件{|T|>qt(0.975,n-1)}，而P({|T|>t})就是表示R里通常看到的p值。同样的，假设H0：E(Xa)-E(Xb)=0，那么，根据上面T值公式可得：

又回到刚刚的耗油量之差的例子，先前我们已经把里面的样本均值和方差算出来了，因此，我们得到它们的t值是：

因此，我们算出来的p值为P(|T|>2.425531)=2×[1-P(|T|<=2.425531)]，根据这个结果，我们在R模拟一下：

2*(1-pt(2.4255,191.561))

两样本方差比较

之前，我们已经介绍了如何用期望、置信区间和t检验进行两样本的比较；接下来，我们还要介绍一种方法来比较两个样本，它就是方差比较。

首先，我们在讲第11章就讲了讲卡方分布。卡方分布就是假设一个标准正态分布有X1，X2……Xn这n个随机变量，而它们的随机平方和由组成一个新的分布的就称之为卡方分布；而卡方检验就是在假设性统计里，统计推断值和实际值的偏差，以卡方值表示。卡方值越大，即它们的偏差就越大，反之亦然，如果为0，即它们没有任何偏差。

而这里，我们要介绍的是F检验法。我们还是假设两个样本的方差分别为Sa和Sb。构造F分布的时候，我们可以根据它们两个样本的方差构造得：

其中，左边就是分别构造两样本的方差估计值和实际值的比率，之所以要构造这个比例，就是因为F分布的计算标准就是根据比率进行的，因此我们也就得到了上面的那个公司。

在R里面，qf()函数计算F分布的分位数，一般形式为qf(σ,dfa,dfb)，其中，σ表示求哪个分位的分位数，dfa和dfb分布代表样本a和样本b的自由度。

现在，根据F分布的公式，再结合qf()函数来构造它的95%置信区间，得：

根据这个公式，我们可以得到：

现在，我们假设H0:Var(Xa)/Var(Xb)=1，而原假设的拒绝域为Fqf(0.975,qfa,qfb)，而p则为2P(F>f)=2[1-P(F<=f)]，它在f<1条件下成立。衡量的标准还是p值是否达到0.05。现在，再次回到之前的耗油量之差的例子，用R模拟过程和结构如下：

var.test(dif.mpg~heavy)

我们看到p值仅为0.16663，小于0.05，这时，我们要拒绝原假设，即，Var(Xa)和Var(Xb)不相同。同时，从这份报告中，我们还看到比率的95%置信区间为[0.4189200,0.9162126]，而样本的比率方差，在最后一行可以看到，是0.6196502；而这一个值，就是由先前我们在求耗油量之差时求出来的，Sa2/Sb2得来的，具体Sa和Sb可以根据先前的结果查看。这里，再说一下p，根据耗油量之差，我们可以用相关函数pf()模拟计算，过程如下：

2*pf(0.6196502,102,101)

最后，我们算一算两样本方差比率的95%置信区间，过程结果如下：

qf(0.025,102,101)

qf(0.975,102,101)

得到95%置信区间为[0.676317,1.479161]。

总结

这一部分的内容把样本的比较方法单独拿出来讲，说明比较两个样本的内容还是相当重要的，而且有很多的方法和相关理论需要掌握。

这部分内容，我们分别从均值、置信区间和方差这3个角度来比较这两个样本的大致情况。比较这两个样本的重要指标就是引入了t检验和F检验，也就是说，我们分别从t分布和F分布来间接比较这两个样本。

用均值进行两样本的比较，我们列举了汽车耗油量之差这个例子，把里面的数据分成2组，然后用t分布计算出相关的p值，并与p值的极值0.05进行比较，如果大于0.05，我们接受原假设，反之亦然。另外，我们在介绍比较两样本的方差之前，我们还通过构造t分布来比较两样本的均值，计算相关的t值和p值，并对比我们所求出的拒绝域；如果落入拒绝域，则原假设不成立，反之亦然。

用置信区间比较两样本，我们引入了两个样本的期望，同时也引入这两个样本的标准差，通过置信区间的计算公式，利用两样本的均值之差构造出95%置信区间，然后根据这个置信区间进行分析。

最后，我们还引入了F分布，通过构造两样本的方差之比进行F检验分析，同样比较它的p值是否达到0.05；如果达到，我们接受原假设，反之亦然。

从上面的文章，我们可以看到假设性检验的其中一种应用，它通过计算相关的值和我们原来的假设进行比较，作为我们的假设是否合理的一个重要指标。由于受限于水平以及课本所提到的内容，可能很多地方会有一些错误，也欢迎大家留言指出。当然，如果大家有什么疑问也可以到留言板上留言，我会尽自己的能力帮你解答。最后，由于文章讲的比较少，而且可能比较难以理解，同时也是读书笔记的形式来写的，所以我打算在后面一段时间，会从概率论与数理统计的角度，把这个系列的读书笔记里所提到的知识进行一个扩充，这样能更有助于你们理解统计学的相关内容。后面的章节，我们就要开始简单的讲述相关的统计模型；不过，由于已经快到本书的结尾，而本系列的比较也很快就写完了，所以如果大家还想看更多的统计模型，我后续也会以各种方式进行补充。

转载于：http://shujuren.org/article/98.html

最后编辑于：2017.12.04 02:50:34

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,456评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,370评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,337评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,583评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,596评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,572评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,936评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,595评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,850评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,601评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,685评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,371评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,951评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,934评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,167评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,636评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,411评论 2赞 342

统计学思考导论读书笔记-样本比较（二）

推荐阅读更多精彩内容