Lesson 9 - 置信区间

引入

尝试根据统计量来推断总体参数, 例如钓鱼
如果撒一张网调到鱼的可能性更大, 那么这个网需要多大呢

image.png

那么网越大, 那么抓到鱼的信心越大, 因为总体参数总是不会发生改变, 所以就好像水中不会动的鱼一样, 但提供一个区间, 而不仅仅是一个估值, 能够帮助我们增加获得总体参数的信心

image.png

那么区间越大, 信心就越大.

image.png

From Sampling Distributions to Confidence Intervals

通过抽样分布和自助抽样从而计算一个统计量的可能值, 也可以通过这些抽样分布计算一个参数的最可能值, 在实践中一般不知道参数的值

如何使用抽样分布推断总体参数值

假设这是某个分布的统计量, 我们可以用这个分布为总体参数建立一个置信区间

image.png

如果我们想要95%的置信区间, 我们可以去掉前后各2.5%,

如果我们想要99%的置信区间, 可以从两边各去掉0.5%

image.png

an example of how to build a confidence interval using the sampling distribution of the statistic

You can interpret your confidence interval as We are 95% confident, the population mean falls between the bounds that you find. Notice that the percent and the parameter can both change depending on what you are building your confidence interval for, and what percentage you cutoff in each tail.

image.png

图中coffee_redcoffee_full的子集, 是随机抽取的样本
coffee_full是总体中的所有个体

提示:
为了了解置信区间的效果如何, 往往有总体数据将会很有好处.

计算样本喝咖啡的平均值, 以及喝咖啡且身高的均值数据

image.png

接下来使用bootstrapping重新抽样, 并重复10000次, 再次计算喝咖啡并对身高数据的均值可视化

image.png

boot_means是每次抽样200个样本的均值, 并重复10000次的均值列表, 然后对其使用np.percentile(boot_means, 下限其实百分比) 代表置信区间的起始位置, 因此还需要设置使用同样的方法设置置信区间的结束位置, 如图.

image.png

上面的意思是去掉最初的2.5%和最终的2.5%, 在中间建立了95%的区间.

image.png

解释为: 在95%的置信区间下, 总体中所有喝咖啡的人的平均身高范围在68.06英尺和68.97英尺之间.

再次回到总体均值, 计算喝咖啡的人的身高的总体均值

image.png

在这个案例中我们的置信区间所示成功的

Difference In Means

用什么方法估算两个参数的差, 并建立置信区间?
思考
例如喝咖啡和不和咖啡的人之间的平均身高之间的差是多少? 我们有平均身高差之间的证据吗?

为了建立这两组人的平均身高差, 方法和上述求置信区间的方法类似

image.png

然后, 可以对两者的求差的过程进行多次迭代, 并将单词迭代的 差值存储于列表中. 见下图

image.png

然后对差值列表求相应的置信区间, 认为这两组人的身高差在这个区间范围内.

image.png

你发现置信区间内并不包括0, 这表明总体均值是存在差异的.

进一步我们可以说, 平均而言, 喝咖啡的人比不喝咖啡的人高

Confidence Interval Applications

为均值差建立置信区间的场景有哪些?

  1. 对服药的一组人和不服药的一组人进行比较, 确定药物的疗效
image.png
  1. 对同一主题实施, 两种不同的教学方法, 然后确定那种方法可以提升记忆力, 用这种方法比较两组人,最常见的案例是A/B测试

例如对不同的网页进行比较, 确定哪个网页能够吸引更大的流量

image.png

Statistical vs. Practical Significance

我们已经介绍了置信区间的几种不同应用 ,以及用于创建这些置信区间的一个自助抽样法 ,我们发现 创建两组均数差的置信区间 ,而不是只比较两个点估计值 这是很重要的 ,能保证 已选样本的随机性 ,不是出现这些差的唯一原因 .

置信区间肯定是有用的 ,但是 如果只利用置信区间做决策 ,可能会出现问题 ,这就引出了实际显著性和统计显著性的概念 .

我们举一个例子 解释这两个术语的区别 ,假设我从事遛狗业务 我在网上发广告 ,我想知道 这两个广告中的哪一个 ,能给我的业务带来更大的利益 ,我将每个广告发给相同数量的 ,随机选择用户 建立置信区间 ,它表明 更多的人点击这个广告 ,根据我的置信区间 ,我有统计证据表明 第二个广告更好 ,从置信区间中获得的这个证据就是统计意义 .

image.png

假如两个广告 ,都带来了足够大的利益 超过了我的处理能力 ,但是第二个广告的制作成本较大 耗时较长 ,如果你的一个朋友决定 ,投放类似广告 开展他们自己的遛狗业务 ,你推荐他们选择哪种广告? ,在这个案例中 你可能建议他们选择第一个广告 ,即使你在统计学上证明第二个广告更好 ,但第一个广告会对他们的业务带来足够的利益 ,成本较低 耗时较少 ,你建议他们采用第一个广告 就是实际意义的一个例子 .

实际意义会考虑 ,其它方面和我们周围的世界 ,而不是只考虑数字 ,这对做决策来说是非常重要的

使用置信区间和假设检验,您可以在做出决策时提供统计学意义。

但是,在决策时考虑实际意义也很重要。实际意义考虑了您的情况的其他因素,这些因素可能不会直接在您的假设检验或置信区间的结果中考虑。在商业决策中,空间,时间或金钱等限制很重要。但是,它们可能不会直接在统计检验中考虑。

传统的置信区间

我们目前建立置信区间的方法 ,基于自助法和我们的抽样分布相关知识 ,这是一种极其有效的方法 ,能对我们感兴趣的几乎任何参数建立置信区间

但是 如果你在其他地方学习过统计课程 ,你可能会疑惑为什么 ,这种注释法与你在其它课程中学过的不一样 ,你可能见过这种计算总体均值或比例的方程

image.png

同样 你可能还见过这种 ,计算均数差或比例差的方程

image.png

所有这些公式都有可能为真或者可能为假的基本假设, 如果你真的认为你的数据能代表你研究的总体 ,自助法应该能更好地表示参数的可能位置 ,但是 在足够大的样本量下 ,这些公式的结果应该 ,与我们在自助法中看到的结果非常相似

传统的置信区间方法

在 Python 中建立置信区间的传统方法 ,和这一节课中采用自助抽样的方法进行快速比较

假设检验和建立置信区间的方法有很多 ,例如

  • 用于总体均值的 ,单样本 T 检验
  • 用于比较两个均值的 ,双样本 T 检验
  • 还有一种常用于将个体与自己比较的配对 T 检验 ,以及 Z 检验、卡方检验和 F 检验

许多假设检验 ,与创建置信区间的方法相关联 ,自助抽样法可以代替这些方法中的任何一个

举例说明
bootstrapping法


image.png

传统t检验法

image.png

对于大样本,这些最终看起来非常相似。对于较小的样本量,使用传统方法可能会假设您的区间不正确。小样本大小对于自举方法来说并不理想,因为它们可能导致误导结果,原因很简单,因为没有准确地代表整个人口。

与置信区间相关的其他语言

以下是我们看到政治选举结果的一种常见方法 ,
候选人 A 的得票率是 34%+/-3%
候选人 B 的得票率是 22%+/-3%

image.png

你可能会看到 ,用小号字体印刷的内容 例如 ,“这些数字基于 95% 的置信区间 ” ,在这个样本中 每位候选人的得票率分别是 34% 和 22% ,这个 3% 称为误差范围(margin of error)

image.png

为了建立置信区间 ,我们实际上会加减这个量

所以 候选人 A 在总体中的真实比例的 ,置信区间是 31% 至 37% ,
候选人 B 是 19% 至 25% ,

image.png

如果每位候选人的置信区间大于我们的预期 ,我们可以收集更大的样本量 ,根据大数定律 ,我们知道 样本量越大 ,估值越接近参数 因此 ,会缩小区间

image.png

Assuming you control all other items of your analysis:

  • Increasing your sample size will decrease the width of your confidence interval.

  • Increasing your confidence level (say 95% to 99%) will increase the width of your confidence interval.
    You saw that you can compute:

  • The confidence interval width as the difference between your upper and lower bounds of your confidence interval.
    The margin of error is half the confidence interval width, and the value that you add and subtract from your sample estimate to achieve your confidence interval final results.

Confidence Intervals (& Hypothesis Testing) vs. Machine Learning

你已经针对如何在实践中 ,建立、解释和使用置信区间进行了大量学习, 我们可以用置信区间做出哪些类型的结论 以及不能用它做出哪些类型的结论 ,两者是很容易混淆的

我们建立置信区间时 ,它们针对的是参数 ,即 它们针对的是总体中的单个值 ,这些值包括总体均值 ,或者总体标准偏差 ,两个总体均值的差 ,或者总体中的任何其它值摘要

image.png

注意: 置信区间不允许我们 ,对总体中的任何个体有任何特定表示

image.png

机器学习中的更高级技术的目的在于 ,给我们提供总体中每个个体的信息

image.png

但是一般来说 置信区间的目的不是解决这些类型的问题 ,置信区间的目的一般是 ,给你提供总体中的聚合值

Confidence intervals take an aggregate approach towards the conclusions made based on data, as these tests are aimed at understanding population parameters (which are aggregate population values).

Alternatively, machine learning techniques take an individual approach towards making conclusions, as they attempt to predict an outcome for each specific data point.

In the final lessons of this class, you will learn about two of the most fundamental machine learning approaches used in practice: linear and logistic regression.

image.png
image.png

置信区间和假设检验

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 193,495评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,469评论 2 369
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 140,825评论 0 318
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 51,974评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,849评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 45,990评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,415评论 3 380
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,125评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,351评论 1 288
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,474评论 2 307
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,249评论 1 324
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,119评论 3 310
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,496评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,838评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,118评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,366评论 2 340
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,573评论 2 335

推荐阅读更多精彩内容