Live 简介:
- 谁适合本课程?
谷歌公司首席经济学家哈尔·瓦里安说过 “统计学是我们在大数据时代读懂、听懂和看懂一切事实真相的基础。”
如果你想在信息时代,抓住那些隐藏的机会,概率是你不得不学习的知识。
统计概率是人工智能的基础知识,如果你想成为数据分析、大数据、机器学习、人工智能领域的稀缺人才,零基础即可加入。 - 你将从本次课程中学到什么?
- 什么是概率,对你有什么用?
- 如何通俗易懂地计算出概率?
- 什么是赌徒谬论?
- 什么是大数定律?
- 风险的本质是什么?
- 哪些风险是你必须要预防的?
- 如何预防风险?
- 学完本课程预计达到的效果
知道我们日常生活中说的概率是什么,并用概率思维抓住你未来人生中的那些隐藏机遇。
并为掌握数据分析,机器学习,人工智能相关的知识打下基础。
内容大纲
- 什么是概率?
- 如何计算概率?
- 什么是赌徒谬论?
- 什么是大数定律?
- 练习:通过游戏理解大数定律
- 如何预防风险?
- 你将挑战的项目
1、什么是概率?
我们每一个人,其实每天都有固定的时间和精力,固定就是说我们的资源和时间都是有限的。在这个前提下,把它们投入到哪个方向上能够让我们取得最好的效果,这是我们每天都要考虑的问题。
取个例子,比如你刚毕业,已经拿到了3家公司的offer:一家是传统企业,一家是创业公司,还有一家是上市互联网公司。选择哪一个offer对于你未来的发展更好呢?因为我们的时间和精力是有限的,所以我们不能同时到这三家公司上班赚钱,这是不现实的。我们只能在有限的资源和时间下做出最佳选择,这个选择代表了我们去这家公司工作以后,在未来三年内能让我们的赚钱能力提升的可能性最大。这里提到了可能性,但是只知道可能性是无法做出判断的。这时候就需要用数值去表示这种可能性,这就是概率!
概率就是用数值来表示某件事发生的可能性
概率一定是在0~1之间
2、如何通俗易懂地计算概率?
3、练习:玩游戏了解如何计算概率
4、如何计算复杂概率?
复杂概率计算方法1:寻找经验概率值
例子:飞机存活概率分布图
复杂概率计算方法2:数据分析
例子:保险公司在提出一个保险项目之前都会计算出这个项目发生的概率。一旦确定了发生概率,保险公司就能决定这个保险的保险费用。
5、练习:分析微信公众号分享率
分享概率是一个很好的衡量文章质量的指标,可以用来指导微信公众号的运营。比如将分享率高的文章放在菜单栏中,后面关注的新用户就能很方便地看到这些高质量的文章,对于提升用户的体验很有帮助。同时也可以分析那些分享率较低的文章,找出原因,从而在后期不断改进产品。这就是数据分析对于产品运营的一个迭代的作用。
6、概率有什么用?
一定要重视基础学科的学习
虽然概率并不会确凿地告诉我们将会发生什么,但是我们可以通过计算概率知道接下来很有可能发生什么,不太可能发生什么。聪明的人会使用概率为自己的事业和生活指明方向,牛人就是持续对大概率事件下注,并同时有意识地预防那些足以毁掉我们生活的风险。
其实我们每个人都应该学一点概率知识,它现在已经是公民必备的基础知识。当不懂概率的人大惊小怪的时候,懂概率的我们可以淡定自若。大多数人在中学的时候,数学课本里面已经学过概率了,但是掌握了计算概率的方法不等于真正理解了概率思维。实际上,概率中有几个关键思维是数学老师没有讲明白的。理解这些思维不需要我们做任何的计算,但是它们能够让我们看世界的眼光发生根本的改变。
7、什么是赌徒谬论?
赌徒谬论:绝大多数的赌徒倾向于相信之前的下注结果对当前下注有影响
独立事件是不受过去事件影响的
8、什么是条件概率?
相关事件是受过去事件影响的,条件概率就是相关事件的概率
P(AB) = P(A) × P(B | A)
决策树是一种把决策的各个节点划分为树的形状,从而辅助我们决策的工具。
9、生活中的条件概率
实验给这些糖人设置了一些简单的决策规则:
1)糖人的视力向四个方向观察,目标是找到含糖最高的地方,单元格里的糖被吃掉以后过一段时间能够重新长回来;
2)如果糖人吃的糖跟不上自己新陈代谢的速度,糖人就会被饿死,饿死的糖人就会被计算机清除这个棋盘;
3)糖人被随机分配了不同的基因禀赋。也就是说有的糖人视力比较好,能够看到6个格子以外;有的糖人只能看到眼前1个格子的地方;有的糖人新陈代谢比较强;有的糖人新陈代谢比较弱。
现在我们按下启动实验的按钮,糖人们就移动起来。一开始局面有点乱,但是很快研究者发现糖人社会呈现出下面图片中有规律的分布。
当程序运行期从图1演示到图4的时候,糖人们开始围绕两大糖山聚集到一起,逐渐形成了两大部落。当研究者把目光投向财富变量的时候(这里的财富是用每个糖人收获的糖的多少来代表的),他们发现了一个令人非常意外的现象:这个虚拟社会出现了严重的贫富分化。下图展示了从实验启动到结束人均财富分布的演变趋势。
我们可以看到:图片里横轴表示财富从低到高,也就是说左侧是穷人,右侧是有钱人;纵轴表示人数。
正如我们看到的:社会诞生之初,财富在国民间的分配是平均分布的,基本算得上是一个平等的社会,非常富有和非常贫穷的人是非常少的,绝大多数人的收入差别很有限,即使最富有的人也不过拥有30个单位的糖量。但是随着时间的推移,这个社会的财富分布发生了严重的扭曲,从最底下的图可以看出:20%的人占有了全社会80%的财富。
根据实验者在程序中的设置,我们可以随意调整糖人的各种初始参数,瞧瞧到底哪个参数引发了糖人国的贫富分化这么严重。
决定我们赚多少钱是由3个因素决定的:
1.天赋异禀:实验中有的糖人视力好,能够看到6个格子以外,有的糖人只能看到眼前1个格子。好消息是现实生活中像爱因斯坦这样智商爆表的天才是少数的,大部分人的智商都是差不多的。虽然天生的天赋异禀不能改变,但是后天的天赋异禀却可以通过学习逐渐提高。比如,有统计概率知识的人就是比其他人思考得更深入,看得更远,也能更看清楚问题的本质。
2.出身位置:其实就是指条件概率,具体来讲有两类:
第一类是我们不可以改变的出生位置,比如我们出生的家庭,出生的年代,这都是不可以改变的。例如:王思聪就是有王健林这样的条件概率,出生在80年代的人就要面对高房价的压力。这都是不可以改变的条件概率。
第二类是我们可以改变的出身位置,比如我们可以选择去哪所学校读书,做哪些行业的工作。(e.g. 学区房)
3.随机的运气
打个比方,有两个糖人A和B,一开始的时候,两个人的视力、新陈代谢、出生地的含糖资源等各方面的条件都一样。这个时候,在视力所及范围内,A偶然随机地向东北方的糖山迈出了一步。真是凑巧啊,这里居然没有糖人占领,于是A占领了这个格子,财富开始快速地积累,于是越来越有钱。而B同样四处张望,同样出于偶然,它向东南移动了一步,结果逐渐开始远离有糖的地区。当它意识到方向错误的时候,其他糖人早已围满了通往北方糖山的路径。于是它再也没有机会,只能随机漫游,在资源贫乏的地区采集糖分,但是只够温饱,最后变成了那最贫穷的122个小糖人之一。就这样两个天赋和出生位置都差不多的人,因为一个微不足道的选择差异,最终导致了社会财富积累出现了天壤之别。这也可以称之为“蝴蝶效应”。
对于没有太多资源,又不如阿尔法狗强大的普通人,该做什么呢?做到下面2点就可以了:
① 选择比努力更重要
这里的选择就是我们要想办法提高自己的条件概率,选择能改变的出身位置。对于个人而言,应该选择去正确的地方,在水多的地方挖井,这是一切努力的第一步。切勿以穿越荒漠为荣。
② 在正确的前提下,努力提高自己的能力
《随机漫步的傻瓜》书中有一句话是这么写的:
有一身好本事却穷困潦倒的人,最后一定会爬上来,而幸运的傻瓜他可能短时间内借助于生命中某些好运气,但是长期来看,他的处境会慢慢趋近于运气并没有那么好的傻瓜。所以想办法提高自己的能力很重要。
10、什么是小数定律?
1962年,巴西夺冠,4年后英格兰本土称雄。1970年巴西三夺金杯,1974年轮到东道主西德捧杯。1994年巴西在美国夺冠,1998年法国在本土一鼓作气首次捧得大力神杯。1958年,巴西在瑞典夺取了冠军,4年后他们成功卫冕,收回了“礼物”。
看起来这个定律很有规律,但是这一定律在2006年被破解。2006年在德国的世界杯,巴西队和东道主德国国家足球队都没能夺冠。
小数定律:如果统计数据很少,那么事件就表现为各种极端情况,而这些情况都是偶然事件,跟它的期望值一点关系都没有
例子:
① 河南人骗子多:如果骗子在中国各个省份是随机分布的,那么为什么恰好让人感觉河南骗子多呢?这是因为河南是个人口大省,数据本来就多,这个地方的坏消息似乎也比相同量级的省份高了一点。问题的关键就在于:随机分布不等于平均分布。一旦不平均人们就认为这其中必有缘故,而事实上这可能只是偶然事件。
② 随机播放功能“不随机”:ipod最早推出随机播放功能的时候,用户发现有些歌曲会被重复播放,他们就此认为ipod播放器根本不能随机播放。苹果公司只好放弃真正的随机算法,用乔布斯本人的话来说:改进以后的算法使播放更不随机以至于让人感觉很随机。
理解小数定律最大的一个好处就是:
我们以后不会再轻易地大惊小怪了,也不会有个人偏见了。如果统计数据不够大,就什么也说明不了。正因为如此我们才不能只凭借个人经验,哪怕加上家人或朋友的经验,去对事物做出判断。别看个例而要看大规模的统计。
11、什么是大数定律?
大数定律:如果统计数据量足够大,那么事物出现的频率就能无限接近他的期望
期望3.5元代表什么意思呢?
只要我们持续玩下去这个游戏,我们每次游戏的预期收益是3.5元。可能我们某一次抛色子赢了1元,某一次抛色子赢了6元。但是长期来看,根据大数定律,我们平均下来每次的收益会是3.5元。期望的本质就是概率的平均值。
我们可以通过比较成本投入和期望收益,就能判断做这件事情是不是值得的。
如果我们在上述游戏中加入这样一个规则:每抛一次色子,需要交纳5元。根据大数定律,如果统计数据足够大,那么事物出现的频率就能无限接近它的期望。也就是说,我们只要一直持续玩下去,我们每次游戏的预期收益是3.5元。如果我们玩10000次游戏,投入的成本就是50000元,而预期收益才只有35000元,那么我们将输掉15000元。所以这种赔本的游戏我们还是不要去玩了。这也可以解释买彩票长期来看是一种赔本的游戏,彩票从本质上来看就是一种赌博行为。
我们也可以用大数定律来解释为什么赌场从长期来看总是挣钱的问题。因为赌场内所有项目的概率都是有利于赌场老板的,如果赌场的营业时间足够长,吸引的下注人数也足够多,那么赌场从赌桌上赚到的钱肯定要比付出的多。
12、练习:通过游戏理解大数定律
前面抛筛子游戏来自于这个网站,当在电脑前面时再打开该网站,点击图片中期望的图形,就可以开始玩游戏,理解什么是小数定律,什么是大数定律。看见统计
13、期望:是否要去相亲呢?
我们应该加入其它因素和概率来进一步考虑:
这里的70%可能脾气不错、40%可能将来会有钱就是主观概率
这里利用决策树就可以决定是否要去相亲。
假设满意的最高分是10分,不满意的最高分是-10分。现在我们需要给脾气好不好和有没有钱这两个不确定的因素所产生的四个组合诚实地打分,进而计算出每个结果的期望值。因为这里期望>0,可以决定去相亲了。
瑞·达利欧在《原则》一书中分享了一个用大数定律做决策的方法,那就是计算预期价值。
预期价值的计算方法就是期望的计算公式,押对决策的概率 × 相应的奖励 - 押错决策的概率 × 相应的处罚。比如说押对的奖励是100美元,押对的概率是60%,押错的惩罚是100美元,押错的概率是40%,那么预期价值就是100 × 60% - 100 × 40% = 20美元。
理解了大数定律的概念以后,我们就会更聪明地做出决策判断。此外,大数定律意味着最好的选择是好处多于坏处的选择,而不是毫无坏处的选择。因此不要因为发生了一些问题就反对某件事,更应该做的是权衡所有的利弊,然后做出最好的选择。巴菲特每天做的都是算这个简单的数学问题,与其说是一种数学能力,不如说是一种思维方式。知道容易,做到极难。这就是所谓的赢家的秘密:坚持按照统计概率思维来做事,哪怕屡受挫败也不给人生下注的原则,因为他们知道大数定律的威力。
14、风险的本质是什么?
中国有一句老话:不怕一万,就怕万一。这是对小概率事件最朴素的认知了。虽然某个事件的概率小到万分之一的地步,但这并不意味着一定要做到第一万次才出现,因为这个事件是随机的,可能第一百次就出现了。这就是随机事件:可能发生,也可能不发生,关键的一点是你不知道它什么时候发生。国外也有相应的说法,叫做墨菲定律。
墨菲定律:凡事只要可能出错,就会出错。
指的是任何一个事件,只要具有大于0的概率,如果时间足够长,它就肯定会发生。
弱者把墨菲定律当做回天乏力的一个借口,但是强者把它当做提醒自己随时保持警惕的警钟。缺少对概率的认知直接导致的结果就是这个人没有风险意识。其实生活中有很多人不仅没有风险意识,而且很喜欢冒险。“要想赚大钱,就要有冒险精神”这句话洗脑了很多人。现在很多媒体、大V鼓励去冒险,但是对其中的风险却只字不提。比如有些所谓的大V不负责任地鼓吹创业,却从来不提创业的成功率只有1%。
在两件事上一定要注意安全,并一定要学会积累规避风险的经验:
1)在资本安全上防范风险;
2)在人生安全上防范风险。
15、如何在资本上预防风险?
巴菲特在致股东信中说道:“面对可能出现的黑天鹅事件,我们应该谨慎评估,提前预防。投资的目的是获得最大化收益和降低系统化风险,所以投资的刚需就是避险,而最佳避险常识就是永远不要押上全部!”
很多人看起来一辈子运气不好,实际上这些人都是险盲,没有一点统计概率常识。他们倒霉的原因只有一个,那就是动不动就把自己的全部赌进去了。
学过一点概率的人当中有一个普遍的误解:他们认为风险的概率决定了风险的大小。但是衡量风险大小的主要因素并不是风险的概率,而是赌注的大小。
值得一提的是,这里的赌注可并不仅仅是你把自己的全部身家投进去,还包括你未来的全部。比如有人动不动就裸辞,有人没有完全准备好就贸然创业,这都是冒险的事情。
赌注太大就意味着结果没有办法承受,那为什么赌本少的人更倾向于下大赌注呢?因为这些人梦想太大,更为危险的是赌注相对大的时候,人的智力也会急剧下降。比如说高考总有一些人考不好,就是因为赌注是自己未来一辈子,太大了,乃至于造成很大的压力,于是无法正常发挥。历史上有很多成功的庞氏骗局都有一个普遍的重要特征,那就是加入费用特别高,因为只有这样进来的人才能够普遍不冷静。
为了预防风险,必须牢记且绝对不能犯的铁律就是:永远不要押上自己的全部!
那么接下来的问题就很重要了:究竟多少才算得上是自己的全部呢?
在没有概率常识的人眼里,所谓的全部就是倾家荡产。因为在诱人的回报率面前,他们认为这些都不足挂齿。即便在概率上他们几乎没有胜算了,这些人也会一股脑地押上自己全部的家当。
心理学上已经做过研究了:当我们把总资产的25%拿出去冒险,你将无法对它熟视无睹。真正的专家是懂得如何去分配资产,让自己保持理性,做出尽可能准确的判断。
接下来我们就利用统计概率的知识来计算一下究竟押上多少已经是我们的全部了。
b:下注可能得到的赔率,这个赔率不包含本金。例如1:1的赔率就是下注一元,如果赢了,不仅能把本金赢回来,还能获得一元的净利
p:赢的概率
16、如何在人身安全上预防风险?
保险公司为了能挣到钱,只需要做上面这道简单的数学题就可以了。也就是说保险公司要保证收取的保费大于预期损失即可!
金融的本质就是风险买卖。无论是互联网金融、科技金融或者任何一种新的金融形式,都应该基于更高效的风险买卖模型。所以保险公司必须清楚地知道合同里每一项条款可能会带来的赔偿金额,这里的赔偿金额在行业术语里也叫作“预期损失”。“预期损失”和预期值(期望)是完全相同的概念,只不过套上了保险的外衣。理论上讲,在提出一个保险项目之前,都会有一名保险商计算出项目的发生概率。一旦确定了发生概率,保险商就能决定这个保险的投保费用。
从统计概率的角度来看,购买保险是一项糟糕的投资。因为平均来看,我们支付给保险公司的钱永远要比得到的赔偿金多,所以从长远来看保险并不能为我们省钱。
上述的保险是对市面上各种五花八门的保险的总称,那么如何选择适合自己的保险呢?我们只需要记住下面图片中的原则即可。
17、练习:如何用概率思维抓住自己的人生机会?
用概率思维重新审视自己目前做的事情,从整体行业角度来看,条件概率高不高?
并运用决策树来分析,未来如何做,可以提高自己成功的条件概率?
18、总结:一句话记住知识
概率知识对我们还有一点启发,就是“为大概率坚持,为小概率备份”。只要我们选择有利的大概率事件,持续投入,结果一定比东一榔头西一棒槌地做事情要好。另外,要为小概率事件做好备份,避免小概率事件对我们造成无法挽回的损失,比如重要文件要多备份,以免丢失。