一个小问题:已知有两个盒子,一号盒里有18枚黑棋和2枚白棋,2号盒里有4枚黑棋盒16枚白棋,现将两盒置于箱中,随机从其中一个盒子抽出一枚棋子,为白棋,你认为这枚白棋从几号盒里抽出的概率更大?从2号盒抽出的概率为多少?
如果我们不知道抽出的结果,那么两个盒子概率各50%;当我们知道抽出为白棋的时候,我们就知道更大的可能是从2号盒抽出的,不用理论分析,直觉告诉我们就是如此。
但是数据分析不是一个仅仅依靠直觉的学科,依靠直觉说服不了别人,我们需要更专业的解读,那就是后验概率。
我们先用我们自己的方法试着做这道题:
1号盒抽出白棋的概率 P(w1)=1/10;
2号盒抽出白棋的概率 P(w2)=8/10;
抽中1号盒并抽出白棋的概率P(w,1)=1/2*1/10=1/20;
抽中2号盒并抽出白棋的概率P(w,2)=1/2*8/10=8/20;
那么白棋是从2号盒抽出的概率P(2|w)===8/9;
可以理解吗?看起来很简单吧。
我们回过头看一下贝叶斯公式——后验概率的公式,我把详细的过程写出来。
贝叶斯公式:
P(A|B)===
(由于简书输入问题,这里用!A表示非A)
emmm。。。这个公式,简直就是鬼画符!
我们这里不解释每个表达式的含义,我们用另一种方式来解释这个公式。看下一个抽象一点的例子:
假设某个事件的结果为R的概率为P(R),造成B的原因有事件1、2、3,事件1、2、3发生的概率分别为P(1)、P(2)、P(3),事件1、2、3导致结果R发生的概率为P(R|1)、P(R|2)、P(R|3),现在事件结果R发生了,问事件1发生的概率是多少?
直观的理解:R发生的原因是事件1的发生概率为:事件1发生并导致R发生/事件R发生的概率
事件R发生的概率是什么呢?因为原因事件只有123,所以P(R)=事件1发生并导致R+事件2发生并导致R+事件3发生并导致R,即:
P(R)=P(1,R)+P(2,R)+P(3,R)
很好理解吧?我们再分解一下,事件1发生并导致R发生:
P(1,R)=P(1)*P(R|1);
就是事件1发生的概率*事件1导致R发生的概率,同理可得:
P(2,R)=P(2)*P(R|2);
P(3,R)=P(3)*P(R|3);
所以:
P(1|R)==
我们带入看一下:
P(1|R)=
有没有感觉很眼熟?没错,就是贝叶斯公式的123版本!
所以贝叶斯公式是什么?不记得了。
后验概率明白了吗?明白了!很简单!