博弈论就是讨论人们在博弈的交互过程中如何决策的学问,不仅仅出现于经济、管理、政治、生物,也用于社交。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还要考虑自身决策行为对他人的可能影响,通过选择最佳行动计划,来寻求收益或效用最大化。
《博弈论的统计全集》向人们介绍了二十种博弈模型,小二就简单地介绍其中几个自己感兴趣的模型给大家。
囚徒困境
话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。检察官说:“你们的偷盗罪确凿,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”
显然最好的策略是双方都抵赖,结果是大家都只被判1年。
这个是博弈论中最经典的入门理论,活路就是彼此信任,惩罚作弊者;比对手跑得快。
智猪博弈
智猪博弈是不同期望值之间的博弈,一方的期望值小于另一方。
笼子里面有两只猪,一只大,一只小。笼子很长,一头有一个踏板,另一头是饲料的出口和食槽。每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
如果定量地来看,踩一下踏板,将有相当于10个单位的猪食流进食槽,但是踩完踏板之后跑到食槽所需要付出的“劳动”,要消耗相当于2个单位的猪食。
如果两只猪同时踩踏板,再一起跑到食槽吃,大猪吃到7个单位,小猪吃到3个单位,减去劳动耗费各自2个单位,大猪净得益5个单位,小猪净得益1个单位。
如果大猪踩踏板,小猪等着先吃,大猪再赶过去吃,大猪吃到6个单位,去掉踩踏板的劳动耗费2个单位净得4个单位,小猪也吃到4个单位。
如果小猪踩踏板,大猪等着先吃,大猪吃到9个单位,小猪吃到1个单位,再减去踩踏板的劳动耗费,小猪是净亏损1个单位。
如果大家都等待,结果是谁都吃不到。矩阵如下:
可以得出结论,唯一解是大猪踩踏板,小猪等待。
按照“重复剔除严格劣策略”的逻辑思路,剩下唯一的策略组合,即搭便车,紧跟策略。
抢手博弈:
彼此痛恨的甲、乙、丙三个枪手准备决斗。甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。
先提第一个问题:如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?一般人认为甲的枪法好,活下来的可能性大一些。但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。
来分析一下各个枪手的策略。
枪手甲一定要对枪手乙先开枪。因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。同样的道理,枪手乙的最佳策略是第一枪瞄准甲。乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。枪手丙的最佳策略也是先对甲开枪。乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。
多人博弈的情况,最后能否胜出,不仅取决于自己的实力,更取决于实力对比关系以及各方的策略:
与强者正面交锋时,要避其锋芒;
依据情势和自身实力,先发或者后发制人;
在冲突的最初阶段,等距离外交,谁也不得罪,保存自己的实力;
挑选对手结成同盟;
保持谦逊、低调、圆融平和。
路径依赖
把五只猴子关在铁笼里,铁笼上面放一根香蕉,猴子伸手去拿香蕉,就有人用水枪喷它们,它们手放下去,水也就停了,猴子们都不再去打这根香蕉的主意,这时心理学家把笼子里的一只猴子放出,关进一只新来的猴子,这只新来的猴子看到香蕉就伸手去拿,另外四个知道拿香蕉就会被水喷,然后就把新来的猴子暴揍一顿,新来的猴子认为这根香蕉碰不得,就这样,学家们依次顺序把猴子换掉,到后来,只要有猴子去拿香蕉就被揍,被揍的不知道为什么挨揍,另外四个也不知道为什么要揍它。
在现实生活中,存在着报酬递增和自我强化的机制。这种机制使人们一旦选择走上某一路径,要么进入良性循环的轨道加以优化;要么顺着原来的错误路径下滑。给我们的启示:初始选择至关重要,多在成功的地方选择机会。
均衡博弈
在均衡博弈中,一个优势策略优于任何其他策略;同样,一个劣势策略则劣于仍和其他策略。若果你有一个优势策略,可以采用;嫁入有一个劣势策略,则要避让。
1.同时行动时,猜测对方现在在做什么,采取相应的最优策略;
2.相继行动时,预测其他参与者接下来会有什么反应,据此盘算自己的最优策略。
博弈法则:假如你有一个优势策略,请照办,不要考虑你的对手怎么做;假如你没有一个优势策略,但你的对手有,假定他会采用这个优势策略,相应选择最好的做法。
3.没有优势时,提出所有劣势策略。
以上就是我想分享的内容。