这篇文章要说的是“纳什均衡”。如果参与游戏的各方都是“老司机”——每个人都非常聪明,谁也糊弄不了谁,那么游戏就会达到一个各方都满意,或者各方都无奈的局面,任何一方想要采取一个什么行动让自己的局面比现在更好都不可能了,这个局面就叫“纳什均衡”。
先举一个不是纳什均衡的例子:田忌赛马。田忌与齐威王赛马,本来,田忌的上、中、下三等马都不如齐威王的,孙膑献计让田忌以下马对齐威王上马,中马对下马,上马对中马,最后二比一取胜。
这个游戏对齐威王其实是不公平的,因为田忌知道齐威王赛马的出场顺序,齐威王却不知道田忌的,齐威王如果是老司机,他就不应该首先公布自己队伍的出场顺序。
当一个数学家或者经济学家说“博弈论”的时候,他说的可不是孙膑搞的这种欺负老实人的骗术。作为一门高大上的理论,博弈论的最基本假设就是参赛各方全是老司机。
这就要求每个参与者在做决定的时候,必须知道对手并不笨,对手会有什么反应,而且他还必须知道对手也知道他也不笨,也在考虑他未来的反应。这样的高手下棋一定会往后看很多步:我如果这样走,你一定会这样走,然后我就这样走,你再这样走……而且参与者还会考虑到所有的可能性,对所有选择的结局做出评估,才能出手。这里面没有“阴”谋,全是“阳”谋。
那么老司机遇到老司机,高手过招是一个什么境界呢?说一个有点极端的纳什均衡例子——“旅行者困境”。
这是印度经济学家考希克·巴苏1994年提出来的。有一趟航班的两个旅行者丢失了行李,其中包括价值相同的两件古董,而两人都声称古董的价值是100元。航空公司认为,这两人故意高估了价值骗赔偿,于是把两人分开,要求他们写下古董的真正价值,且必须是2~100元之间的一个数字。航空公司规定,如果二人写下的数字相同,就认为那是一个真实的数字,照价赔偿;如果二人写下的数字不同,那么就认为较小的那个数字是真实价格,就按这个价格赔偿,并且对写下较大数字的人处以2元罚款,对写下较小数字的人给予2元奖励。
规则看起来简明合理,可是老司机一看,可就要了命了。
你的第一反应是写100元。但你随即想到,对手也会写100元,而这样一来你的最佳策略其实是写99元,因为如此你就会得到99+2=101元,还能多拿一元。但是,对手难道就想不到这一点吗?他肯定也写99元。而在这种情况下你写98元比99元更好,因为这样你可以得到100元而不是99元。同理,对手也会得出写98元比写99元好的结论……这样一步步地推理下去,你会发现最后的结果(也就是纳什均衡)是两个人都写2元。
看到这里你可能会说这个纳什均衡也太不亲民了,日常生活中谁会算得这么精?这个例子确实极端了一点,但日常生活中的很多局面,其实就是纳什均衡。比如,你换了个新工作,早上开车去上班,走到高速公路上正好赶上大堵车。这时候你可能就会想,如果我从高速上下来,走一条有点绕远的小路,那条小路如果不堵的话,岂不是能更早到吗?于是你下高速,走小路,结果一看,小路也在堵。为什么呢?因为你能想到这招,别的司机也能想到,如果小路不堵,也会有人过去把它弄堵了。路上的交通状况,基本上就是一个纳什均衡。就算有偶尔偏离均衡的时候也是稍纵即逝的机会,根本别想抓住。等你上过几天班,在这条路上成了老司机以后,就不会再动这种脑筋,而会心平气和地接受纳什均衡。
—— 万维钢《高手:精英的见识和我们的时代》