13博弈论的发展历程
1944年,冯•诺依曼(Von Neumann)与摩根斯坦(Morgenstern)合作的《博弈论与经济行为》这本书,标志着博弈理论的正式诞生,不过,此书与现代博弈论关系不大。
1950年,纳什和夏普里的“讨价还价”模型以及“核”的概念,提出了合作博弈的概念。
Tucker于1950年定义了“囚徒困境”,纳什(1950、1951)发表了非合作博弈论的一些文章,这奠定了现代非合作博弈的基石。
60年代后期,纳什提出纳什均衡;泽尔腾(1965)引入动态分析,提出了“子博弈精练纳什均衡”;海萨尼(1967-1968)将不完全信息引入博弈论研究,这标志着博弈论的快速发展时期。
博弈论影响了计量经济学的发展(日本和阿根廷),在上个世纪的70年代之前,新古典经济学一直有两个基本假定:一个是,市场参与者的人数足够多从而市场是完全竞争的;另一个是,参与人之间不存在信息不对称问题,价格制度是透明的。
这两个假定相信,个人决策,在给定一个价格参数和收入的条件下,最大化效用。
但在上世纪70年代以后,经济学逐渐强调个人理性,开始关注两个问题:信息与时序。
80年代后,博弈论成为主流经济学的一部分,甚至是微观经济学的基础。80年代后期出现了几个重要人物,如克瑞普斯,威尔逊等,至今,博弈论已经成为主流经济学的重要组成部分。
14博弈论与信息经济学的区别
博弈论,是研究给定信息结构,求均衡结果,它使用的理论是均衡理论,是方法论的导向,研究是实证的科学。
信息经济学,是研究给定信息结构,求契约结果,它使用的理论是契约设计理论,是问题导向的,研究的是规范性的问题。
信息经济学的基本特征,是非对称发生在事前(签约前),逆向选择模型。非对称发生在事后(签约后),则是道德风险模型。研究不可观测行动的模型称为隐藏行动模型,研究不可测信息的模型称为隐藏信息(或知识)模型。
注意,上述区分不宜过分强调,信息经济学是从研究具体的制度安排中独立发展出来的。
15博弈故事和生活中的例子
一只河蚌正张开壳晒太阳,不料,飞来了一只鸟,张嘴去啄它的肉,河蚌连忙合起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今天不下雨,明天不下雨,就会有死蚌肉。”
河蚌说:“今天不放你,明天不放你,就会有死鸟。”
谁也不肯松口,有一个渔夫看见了,便过来把他们一起捉走了。
话说有一对热恋中的情侣男A和女B,他们都是工作繁忙的公司主管,平时很少能够在一起共度浪漫时光。这一天他们约好下班后去看电影。男A是个军事迷,特想看战争片,对艺术片一点都不感冒;女B则是艺术爱好者,只想看艺术片,对战争片毫无兴致。
这其实是一个博弈问题。
很显然,男女要么都去看战争片,要么都去看艺术片,这两种情况达到了该博弈的纳什均衡。这个博弈还有一个特征就是,每一个参与者都不存在优势策略,因为不管是男A或是女B,都会发现自己的最优策略取决于对方的选择。
生活当中就是这样的道理,“吃别人的嘴短,拿别人的手短”。不同的人在一起合作时,有求于对方的人,在讨价还价的谈判中,一定是处于劣势的。
另一个经典的例子是,假如你正在跟恋人用手机通电话,突然信号断了,这时,你会立即拨电话过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,这取决于你的恋人是否会拨过来。如果你们其中一方要拔,那么另一方最好是等待;如果一方等待,那么另一方最好是拨过去。因为如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中流逝。
这个思路过程,其实就是博弈的过程。
在一场博弈中,你必须考虑到对方的选择以确定你自己的最优选择,而对方也必须考虑你的选择来确定他的最优选择。
你从博弈中得到的,不仅取决于你自己的行动,也取决于对方的行动,因此博弈是双方的,多方的,而不是你单独一个人的。如果你知道恋人不会打过来(如以前断线就是她在等电话,如果你的手机包月额度很难用完而她的接听免费),那么,你的最优行动就是拨过去。
其实,博弈最本质的特征就是,双方的行动相互影响又相互依赖。
金庸小说中的珍珑棋局,多少高手未曾破解;而棋艺浅陋的虚竹“退一步”,闭了眼睛乱下一子,杀死自己一片,反而天地一宽,破解迷局。
著名的田忌赛马中说,孙膑先以下等马对齐威王的上等马,第一局田忌输了。齐威王站起来说:“想不到赫赫有名的孙膑先生,竟然想出这样拙劣的对策。”孙膑不去理他。
接着进行第二场比赛。孙膑拿上等马对齐威王的中等马,获胜了一局。齐威王有点慌乱了。
第三局比赛,孙膑拿中等马对齐威王的下等马,又战胜了一局。这下,齐威王目瞪口呆了。
比赛的结果是三局两胜,田忌赢了齐威王。还是同样的马匹,由于调换一下比赛的出场顺序,就得到转败为胜的结果。
这说明,充分的利用博弈思想,当双方条件相当时,对策得当可以战胜对方;在双方条件相差很远时,对策得当也可将损失减低到最低程度。
人生是永不停歇的博弈过程,博弈意味着达到合意的结果。作为博弈者,最佳策略是最大限度的利用游戏规则,最大化自己的利益。作为社会最佳策略,是通过规则使社会整体福利增加。
16什么是博弈论?
博弈论(game theory,又译为对策论,游戏论等。)
它是研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡。
此处,要注意两点,一是,是两个或两上以上参与者之间的对策论。博弈论试图研究即存在冲突又存在合作的情况(比如寡头垄断)时人们的决策行为。博弈是一种势态,在该势态中,两个或更多的参与人都在追求他们各自的利益,没有人能够支配结果。
二是,关于理性人的假设。理性人是指一个定义的偏好,在面临一定的约束条件下最大化自己的偏好。
博弈的过程是一个策略上的相互作用的过程。这使得任何一方的行为都必须要考虑到对方可能做出的反应。博弈论是研究理性的决策主体,在其行为发生直接的相互作用时的策略选择,及策略均衡的理论。博弈分析的关键步骤是找出在别人选择既定的情况下,自己的最优化反应策略(给自己带来最大收益的策略)。
博弈论说起来有点绕嘴,但理解很起是很容易理解的,那就是每个对弈者在决定采取哪种行动时,不但要根据自身的利益和目的行事,而且要考虑到他的决策行为对其他人可能的影响,通过选择最佳行动计划,来寻找收益或效用的最大化。
17囚徒困境经典故事的启示
两个寡头企业选择产量的博弈。
如果两个企业联合起来形成卡特尔,选择垄断利益最大化的产品,每个企业都可以得到更多的利润。给定双方遵守协议的情况下,每个企业都想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格的小于卡特尔产量下的利润。
第二次世界大战胜利在望,可是为了给自己捞取功劳,一个飞行大队的指挥官没完没了地下达提高下属的任务定额,弄得所有的人都人心惶惶。
投弹手尤塞里安不想成为胜利前夕的最后一批牺牲品,千方百计的逃避任务。他的上级问:“假如,我的士兵都像你这样,这仗还怎么打?”,可尤塞里安回答到:“那我若不这么想,岂不成了一个大傻瓜?”
其实,囚徒困境的性质是,个人理性和集体理性的矛盾,个人的“最优策略”使整个“系统”处于不利的状态。
为什么会造成囚徒困境,难道仅仅是由于“通讯”问题才造成的?
亚当斯密在1776年发表的经典之作《原富》(又译《国富论》)中认为:
很多时候,一个人会需要兄弟朋友的帮助,但假如他真的要依靠他们的仁慈之心,他将会失望。倘若在需求中他能引起对方的利己之心,从而证明帮助他人是对自己有益的事,那么这个人的成功机会较大。任何人向他人提出任何形式的交易建议,都是这样想:给我所需要的,我就会给你所需要的--这是每一个交易建议的含义;而我们从这种互利的办法中,所获的会比我们所需的更多。我们的晚餐不是得自屠夫、酿酒商人,或面包师傅的仁慈之心,而是因为他们对自己的利益特别关注。我们认为他们给我们供应,并非行善,而是为了他们的自利。
所以,每个人都会尽其所能,运用自己的资本来争取最大的利益。一般而言,他不会有意图为公众服务,也不自知对社会有什么贡献。他关心的仅是自己的安全、自己的利益。但如此一来,他就好像被一只无形之手引领,在不自觉中对社会的改进尽力而为。在一般的情形下,一个人为求私利而无心对社会作出贡献,其对社会的贡献远比有意图作出的大。
这是其中关于自私行为与市场运作的两段,是经济学上被引用得最多的名言。
诺贝尔经济学奖获得者萨缪尔森有一句话:你可以将一只鹦鹉训练成一个经济学家,因为它只需要学习两个词:供给和需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,就是“纳什均衡”。
18如何解决囚徒困境这类问题?
当然了,也许人类自私的天性,使人们往往陷入“囚徒困境”,难以自拔,而难以解决。
也许,我们可以沿着博弈论的思路,想一想解决的方法。
解决个人理性和集体理性之间冲突的办法,当然不是否认个人理性,而是应该设计一套机制,正如上一篇的结尾处所提倡的那样,在满足个人理性的前提下,达到集体理性。
需要设计一种制度安排,要发生效用,必须是一种纳什均衡,否则,这种制度安排本身就是不合理的,本身便不能成立了。
因此,从这一点上来说,囚徒困境就是,让我们认识到了在不同的情况下,这对社会而言是负面的,但如果正视它并试图加以管控和解决,这反而是正面的。