兵者,诡道也。
以前在跟别人石头剪刀布的时候,会问对方你打算出什么,对方一旦说出了打算,就开始进入心理博弈阶段。对方说出打算出剪刀,那我就会开始思考,对方说的是实话吗?
如果是实话,那我只要出石头就好了,但是哪有人会把打算告诉敌人的,所以对方应该是骗我的,他打算出的是布,但再想深一层,如果他也想到我会考虑到他的欺骗行为,那他就会觉得我不会出石头了,而是剪刀,那么他就会出石头,所以我只要出布就一定会赢。但如果遇到对方以不变应万变的情况,就栽了。所以这种情况,还得把对方的智力因素放入考虑因素。
上述例子里,倘若对方以逸待劳,且一直使用这个策略,则该策略叫做支配性策略,但这里不存在纳什均衡,也就是两人使用固定的策略。
万老师指出,这是“没有纯策略的纳什均衡”,但是如果要参加多次罚点球,运用“混合策略”这个系统可以取胜。
以一定的概率往左踢,以一定的概率往右踢。这是显而易见的,但如果计算概率才是关键。
假设我比较喜欢往左边踢,如果我以各50%的概率,那守门员会坚决扑向右边,因为我的习惯的存在,守门员会觉得右边更值得交给运气。50%的概率虽然无法预测,但我的习惯很容易被对手利用。
那么这个时候要做的就是混合策略,结合自己往左踢和往右踢的进球概率,合理搭配往左踢和往右踢的概率,误导对方以为不过扑左边还是扑右边,我进球的概率都是一样的。
冯·诺依曼提出的理论——最小最大值定理。就是把对手的最大报偿最小化,有两点,一是按照一定的概率,混合自己的打法,二是这套打法必须让对手无法利用,也就是所谓的阳谋。你知道我在干嘛,但是你拿我没办法。
如果你一直说谎话,其实和说实话一样。最佳撒谎者是把实话和谎话结合,且别人无法计算出占比。
人类最无法执行随机性策略,比如要执行以40%和60%的概率来罚点球,是先踢4个左,再踢6个右吗?这样安排太整齐了,别人很容易就能发现并加以利用。那交替进行呢?踢了两次左之后,第三次就很想踢右,守门员很可能就会防守右边。这其中其实还涉及到一些赌徒谬论,这个放在文末写。
正确的做法就是执行真实的随机性,如一本书,翻到页码个数是0-3就踢左,4-9就踢右。只要不是真的随机性,就会被发觉。
足球比赛中,梅西明明很厉害,但在场上看到的表现通常不是他一直持球,突破。因为实力强,所以被重点防守,很大程度上起到的是一个牵制对方防守队员的作用,球星再强,也要一定概率的传给队友,这样才能让阵容更加诡异。
这种策略属于阳谋,就算对方知道你在计算概率,也不知道你的概率是多少。以前看柯南的时候,许多犯罪手法是根据被害人的生活习惯来制定方案的,这使我一度频繁改变我的放学回家路线。曹操也说过类似的言论,真正的英雄不应该有被敌人利用的规律。
文中所说的赌徒谬论,守门员猜扑左还是扑右,其实跟猜测硬币的正反面一样,我们都知道正反面概率是50%,所以有些人会理所当然的以为已经抛了1000次正面了,那第1001次一定是反面,然而第1001次正反面的概率还是各占50%。扑球同理,如果射门的选手左右交替太频繁,刻意去营造相对平衡的概率,那前两次射了左边,第三次很大的概率就是右边。
博弈论真是魅力四射!