在纳什均衡中,各方的预期全部会实现,所选的策略亦属最佳。
——摘自1994年宣布诺贝尔经济学奖得主时的新闻稿
约翰·纳什(John Nash)在博弈论的发展中扮演着极为重要的角色,《美丽心灵》(Beautiful Mind)这本书以及赢得奥斯卡金像奖的同名电影就是在描述他的一生。纳什发展出解决博弈的方法,这个方法也以其名字称为“纳什均衡”。
纳什均衡是指一个不会令人后悔的结果,不管其他人怎么做,各方对于自己的策略都很满意。在纳什均衡中,你不一定满意其他人的策略,但你的策略是回应对手招数的最佳策略。纳什均衡中的各方绝对不会合作,而且总是认定自己改变不了对手的行动。
纳什均衡:给定其他人的选择,没有人对自己的策略感到后悔。
试想一个简单的博弈,汤姆和吉姆这两个员工都想要加薪。假如只有一个员工要求加薪,老板会答应;但如果两个人都要求加薪,老板就会愤怒地把两个人都开除。这个博弈有两个纳什均衡,一个是只有汤姆要求加薪,另一个是只有吉姆要求加薪。两个员工都不要求加薪并不是纳什均衡,因为当两个人知道对方没有提出要求时,就会后悔自己的选择。两个人都要求加薪也不是纳什均衡,因为两个人事后都会后悔自己被开除。
对于什么“不是”纳什均衡,《美丽心灵》无意中提供了一个绝佳的例子。电影里有这样一幕,有四位美人和一位真正的绝色美女走进了酒吧。于是纳什便跟三个男同学解释说,他们该怎么去讨好这些女孩。纳什说,在正常情况下,四个男生会同时对这个绝色美女展开攻势。但纳什认为,采取这种策略并不明智,因为假如所有的男生都去追同一个女生,他们就会互相牵制,到头来“没有一个人”能如愿以偿。纳什预测说,假如四个男生被绝色美女拒绝后才去找那些颇有姿色的女生,那么这些女生就会因为自己成为别人的第二选择而愤怒,于是她们也会把这些男生一脚踢开。纳什提议说,为了避免两头落空,这些男生应该一起冷落这位绝色美女,转而去追求那几个颇有姿色的女生。虽然电影里一直没有明确,但它却以暗示的手法告诉大家,纳什所提出的配对策略和他赢得诺贝尔经济学奖的理论及纳什均衡的概念有关。
我们先来看被纳什否定的追女友策略。这四个男生绝对不应该一起去追那个女生。情况很明显,假如其他三个男生已经对她展开攻势,而且你也知道自己去追一定追不上,那么去追其中一个颇有姿色的女生对你会比较有利。因此,四个男生都去追同一个女生并不是纳什均衡,即使她再漂亮也一样。假如这四个男生同时对这个绝色美女展开攻势,他们就会后悔自己选择去追她,但如果他们采取不同的策略,各自去追求一位颇有姿色的女生,结局就会不一样。因此,约翰·纳什所否定的结果并不是纳什均衡。
但老实说,《美丽心灵》的奥斯卡奖应该被撤销,因为纳什在这部电影中所提出的结果也不是纳什均衡。还记得他建议说,四个男生应该一起冷落那位绝色美女。但如果每个人都冷落她,他们事后就会对这一策略感到后悔。当然,假如有很多人都对酒吧里最漂亮的女生展开攻势,不追求她可能还有点道理。但如果别人都对她视而不见,那么你显然应该去追她(假设你喜欢的是女生)。
不过,酒吧里的追女友博弈最少会有一个真正的纳什均衡。有一个可能的纳什均衡是,只有一个男生追求这位绝色美女,其他人则退而求其次。这位男生显然会很满意自己的策略,因为他等于打赢了这场仗。其他三个人可能也会很满意自己的选择。假如这个结果是纳什均衡,那么这三个男生就会去追求那些颇有姿色的女生,而不会去和第一个人抢夺绝色美女,因为第一种做法比较容易成功。不过,真正的纳什均衡可能是两三个男生去追求那个绝色美女,其他人则去追求那些颇具姿色的女生。假如这些男生宁可采取追求绝色美女这种相对不容易成功的做法,也不愿意采取追求其他女孩这种比较容易成功的做法,这个结果就会变成纳什均衡。
纳什均衡的威力来自于它的稳定性。不管其他人怎么做,每个人都很满意自己的做法,所以没有人想改变自己的策略。我们来看图5-1的纳什均衡。
在这个博弈中,甲选A、乙选X会形成纳什均衡。假如甲选A,那么乙的最佳选择就是X。因此,如果甲选了A,乙就会对X很满意。同样,假如乙选X,那么甲的最佳选择就是A。
很明显,双方比较满意的是B与Y的组合,而不A与X,但这并不妨碍A与X的决策组合成为纳什均衡,因为当双方选择A与X的时候,双方的策略都是回应对手的最佳策略。而B与Y的组合同样是这个博弈的纳什均衡,因为在选择B与Y的组合时,双方都能得到最大的报酬,所以会对自己的策略感到满意。
而B与X的组合并不是纳什均衡,因为这个选择会让双方后悔,假如乙选了X,甲就会后悔自己选了B,因为他如果选了A,就可以得到更高的报酬。
在图5-2中,B与Y的组合是很明显的纳什均衡,而A与X则是另一个纳什均衡。假如甲选A,选X并不会让乙后悔,因为无论如何他都是一无所获。同样的道理,假如乙选X,选A也不会让甲后悔。在对手出招时,假如你不可能有比X更好的选择,你就不会后悔选了X。
图5-1和图5-2的结果显示,纳什均衡可以不止一个,但高下可能有所不同。参与者显然应该设法从“次级”均衡跳到比较好的均衡去。
图5-3提供了另一个有多个纳什均衡的例子。在这个博弈中,双方都好心显然是纳什均衡。假如双方都好心,便可以各得10单位的报酬。假如一个好心,另一个坏心,坏心的人只能得到8单位的报酬。双方都好心是稳定的结果,因为假如有一个人好心,另一人也会以好心响应。遗憾的是,双方都很坏心也是纳什均衡。当双方都使坏的时候,他们的报酬都是0。但如果一个好心、一个坏心,那么好心的人就会损失5单位。当对方使坏时,你最好的回应之道就是一起使坏。因此,两个人均使坏,便成了稳定的纳什均衡。
假如你发现自己处在像图5-3这样一个每个人都在使坏的博弈中,那么最好的办法就是说服对手,你们应该一起持有好心。但千万要记得,假如你不能说服对手改变策略,你也不应该改变策略。
假如我们把图5-3的报酬调整成图5-4,两人均当好人的结果就不可能出现。在图5-4中,和上一个博弈唯一不同的地方在于,以怨报德的好处提高了。不过,这个改变却会使两人均当好人的结果不再是纳什均衡。假如有一方好心,另一方坏心对自己反而有利,于是两人均当好人的结果便无法保持稳定。
举一个比较抽象的例子。如果你和同事都坏心,且分别向老板说对方的坏话,那么决定你们的博弈是像图5-3还是图5-4的关键问题在于,假如你们之中有一个人很好心,另一个人应该以怨报德还是以德报德?假如有一个人很好心,老板可能不允许另一个人不以礼相待,但以怨报德可能是在公司出人头地的理想方式。假如双方都能从对好人使坏的策略中得利,那么你们就会陷入应该坏心的纳什均衡中。每个人都使坏的博弈形态又被称为囚徒困境(prisoners'dilemma),下一章将予以介绍。