假如你和同一个对手玩了100次图6-6所示的囚徒困境博弈,会出现什么情况?假如只玩一次,你一定会使坏。假如对手使坏,你跟着使坏就会得1分,好心则会得0分。假如对手好心,你使坏就会得3分,好心则会得2分。因此,不管对手怎么做,假如博弈只玩一次,坏心对你一定比较有利。但假如你们要玩100次,情况会如何?
假如在整个博弈中,双方都很坏心,双方每次就只能各得1分的报酬。但如果双方一直很好心,其报酬就是每回合2分。假如一方开始使坏,对方就会跟着使坏,于是双方就会形成只得1分的僵局。所以一方宁可先展现善意,希望对方跟进。假如对方很好心,一方的确可以占他便宜而在此次中坏心。但是,等此回合结束后,对方也就不会再好心下去了。接下来就会陷入每次只得1分的窘境,因为自此之后,对方会一直坏心下去。因此,一方至少应该好心到对方坏心为止。
遗憾的是,最后一次会阻止所谓理性的双方善待对方,即使是第一回合也一样。想想看,在第100次,也就是最后一次,你应该采取什么策略?在这个回合中,坏心带给你的报酬一定比好心更高。假如你会在某个回合选择好心,唯一可能的原因就是为了让对方在下一回合选择好心(还记得在类似的同步行动博弈中,当你行动的时候,对方并不知道你会怎么做;因此,你在任何一回合的选择都不会影响对手在该回合的行动)。不过,最后一次显然不必考虑到下一个回合。因此,在第100回合时,你肯定应该选择坏心,对方也应该这么做。
既然如此,你在第99回合应该怎么做?你在第99回合选择坏心一定可以得到比较高的报酬。假如你不想在第99回合选择坏心,唯一的理由就是为了让对方在第100回合对你好心。但前面已经说过,无论如何,对方在第100回合都应该会选择坏心。因此,双方在第99回合都应该选择坏心。当然,这表示你们两个在第98回合也应该选择坏心,因为双方在第99和第100回合一定会选择坏心。你可以把这个逻辑一直往前推,并借此证明你在第一回合就应该选择坏心!
因此,即使这个囚徒困境博弈玩100次、1000次或是10亿次,理性的参与者在每个回合都会选择坏心,只要这个博弈存在确定的最后一次。
不理性与囚徒困境
博弈论指出,当两个人陷入有限次重复性博弈中的囚徒困境时,他们绝对应该选择坏心。不过,经济学也是科学,只要谈到科学,自然就少不了理论测试。就博弈论来说,当实际陷入有限次重复性博弈中的囚徒困境时,当事人往往会善待对方,尤其是在前几个回合。理论与现实之间为什么会出现这种差异?
现实有所偏差,它应该按照理论进行调整才对。当然,也可能是博弈论学者对于人的理性假设出了问题。假设你正和某人玩有限次数为100次的重复博弈,而且你知道他并不是很理性。在博弈论之外,有很多人的好心都很强,但也不喜欢被人占便宜。比如,你认为对方一开始会选择好心,但也觉得假如你开始对他坏心,他也会对你坏心。此时你该怎么做?你或许应该选择好心,直到最后一次为止。当然,到了最后一次时,你绝对应该背叛对方。
在重复次数有限的囚徒困境博弈中,理性的双方之所以不可能善待对方,原因就在于这最后一回合的背叛。既然理性的对手在第100回合一定会背叛你,你在第99回合就应该背叛他。同样,既然你在第99回合会背叛他,他在第98回合就应该对你坏心……不过,如果你对对方的理性程度有所质疑,你可能就想在第一回合选择好心。这并不表示不理性对对方有利,而是表示“看起来不理性”对他有利。
有趣的是,就算你们两个都很理性,两人皆好心的结果还是有可能延续到最后一回合。假如双方都很理性,但没有人能百分之百确定对方很理性,那么双方可能就会理性地选择好心,并持续到最后几回合。
无限重复的囚徒困境
假如囚徒困境的博弈没有最后一次,那么就会出现双方皆好心的结果。由于最后一次一定是以背叛结束,因此参与者在最后一次绝对不可能好心。但在现实生活中,有很多博弈并没有最后一次。假如存在囚徒困境的博弈要永远玩下去,你可能就会顺理成章地采取一直好心直到对方对你使坏为止的策略。假如两个人都采取这种策略,双方就可以在每一回合得到很好的结果。即使存在囚徒困境的博弈不是永无止境的,但只要没有明确的结束日期,双方均好心的结果还是会出现。举例来说,假如有两个人在玩存在囚徒困境的博弈,此时他们要抛硬币来决定该不该再玩下去。如果他们直到硬币的正面朝上才停手,那么这个博弈就未必会存在最后一次。
在没有最后一次的重复博弈中,理想的结果是你保持坏心、对方保持好心,但这种结果几乎不可能出现,比较可能的结果是双方都保持好心。别忘了,在囚徒困境中,任何一个理性的人之所以会选择好心,唯一的理由就是诱使对方在下一回合选择好心。因此,如果要诱使对手选择好心,一定要让他认识到只要他变坏,你就会跟着变坏。在博弈论中,只有当好心对自己有利时,人们才会好心。可惜的是,存在囚徒困境的重复博弈必须一直玩下去,但这并不表示参与者一定会一直善待彼此。
背叛信任你的人是最容易的事,只不过当你背叛了他以后,他就不会再信任你了。如果背叛可以带给你可观的短期利益,这么做就很值得。我们来比较图6-7和图6-8的博弈,它们都属于存在囚徒困境的博弈。在这两个博弈中,双方都坏心可以各得5分,都好心则可以各得10分。双方所希望见到的情况显然是一直好心,而不是恶斗。当有一方背叛了对方时,这两个博弈的差异就会显现出来。当你坏心、他好心时,图6-8的博弈会比图6-7的博弈对你有利得多。因此,在图6-8的博弈中,背叛对手的诱因便大得多。
再来看另一个例子。抽烟可以满足一时的快感,但会造成健康问题。对于只顾眼前而不管未来的人来说,抽烟可能是理性的抉择。同样,在存在囚徒困境的重复博弈中,背叛对方对眼前有帮助,对将来却会造成不良影响。因此,当某个人对未来越不在意时,他就越有可能在这样的重复博弈中背叛你。举例来说,可能破产的供应商或是考虑退休的律师就比较重视现在,而不在意未来,因为他已经没有明天。因此,你更应该信任未来可期的人。
人的行为往往会透露出自身对现在与未来的重视程度。举例来说,你对于瘾君子的信任度应该打折扣,因为他们显然只重视现在、不注重将来。相反,锻炼身体的人则愿意牺牲现在以换取未来的利益,所以他们不会为了一时的利益背叛你。
假如你相信对方不久之后就会欺骗你,你就没有必要去改变他的想法,因为他很可能是基于自身的利益而对你使坏。假如你怀疑对方总有一天会背叛你,最理想的回对方法也许就是先背叛他。