首页

第四章 囚徒困境

关灯 护眼    字体:

上一章 章节列表 下一页


“囚徒困境”是博弈论中具有代表性的一个博弈模型。我们一起来分析一下在囚徒困境中,局中人为什么只盯着眼前的利益不放,不愿与对手协作,最终错过更大收益的原因。与此同时也思考一下这个博弈的解决方案。



“坦白”还是“抗拒”?囚徒们的困境


~囚徒困境①~


在博弈论中,有一个非常著名的模型——“囚徒困境”。这里的“囚徒”,准确地说是指被逮捕的两名犯罪嫌疑人。两个人都想获得更高的收益,结果两人不愿协作获得相对较高的收益,而是在警察的说服下选择了背叛对方。最终,两人只能获得较低的收益。这是一个残酷的博弈。

◎例题4-1囚徒困境

有两名一起行窃的盗贼被警察抓住了。但是,警方手上暂时缺乏有效的证据,如果两名犯罪嫌疑人始终保持沉默的话,警方因为证据不足,就无法对他们进行起诉。那样一来,两人最多只能被监禁1年。为了让他们招供,警察和两名犯罪嫌疑人说了同样一番话:“如果你把犯罪的经过原原本本地供出来,我可以减轻对你的惩罚,甚至说你是被他人胁迫犯罪的,进而免予惩罚。但是,如果你拒不招供,而你的同伙坦白了,把你供出来的话,你可能要被判5年。如果你们俩都坦白的话,那么都会被判3年。”假设你是犯罪嫌疑人A的话,此时你会怎么选择呢?是继续保持沉默,还是按照警察说的坦白罪行?

在这个博弈中,局中人是犯罪嫌疑人A和B,策略是“坦白”或“沉默”。局中人的收益如表4-1所示。

作为犯罪嫌疑人A,你可能会这样分析:“如果我们俩都保持沉默的话,最多也就被监禁1年。1年时间,忍忍也就过去了。所以,我还是不能坦白,要继续保持沉默。等等!不对!B那个家伙可靠不住,他胆小怕事,只顾自己,又爱背叛。如果他禁不住警察的威逼利诱,为了自己的自由把我供出来的话,我可要被判5年。那家伙绝对会坦白招供的!我可不想吃5年的牢饭!好,还是我先坦白吧!”

结果,你先向警方坦白了。而你的同伙——犯罪嫌疑人B,也经历了和你类似的心理斗争,他也坦白了。结果,你们两个都坦白了,都被判了3年。



~囚徒困境②~


我们用博弈论来分析一下这个博弈。首先,来寻找犯罪嫌疑人A的最优反应。当犯罪嫌疑人B选择“沉默”策略的时候,A选择“坦白”的收益最高,可以获得自由。如果B选择“坦白”策略的话,那么A也只有“坦白”才能获得相对较高的收益。也就是说,对于犯罪嫌疑人A来说,“坦白”策略强支配着“沉默”策略(表4-2)。

我们再来看看犯罪嫌疑人B的最优反应。同样的道理,对于B来说,“坦白”策略强支配着“沉默”策略(表4-3)。

由此可见,不管是犯罪嫌疑人A还是B,都是选择“坦白”可以获得较高的收益。在这个博弈中,局中人的最优反应,也就是纳什均衡只有一个,就是“坦白”对“坦白”的策略组合(表4-4)。

但是,通过分析收益表,也许有朋友感觉“坦白”对“坦白”的组合并不是最优反应。他们认为,如果犯罪嫌疑人A和B都保持沉默的话,双方的收益会更高一些。如果犯罪嫌疑人A和B是在同一间审讯室受审的话,没准儿他们俩可以趁警察不注意用眼神交流,达成“谁也不许招供”的攻守同盟。但是,警察不会蠢到在同一间审讯室中审讯他们,肯定会对犯罪嫌疑人进行单独审讯。这样一来,犯罪嫌疑人就无从知晓同伙会选择“坦白”还是“沉默”了,只能根据自己的经验进行推测,而且一般都会认为对方会选择更有利于他自己的策略。因为在这个博弈中,存在着强支配策略,而且这个策略还是最优反应,所以,最终两人都会选择对自己最为有利的策略,那就是“坦白”。



~囚徒困境③~


在博弈论中,局中人不会产生误解,他们会合理地思考问题,采取的行动都是为了让自己的收益最大化。一个局中人通过合理地分析能够认识到,对方不会选择“沉默”,肯定会“坦白”。在这种情况下,就不能期待“1年监禁”的惩罚了,相对较高的收益应该是“3年监禁”。如果两个人建立攻守联盟的话,双方都可以得到较高的收益,但是,在没有条件进行合谋的情况下,就只有选择背叛对方。结果,双方都只能得到较低的收益。这便是“囚徒困境”的原理。

下面我们再来仔细分析一下“囚徒困境”这个博弈的特征。表4-1是囚徒困境的收益表。表3-2是第三章中(第87页)介绍斗鸡博弈时使用的一个收益表。这两个收益表中的数字有相似的地方,但是策略的关系、收益的大小、纳什均衡的位置等都存在差异。在斗鸡博弈中,如果对方强硬地选择“直行”,那么自己妥协,选择“转向”的收益更大。但是,在囚徒困境的博弈中,不管对方选择“沉默”还是“坦白”,自己选择“坦白”的收益都相对较大。

我们再把两个收益表的数字简化一些,然后进行比较,两个博弈在结构上的差别就更加明显了(表4-5、表4-6)。

囚徒困境这样的博弈类型,在现实生活中经常能够见到。比如,企业之间的价格竞争,也属于囚徒困境的博弈。企业采取“高价格”策略就相当于“沉默”,而采取“低价格”策略就相当于“坦白”。最后,存在竞争的企业就陷入了竞相降价的囚徒困境之中。再有,国家与国家的军备竞赛也属于囚徒困境类型的博弈,削减军备相当于“沉默”,扩充军备相当于“坦白”。结果,竞争国之间就陷入了无休止的军备扩充竞赛之中。

注:①为了方便比较,我们将第87页的表3-2中“转向”和“直行”的顺序进行了调换。



水门事件中的“囚徒困境”


~囚徒困境的现实案例~


1972年6月,在美国总统大选期间,共和党候选人尼克松为了赢得连任,其竞选团队成员潜入了位于华盛顿水门大厦的民主党全国委员会总部办公室,准备安装窃听装置并偷拍文件,以窃取民主党的竞选策略等情报。然而,这些人被当场抓获。以此为开端,揭开了一个由白宫指挥、多名政府高官参与的情报窃取计划,这便是美国历史上著名的政治丑闻——“水门事件”。在对这个事件进行调查的过程中,就可以看到囚徒困境的身影。

据说,华盛顿联邦地方法院的法官塞尔伯特为了获得总统助手乔治·G.李迪和总统法律顾问约翰·迪安的协助,和他们俩分别做了交易。塞尔伯特分别告诉他们俩,只要他们愿意指证水门事件背后的黑幕,就可以减轻自己的罪行。一开始,李迪和迪安都不打算认罪,也不准备指证背后黑幕和对方。由于迪安对事件的参与度相对较低,于是塞尔伯特准备先以迪安为突破口,对他做了一些工作。首先,塞尔伯特告诉迪安,自己已经和李迪进行了密谈,谎称李迪已经准备当证人。然后,又假装向李迪的律师讲述李迪的打算。看到这些后迪安开始感到不安,据他判断,李迪
m.qiduwx.com提示您,本章没有阅读完,点击下一页进入下一页阅读!

上一章 章节列表 下一页