首页

第二章 纳什均衡

关灯 护眼    字体:

上一章 章节列表 下一页


可以说,纳什均衡是博弈的解,也是博弈论的核心。在本章中,我将通过具体案例来为大家详细讲解纳什均衡。博弈论中的经典模型——“男女博弈”也将在本章中登场。



每个局中人的策略都是对其他局中人策略的最优反应


~什么是纳什均衡?①~


著名数学家约翰·纳什曾为博弈提出了一种解决方法。在博弈论中,局中人都想为自己赢得最好的收益而采取适当的策略。纳什将局中人的这种基本行为规则称为“最优反应”。而让每个局中人选择的策略都是最优反应的一套策略组合,就是这个博弈的解。这个解处于一种均衡的状态,非常稳定。如果有局中人打破这种均衡,选择其他策略,那么他的收益注定会减少,因此他不愿意打破这种均衡的状态。这种均衡的状态就被命名为“纳什均衡”。简单地说,纳什均衡就是所有局中人都对自己选择的策略感到满意,对于得到的结果也不会后悔。

我们来看一个简单的博弈例题。假设有一对兄弟,祖父想给他们总计100万日元的财产。但是有一个规则,需要兄弟二人同时报出一个自己想要的金额,这个金额必须在0~100万之间,而且以1万为最小单位。如果二人报出的数字相加不高于100万,那么他们可以得到与自己所报数字相同的财产。但如果兄弟二人所报数字之和高于100万,则两个人一分钱也得不到。

我们肯定会想,兄弟二人每人报50万,应该没什么问题。两人申报的数额相加正好等于100万,祖父就会按照事先的约定,给他们每人50万日元。这种状态就是纳什均衡,即不管哥哥还是弟弟,都会对自己的策略和收益感到满意。

但是,如果哥哥生性贪婪,爱占弟弟便宜,从小到大,不管什么都要得到弟弟的两倍才肯罢休,那结果又会如何呢?假设弟弟非常了解哥哥的霸道性格,因此他知道,如果自己报50万,结果很可能两个人一分钱都得不到。知道哥哥肯定会报双倍于自己的数额,那么弟弟为了获得最大收益的最优反应就是报33万。

这样一来,弟弟报的数额是33万,哥哥报的是67万,比弟弟的两倍还多一点儿。结果,二人所报数额相加等于100万,两人分别得到33万和67万,两人都满意,这也是纳什均衡。但是,如果弟弟报的是33万,而哥哥这次良心发现,只报了50万。结果,两人合计83万,低于100万。虽然最终各自拿到了相应数额的财产,但两人肯定都会后悔。哥哥心想,我再多报17万就好了。而弟弟心想,我报50万就好了。因此,弟弟报33万,哥哥报50万,就不算纳什均衡。

可以说,纳什均衡是一种对手的收益不会减少、自己的收益不会增加,谁也无法单独改变策略的状态。在纳什均衡中,假定局中人之间不会相互合作,对方的行动也无法改变。就像两个数相加得100万,我们可以列出很多种组合方式一样,人所参与的博弈也不一定只有一种纳什均衡。某些情况下,同一个博弈会有多个纳什均衡。



~什么是纳什均衡?②~


现在我们以第一章中的例题1-2“评价成绩博弈”为例,解说一下纳什均衡的求法。在例题1-2的博弈中,不管对方采取什么样的策略,自己的最优反应是选择“α”(表1-13),即策略“α”强支配着策略“β”。另外,对方的最优反应也是不管我们采取什么样的策略都选择“α”(表1-21)。

我们将这两个收益表综合到一起,结果发现,有一个单元中没有任何收益,用红线勾掉了。这个单元相对应的策略,便是局中人相互采取的最优反应的策略组合。而这个策略组合,也就是纳什均衡(表1-22)。

纳什均衡是指博弈中的所有局中人都采取了最优策略,没有更好的策略可选,从而达到了一种稳定的状态。实现这种稳定状态的策略组合就是纳什均衡。只要对方选择“α”,我们也只能选择“α”,因为我们选择“β”的话,收益就下降了。同样的道理,只要我们选择“α”,对方也不能改变策略,只能选择“α”。这就是一种均衡状态。

不过,虽说纳什均衡是指博弈中的所有局中人都做出了最优反应,但并不等于所有局中人一定都能获得该博弈中的最高收益。在例题1-2的博弈中,最高成绩是A,但两名局中人不可能同时获得A。



约会的时候,需要迎合对方的行为和感受吗?


~男女博弈/纳什均衡①~


我们再来看一道纳什均衡的例题。相信有不少年轻的情侣一到周末就会为一件事情发愁,那就是“去哪里约会比较好”。在选择约会地点、约会方式的时候,是该迎合对方的喜好,还是自作主张呢?如果你觉得分手也无所谓,那当然可以按照自己的喜好做决定。但是,如果你很珍惜这段感情,希望双方都能度过一个愉快的周末,那到底该怎么决定约会的地点和方式呢?

◎例题2-1男女博弈

假设有一对刚开始交往不久的情侣,男的叫猴太郎,女的叫猴美。有一天,他们讨论起周末的约会计划。猴太郎喜欢足球,他想利用周末去看足球比赛。猴美喜欢看爱情电影,正值一部新片上映,她想去看电影。两人的兴趣存在差异,如果各行其是的话,就会浪费美好的周末约会时间,这是两人不想看到的结果。如果两人一起去看足球比赛,猴太郎是高兴了,猴美就不太开心了。反之,如果两人都去看爱情电影,猴美很欢喜,但猴太郎就有点儿不乐意了。那么,到底该选择什么样的约会方式呢?让我们从博弈论的角度来分析一下这个问题,希望找到对双方来说都是最好的选择。

局中人:猴太郎和猴美

策略:“看足球比赛”和“看电影”

收益:如果各行其是的话,双方都不开心,所以两人的收益都为0;如果两人都去看足球比赛,猴太郎的收益是10,但猴美的收益只有3;如果两人都去看电影,猴美的收益是10,但猴太郎的收益只有3。



~男女博弈/纳什均衡②~


在这道例题中,我们首先来确认一下是否存在支配性策略。根据对手的策略,我们将自己不是最优反应的策略(收益较小的一方)用横线勾掉。

当猴美选择看足球比赛时,猴太郎的最优反应是看足球比赛,看电影就不是最优反应。于是,我们用横线将看电影的收益勾掉。当猴美选择看电影时,猴太郎的最优反应是看电影,看足球比赛就不是最优反应,因此用横线将看足球比赛的收益勾掉。

同样,当猴太郎选择看足球比赛时,猴美的最优反应是看足球比赛,看电影就不是最优反应。于是,用横线将看电影的收益勾掉。当猴太郎选择看电影时,猴美的最优反应也是看电影,此时看足球比赛就不是猴美的最优反应,因此用横线将看足球比赛的收益勾掉。

在这个博弈中,不管对方采取什么样的策略,让自己收益较高或相等的策略是不存在的。也就是说,这个博弈中没有支配性策略
m.qiduwx.com提示您,本章没有阅读完,点击下一页进入下一页阅读!

上一章 章节列表 下一页