|
今天来谈谈博弈论中的囚徒困境,这个题目大家可能都有所了解,但对它的具体扩展应用,或许还讨论得不多。我们先谈谈它的模型构建和均衡结果,然后讨论一个实际应用的例子。
囚徒困境(Prisoners' Dilemma)
1.策略博弈模型的构建
在一次严重刑事犯罪案件中,两名疑犯被分别关押。有充分的证据可以给两个人都定轻罪,但没有充分证据给其中任何一人定重罪,除非两人中有一个人愿意告发另一个人(告密)。
如果两人都保持沉默,他们将都被判轻罪入狱,刑期1年;
如果两人中有且仅有一个人选择告密,他将作为证人而获得免刑,而另一人则会被判入狱4年;
如果两人都选择告密,他们将都被判入狱3年。
根据策略博弈模型的定义,这个情形可以表示为一个策略博弈(strategic game):
博弈者(Players):两名疑犯。
行动集(Actions):每个人的行动集合是 {沉默,告密}。
偏好(Preferences):疑犯1对可能的行动组合(action profile,用 (a1,a2) 来表示,其中a1是博弈者1的行动,a2是博弈者2的行动)的偏好,按照从高到低的顺序排列,是:
(告密,沉默):他告密,疑犯2沉默,因此他免刑;
(沉默,沉默):他入狱1年;
(告密,告密):他入狱3年;
(沉默,告密):他入狱4年。
疑犯2的偏好顺序是:(沉默,告密),(沉默,沉默),(告密,告密),(告密,沉默)。
可以用表格来更简洁地表达这个博弈。首先定义代表疑犯偏好顺序的回报函数(payoff function)。
对疑犯1,有回报函数
u1(告密,沉默)>u1(沉默,沉默)>u1(告密,告密)>u1(沉默,告密)。
可以简单定义u1(告密,沉默)=3,u1(沉默,沉默)=2,u1(告密,告密)=1,u1(沉默,告密)=0 (函数值只需能够表达出偏好顺序即可,具体大小无所谓)。
同理,对于疑犯2,可以定义:u2(沉默,告密)=3,u2(沉默,沉默)=2,u2(告密,告密)=1,u2(告密,沉默)=0。
有了这些定义,这个博弈可以表示为下表:
在这个表中,两行表示博弈者1的两种可能行动,两列表示博弈者2的两种可能行动,这样每一格就代表了一个行动组合,而每格中的数字则是这个行动组合中两个博弈者分别的回报值,博弈者1的回报值在前。
2.囚徒困境模型的纳什均衡(Nash Equilibrium)
根据纳什均衡的定义(可以简单理解为这样的行动组合:对于其中任何一个博弈者而言,如果只有他改变行动而别人不变,他获得的回报不会比不改变来得多。因此均衡也可以看成是博弈的最终结果),囚徒困境博弈有且只有一个纳什均衡:(告密,告密)。
因为:
i. 如果博弈者2选择告密,博弈者1选择告密将比选择沉默得到更大的回报(观察表格右边的那一列,1>0);
ii.如果博弈者1选择告密,博弈者2选择告密将比选择沉默得到更大的回报(观察表格下边的那一行,1>0);
其他行动组合不符合纳什均衡的定义:
(沉默,沉默):当博弈者2选择沉默,博弈者1选择告密的回报大于他选择沉默(观察表格左边的那一列,3>2),因此他将改变行动;
(告密,沉默):当博弈者1选择告密,博弈者2选择告密的回报大于他选择沉默(观察表格下边的那一行,1>0);
(沉默,告密):当博弈者2选择告密,博弈者1选择告密的回报大于他选择沉默(观察表格右边的那一列,1>0)。
可以看到,最终的纳什均衡,不是总回报最大的行动组合(沉默,沉默)。
自私和利他的社会行为
现在考虑一个囚徒困境的具体应用。
两个人上了一辆公共汽车。车上只剩两个狭小的相邻空座位。每个人要决定是坐下还是站着。单独坐着比坐在别人旁边舒服,而坐在别人旁边又比站着舒服。
a. 假设每个人都是自私的,即只考虑自己的舒适度。
b. 假设每个人都是利他的,即根据别人的舒适度来衡量自己行动的回报,并且出于礼貌,如果别人站着,自己也选择站着而非坐下。
问题:这两种情况的策略博弈模型分别是怎样的?它们是否是囚徒困境模型?有没有纳什均衡?
a.此时的博弈模型如下表:
可以看出,这个博弈不是囚徒困境博弈(不管是把坐下假设为沉默、把站着假设为告密还是相反,都不符合囚徒困境的特征),但此博弈有唯一的纳什均衡:(坐下,坐下)。
b. 此时的博弈模型如下表(α>0):
可以看出,当α<1时,这个博弈是囚徒困境博弈。同时,不管α是何值,此博弈有唯一的纳什均衡:(站着,站着)。
比较a和b这两种情况的纳什均衡,可以得出一个有趣的结论:当每个人都自私的时候,要比人人都利他的时候过得更舒服一些。
至少在坐公共汽车的时候是这样。
(末注:本文大体译自Martin J. Osborne: An Introduction to Game Theory, 2004,行文略有调整) |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?注册
×
|