1、第三章 不完全信息静态博弈 -贝叶斯纳什均衡n一 不完全信息静态博弈和贝叶斯纳什均衡不完全信息博弈海萨尼转换不完全信息静态博弈的战略式表述和贝叶斯纳什均衡n二 贝叶斯纳什均衡应用举例n三 贝叶斯纳什均衡与混合战略均衡n四 机制设计理论与显示原理完全信息博弈完全信息博弈:完全信息博弈:假定博弈中的每个参与人对所有其他参与人的支付(偏好)函数都有完全的了解,并且所有参与人知道所有参与人知道所有参与人支付函数,即支付函数式所有参与人的共同知识。尽管完全信息在许多情况下是一个很好的近似,现实中许多博弈并不满足完全信息的要求。不完全信息博弈:不完全信息博弈:不满足完全信息假设的博弈称为不完全信息博弈(或
2、者说,至少有一个参与人不知道其他参与人的支付函数称为不完全信息博弈)。不完全信息博弈“空城计”街亭失守,司马懿引大军蜂拥而来,当时孔明身边只有一班文官,军士一半已经运粮草去了,只有2500军士在城中。众官听得这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明令众将旌旗尽皆藏匿,打开城门,每一门用20军士,扮作百姓,洒扫街道。而孔明羽扇纶巾,引二小童携琴一张,于城上敌楼前凭栏而望,焚香操琴。不完全信息博弈 司马懿自马上远远望之,见诸葛亮神态自若,顿时心生疑忌,犹豫再三,难下决断。又接到远山中可能有埋伏的情报,于是叫后军做前军,前军做后军,急速退去。司马懿之子司马昭问:“莫非诸葛
3、亮无军,故做此态,父何故便退兵?”司马懿说:“亮平生谨慎,不曾弄险,今大开城门,必有埋伏,我兵若进,必中计也。”孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险,疑有伏兵,所以退去。吾非行险,盖因不得已而用之,弃城而去,必为之所擒。”不完全信息博弈n分析这个博弈参与人行动战略支付n画出这个博弈的战略式或扩展式表述不完全信息博弈-信息的重要性被擒,?不被擒,?被擒,?不被擒,?司马懿诸葛亮弃城守城进攻撤退司马懿:兵多将广,但不知道自己和对方在不同行动策略下的支付;诸葛亮:处于劣势,但知道博弈的结构,比对方掌握更多的信息。计策:使用各种手段迷惑司马懿,为的是不让对方
4、知道其策略的结果(支 付)。迫使其认为,撤退比进攻好,降低其进攻的预期收益。如用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主 观概率,使司马懿认为进攻的期望收益小于撤退的期望收益。司马懿关于自己策略的支付的信息是不完全的。不完全信息博弈 在信息不充分的情况下,博弈参与者不是使自己的支付或效用最大,而是使自己的期望效用或支付最大。如让你在50%的概率获得100元与10%的概率获得200元两者之间选择的话,前者的期望所的是50元,后者是20元,一般会选前者。不完全信息博弈100,100-50,00,00,0不接受求爱者求爱不求爱接受100,-100-50,00,00,0不接受被求爱者求
5、爱者求爱不求爱接受被求爱者100 x+(-100)(1-x)=0当x大于1/2时,接受求爱求爱博弈:品德优良者求爱求爱博弈:品德恶劣者求爱 被求爱者对于求爱者的品德的信息是不完全的。40004000,4000400080008000,0 00 0,800080000 0,0 0不开发开发商A开发不开发开发-3000-3000,-3000-300010001000,0 00 0,100010000 0,0 0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求小的情况需求大的情况需求大的情况房地产开发博弈不完全信息博弈 市场需求信息是不完全的。40,50-10,030,80-10,100
6、0,3000,3000,4000,400默许斗争默许斗争进入不进入在位者在位者市场进入博弈:不完全信息进入者进入者高成本情况高成本情况低成本情况低成本情况不完全信息博弈 进入者关于在位者成本信息是不完全的。进入者的最优选择依赖于他在多大程度上认为在位者进入者的最优选择依赖于他在多大程度上认为在位者是低成本的。是低成本的。n假定进入者认为在位者是高成本的概率是p,低成本的概率是(1-p),那么,进入者选择进入的期望利润是p(40)+(1-p)(-10),选择不进入的利润是0,因此,进入者的最优选择是:如果p=1/5,进入,如果p1,c21,c21 类似囚徒困境。1212信息完全时,公共物品提供的
7、概率3/4.不完全信息情况下公共产品的提供一级密封价格拍卖一级密封价格拍卖(the first-price sealed auction)是许多拍卖方式中的一种。在这种拍卖中,投标人(bidders)同时将自己的出价写下来装入一个信封,密封后交给拍卖人,拍卖人打开信封,出价最高者是赢家(获得拍卖品),并按他的出价支付。这里,每个投标人的策略是根据自己对物品的评价和对其他投标人评价的判断来选择自己的出价,赢者的支付是他对物品的评价减去他的出价,其他投标人的支付为零。首先考虑两个投标人的情况,。令 是投标人 的出价,为拍卖品对投标人 的价值。假定 只有 自己知道,因而 是投标人 的类型,但两个投标
8、人都知道 独立地取自定义在区间 上的均匀分布函数。投标人 的支付为2,1i0ibiiiviiviiviv1,0ijijiiijiiiijiibbbbbvbbbvvbbu如果如果如果,0,)(,);,(21一级密封价格拍卖 ,.0,1jjjjjjjjjjjjijjijijjjjjjjijjijijijjjjjb vac vvb va acabacbabb vac vvcvb vbabaP bb vP vcc现假设:以及 服从0,1上的均匀分布,服从上的均匀分布另由理性知则参与人i获得拍品的条件:又及服从均匀分布一级密封价格拍卖 1()()2()1122,112211,022iiiijjiiijj
9、ijiijiiijijijijijijiijijiiiiiiijiuvbP bbvvbP bbvbavbcbvvabavabavavabvavab vcvacaab因此参与人 最优化下述期望效用函数:由一阶条件得参与人i的最佳反应为:由于若则至少 取,因此有()()综上所述,12iiivv一级密封价格拍卖贝叶斯均衡的应用举例4.双方叫价拍卖 在双方叫价拍卖(double auction)中,同一物品的潜在卖方和买方同时叫价,卖方报价同时买方出价。然后,拍卖人选择一个价格 使市场出清:所有报价低于 的卖方卖出,所有报价高于 的买方买进;且价格为 时的总供给等于总需求。卖者提供该商品的成本是 ,该
10、商品对买者的价值是 ,买者和卖者同时选择出价和要价,分别为pppp 1,0c1,0v0,10,1()/2()/2;()/20sbsbsbssbbsbsbpppppppuppcuvpppp 和;如果,双方在上成交;卖者的效用是买者的效用是。如果,没有交易发生;买者和卖者的效用均为。贝叶斯均衡的应用举例 现在考虑不完全信息下,即只有卖者知道 ,只有买者知道 (因而 是卖者的类型,是买者的类型)。假定 和 在 上均匀分布,分布函数是共同知识。在这个贝叶斯博弈中,卖者的战略(要价)是 的函数 ;买者的战略(要价)是 的函数 。战略组合 是一个贝叶斯均衡,如果下列两个条件成立:ccccvvvv 1,0s
11、p cpsbp vpb ),(vpcpbs cppPcppcpEpvvppvpPcpvpvpEpcpsbsbsbpbsbsbbspsbs(21max)(21max买者最优:卖者最优:贝叶斯均衡的应用举例现假定:ccpsss vvpbbb cppcppppvpPdxxpvpvpEppvPpvPpvpPpvbbsbsbbbbsspbbssbpbsbbbsbbbbssbbsbbbbbsbbs3231)(2121max)(211,)1,0)(求导得:代入卖者的目标函数:上均匀分布。在上均匀分布,因此,在因为贝叶斯均衡的应用举例 vppppvpcppPdxxcppcpEppcPcpPcppPpcssss
12、bsbbpsbsbpssbsssbssbssbsbssssbbs3231)(2121max)(211,1,0求导得:代入卖者的目标函数:上均匀分布。在上均匀分布,因此,在同理,因为贝叶斯均衡的应用举例解两个一阶条件得均衡线性战略为:ccps3241 vvpb3212111/41/43/413/4spbpc v cps vpb在均衡线性战略下,当c3/4,卖者的要价ps=1/4+2c/3低于成本,但高于买者的最高出价pb(1)=1/12+2/3=3/4,因此卖者低于成本出售的情况不会出现;类似地,当v1/4,买者的出价高于其价值,但低于卖者的最低要价ps(0)=1/4,买者高于价值的交易也不会发
13、生。将计就计-掌握的正确信息越多,获胜的可能就越大n有一个卖草帽的人,有一天叫卖归来,在一棵大树旁打起了瞌睡,等他醒来的时候,发现身边的帽子都不见了,抬头一看,树上有很多猴子,模仿人的样子把帽子戴在头上,他想到猴子喜欢模仿人的动作,就拿下自己的帽子扔在地上,猴子也学他,纷纷将帽子扔在地上。于是卖帽子的人检起帽子回家去了,并将这个故事告诉了他的子孙。n很多年后,他的孙子继承了卖帽子的家业,有一天,他也在大树旁睡着了,而帽子也同样被猴子拿走了,他想起爷爷的办法,拿下帽子扔在地上。可是猴子非但没有照他的做,还把扔在地下的帽子也拣走了,临走时还说:我爷爷早告诉我了,你这个老骗子要玩什么把戏。著名的BF
14、实验-如果我们根本不能从别人那里得到有用的信息,怎么办?n把几只蜜蜂和几只苍蝇放进一个玻璃瓶中,然后将瓶子平放,让瓶底朝向窗户,结果会怎样呢?你会看到,蜜蜂不停地在瓶底寻找出口,直到累死为止,而苍蝇则在不到两分钟内全部逃出。为什么呢?因为蜜蜂喜欢光亮而且有智力,于是他们坚定的认为,出口一定在有光亮的地方,于是他们不停地重复这一合乎逻辑的行为。而苍蝇呢?它们对事物的逻辑毫不在意,而是到处乱飞,探索有可能出现的任何机会,于是他们成功了。n实验、试错、冒险、即兴发挥、迂回前进、混乱、随机应变,所有这些都有助于应付变化,要善于打破固定的思维模式,要有足够的探索未知领域的学习能力。如何甄别信息的真伪?n
15、索罗门王断案将计就计-练习 在三国演义第45-46回中,周瑜伪造假降书,诱骗曹操杀了蔡瑁、张允二将,曹操遂派蔡中、蔡和两兄弟假装降周瑜,去土获取东吴情报,周瑜识破曹操的诡计,将计就计,对黄盖施以苦肉计,如何将这一故事模型转化为一个不完全信息博弈?或者,不完全信息博弈是否就是将计就计?练习n自然决定支付矩阵如下所示,概率分别为x和1-x,参与人1知道自然选择了a还是b,但参与人2不知道,参与人1和2 同时行动。n给出这个博弈的扩展式表述并求纯战略贝叶斯纳什均衡。1,10,00,00,0R参与人1TBL0,00,00,02,2R参与人2参与人1TBL参与人2人有了知识,就会具备各种分析能力,明辨是非的能力。所以我们要勤恳读书,广泛阅读,古人说“书中自有黄金屋。”通过阅读科技书籍,我们能丰富知识,培养逻辑思维能力;通过阅读文学作品,我们能提高文学鉴赏水平,培养文学情趣;通过阅读报刊,我们能增长见识,扩大自己的知识面。有许多书籍还能培养我们的道德情操,给我们巨大的精神力量,鼓舞我们前进。