1、博弈论与信息经济学博弈论与信息经济学Game Theory and Economics of Information练习练习Exercise1 完全信息静态博弈2.在下表所示的战略式表述中,找出重复剔除的占优均衡。LMRU4,35,16,2M2,18,43,6D3,09,62,84.一群赌徒围成一圈赌博,每个人将自己的钱放在身边的地上(每个人都知道自己有多少钱),突然一阵风吹来将所有的钱混在一起,使得他们无法分辨哪些钱属于自己的,他们为此而发生争执,最后请来一位律师。律师宣布了这样的规则:每一个人将自己的钱数写在纸条上,然后将纸条交给律师;如果所有人要求的加总不大于钱的总数,每个人得到自己要求
2、的部分(如果有剩余的话,剩余的归律师);如果所有人要求的加总大于钱的总数,所有的钱都归律师所有。写出这个博弈中每个参与人的战略空间和支付函数,并给出纳什均衡。解:设金钱总数为M。对赌徒i,战略空间Si=0,M,siSi,支付函数ui为所有满足isiM的选择都是纳什均衡。纳什均衡有无穷多个。MsifMsifsuiiiiii05.(库诺特博弈)假定有n个库诺特寡头企业,每个企业具有相同的不变单位成本c,市场逆需求函数是p=a-Q,其中p是市场价格,Q=jqj是总供给量,a是大于零的常数。企业i的战略是选择产量qi最大化利润 i=qi(a-Q-c),给定其他企业的产量q-i,求库诺特-纳什均衡。解:
3、根据问题的假设可知各企业的利润函数为其中i=1,n。将利润函数对qi求导并令其为0得:解得各企业对其他企业产量的反应函数为:iinijjiiiicqqqqacqpq02inijjiiqcqaq2/cqaqnijji根据n个企业之间的对称性,可知必然成立。代入上述反应函数可解得:因此该博弈的纳什均衡是所有n个企业都生产产量 。*2*1nqqq1*2*1ncaqqqn1nca6.(伯川德博弈)假定两个寡头企业之间进行价格竞争(而不是产量竞争),两个企业生产的产品是完全替代的,并且单位生产成本相同且不变,企业1的价格为p1,企业2的价格为p2。如果p1p2,企业1的需求函数为0,企业2的需求函数为q
4、2=a-p2;如果p1=p2=p,市场需求在两个企业之间平分,即qi=(a-p)/2,什么是纳什均衡价格?解:假设单位成本为c。企业i的需求函数为 从上述需求函数可以看出,企业i绝不会将其价格定的高于企业j。由于对称性,可知博弈的均衡结果必然是两企业的价格相同,即p1=p2。如果pic,企业i的利润i=qi(pi-c)=(pi-c)(a-pi)/20。因此,只要企业i将其价格略微降低一点点(0),则可获得整个市场的需求,利润为(pi-c)(a-pi)(pi-c)(a-pi)/2。另一企业也会采取相同的战略,直到其利润为0。此时均衡的结果为p1=p2=c。jijiijiiippifppifpap
5、pifpaq027.(产品有差异时的价格竞争)现在假定两个企业的成本并不完全相同,企业1的需求函数为q1(p1,p2)=a-p1+p2,业2的需求函数是q2(p1,p2)=a-p2+p1。求两个企业同时选择价格时的纳什均衡。解:两企业的利润函数分别为求各自价格的一阶偏导数,令其等于0,得:121211,pppapp 212212,pppapp021211ppap022122ppap分别得到两个企业的反应函数:求解方程得:221pap212papapp219.(投票博弈)假定有三个参与人(1,2,3)要在三个项目(A,B,C)中投票选择一个。三个参与人同时投票,不允许弃权,因此,战略空间为Si=
6、A,B,C。得票最多的项目被选中,如果没有任何其他项目得到多数票,项目A被选中。参与人的支付函数如下:u1(A)=u2(B)=u3(C)=2 u1(B)=u2(C)=u3(A)=1 u1(C)=u2(A)=u3(B)=0找出这个博弈的所有的纳什均衡。解:所有战略组合的支付函数如下参与人3选择A参与人2ABC参与人1A2,0,12,0,12,0,1B2,0,11,2,02,0,1C2,0,12,0,10,1,2纳什均衡为(A,A,A)、(A,B,A)、(B,B,B)、(A,C,C)、(C,C,C)参与人3选择B参与人2ABC参与人1A2,0,11,2,02,0,1B1,2,01,2,01,2,0
7、C2,0,11,2,00,1,2参与人3选择C参与人2ABC参与人1A2,0,12,0,10,1,2B2,0,11,2,00,1,2C0,1,20,1,20,1,210.模型化下述划拳博弈:两个老朋友在一起划拳喝酒,每个人有四个纯战略:杆子、老虎、鸡、虫子。输赢规则是:杆子降老虎、老虎降鸡、鸡降虫子、虫子降杆子。两个人同时出令、如果一个打败另一个,赢着的效用为1,输者的效用为-1;否则,效用都为0。写出这个博弈的支付矩阵。这个博弈有纯战略纳什均衡吗?计算出混合战略纳什均衡。解:补充1:求出下图中的博弈的混合战略纳什均衡解:设参与人1采用战略T的概率为p;参与人2采用战略L的概率为q。分别计算两
8、个参与人采用各自两个纯战略的期望效用,并令它们相等得:2q=q+3(1-q)p+2(1-p)=2p求解得:p=2/3,q=3/4参与人2LR参与人1T2,10,2B1,23,0p1-pq1-q2 完全信息动态博弈1.参与人1(丈夫)和参与人2(妻子)必须独立地决定出门时是否带伞。他们知道下雨和不下雨的可能性相同(即50:50)。支付函数如下:如果只有一人带伞,下雨时带伞者的效用为-2.5,不带伞者(搭便车者)的效用为-3;不下雨时带伞者的效用为-1,不带伞者的效用为0;如果两人都带伞,下雨时每人的效用为-2,不下雨时每人的效用为1;如果两人都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为
9、1。给出以下两种情况下的扩展式表述(博弈树)和战略式表述:(1)两人出门前都不知道是否会下雨,并且两人同时决定是否带伞(即每一方在决策时都不知道对方的决策);(2)两人出门前都不知道是否会下雨,但丈夫先决策,妻子在观察到丈夫是否带伞后才决定自己是否带伞;(3)丈夫出门前知道是否会下雨,妻子不知道,但丈夫先决策,妻子后决策;(4)同(3),但妻子先决策,丈夫后决策。解:扩展式表述:假设用N代表自然,H代表丈夫,W代表妻子。NHHFFFF带伞不带伞不下雨带伞不带伞带伞不带伞带伞不带伞带伞不带伞(-2,-2)(-2.5,-3)(-1,-1)(-1,0)(-3,-2.5)(-5,-5)(0,-1)(1
10、,1)下雨带伞不带伞(1)(2)NHHFFFF带伞不带伞不下雨带伞不带伞带伞不带伞带伞不带伞带伞不带伞(-2,-2)(-2.5,-3)(-1,-1)(-1,0)(-3,-2.5)(-5,-5)(0,-1)(1,1)下雨带伞不带伞NHHFFFF带伞不带伞不下雨带伞不带伞带伞不带伞带伞不带伞带伞不带伞(-2,-2)(-2.5,-3)(-1,-1)(-1,0)(-3,-2.5)(-5,-5)(0,-1)(1,1)下雨带伞不带伞(3)NHHFFFF带伞不带伞不下雨带伞不带伞带伞不带伞带伞不带伞带伞不带伞(-2,-2)(-2.5,-3)(-1,-1)(-1,0)(-3,-2.5)(-5,-5)(0,-1
11、)(1,1)下雨带伞不带伞(4)战略式表述:(麻烦,自己写)下雨妻子带伞不带伞丈夫带伞-2,-2-2.5,-3不带伞-3,-2.5-5,-5不下雨妻子带伞不带伞丈夫带伞-1,-1-1,0不带伞0,-11,13.下面的两人博弈可以解释为两个寡头企业的价格竞争博弈,其中p是企业1的价格,q是企业2的价格。企业1的利润函数是:1=-(p-aq+c)2+q企业2的利润函数是:2=-(q-b)2+p求解:(1)两个企业同时决策时的(纯战略)纳什均衡 (2)企业1先决策时的子博弈精炼纳什均衡 (3)企业2先决策时的子博弈精炼纳什均衡 (4)是否存在某些参数值(a,b,c),使得每一个企业都希望自己先决策?
12、解:(1)根据两个企业的利润函数,得各自的反应函数为:求解得纳什均衡:caqpcaqpp021bqbqq022bqcabp (2)企业1先决策 根据逆推归纳法,先求企业2的反应函数代入企业1的利润函数,得再求企业1的反应函数,得bqbqq022bcabpqcaqp221cabpcabpp021 (3)企业2先决策 根据逆推归纳法,先求企业1的反应函数代入企业2的利润函数,得再求企业2的反应函数,得再代入企业1的反应函数,得 baqabqq2022caqbqpbq222caqpcaqpp021cabacaqp22 (4)因为只有先决策的利润大于后决策的利润时企业才希望先决策,因此得两个企业都希望
13、先决策的条件为01,2abab希望先决策企业当02,42acabcaba希望先决策企业当0400202cabacabbab利润非负abcaba204.考虑如下的双寡头市场的战略性投资模型:企业1和企业2目前情况下的单位生产成本是c=2。企业1可以引进一项新技术使单位生产成本降低到c=1,该项技术需要的投资为f。企业2可以观察到企业1的投资决策。在企业1做出是否投资的决策之后,两个企业同时选择产量(库诺特博弈)。因此,这是个两阶段博弈。假定需求函数为p(q)=14-q,其中p是市场价格,q是两个企业的总产量。问题:当f 取什么值时,企业1将投资引进新技术?解:分企业1第一阶段未引进和引进投资两种
14、情况,每种情况都用逆推归纳法进行分析。假设企业1第一阶段未投资引进新技术。此时两个企业的边际成本都为2,利润函数为:一阶最优条件为求解可得 11211214qqqq22212214qqqq022142111qqq022142122qqq1644121qq 假设企业1第一阶段投资引进新技术。此时两个企业的边际成本下降到1,利润函数为:一阶最优条件为求解可得故当 时,引进新技术 fqqqq112111422212214qqqq012142111qqq022142122qqqfqq9196311314121952169196ff8.下表所示博弈重复两次,第二次开始之前第一次的行动能被双方观察到。假定
15、参与人对未来收入不贴现。问题:支付向量(4,4)能否作为子博弈精炼均衡结果在第一阶段出现(假定参与人只选择纯战略)?如果能,请给出支持这一结果的战略;如果不能,解释为什么。LCRT3,10,05,0M2,11,23,1B1,20,14,4解:上述静态博弈有两个纯战略纳什均衡(T,L)和(M,C)。由于战略组合(B,R)实现的收益(4,4)对参与人2来说已经是最理想的,所以参与人2不会有偏离动机,只有参与人1有偏离动机,因此可以设计如下制约参与人1行为的触发战略:参与人1:第一阶段选B;第二阶段选T 参与人2:第一阶段选R;第二阶段,如果第一阶段的结果是(B,R),则选L,否则选C。补充1:三寡
16、头垄断市场有倒转的需求函数为p(Q)=a-Q,其中Q=q1+q2+q3,qi是厂商i的产量。每一个厂商生产的边际成本为常数c,没有固定成本。如果厂商1先选择q1,厂商2和3观察到q1后同时选择q2和q3,问它们各自的产量是多少?解:用逆推归纳法先分析第二阶段厂商2和厂商3的静态博弈,再讨论第一阶段厂商1的选择。三个厂商的利润函数为:先分析第二阶段厂商2和3的决策。最优一阶条件为:113211cqqqqqa223212cqqqqqa333213cqqqqqa0223122cqqqaq0232122cqqqaq联立解得厂商2和3对厂商1产量的反应函数为:再分析第一阶段的决策。将反应函数代入厂商1的
17、利润函数得:最优一阶条件312qcaq313qcaq111132113qcqacqqqqqa20321111caqcqaq6,632caqcaq补充2:某人正在打一场官司,不请律师肯定会输,请律师后的结果与律师的努力程度有关。假设当律师努力工作努力工作(100小时)时有50%的概率能赢,律师不努力工作(10小时)则只有15%的概率能赢。如果诉讼获胜可得到250万元赔偿,失败则没有赔偿。因为委托方无法监督律师的工作,因此双方约定根据结果付费,赢官司律师可获赔偿金额的10%,失败则律师一分钱也得不到。律师的效用函数为m-0.05e,其中m是报酬,e是努力小时数,且律师有机会成本5万元。求这个博弈的
18、均衡。解:1不委托委托2接受拒绝不努力努力2(0,5)(0,5)(0,-0.5)(225,24.5)(0,-5)(225,20)输(0.85)赢(0.15)输(0.5)赢(0.5)3 不完全信息静态博弈2.考虑如下贝叶斯博弈:(1)自然决定支付矩阵如表a或b,概率分别为和1-;(2)参与人1知道自然选择了a还是b,但参与人2不知道;(3)参与人1和参与人2同时行动(参与人1选择T或B,参与人2选择L或R)。给出这个博弈的扩展式表述(博弈树)并求纯战略贝叶斯纳什均衡。LRT1,10,0B0,00,0表aLRT0,00,0B0,02,2表b解:在这个静态贝叶斯博弈中,参与人1的战略是私人信息类型的
19、函数:当自然选择表a时选择T,当自然选择表b时选择B。参与人2的战略则根据期望利润最大化决定。参与人2选择L的期望收益为0.51+0.50=0.5,选择R的期望收益为0.50+0.52=1,因此参与人选择R。3.在3.2节的第2部分中,假定参与人1的成本也有两种可能,分别以相同的概率取c1=3/4和c1=5/4,求贝叶斯均衡产量。4.两个企业同时决定是否进入一个市场。企业i的进入成本i0,)是私人信息,来自独立的分布函数P(i)(密度函数p(.)严格大于0)。如果只有一个企业进入,进入企业i的利润函数为m-i;如果两个企业都进入,企业i的利润函数为d-i;如果没有企业进入,利润为0。假定m和d
20、是共同知识,且md0。问题:(1)指出这个博弈与3.2节第二部分的相同之处和不同之处;(2)计算贝叶斯均衡并证明均衡是唯一的。解:根据问题的假设,该博弈的得益矩阵为:假设企业1采用如下的临界值战略:当1w时,采用“进入”战略;当1w时,采用“不进入”战略。假设企业2采用如下的临界值战略:当2t时,采用“进入”战略;当2t 时,采用“不进入”战略。厂商2进入不进入厂商1进入d-1,d-2m-1,0不进入0,m-20,0 因此企业1采用进入战略的概率是p(w),不进入的概率是1-p(w);因此企业2采用进入战略的概率是p(t),不进入的概率是1-p(t);从企业1的角度来看,选择进入和不进入的期望
21、收益分别为:p(t)(d-1)+1-p(t)(m-1)=p(t)(d-m)+m-1 p(t)0+1-p(t)0=0 当进入的期望收益大于不进入的期望收益时企业1会采用进入。所以企业1的进入条件是:p(t)(d-m)+m-1 0或1 0或2 bj0的前提下,上述最大化问题与bibj的概率最大化是一致的。使bibj的概率最大化的唯一方法是尽可能取最大的bi。由于当vibj。由于bj就是中标价格,因此vi-bj=bi-bj0,博弈方有正的利益,取尽可能大的概率是正确的;此时如果博弈方i不能中标,那么说明bi=vi bj,为了中标再进一步提高标价只会带来亏损。因此标价等于估价jibbbiPrmax正是
22、博弈方i的最佳策略。由于两博弈方的情况是相同的,因此所有博弈方都把自己的真实估价作为报价,就是这种最高报价者以次高价中标的一级密封价格拍卖博弈的贝叶斯纳什均衡。该贝叶斯纳什均衡当然也是线性策略均衡。投标者的数量增加到超过两人时结论也是相同的。4 不完全信息动态博弈补充1:两寡头库诺特产量竞争模型中厂商i的利润函数为i=qi(ti-qj-qi),i=1,2。若t1=1是两个厂商的共同知识,而t2则是厂商2的私人信息,厂商1只知道t2=3/4或t2=5/4,且t2取这两个值的概率相等。若厂商2先选择产量,然后厂商1再选择产量,请找出该博弈的纯策略贝叶斯均衡。解:由于后选择的厂商1的利润只受先选择的
23、厂商2产量的影响,而不受其参数类型的影响,因此我们可以根据逆推归纳法直接分析第二阶段厂商1的选择。假设厂商2在第一阶段选择的产量是q2,那么厂商1选择q1的利润为 1=q1(1-q1-q2),厂商1最符合自身利益的产量满足 1-2q1-q2=0,即厂商1有反应函数 q1=(1-q2)/2 再回到第一阶段厂商2的选择。如果t2=3/4,那么此时厂商2的利润函数是 2=q2(3/4-q1-q2),把厂商1的上述反应函数代入该函数可得 2=q2(3/4-q1-q2)=q2(1/4-q2/2)因此厂商2最符合自己利益的产量满足-q2=0 再把q2=1/4代入厂商1的反应函数可得 q1=(1-q2)/2
24、=3/8 如果t2=5/4,那么此时厂商2的利润函数是 2=q2(5/4-q1-q2),把厂商1的上述反应函数代入该函数可得 2=q2(5/4-q1-q2)=q2(3/4-q2/2)因此厂商2最符合自己利益的产量满足 3/4-q2=0 再把q2=3/4代入厂商1的反应函数可得 q1=(1-q2)/2=1/8 综合上述分析我们可以得出结论,本博弈中当t2=3/4时均衡是厂商1生产3/8,厂商2生产1/4,当t2=5/4时均衡则是厂商1生产1/8,厂商2生产3/4。上述均衡与类型的概率分布无关。补充2:厂商A面临着一个潜在竞争者厂商B,如果厂商B进入该市场则厂商A既可以打击也可以容忍。设厂商B不进
25、入市场厂商A的利润是3/4,如果厂商B进入厂商A容忍则厂商B独享1单位利润,如果厂商B进入厂商A打击则有两种可能性:二者得益为(1/2,-1)的概率为x,得益为(-1,-1)的概率为1-x。请问该博弈的均衡是什么?解:博弈的扩展形表示如下:为了简单起见,先计算出厂商B进入而厂商A打击时双方的期望收益:厂商A的期望收益为 x+(1-x)(-1)=3x/2-1 厂商B的期望收益为-1BN进入不进入x1-x打击容忍(-1,-1)(1,0)(-1,1/2)(0,3/4)A 根据逆推归纳法先分析第二阶段厂商A的选择。由于厂商A在第二阶段打击的期望得益是3x/2-1,容忍的得益是0,因此当3x/2-10,
26、也就是x2/3时厂商A肯定会选择打击,而在3x/2-10,也就是x2/3的情况下,因为进入被打击的得益小于不进的得益(-10),应该选择不进;在x0),应该选择进入。因此该博弈的均衡有几种可能性:当x2/3时是“厂商B不进,厂商A打击”,双方得益(0,3/4);当x0,也就是1/3时,应该进入,1/3时进入,否则不进入,而企业2则高成本时容忍,低成本时打击,是该博弈的均衡结果。补充4:假设在一个经济案件中,原告清楚上法庭自己是否能赢,而且这一点是原被告双方的共同知识,而被告不清楚谁会赢,只知道原告赢的可能性是1/3。再假设原告胜诉时净利益为3,被告净利益为-4,原告败诉时净利益为-1,被告净利
27、益为0。如果原告在起诉之前可以先要求被告赔偿M=1或M=2和解,被告接受就不上法庭,拒绝则上法庭。请用扩展式表示该博弈,并找出博弈的均衡。解:如果增加自然对原告上法庭是否会赢的随机选择的第一阶段,该博弈就转化成了与双价二手车交易模型相似的完全但不完美动态博弈。此时,博弈的扩展形如下:N被告原告赢原告输1/3M=1M=2M=1M=2不接受斗争(1,-1)被告(3,-4)(1,-1)(-1,0)原告接受在位者2/3原告不接受接受不接受接受不接受接受(2,-2)(3,-4)(2,-2)(-1,0)首先根据上述得益情况容易看出,因为原告采用M=2是相对于M=1的上策,因此原告不管自己上法庭是会赢还是会
28、输,都要求M=2.原告的上述策略被告也可以分析出来,因此被告在看到M=2时的判断应该是原告能赢的概率是1/3,即p(原告赢|M=2)=1/3,p(原告输|M=2)=2/3。根据上述判断,被告接受原告的提议有得益-2,而不接受提议则有期望收益1/3(-4)+2/30=-4/3-2,因此被告拒绝接受和解提议是满足理性要求的策略选择。综合上述分析可以得出结论,在该博弈中“原告不管上法庭自己会赢还是会输都要求M=2;而被告在原告要求M=2时判断原告只有1/3的机会会赢,在对方要求M=1时判断对方肯定会输;被告不管对方提出的和解要求是M=1还是M=2都不接受”,构成本博弈的一个合并纯策略完美贝叶斯均衡。委托人可以选择任何一个满足代理人参与约束和激励约束的机制。但所有可选择的机制可以划分为两类,一类是直接机制,另一类是间接机制。在直接机制中,信号空间等于类型空间,即Mi=i,i=1,n。所有信号空间不等于类型空间的机制都是间接机制。