1、国内外经典教材名师讲堂国内外经典教材名师讲堂范里安范里安微观经济学:现代观点微观经济学:现代观点(第8版)主讲教师:刘维刚主讲教师:刘维刚第第2828章章 博弈论博弈论 28.1 28.1 本章要点本章要点纳什均衡囚徒困境序贯博弈 28.2 28.2 重难点解读重难点解读 一、博弈的收益矩阵一、博弈的收益矩阵 假设两人进行简单的博弈,参与人A在纸上记下“上”或“下”。同时,参与人B独立地在另一张纸上记下“左”或“右”。他们最终获得的收益如表28-1所示。表28-1 博弈的收益矩阵 占优策略:不论其他参与人如何选择,每个参与人都有一个最优策略。如果在某个博弈中,每个参与人都有一个占优策略,那么,
2、可以预期这个占优策略组合就是该博弈的均衡结果。二、纳什均衡二、纳什均衡 纳什均衡:给定其他人的选择,每个参与人都作出了最优的选择。纳什均衡可以看作关于每个参与人的策略选择的这样一组预期,这些预期使得当任何一个人的选择被揭示后,没有人愿意改变自己的行为,如表28-2所示。表28-2 一个纳什均衡 纳什均衡的评价:第一,一个博弈可能会存在一个以上的纳什均衡。表28-2中,策略组合(下,右)与(上,左)都是纳什均衡。第二,有一些博弈根本不存在纳什均衡。表28-3 不存在(纯策略)纳什均衡的博弈 三、混合策略三、混合策略 纯策略:每个参与人只选择一种策略并始终坚持这个选择。混合策略:参与人随机按照概率
3、选择策略。混合策略纳什均衡:给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率。表28-3所示的例子中,如果参与人A以3/4的概率选择“上”,以1/4的概率选择“下”,参与人B以1/2的概率选择“左”,以1/2的概率选择“右”,那么该混合策略组合就构成一个纳什均衡。四、囚徒困境四、囚徒困境 纳什均衡并不一定会导致帕累托有效率的结果,如表28-4所示,即出现囚徒困境。表28-4 囚徒困境 囚犯博弈可以解释寡头垄断厂商的行为,关键是赋予合作与背叛具体的经济含义。比如在双头垄断情况下,合作可解释为“保持索要一个高价”,背叛可解释为“降价以争夺对手的市场”。五、重复博弈五、
4、重复博弈 囚徒困境的博弈主要出现在一次性博弈中,如果是无限次重复博弈,则会改变博弈策略。如果是有限次重复博弈则不改变囚徒困境博弈的策略。假设两个参与人事先都知道博弈将进行n次。通过倒推法则,第n次博弈,每个参与人都会选择占优策略均衡,即选择背信。可以倒退到第n-1次,直至第一次博弈。如果博弈重复无限次,就会有办法影响对手的行为:如果这次他拒绝合作,那么下一次,也可以拒绝合作(以牙还牙)。只要双方都充分关心将来的收益,那么将来不合作的威胁就足以使他们采取帕累托有效率的策略。六、序贯博弈六、序贯博弈 序贯博弈存在时序性。在第一个阶段,参与人A选择“上”或者“下”。参与人B先观察A的选择,然后再选择
5、“左”或者“右”,如表28-5所示。表28-5 一个序贯博弈的收益矩阵 单纯分析收益矩阵,共有两个纳什均衡:(上,左)和(下,右),但这两个均衡中的一个实际上是不合理的。收益矩阵掩盖了这样一个事实:其中的一个参与人在做出自己的选择以前必须先要了解另一个参与人的选择。如图28-1所示,扩展式博弈:现实选择次序的表述博弈的方式。图28-1 博弈的扩展形式 七、遏制进入的博弈七、遏制进入的博弈 假设一个垄断者正面临着另一家厂商的进入威胁。进入者先决定是否进入市场,然后在位者再决定是否以降价作为反应。如果进入者决定不进入这个行业,那么,它得到收益1,而在位者得到收益9。如果进入者决定进入这个行业,那么
6、,它得到的收益就取决于在位者是与它进行强有力的竞争,还是默许。如果在位者选择斗争,那么进入者收益为0,在位者收益为2;如果在位者选择默许,那么进入者得到收益2,而在位者获得收益1。图28-2 新进入博弈 28.3 28.3 名校考研真题详解名校考研真题详解 【例【例28.128.1】“鹬蚌相争,渔翁得利”说明双方相互争夺的过程中,反而会受到损失。请用博弈论的知识说明这一现象,并指出实际生活中的例子。西南财经大学2011研 答:答:(1)“鹬蚌相争,渔翁得利”是典型的囚徒困境,虽然双方知道合作比非合作各自的收益都大,但是因为非合作是各自的占优策略,所以最终的结果只能是两败俱伤的非合作。设计一个博
7、弈模型来解释,假设鹬蚌都采取合作策略,各自获得5个单位收益,假如二者都采取争斗策略,各自获得2个单位收益,而假如一个采取合作策略而另外一个采取争斗策略,则争斗者获得7个单位收益,合作者获得1个单位的收益。如表28-6所示,很显然本博弈的纳什均衡就是二者都采取争斗策略。表28-6 鹬蚌相争的博弈模型 (2)实际生活中这样的例子很多。比如中国移动和中国联通就经常就某一产品进行价格战,结果是二者都被迫采取低价策略,二者在该产品上的盈利能力都很低。事实上,假如二者合作采取高价策略,则二者在该产品上都可以赚大钱,但是由于采取争斗策略是各自的占优策略,收益合作是不可能的,最终二者只能在低价策略上获得纳什均
8、衡,个体理性战胜了集体理性。【例【例28.228.2】两个企业生产完全同质的产品,它们之间进行(静态的)产量竞争,市场需求函数为 。记两个企业的成本函数分别为 和 ,其中F 为固定成本,c为边际成本。(1)请找出两个企业的均衡产量和利润(作为 、的函数)。15PQ11Fc q22Fc q1F2F1c2c (2)假设有两个生产技术A和B可供企业选择。采用技术A时,固定成本为0,而边际成本为6。采用技术B时,固定成本为10,而边际成本为3。在进行产量竞争之前,企业选择各自的生产技术。请找出均衡情况下两个企业选择的技术。北京大学国家发展研究院2011研 解:解:(1)企业1的利润函数为:求它关于企业
9、2产量的反应函数,有:企业2的利润函数为:求它关于企业1产量的反应函数,有:1121111215qqqFcqq112111520qqcq1122221215qqqFcqq112221520qqcq 联立上述两个反应函数即可得到各自的最优产量(即古诺产量)为:代入各自的利润函数得到各自的最大利润:*211212225,533ccccqq 12121121212111122121212212221515 2302 10530259391515 2302 1053025939cccccccccccFFcccccccccccFF (2)这是一个静态博弈,企业1和企业2同时有两种技术选择:A和B。企业1选择技术A而企业2也选择技术A时各自的利润均为-21,企业1选择技术A而企业2选择技术B时各自的利润为-26和9,企业1选择技术B而企业2选择技术A时各自的利润为9和-26,两企业同时选择技术B的利润均为-6。支付矩阵如下所示:用划线法不难得到上述博弈的纳什均衡为两企业均选择技术B。