第二章：完全信息动态博弈课件.ppt_163文库

资源描述

1、第二章完全信息动态博弈本章内容：博弈的扩展式表述子博弈精炼纳什均衡子博弈精炼纳什均衡举例重复博弈和无名氏定理o 考虑下列问题：考虑下列问题：一个博弈可能有多个（甚至无穷多个）纳什均衡，究竟一个博弈可能有多个（甚至无穷多个）纳什均衡，究竟哪个更合理？哪个更合理？纳什均衡纳什均衡假定每一个参与人在选择自己的最优战略时假假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的定所有其他参与人的战略是给定的，但是如果参与人的，但是如果参与人的行动有先有后，后行动者的选择空间依赖于前行动者的行动有先有后，后行动者的选择空间依赖于前行动者的选择，前行动者在选择时不可能不考虑自己的行动对后选

2、择，前行动者在选择时不可能不考虑自己的行动对后行动者的影响。行动者的影响。子博弈精练纳什均衡的一个重要改进是将子博弈精练纳什均衡的一个重要改进是将“合理纳什均合理纳什均衡衡”与与“不合理纳什均衡不合理纳什均衡”分开。分开。市场进入阻挠博弈树市场进入阻挠博弈树特点：剔除博弈中包含的不可置信威胁。特点：剔除博弈中包含的不可置信威胁。承诺行动承诺行动-破釜沉舟破釜沉舟-背水一战背水一战v给定进入者进入，剔除（进入，斗争），（进入，默许）给定进入者进入，剔除（进入，斗争），（进入，默许）是唯一的子博弈精练纳什均衡是唯一的子博弈精练纳什均衡-举例（结婚举例（结婚-反对）反对）进入者进入不进入（0，300

3、）在位者合作（40，50）斗争（-10，0）不可置信威胁支付函数行动第一节博弈的扩展式表述o 在静态博弈中，所有参与人同时行动（或行动虽有先在静态博弈中，所有参与人同时行动（或行动虽有先后，但没有人在自己行动之前观测到别人到行动）；后，但没有人在自己行动之前观测到别人到行动）；在动态博弈中，参与人的行动有先后顺序，且后行动在动态博弈中，参与人的行动有先后顺序，且后行动者在自己行动之前能观测到先行动者的行动。者在自己行动之前能观测到先行动者的行动。o 博弈论专家习惯用战略式表述来描述和分析静态博弈，博弈论专家习惯用战略式表述来描述和分析静态博弈，也习惯于用扩展式表述来描述和分析动态博弈。也习惯

4、于用扩展式表述来描述和分析动态博弈。o 扩展式表述所扩展式表述所“扩展扩展”的主要是参与人的战略空间的主要是参与人的战略空间o 战略式表述简单地给出参与人有些什么战略可以选择，战略式表述简单地给出参与人有些什么战略可以选择，而扩展式表述要给出每个战略的动态描述：谁在什么而扩展式表述要给出每个战略的动态描述：谁在什么时候行动，每次行动时有些什么具体行动方案可供选时候行动，每次行动时有些什么具体行动方案可供选择，以及知道些什么择，以及知道些什么o 此时的战略：如果你这样，我将怎样此时的战略：如果你这样，我将怎样2.1-1扩展式表述包含的要素o 要素：要素：n 参与人集合参与人集合n 参与人的行动顺

5、序参与人的行动顺序n 参与人的行动空间参与人的行动空间n 参与人的信息集参与人的信息集n 参与人的支付函数参与人的支付函数n 外生事件外生事件(即即“自然自然”的选择的选择)的概率分布的概率分布战略式表述战略式表述(strategic form(strategic form representation)representation)多用矩阵多用矩阵2,1-1,-1-1,-11,2女足巴足巴男扩展式表述扩展式表述(extensive form(extensive form representation)representation)多用博弈树多用博弈树战略式与扩展式男足球芭蕾女女芭蕾足球芭

6、蕾(-1,-1)(2，1)（1，2)(-1,-1)xxo 男的策略：男的策略：足球，芭蕾足球，芭蕾，选择足球；还是选择芭蕾。，选择足球；还是选择芭蕾。o 女的策略：女的策略：（足球，芭蕾），（芭蕾，足球）（足球，芭蕾），（芭蕾，足球）（芭蕾，芭（芭蕾，芭蕾），（足球，足球）蕾），（足球，足球）o 1 1、追随策略：他选择什么，我就选择什么、追随策略：他选择什么，我就选择什么o 2 2、对抗策略：他选择什么，我就偏不选什么、对抗策略：他选择什么，我就偏不选什么o 3 3、芭蕾策略：不管他选什么，我都选芭蕾；、芭蕾策略：不管他选什么，我都选芭蕾；o 4 4、足球策略：不管他选什么，我都选足球。、足

7、球策略：不管他选什么，我都选足球。o 策略即：如果他选择什么，我就怎样行动的相机行动方案。策略即：如果他选择什么，我就怎样行动的相机行动方案。在扩展式博弈里，参与人是相机行事，即在扩展式博弈里，参与人是相机行事，即“等待等待”博弈到博弈到达一个自己的信息集（包含一个或多个决策结后，再采取达一个自己的信息集（包含一个或多个决策结后，再采取行动方案。行动方案。需求大，开发需求大，开发者者利润利润8 8千万，千万，不开发者不开发者利润利润0 0。需求大，需求大，两者都开发两者都开发利润各为利润各为4 4千万。千万。需求小，开发需求小，开发者者利润利润1 1千万，千万，不开发者不开发者利润利润0 0。

8、需求小，需求小，两者都开发两者都开发利润各为利润各为-3-3千万千万两者都两者都不开发利润各为不开发利润各为0 0。博弈树：房地产开发博弈博弈树：房地产开发博弈IA 开发开发不开发不开发大大小小大大小小开发开发不开发不开发开开不开不开开开不开不开开开不开不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4博弈树：不允许的情形博弈树：不允许的情形-3，-3-3，-31，01，00，10，00，10，0AB（进入，进入）（进入，进入）进入进入不进入不进入（进入，不进入）（进入，不进入）（不进入，进入）（

9、不进入，进入）（不进入，不进入）（不进入，不进入）市场进入博弈的战略式市场进入博弈的战略式进入不进入ABB进入不进入不进入进入收益：收益：A B-3，-31，00，10，0市场进入的扩展式市场进入的扩展式o 在市场进入博弈中：在市场进入博弈中：A A有两个行动：有两个行动：“进入进入”、“不进不进入入”。由于是先行动者，只有两个战略：选择。由于是先行动者，只有两个战略：选择“进入进入”或或“不进入不进入”。o B B有两个行动：有两个行动：“进入进入”、“不进入不进入”。但是，有。但是，有4 4个战略：个战略：o(1)(1)若若A A选择选择“进入进入”，B B选择选择“进入进入”，若，若A

10、A选择选择“不进不进入入”，B B选择选择“进入进入”，即（进入，进入），即（进入，进入）o(2)(2)若若A A选择选择“进入进入”，B B选择选择“进入进入”，若，若A A选择选择“不进不进入入”，B B选择选择“不进入不进入”，即（进入，不进入），即（进入，不进入）o(3)(3)若若A A选择选择“进入进入”，B B选择选择“不进入不进入”，若，若A A选择选择“不进不进入入”，B B选择选择“不进入不进入”，即（不进入，进入），即（不进入，进入）o(4)(4)若若A A选择选择“进入进入”，B B选择选择“不进入不进入”，若，若A A选择选择“不进不进入入”，B B选择选择“不进入不进

11、入”，即（不进入，不进入），即（不进入，不进入）2.1-2博弈树的构成o 1 1结结(nodes)(nodes)：结包括决策结：结包括决策结(decition nodes)(decition nodes)和终点结和终点结(terminal nodes)(terminal nodes)两类。决策结是参与人采取行动的时点，两类。决策结是参与人采取行动的时点，终点结是博弈行动路径的终点。在博弈树中，终点结是博弈行动路径的终点。在博弈树中，“谁在什么时谁在什么时候行动候行动”用在决策结旁边标注参与人的办法来表示。参与人用在决策结旁边标注参与人的办法来表示。参与人的支付标注在博弈树终点结处。的支付标注在

12、博弈树终点结处。o 2 2枝枝(branches)(branches)：在博弈树上，枝是从一个决策结到它的直：在博弈树上，枝是从一个决策结到它的直接后续结的连线，每一个枝代表参与人的一个行动选择。接后续结的连线，每一个枝代表参与人的一个行动选择。o 3 3信息集信息集(information sets)(information sets)：博弈树上的所有决策结分割：博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集。成不同的信息集。每一个信息集是决策结集合的一个子集。该子集包括所有满足下列条件的决策结：该子集包括所有满足下列条件的决策结：(1)(1)每一个决策结都每一个

13、决策结都是同一参与人的决策结；是同一参与人的决策结；(2)(2)该参与人知道博弈进入该集合的该参与人知道博弈进入该集合的的某个决策结，但不知道自己究竟处于哪一个决策结。的某个决策结，但不知道自己究竟处于哪一个决策结。122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）结结nodesnodes信息集分单节信息集和多节信息集；如果用虚线匡起来表示2知道自己位于信息集内，但不知道是哪一点，因为他没能观察到对手的行动；如果博弈树的所有信息集都是单结的，称为完美信息博弈122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）完美信息（完美信息（perfect informatio

14、nperfect information）与）与不完美信息不完美信息(imperfect information)imperfect information)122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）不完美信息：2不能区分1是采用了L还是S完美信息：2能区分1是选择了L还是S完美信息博弈完美信息博弈&不完美信息博弈不完美信息博弈o 一个信息集可能包含多个决策结，也可能只包含一个决一个信息集可能包含多个决策结，也可能只包含一个决策结。只包含一个决策结的信息集称为单结信息集；如策结。只包含一个决策结的信息集称为单结信息集；如果博弈树的所有信息集都是单结的，该博弈称为完美信果

15、博弈树的所有信息集都是单结的，该博弈称为完美信息博弈息博弈(Game of perfect information)(Game of perfect information)；否则就是不；否则就是不完美信息博弈。完美信息博弈。信息集：房地产博弈信息集：房地产博弈IIA 开发不开发大小大小开发不开发开不开开不开开不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4信息集：房地产博弈信息集：房地产博弈IIIA 开发不开发大小大小开发不开发开不开开不开开不开 (4,4)(8,0)(

16、-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4信息集：房地产博弈信息集：房地产博弈IVN 大小开不开开不开开发不开发开不开开不开开不开 (4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)B1 B2 A1 A2 A3 A4几个符号的意义几个符号的意义o 第第i个人的信息集为个人的信息集为Hi，其中某特定信息集，其中某特定信息集为为hi，在，在hi的情况下会有的情况下会有A(hi)的行动。他的行动。他的所有信息集所对应的所有行动的所有信息集所对应的所有行动A(hi)的集的集合为合为Ai，表示

17、聚合表示聚合)(iHhihAAiiiiiAHS:第第i个人有信息个人有信息H，乃有行动，乃有行动A此时的战略是此时的战略是S(而且是纯战略，而且是纯战略，以后用其他字母表示以后用其他字母表示“不纯不纯”战略战略)maps into第二节子博弈精炼纳什均衡主要内容主要内容子博弈子博弈子博弈精炼纳什均衡子博弈精炼纳什均衡求解方法：逆向归纳法求解方法：逆向归纳法承诺行动与子博弈精炼纳什均衡承诺行动与子博弈精炼纳什均衡2.2-1子博弈（sub-game）l子博弈由一个决策结子博弈由一个决策结x x和所有该决策结的后续结和所有该决策结的后续结T(x)(T(x)(包括终点结包括终点结)组成，它满足下列条

18、件：组成，它满足下列条件：l(1)x(1)x是一个单结信息集；是一个单结信息集；l(2)(2)子博弈不改变原博弈的信息集和支付向量子博弈不改变原博弈的信息集和支付向量条件条件1 1说的是一个子博弈必需从一个单结信息集开始。说的是一个子博弈必需从一个单结信息集开始。即：即：(1)(1)当且仅当决策者在原博弈中确切地知道当且仅当决策者在原博弈中确切地知道博弈进入一个特定的决策结时，该决策结才能作博弈进入一个特定的决策结时，该决策结才能作为一个子博弈的开始。为一个子博弈的开始。(2)(2)如果一个信息集包含如果一个信息集包含两个以上决策结，没有任何一个决策结可以作为两个以上决策结，没有任何一个决策结

19、可以作为子博弈的初始结。子博弈的初始结。A 开发不开发大小大小开发不开发开不开开不开开不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4A 开发不开发大小大小开发不开发开不开开不开开不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4o 条件条件2 2说的是，子博弈的信息集和支付向量都直接继说的是，子博弈的信息集和支付向量都直接继承自原博弈，并不会发生任何变化。承自原博弈，并不会发生任何变化。o 这意味

20、着子博弈不能分割原博弈的信息集。这意味着子博弈不能分割原博弈的信息集。A 开发不开发大小大小开发不开发开不开开不开开不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4进入不进入ABB进入不进入不进入进入收益：收益：A B-3，-31，00，10，0抵赖坦白ABB抵赖坦白坦白抵赖-1，-1-9，00，-9-6，-6在市场进入博弈中，包含在市场进入博弈中，包含3 3个子博弈（包括原博个子博弈（包括原博弈）。而在囚徒博弈中，只有一个子博弈（？弈）。而在囚徒博弈中，只有一个子博弈（？）2.2-2子博弈精炼

21、纳什均衡o 扩展式博弈的战略组合扩展式博弈的战略组合s*=(s1*,si*,sn*)是是一个子博弈精炼纳什均衡，如果：一个子博弈精炼纳什均衡，如果：o(1)它是原博弈的纳什均衡；它是原博弈的纳什均衡；o(2)它在每一个子博弈上给出纳什均衡。它在每一个子博弈上给出纳什均衡。o 一个战略组合是一个战略组合是个子博弈精炼纳什均衡，当且仅当个子博弈精炼纳什均衡，当且仅当它在每一个子博弈上都构成一个纳什均衡它在每一个子博弈上都构成一个纳什均衡o 如果整个博弈是唯一的子博弈，纳什均衡与子博弈如果整个博弈是唯一的子博弈，纳什均衡与子博弈纳什均衡是相同的；如果有其它子博弈存在，有些纳什均衡是相同的；如果有其它

22、子博弈存在，有些纳什均衡可能不构成子博弈纳什均衡。纳什均衡可能不构成子博弈纳什均衡。子博弈精炼纳什均衡子博弈精炼纳什均衡o 均衡路径：如果一个博弈有几个子博弈，一个特定的纳均衡路径：如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，这条路径称什均衡决定了原博弈树上唯一的一条路径，这条路径称为均衡路径。为均衡路径。o 构成子博弈精炼纳什均衡的战略不仅在均衡路径上是最构成子博弈精炼纳什均衡的战略不仅在均衡路径上是最优的，而且在非均衡路径上也是最优的。这是纳什均衡优的，而且在非均衡路径上也是最优的。这是纳什均衡与子博弈精炼纳什均衡的实质区别与子博弈精炼纳什均衡的实质区别o

23、只有当一个战略规定的行动规则在所有可能的情况下都只有当一个战略规定的行动规则在所有可能的情况下都是最优的时，它才是一个合理的、可置信的战略是最优的时，它才是一个合理的、可置信的战略o 序贯理性：不论过去发生了什么，参与人应该在博弈的序贯理性：不论过去发生了什么，参与人应该在博弈的每一个时点上最优化自己的决策每一个时点上最优化自己的决策市场进入博弈的纳什均衡市场进入博弈的纳什均衡进入不进入ABB进入不进入不进入进入收益：收益：A B-3，-31，00，10，0-3，-3-3，-31，01，00，10，00，10，0AB（进入，进入）（进入，进入）进入不进入（进入，不进入）（进入，不进入）（不进入

24、，进入）（不进入，进入）（不进入，不进入）（不进入，不进入）该博弈中有三个纳什均衡：该博弈中有三个纳什均衡：不进入，（进入，进入）；不进入，（进入，进入）；进入，（不进入，进入）；进入，（不进入，进入）；进入，（不进入，不进入）进入，（不进入，不进入）如果理论得到这样的结果，无助于预测如果理论得到这样的结果，无助于预测博弈参与人的行为。此外，纳什均衡假博弈参与人的行为。此外，纳什均衡假定，每一个参与人选择的最优战略是在定，每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最所有其他参与人的战略选择给定时的最优反应，即参与人并不考虑自己的选择优反应，即参与人并不考虑自己的选择对其他人

25、选择的影响，因而纳什均衡很对其他人选择的影响，因而纳什均衡很难说是动态博弈的合理解。难说是动态博弈的合理解。市场进入博弈的纳什均衡市场进入博弈的纳什均衡必须在多个纳什均衡中剔除不合理的均衡解，即所谓必须在多个纳什均衡中剔除不合理的均衡解，即所谓“不可置信威不可置信威胁胁”。子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。它的。子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。它的目的是把动态博弈中的目的是把动态博弈中的“合理纳什均衡合理纳什均衡”与与“不合理纳什均衡不合理纳什均衡”分开。分开。正如纳什均衡是完全信息静态博弈解的基本慨念一样，子博弈精炼纳正如纳什均衡是完全信息静态博弈解的基本慨

26、念一样，子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。什均衡是完全信息动态博弈解的基本概念。前边得到的三个纳什均衡中，均衡前边得到的三个纳什均衡中，均衡意味着当意味着当A A不进入时，不进入时，B B选择进入；选择进入；而当而当A A选择进入时，选择进入时，B B仍选择进入（仍选择进入（B B威胁无论如何都要进入市场）。威胁无论如何都要进入市场）。显然，当显然，当A A选择进入时，选择进入时，B B仍选择进入是不合理的，如果仍选择进入是不合理的，如果A A进入市场，进入市场，B B选择选择“不进入不进入”比选择比选择“进入进入”收益要更大，理性的收益要更大，理性的B B不会选择进入，不会选

27、择进入，而而A A知道知道B B是理性的，因此也不会把该战略视为是理性的，因此也不会把该战略视为B B会选择的战略。因此，会选择的战略。因此，B B的战略（进入，进入）是不可置信威胁。的战略（进入，进入）是不可置信威胁。均衡均衡意味着当意味着当A A进入时，进入时，B B选择不进入；而当选择不进入；而当A A选择不进入时，选择不进入时，B B仍仍选择不进入（选择不进入（B B威胁无论如何都不进入市场）。显然，当威胁无论如何都不进入市场）。显然，当A A选择不进选择不进入时，入时，B B仍选择不进入是不合理的，仍选择不进入是不合理的，B B的战略是不可置信的。的战略是不可置信的。只有均衡只有均衡

28、是合理的：如果是合理的：如果A A进入，进入，B B不进入；如果不进入；如果A A不进入，不进入，B B进入。进入。因为因为A A是先行动者，理性的是先行动者，理性的A A会选择会选择“进入进入”（他知道（他知道B B是理性的，是理性的，B B不不会选择会选择“进入进入”），而理性的），而理性的B B选择选择“不进入不进入”。观察博弈树上的三个均衡中，观察博弈树上的三个均衡中，B B的不可置信战略中的反应，在第二阶的不可置信战略中的反应，在第二阶段段B B开始行动的两个子博弈中不是最优；而合理的纳什均衡中，开始行动的两个子博弈中不是最优；而合理的纳什均衡中，B B的战的战略在所有子博弈中都是最

29、优的，与略在所有子博弈中都是最优的，与A A的第一阶段可能选择的行动构成的第一阶段可能选择的行动构成该子博弈的纳什均衡。该子博弈的纳什均衡。只有当一个战略规定的行动规则在所有可能的情况下都是最优的时，只有当一个战略规定的行动规则在所有可能的情况下都是最优的时，它才是一个合理的、可置信的战略。子博弈精炼纳什均衡就是要剔除它才是一个合理的、可置信的战略。子博弈精炼纳什均衡就是要剔除掉那些只在特定情况下是合理的而在其他情况下并不合理的行动规则。掉那些只在特定情况下是合理的而在其他情况下并不合理的行动规则。子博弈精炼纳什均衡：子博弈精炼纳什均衡：如果参与者的战略在每一个子博弈中都构成如果参与者的战略在

30、每一个子博弈中都构成了纳什均衡，则称纳什均衡是子博弈精练的了纳什均衡，则称纳什均衡是子博弈精练的(泽尔滕，泽尔滕，1965)1965)。为简单起见，假定博弈有两个阶段，第一阶段参与人为简单起见，假定博弈有两个阶段，第一阶段参与人1 1行动，第行动，第2 2阶段阶段参与人参与人2 2行动，并且行动，并且2 2在行动前观测到在行动前观测到1 1的选择。令的选择。令A A1 1是参与人是参与人1 1的行动的行动空间，空间，A A2 2是参与人是参与人2 2的行动空间。当博弈进入第二阶段，给定参与人的行动空间。当博弈进入第二阶段，给定参与人1 1在第一阶段的选择为在第一阶段的选择为a a1 1 A A

31、1 1 ，参与人，参与人2 2面临的问题是：面临的问题是：),(21max22aauAa 令上述问题的最优解为令上述问题的最优解为a a1 1*。那么，这个博弈的子博弈精炼纳。那么，这个博弈的子博弈精炼纳什均衡为什均衡为 a a1 1*,R,R2 2(a(a1 1)，均衡结果为，均衡结果为 a a1 1*,R,R2 2(a(a1 1*)。(a(a1 1*,R,R2 2(a(a1 1*)是一个精炼均衡，因为是一个精炼均衡，因为a a2 2*R R2 2(a(a1 1)在博弈的第二在博弈的第二阶段是最优的。除阶段是最优的。除a a2 2*R R2 2(a(a1 1)之外，任何其他的行为规则都不之外

32、，任何其他的行为规则都不满足精练均衡的要求。满足精练均衡的要求。上述思路就是逆向归纳法寻找子博弈精炼纳是均衡的基本思路。上述思路就是逆向归纳法寻找子博弈精炼纳是均衡的基本思路。显然参与人显然参与人2 2的最优选择的最优选择a a2 2*依赖于参与人依赖于参与人1 1的选择的选择a a1 1。用。用a a2 2*R(aR(a1 1)代表上述最优化问题的解代表上述最优化问题的解(即即2 2的反应函数的反应函数)。因为参与人。因为参与人1 1应该预测应该预测到参与人到参与人2 2在博弈的第二阶段将按在博弈的第二阶段将按a a2 2*R(aR(a1 1)的规则行动，参与人的规则行动，参与人1 1在在第

33、一阶段面临的问题是：第一阶段面临的问题是：)(,(11max11aRauAa 甲乙（2，2）（1，0）（3，1）上下左右乙（2，1）左右乙左，左左，右右，左右，右2，22，22，12，11，03，11，03，1 上下甲纳什均衡子博弈精炼纳什均衡o 三个纳什均衡：（上，左，左）（下，左，右）（下，右，右）o 排除（上，左，左），（下，右，右），只有（下左，右）是子博弈精炼纳什均衡2.2-3求解方法：逆推法求解方法：逆推法逆向归纳法求解子博弈精炼纳什均衡的过程，实质是重复剔除劣战略过程在扩展式博弈上的扩展：从最后一个决策结开始依次剔除掉每个子博弈的劣战略，最后生存下来的战略构成精炼纳什均

34、衡。如同重复剔除的占优均衡要求“所有参与人是理性的”是共同知识一样，用逆向归纳法求解均衡也要求“所行参与人是理性的”是共同知识。举例举例121（2，0）（5，0）（4，2）（1，1）UDRLUD逆推归纳法的问题逆推归纳法的问题o 逆推归纳法只能分析明确设定的博弈问题，要求博弈的结构，包括次序、规则和得益情况等都非常清楚，并且各个博弈方了解博弈结构，相互知道对方了解博弈结构。这些可能有脱离实际的可能o 逆推归纳法也不能分析比较复杂的动态博弈o 在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难o 对博弈方的理性要求太高，不仅要求所有博弈方都有高度的理性，不允许犯任何错误，而且要求所有博弈方

35、相互了解和信任对方的理性，对理性有相同的理解，或进一步有“理性的共同知识”122软软脆脆软脆（0，0）（10，20）（20，10）（0，0）逆推法：例1甲丙乙上东下西左右（4，2，3）（1，7，8）（5，3，4）（7，6，6）丙丙（2，1，9）（0，4，2）逆推法：例2进入者在位者（0，300）（40，50）（-10，0）不进入进入默许斗争0，3000，300不进入-10，040，50进入斗争默许进入者在位者支付逆推法：例32.2-4承诺行动（commitment）与子博弈精炼纳什均衡o 纳什均衡之所以不是精炼均衡，是因为不可置信的威胁存在，如父母与子女之间的博弈。o 如果参与人在博弈前采取措

36、施改变行动空间或支付函数，原来不可置信威胁就变得可置信，博弈的精炼均衡就会改变；将改变博弈结果而采取的措施称为“承诺行动”o 完全承诺，如破釜沉舟、军事博弈不完全承诺，增加行动成本承诺行动与博弈结果o 春节前夕，某小镇上两个商铺主甲和乙同时看到一个赚钱机会：去城里贩一批鞭炮回来零售，购货款加上运输费用共5000元，如果没有竞争对手，这批货在小镇上能卖6000元；但如果另一家商铺同时在小镇上卖鞭炮，价格下跌使得这批鞭炮只能卖4000元。纳什均衡是什么？o 假设甲先行动，商铺乙看到对方的选择后再决定是否进货，子博弈精炼纳什均衡是什么？承诺行动与博弈结果如果甲先行动，但在博弈开始前商铺主乙有一次

37、行动A的机会，利用子博弈精炼均衡概念分析下述两种情况下的博弈结果：（1）A：商铺主乙逢人便说自己一定要进货，无论对方如何行动他都不会改变这个决定；（2）A：商铺主乙与某个嘲笑他说大话的第三者丙打赌：如果自己到时不进货，向丙支付1500元；如果自己到时候进货，丙向他支付100元。并且，乙将这个赌局通知甲。甲乙乙进进不进不进进不进（-1000，-1000）（1000，0）（0，1000）（0，0）甲乙乙进进不进不进进不进（-1000，-900）（1000，-1500）（0，1100）（0，-1500）开金矿博弈的基本问题：开金矿博弈的基本问题：甲在开采一价值甲在开采一价值4 4万元的万元的金矿时缺

38、金矿时缺1 1万元资金，而万元资金，而乙正好有乙正好有1 1万元资金可以万元资金可以投资。设甲想说服乙将这投资。设甲想说服乙将这1 1万元资金借给自己用于万元资金借给自己用于开矿，并许诺在采到金子开矿，并许诺在采到金子后与乙对半分成，乙是否后与乙对半分成，乙是否该将钱借给甲呢？该将钱借给甲呢？假设金矿的价值是经过权假设金矿的价值是经过权威部门探测确认的，没必威部门探测确认的，没必要怀疑。要怀疑。乙甲（0，4）（2，2）（1，0）不借借分不分开金矿博弈不借乙甲乙借不分分（1，0）不打打（0，4）（1，0）（2，2）有法律保障的开金矿博弈分钱打官司都可信在一个重视自身在一个重视自身利益的成员组成利

39、益的成员组成的社会中，完善的社会中，完善公正的法律制度公正的法律制度不但能保障社会不但能保障社会的公平，而且还的公平，而且还能提高社会经济能提高社会经济活动效率，是实活动效率，是实现最有效率的社现最有效率的社会分工合作的重会分工合作的重要保障要保障乙甲乙打（2，2）不分分不借借（0，4）（-1，0）不打（1，0）法律保障不足的开金矿博弈分钱打官司都不可信由于法制建设不完善，由于法制建设不完善，司法机构执法能力存司法机构执法能力存在问题，并且也存在在问题，并且也存在司法腐败和司法腐败和“执行难执行难”的问题，因此，有理的问题，因此，有理不一定能打赢官司，不一定能打赢官司，赢了官司却反而输了赢了官

40、司却反而输了钱的事情在一些国家钱的事情在一些国家普遍存在普遍存在第三节子博弈精炼纳什均衡举例斯塔克尔伯格（Stackelberg）寡头竞争模型劳资（工会与厂商）博弈模型罗宾斯泰英（Rubinstein）轮流出价的讨价还价模型委托人代理人理论2.3-1斯塔克尔伯格模型产量领导模型：行动顺序为，第一家厂商首先选择产量q10；第二家厂商再选择产量q20，得到反应函数；将反应函数代入第一家厂商的利润函数求出q1*；然后求q2。追随者max 2=p(q1+q2)q2-c(q2)，得到反应函数q2=f2(q1)领导者 max 1=p(q1+q2)q1-c(q1)=p(q1+f2(q1)q1-c(q1)，

41、可以求出均衡产量q1*，跟随者依照反应函数求出q2*，进一步解出p。斯塔克尔伯格模型求解设p=a-(q1+q2)，两个企业有相同的不变单位成本c，则厂商2根据利润最大化得到反应函数q2=f2(q1)=(a-q1-c)/2，代入厂商1的利润函数 1=p(q1+q2)q1-c1(q1)，一阶条件得到q1=（a-c）/2，代入厂商2的反应函数得到q2=（a-c）/4，（a-c）/2，（a-c）/4）为均衡解，（(a-c)2/8，(a-c)2/16）为其相应的支付。斯塔克尔伯格模型斯塔克尔伯格模型y1y2f1(y2)f2(y1)1/21/42.3-2劳资博弈模型o 里昂惕夫1946年提出，分别代表劳

42、资双方的工会与厂商之间的博弈模型。o 该模型假设工资完全由工会决定，而厂商则根据工会要求的工资高低决定雇用工人的数量。o 工会代表的劳方效用u=u(W,L)。o 厂商的利润函数为=(W,L)=R(L)-WL。o 行动顺序为：先由工会决定工资率，然后厂商根据工会提出的工资率决定雇用多少劳动。劳资博弈模型o 采用逆推法求解o 先分析第二阶段厂商的选择。厂商对工会选择的工资率W的反应函数为L=L(W)，则：max(W,L)=maxR(L)-WL,解得R(L)=W，求得L*(W)为在给定工会选择W时厂商的最优雇佣数量。o 然后分析第一阶段工会的选择。工会清楚厂商对应每一个W所选择的L*，工会需要决定的

43、是选择W*，使得max u=u(W,L*(W),求得符合工会最大利益的W*。劳资博弈模型先由工会决定工资率，再由厂商决定雇用多少劳动力先由工会决定工资率，再由厂商决定雇用多少劳动力LW0工会的无差异曲线)(*WL)(*WL0u1u2u3u*W)(,max*0WLWuW)(*WLRL0W L厂商的反应函数R(L)斜率为W)(max),(max00WLLRLWLL2.3-3罗宾斯泰林讨价还价模型讨价还价模型简述：甲、乙两人协商分配上级下拨的1000元钱。在给定的3天协商时间内，第一天甲提出一个分配方案，乙若同意的话就按此分配，乙若不同意他可在第二天提出自己的方案，甲可选择接受或在第三天再提出一个方

44、案，乙对此可以接受或拒绝；如果3天内两人不能达成协议，上级将收回这1000元钱；甲和乙按天贴现率贴现自己的未来收益，0 1。简化条件：如果自己不能从拒绝对方提案中获取更多的收益，局中人都会接受对方提案。Rubinstein讨价还价模型第一天第二天第三天甲乙提案提案拒绝并提案拒绝并提案甲拒绝并提案拒绝并提案乙拒绝拒绝（s1,1000-s1）(s2,1000-s2)(s3,1000-s3)接接受受接接受受接接受受（0，0）112不接受，出S3接受不接受，出S2接受出S1)10000(,22SS)10000,(11SS)10000(,22SSSS2SSS211000010000本博弈的关键点o 第三

45、回合甲的方案有强制力，即进行到该回合甲提第三回合甲的方案有强制力，即进行到该回合甲提出的分割比例出的分割比例S S：1000-S1000-S，乙必须接受，并且这一点，乙必须接受，并且这一点两博弈方都是清楚的；两博弈方都是清楚的；o 该博弈每多进行一个回合总得益就会下降一个比例，该博弈每多进行一个回合总得益就会下降一个比例，因此让谈判拖得越长对双方都可能越不利，如果必因此让谈判拖得越长对双方都可能越不利，如果必须让对方得的数额不如早点让其得到，这对自己是须让对方得的数额不如早点让其得到，这对自己是有利的。有利的。Rubinstein讨价还价模型解析:逆推法第三天：只要甲的提案满足第三天：只要甲的

46、提案满足1000-s1000-s1 1 0 0，乙总会接受，甲的目标，乙总会接受，甲的目标是利益最大化，因而提案为是利益最大化，因而提案为（s s1 1,1000-s,1000-s1 1）（2 2s,s,2 2(1000-s)(1000-s)第二天：乙预料到第三天的结果，所以尽可能让甲接受自己的第二天：乙预料到第三天的结果，所以尽可能让甲接受自己的提案，提案中给甲的金额不小于提案，提案中给甲的金额不小于 2 2s,s,即即 s s2 2 2 2s s，因而有，因而有方案方案(s(s2 2,1000-s,1000-s2 2)=(=(s,s,(1000(1000 s)s)第一天：甲清楚如果自己的提

47、案被否决，对方第二天的提案，第一天：甲清楚如果自己的提案被否决，对方第二天的提案，自己会接受它。甲的问题是保证第一天乙得到自己会接受它。甲的问题是保证第一天乙得到(1000(1000 s s）的前提下自己尽可能多得一些。因此，的前提下自己尽可能多得一些。因此，10001000s s1 1 (1000(1000 s s），即），即s s1 110001000 (1000(1000 s s），他的最佳选择将是），他的最佳选择将是(s(s3 3,1000-s,1000-s3 3)=(1000=(1000 (1000(1000 s),s),(1000(1000 s)s)，乙接，乙接受，博弈于第一天即告

48、结束受，博弈于第一天即告结束o 注意在本博弈中，得出上述结论的前提是甲在第三回合的注意在本博弈中，得出上述结论的前提是甲在第三回合的方案乙必须接受，因此甲提出方案乙必须接受，因此甲提出S=1000S=1000，那么博弈的解就是，那么博弈的解就是甲在第一回合出价甲在第一回合出价S S1 1=1000(1-=1000(1-+2 2)，乙接受，双方的，乙接受，双方的得益得益 1000(1-1000(1-+2 2)，10001000（2 2 ）。）。o 在这种情况下，双方获得利益的比例取决于在这种情况下，双方获得利益的比例取决于 2 2 的大小。的大小。2 2 越大，甲的比例越小，乙的比例越大。越大，

49、甲的比例越小，乙的比例越大。o 这种结果反映了在此博弈中，乙仗以讨价还价的筹码就是这种结果反映了在此博弈中，乙仗以讨价还价的筹码就是跟可以跟甲拖时间。因为虽然甲可以争得最终利益，但拖跟可以跟甲拖时间。因为虽然甲可以争得最终利益，但拖延时间是会给甲造成损失的。延时间是会给甲造成损失的。o 现实生活中的例子：经济活动中的利润分配、债务纠纷，现实生活中的例子：经济活动中的利润分配、债务纠纷，或者财产继承争执等。或者财产继承争执等。无穷次讨价还价模型o 无穷次讨价还价模型不能采用逆推法o 夏克德和萨顿1984年提出了一种解决这个博弈问题的思路。o 要点是对一个无限回合博弈来讲，从第三回合开始（假如可以

50、到达第三回合），还是从第一回合开始，结果应该是一样的。o 于是就有S S=S S1 1=10001000(1000(1000 s),s),容易解容易解得得S S*=1000/=1000/（1+1+）,乙接受并获得乙接受并获得10001000S S*=1000=1000 /（1+1+）。）。2.3-4委托人代理人理论委托人代理人关系o 经济活动和社会活动中有很多委托人代理人关系，有明显的，也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。o 委托人代理人关系的关键特征：不能直接控制，监督不完全，信息不完全，利益的相关性o 委托人代理人涉及问题：激励机制设

展开阅读全文