第5章-不完全信息动态博弈-课件.ppt-资源下载-163文库_上传原创PPT模板、课件、文档赚钱

第5章-不完全信息动态博弈-课件.ppt

1、POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE

2、POWERPOINT TEMPLATE 第五章第五章不完全信息动态博弈不完全信息动态博弈v 在不完全信息动态博弈中，至少有一个博弈参与者对博弈在不完全信息动态博弈中，至少有一个博弈参与者对博弈的结构、博弈参与者类型、博弈收益等信息不完全了解。的结构、博弈参与者类型、博弈收益等信息不完全了解。v 博弈参与者的行动存在先后顺序。博弈参与者的行动存在先后顺序。v 与不完全信息静态博弈类似，可以通过海萨尼转换将不完与不完全信息静态博弈类似，可以通过海萨尼转换将不完全信息动态博弈转化为完全但不完美信息动态博弈。全信息动态博弈转化为完全但不完美信息动态博弈。一、波音与空客博弈的基本假设一、波音与空客博弈的

3、基本假设v 假设波音公司先于空中客车公司进入市场。假设波音公司先于空中客车公司进入市场。v 波音公司可能是一个波音公司可能是一个“有先发优势有先发优势”的公司，也可能是一个的公司，也可能是一个“无先发优势无先发优势”的公司。的公司。v 波音公司波音公司“有先发优势有先发优势”时，其成本函数为：时，其成本函数为：C(q1)=q1。v 波音公司波音公司“无先发优势无先发优势”时，其成本函数为：时，其成本函数为：C(q1)=2q1。v 空中客车公司的生产函数没有不确定性。空中客车公司的生产函数没有不确定性。v 空中客车公司的生产函数为：空中客车公司的生产函数为：C(q2)=2q2。v 空中客车公司进

4、入市场需要付出一个额外的固定成本。空中客车公司进入市场需要付出一个额外的固定成本。v 假设国际市场飞机需求函数为：假设国际市场飞机需求函数为：P=10 Qv 其中：其中：Q=q1+q2。v 波音公司和空中客车公司的行动存在先后顺序。波音公司和空中客车公司的行动存在先后顺序。v 波音公司先进入市场，空中客车公司后进入市场。波音公司先进入市场，空中客车公司后进入市场。v 波音公司和空中客车公司都明确知道空中客车公司的生产函数。波音公司和空中客车公司都明确知道空中客车公司的生产函数。v 波音公司明确知道自己的生产函数，但空中客车公司不知道波波音公司明确知道自己的生产函数，但空中客车公司不知道波音公司

5、的生产函数。存在不完全信息。音公司的生产函数。存在不完全信息。v 所以，这个博弈是一个不完全信息动态博弈。所以，这个博弈是一个不完全信息动态博弈。专栏：专栏：“先发优势先发优势”与与“规模经济规模经济”v 传统经济学理论建立在完全竞争市场和规模报酬不变的前提下。传统经济学理论建立在完全竞争市场和规模报酬不变的前提下。v 在传统经济学理论中，完全竞争条件下企业利润为零，并且企在传统经济学理论中，完全竞争条件下企业利润为零，并且企业的利润与企业进入市场的时间先后没有必然联系。业的利润与企业进入市场的时间先后没有必然联系。v 在在 20 世纪世纪 50 年代以后，伴随着机械化大生产的迅猛发展，年代以

6、后，伴随着机械化大生产的迅猛发展，企业生产过程中企业生产过程中“规模经济规模经济”（Economy of Scale）特征）特征越发明显。生产规模越大，企业生产成本越低。越发明显。生产规模越大，企业生产成本越低。v 规模经济的生产模式催生不完全竞争的市场结构。规模经济的生产模式催生不完全竞争的市场结构。v 具有规模经济生产特征的企业越做越大，逐渐在市场中占据一具有规模经济生产特征的企业越做越大，逐渐在市场中占据一定垄断地位，进而打破完全竞争的市场结构，产生垄断竞争、定垄断地位，进而打破完全竞争的市场结构，产生垄断竞争、寡头、甚至垄断等不完全竞争的市场结构模式。寡头、甚至垄断等不完全竞争的市场结

7、构模式。v 在规模经济和不完全竞争市场结构下，先进入市场的企业具有在规模经济和不完全竞争市场结构下，先进入市场的企业具有垄断优势。垄断优势。v 先进入的企业可以利用规模经济原理扩大规模，降低成本。先进入的企业可以利用规模经济原理扩大规模，降低成本。v 后进入的企业在发展之初，规模小、生产成本高，较难与已经后进入的企业在发展之初，规模小、生产成本高，较难与已经具备一定规模的先发企业进行抗衡。具备一定规模的先发企业进行抗衡。v 即：先进入的企业即：先进入的企业“有先发优势有先发优势”。v 如果先进入的企业没有充分利用自身的便利条件，未建立起自如果先进入的企业没有充分利用自身的便利条件，未建立起自身

8、的竞争优势，那么当后来者进入市场时，两家企业在将在同身的竞争优势，那么当后来者进入市场时，两家企业在将在同一个起跑线上进行竞争。一个起跑线上进行竞争。v 在此种情况下，先进入市场的企业常被称为在此种情况下，先进入市场的企业常被称为“无先发优势无先发优势”。内部规模经济内部规模经济学习曲线与先发优势学习曲线与先发优势二、博弈过程二、博弈过程v 波音公司先行动。波音公司先行动。v 当波音公司选择产量时，可以视波音公司为一个垄断者。当波音公司选择产量时，可以视波音公司为一个垄断者。v 当空中客车进行决策时，如果空中客车公司选择当空中客车进行决策时，如果空中客车公司选择“进入进入”，那么波音公司和空中

9、客车公司在市场中进行寡头博弈。那么波音公司和空中客车公司在市场中进行寡头博弈。v 假设寡头博弈遵从古诺寡头博弈的模式。假设寡头博弈遵从古诺寡头博弈的模式。1波音公司的决策依据波音公司的决策依据v 波音公司通过选择产量最大化自己的利润。波音公司通过选择产量最大化自己的利润。v 首先行动的波音公司如果是一个首先行动的波音公司如果是一个“有先发优势有先发优势”的公司的公司n均衡产量为：均衡产量为：4.5n均衡利润为：均衡利润为：20.25v 首先行动的波音公司如果是一个首先行动的波音公司如果是一个“无先发优势无先发优势”的公司的公司n均衡产量为：均衡产量为：4n均衡利润为：均衡利润为：162空中客车

10、公司的决策依据空中客车公司的决策依据v 当轮到空中客车公司行动时，如果空中客车公司选择当轮到空中客车公司行动时，如果空中客车公司选择“不进不进入入”，那么波音公司将继续自己在市场中的垄断地位。，那么波音公司将继续自己在市场中的垄断地位。v 如果空中客车公司选择如果空中客车公司选择“进入进入”，那么空中客车公司将和波音，那么空中客车公司将和波音公司在市场上进行古诺寡头博弈。公司在市场上进行古诺寡头博弈。v 寡头博弈下寡头博弈下v 首先行动的波音公司如果是一个首先行动的波音公司如果是一个“有先发优势有先发优势”的公司的公司n产量：产量：q1=10/3;q2=7/3；利润：；利润：1=100/9；1

11、=-5/9。v 首先行动的波音公司如果是一个首先行动的波音公司如果是一个“无先发优势无先发优势”的公司的公司n产量：产量：q1=8/3;q2=8/3；利润：；利润：1=64/9；1=10/9。v 如果波音公司是一个如果波音公司是一个“有先发优势有先发优势”的公司，那么空中客车公的公司，那么空中客车公司与波音公司在市场上进行古诺寡头竞争时，空中客车公司的司与波音公司在市场上进行古诺寡头竞争时，空中客车公司的利润为负。利润为负。v 如果波音公司是一个如果波音公司是一个“无先发优势无先发优势”的公司，那么空中客车公的公司，那么空中客车公司与波音公司在市场上进行古诺寡头竞争时，空中客车公司的司与波音公

12、司在市场上进行古诺寡头竞争时，空中客车公司的利润为正。也就是说：利润为正。也就是说：v 当波音公司是一个当波音公司是一个“有先发优势有先发优势”的公司时，空中客车公司将的公司时，空中客车公司将选择选择“进入进入”；v 当波音公司是一个当波音公司是一个“无先发优势无先发优势”的公司时，空中客车公司将的公司时，空中客车公司将选择选择“不进入不进入”。三、先验信念与策略互动三、先验信念与策略互动v 由于空中客车公司并不知道波音公司的成本函数，因此空中客由于空中客车公司并不知道波音公司的成本函数，因此空中客车公司只能根据自己的先验信念进行决策选择。车公司只能根据自己的先验信念进行决策选择。v 先行动的

13、波音公司可以通过自己传递的信息影响空中客车公司先行动的波音公司可以通过自己传递的信息影响空中客车公司的信念。的信念。v 空中客车公司先验的认为波音公司为空中客车公司先验的认为波音公司为“有先发优势有先发优势”的公司的的公司的概率为概率为 p，波音公司为，波音公司为“无先发优势无先发优势”的公司的概率为的公司的概率为 1 p。v 当当 p 2/3 时，空中客车公司选择时，空中客车公司选择“不进入不进入”。v 作为先行动的波音公司，可以通过自己的行为改变空中客车公作为先行动的波音公司，可以通过自己的行为改变空中客车公司的信念。司的信念。v 具体说来，先行动的波音公司作为市场中的垄断者，如果波音具体

14、说来，先行动的波音公司作为市场中的垄断者，如果波音公司已经建立起公司已经建立起“先发优势先发优势”，那么波音公司选择，那么波音公司选择 p=5.5可可以最大化自己的垄断利润。以最大化自己的垄断利润。v 如果波音公司如果波音公司“无先发优势无先发优势”，那么波音公司选择，那么波音公司选择 P=6 可可以最大化自己的垄断利润。以最大化自己的垄断利润。v 波音公司会考虑自己的定价传递给空中客车公司的信息。波音公司会考虑自己的定价传递给空中客车公司的信息。v 如果波音公司把价格定在如果波音公司把价格定在 P=6 的水平，那么等价于告诉空的水平，那么等价于告诉空中客车公司：波音公司是一个中客车公司：波音

15、公司是一个“无先发优势无先发优势”的公司。的公司。v 当轮到空中客车公司进行决策时，空中客车公司一定会选择当轮到空中客车公司进行决策时，空中客车公司一定会选择“进入进入”。v 空中客车公司的进入会攫取部分原本属于波音公司的垄断利润。空中客车公司的进入会攫取部分原本属于波音公司的垄断利润。v 波音公司理想的结果是通过自己传递的信息，让空中客车公司波音公司理想的结果是通过自己传递的信息，让空中客车公司“知难而退知难而退”，不进入市场。，不进入市场。v 即使波音公司是一个即使波音公司是一个“无先发优势无先发优势”的公司，它也有动机把自的公司，它也有动机把自己伪装成一个己伪装成一个“有先发优势有先发优

16、势”的公司，从而改变空中客车公司的公司，从而改变空中客车公司的信念，将空中客车公司排挤在市场之外。的信念，将空中客车公司排挤在市场之外。阶段阶段特点特点情形情形利润情况利润情况阶段阶段1市场中只有波音公司市场中只有波音公司一家企业一家企业波音公司为波音公司为“有先发优有先发优势势”的公司的公司波音公司：波音公司：20.25波音公司为波音公司为“无先发优无先发优势势”的公司的公司波音公司：波音公司：16阶段阶段2空中客车公司选择空中客车公司选择“进入进入”：市场中有：市场中有波音公司和空中客车波音公司和空中客车两家公司两家公司波音公司为波音公司为“有先发优有先发优势势

17、”的公司的公司波音公司：波音公司：100/9空中客车公司：空中客车公司：-5/9波音公司为波音公司为“无先发优无先发优势势”的公司的公司波音公司：波音公司：64/9空中客车公司：空中客车公司：10/9空中客车公司选择空中客车公司选择“不进入不进入”波音公司为波音公司为“有先发优有先发优势势”的公司的公司波音公司：波音公司：20.25空中客车公司：空中客车公司：0波音公司为波音公司为“无先发优无先发优势势”的公司的公司波音公司：波音公司：16空中客车公司：空中客车公司：0不同情况下波音公司和空中客车公司的利润情况不同情况下波音公司和空中客车公司的利润情况v 当空中客车

18、公司没有观察到波音公司的定价策略时，空中客车当空中客车公司没有观察到波音公司的定价策略时，空中客车公司有一个先验信念。公司有一个先验信念。v 当博弈开始后，空中客车公司可以观察到先行动的波音公司的当博弈开始后，空中客车公司可以观察到先行动的波音公司的定价策略，但观察不到波音公司的成本函数。定价策略，但观察不到波音公司的成本函数。v 根据波音公司的定价策略，空中客车公司会修正自己的先验信根据波音公司的定价策略，空中客车公司会修正自己的先验信念，产生后验概率。念，产生后验概率。v 空中客车公司如何根据观察到的波音公司价格的策略修改自己空中客车公司如何根据观察到的波音公司价格的策略修改自己的先验信念

19、呢？的先验信念呢？v“后行动的博弈参与者怎样根据观察到的信息修改自己的先验后行动的博弈参与者怎样根据观察到的信息修改自己的先验概率，得到后验概率。概率，得到后验概率。”这是贝叶斯统计的一个经典问题：这是贝叶斯统计的一个经典问题：第二节第二节先验概率与后验概率先验概率与后验概率v 在贝叶斯统计中，人们根据历史以及经验对某随机事件概在贝叶斯统计中，人们根据历史以及经验对某随机事件概率分布的先验信念称为先验概率。率分布的先验信念称为先验概率。v 先验概率形成后，根据之后得到信息对先验概率进行修正，先验概率形成后，根据之后得到信息对先验概率进行修正，得到后验概率。得到后验概率。v 贝叶斯公式是连接先

20、验概率和后验概率的桥梁。贝叶斯公式是连接先验概率和后验概率的桥梁。一、贝叶斯公式一、贝叶斯公式v 贝叶斯公式（逆概公式）：设试验贝叶斯公式（逆概公式）：设试验 E 的的样本空间为的的样本空间为。事件事件 A1,A2,An 构成样本空间构成样本空间的一个划分（或构成的一个划分（或构成一个完备事件组），且一个完备事件组），且 P(Ai)0，（，（i=1,2,n）则对任意一个事件则对任意一个事件 B（P(B)0），有：），有：1()(/)(/)()(/)jjjniiiP A P B AP ABP A P B A1,2,.,jn二、贝叶斯公式应用实例二、贝叶斯公式应用实例v 某公司考虑从某公司考虑从

21、 F 大学招聘毕业生。大学招聘毕业生。v 经理甲认为：经理甲认为：F 大学的毕业生为大学的毕业生为“高能力高能力”的概率为的概率为 0.9，为，为“低能力低能力”的概率为的概率为 0.1。v 经理乙认为：经理乙认为：F 大学的毕业生为大学的毕业生为“高能力高能力”的概率为的概率为 0.7，为，为“低能力低能力”的概率为的概率为 0.3。v 人事主管先验概率：经理甲正确的概率为人事主管先验概率：经理甲正确的概率为 0.4，经理乙正确的，经理乙正确的概率为概率为 0.6。v 该公司人力主管决定尝试着先招聘该公司人力主管决定尝试着先招聘 5 个个 F 大学的毕业生，通大学的毕业生，通过观察这过观察这

22、 5 个毕业生的实际能力，对自己的先验概率进行修正。个毕业生的实际能力，对自己的先验概率进行修正。v 如果招聘来的如果招聘来的 5 个个 F 大学的毕业生都是大学的毕业生都是“高能力高能力”的。这时，的。这时，该公司人力资源主管如何修正其先验概率？该公司人力资源主管如何修正其先验概率？v 定义事件定义事件 A1 和和 A2nA1=F大学毕业生大学毕业生“高能力高能力”的概率为的概率为 0.9，“低能力低能力”的概率为的概率为 0.1。nA2=F大学毕业生大学毕业生“高能力高能力”的概率为的概率为 0.7，“低能力低能力”的概率为的概率为 0.3。v 公司人力主管的先验概率为：公司人力主管的先验

23、概率为：P(A1)=0.4,P(A2)=0.6v 定义事件定义事件 B=招聘了招聘了 5 个个 F大学的学生，都是大学的学生，都是“高能力高能力”v 需要求解需要求解 P(A1/B)和和 P(A2/B)v 根据：根据：v 根据贝叶斯公式，得到：根据贝叶斯公式，得到：v 公司人力主管将自己的信念进行了调整，调整后的信念为：公司人力主管将自己的信念进行了调整，调整后的信念为：51(/)0.90.59049P B A52(/)0.70.16807P B A1111122()(/)0.4*0.59049(/)0.7()(/)()(/)0.4*0.590490.6*0.16807P A P B AP A

24、BP A P B AP A P B A2221122()(/)0.6*0.16807(/)0.3()(/)()(/)0.4*0.590490.6*0.16807P A P B AP ABP A P B AP A P B A1(/)0.7P AB 2(/)0.3P AB 2先验概率的再修正先验概率的再修正v 假设该公司人力主管决定再进行一次试验假设该公司人力主管决定再进行一次试验。v 该公司又从该公司又从 F 大学招聘了大学招聘了 10 名毕业生。名毕业生。v 经过一段时间的观察，发现这经过一段时间的观察，发现这 10 名毕业生中，有名毕业生中，有 9 名是名是“高高能力能力”，有，有 1 名是

25、低能力。名是低能力。v 定义事件定义事件 C=招聘了招聘了 10 个个 F 大学的学生，有大学的学生，有 9 个是个是“高能高能力力”，1 个是个是“低能力低能力”。v 根据贝叶斯公式，求解后验概率根据贝叶斯公式，求解后验概率v 需要求解需要求解 P(A1/C)和和 P(A2/C)v 定义事件定义事件 A1 和和 A2nA1=F大学毕业生大学毕业生“高能力高能力”的概率为的概率为 0.9，“低能力低能力”的概率为的概率为 0.1。nA2=F大学毕业生大学毕业生“高能力高能力”的概率为的概率为 0.7，“低能力低能力”的概率为的概率为 0.3。v 公司人力主管的先验概率为：公司人力主管的先验概率

26、为：P(A1)=0.7,P(A2)=0.3v 根据贝叶斯公式根据贝叶斯公式v 公司人力主管将自己的信念再次进行了调整。公司人力主管将自己的信念再次进行了调整。1111122()(/)0.7*0.38742(/)0.88()(/)()(/)0.7*0.387420.3*0.12106P A P C AP A CP A P C AP A P C A2221122()(/)0.3*0.12106(/)0.12()(/)()(/)0.7*0.387420.3*0.12106P A P C AP ACP A P C AP A P C A三、不断累积的经验对信念的影响三、不断累积的经验对信念的影响v 新增

27、加的信息，也可能导致人力主管向另一个方向调整信念新增加的信息，也可能导致人力主管向另一个方向调整信念。v 假设该公司从假设该公司从 F 大学招聘了大学招聘了 5 名毕业生。名毕业生。v 经过一段时间的观察，发现这经过一段时间的观察，发现这 5 名毕业生都是低能力。名毕业生都是低能力。v 定义事件定义事件 B=招聘了招聘了 5 个个 F 大学的学生，都是大学的学生，都是“低能力低能力”。v 根据贝叶斯公式，求解后验概率根据贝叶斯公式，求解后验概率1111122()(/)0.4*0.00001(/)0.0027()(/)()(/)0.4*0.00001 0.6*0.00243P A P B AP

28、ABP A P B AP A P B A2221122()(/)0.6*0.0.00243(/)0.9973()(/)()(/)0.4*0.000010.6*0.00243P A P B AP ABP A P B AP A P B Av 不完全信息动态博弈中，博弈参与者在博弈开始前具备先验信念。不完全信息动态博弈中，博弈参与者在博弈开始前具备先验信念。v 当博弈开始后，后行动的博弈参与者观察到先行动博弈参与者的当博弈开始后，后行动的博弈参与者观察到先行动博弈参与者的部分信息。根据观察到的信息，后行动的博弈参与者会修正自己部分信息。根据观察到的信息，后行动的博弈参与者会修正自己的先验概率，得到后

29、验概率。的先验概率，得到后验概率。v 先行动的博弈参与者知道自己透露的信息会影响后行动博弈参与先行动的博弈参与者知道自己透露的信息会影响后行动博弈参与者的信念。者的信念。v 因此，先行动的博弈参与者在透露信息时，也要经过深思熟虑、因此，先行动的博弈参与者在透露信息时，也要经过深思熟虑、理性权衡，尽可能让自己透露的信息能诱导后行动者形成有利于理性权衡，尽可能让自己透露的信息能诱导后行动者形成有利于先行动者的信念。先行动者的信念。第三节第三节不完全信息动态博弈的均衡不完全信息动态博弈的均衡v 与不完全信息静态博弈类似，可以通过海萨尼转换将一个不完全与不完全信息静态博弈类似，可以通过海萨尼转换将一

30、个不完全信息动态博弈写成博弈树的表达形式。信息动态博弈写成博弈树的表达形式。v 一、均衡概述一、均衡概述v 考虑这样一个简单的不完全信息动态博弈：考虑这样一个简单的不完全信息动态博弈：v 两名博弈参与者两名博弈参与者 1 和和 2。v 博弈参与者博弈参与者 1 先行动，博弈参与者先行动，博弈参与者 2 后行动。后行动。v 参与者参与者 1 可能选择策略可能选择策略 L，也可能选择策略，也可能选择策略 R。v 后行动的参与者后行动的参与者 2 不知道参与者不知道参与者 1 的策略选择。的策略选择。v 后行动的参与者后行动的参与者 2 具备关于参与者具备关于参与者 1 选择的先验信念。选择的先验信

31、念。v 参与者参与者 2 认为参与者认为参与者 1 选择策略选择策略 L 的概率为的概率为 p，选择策略，选择策略 R 的概率为的概率为 1-p。v 参与者参与者2有两个策略可以选择：有两个策略可以选择：U 和和 V。参与者参与者2策略策略U策略策略V参与者参与者1策略策略L（2，3）（0，1）策略策略R（1，4）（0，2）v 参与者参与者 2 的两个节点位于一个信息集内。的两个节点位于一个信息集内。v 与完全信息动态博弈不同，这里假设参与者与完全信息动态博弈不同，这里假设参与者 2具有先验信念。具有先验信念。v 根据参与者根据参与者 2 的先验信念，参与者的先验信念，参与者 2 选择策略选择

32、策略 U 的预期收益为：的预期收益为：v 参与者参与者 2 选择策略选择策略 V 的预期收益为：的预期收益为：v 容易得到：对于任意的容易得到：对于任意的 0=p=1，参与者，参与者 2 选择策略选择策略 U的收益都高于选择策略的收益都高于选择策略 V 的收益。的收益。v 参与者参与者 2 会选择策略会选择策略 U。v 参与者参与者 1 预期到参与者预期到参与者 2 的选择逻辑，参与者的选择逻辑，参与者 1 会选择策略会选择策略 L。v 博弈的均衡是（博弈的均衡是（L，U）。）。*3(1)*44ppp*1(1)*22pppv 不完全信息动态博弈的均衡应具备两个特点。不完全信息动态博弈的均衡应具

33、备两个特点。v 特点特点 1：博弈参与者在每个博弈节点上都有一个主观信念：博弈参与者在每个博弈节点上都有一个主观信念n如果某个博弈参与者的信息集为单点信息集，那么可以认为如果某个博弈参与者的信息集为单点信息集，那么可以认为该信息集上的博弈参与者赋予此博弈节点的主观概率为该信息集上的博弈参与者赋予此博弈节点的主观概率为 1。v 特点特点2：均衡必须满足序贯理性（：均衡必须满足序贯理性（Sequentially Rational）。）。n序贯理性指：在博弈的每个信息集上，博弈参与者的决策都序贯理性指：在博弈的每个信息集上，博弈参与者的决策都是最优的。是最优的。二、精炼贝叶斯纳什均衡二、精炼贝叶斯纳

34、什均衡v 完全信息动态博弈中完全信息动态博弈中n子博弈精炼纳什均衡是对纳什均衡的一种子博弈精炼纳什均衡是对纳什均衡的一种“精炼精炼”，n剔除了纳什均衡中包含着剔除了纳什均衡中包含着“空洞威胁空洞威胁”的均衡。的均衡。v 不完全信息动态博弈中不完全信息动态博弈中n精炼贝叶斯纳什均衡（精炼贝叶斯纳什均衡（Perfect Bayesian Nash Equilibrium）指剔除了贝叶斯纳什均衡中包含）指剔除了贝叶斯纳什均衡中包含“空洞威胁空洞威胁”的的均衡，均衡，n是对贝叶斯纳什均衡的是对贝叶斯纳什均衡的“精炼精炼”。1精炼贝叶斯纳什均衡实例精炼贝叶斯纳什均衡实例包含包含“空洞威胁空洞威胁”的博弈

35、的博弈v 博弈参与者博弈参与者 1 有三个策略：有三个策略：L、R 和和 M。v 当参与者当参与者 1 选择策略选择策略 M 时，博弈结束。参与者时，博弈结束。参与者 1 获得收益获得收益 1，参与者参与者 2 获得收益获得收益 10。v 当参与者当参与者 1 选择策略选择策略 L 或者策略或者策略 R 时，轮到参与者时，轮到参与者 2 进行策进行策略选择。略选择。v 参与者参与者 2 能观察到参与者能观察到参与者 1 没有选择策略没有选择策略 M，但参与者，但参与者 2 不不知道参与者知道参与者 1 究竟选择了策略究竟选择了策略 L 还是选择了策略还是选择了策略 R。v 此博弈不存在子博弈。

36、此博弈不存在子博弈。v 根据根据“划横线法划横线法”求解博弈的纳什均衡。求解博弈的纳什均衡。v 博弈有两个纳什均衡：（博弈有两个纳什均衡：（L，U）和（）和（M，V）。）。v 纳什均衡仅考虑在均衡处的情况，而不考虑通往均衡的路径。纳什均衡仅考虑在均衡处的情况，而不考虑通往均衡的路径。v（M，V）虽然是纳什均衡，但在实际博弈中，没有通往这个纳）虽然是纳什均衡，但在实际博弈中，没有通往这个纳什均衡的路径。什均衡的路径。参与者参与者2策略策略U策略策略V参与者参与者1策略策略L（2，3）（0，1）策略策略R（1，4）（0，2）策略策略M（1，10）（1，10）v 博弈参与者博弈参与者 1 先行动，但

37、参与者先行动，但参与者 1 在选择自己的策略时，会考在选择自己的策略时，会考虑自己的策略对博弈参与者虑自己的策略对博弈参与者 2 决策的影响。决策的影响。v 如果参与者如果参与者 1 没有选择策略没有选择策略 M，那么参与者，那么参与者 2 会根据自己的主会根据自己的主观信念以及收益情况选择自己的策略。可以证明：参与者观信念以及收益情况选择自己的策略。可以证明：参与者 2 必必然会选择策略然会选择策略 U。v 理性的参与者理性的参与者 1 可以预期到：如果自己不选策略可以预期到：如果自己不选策略 M，而是选择，而是选择策略策略 L 或者策略或者策略 R，那么参与者，那么参与者 2 必然选择策略

38、必然选择策略 U。v 在这种序贯理性条件下，参与者在这种序贯理性条件下，参与者 1 会选择策略会选择策略 L，参与者，参与者 1 得得到收益到收益 2，参与者，参与者 2 得到收益得到收益 3。v 如果参与者如果参与者 1 选择策略选择策略 M，那么参与者，那么参与者 1 仅能得到收益仅能得到收益 1。v 所以先行动参与者所以先行动参与者 1 不会选择策略不会选择策略 M。v 尽管参与者尽管参与者 2 不知道参与者不知道参与者 1 选择了策略选择了策略 L 还是策略还是策略 R，但参，但参与者与者 2 必然会选择策略必然会选择策略 U。v 所以，作为一个动态博弈，博弈路径必然是：参与者所以，作

39、为一个动态博弈，博弈路径必然是：参与者 1 选择策选择策略略 L，参与者，参与者 2 选择策略选择策略 U。v 博弈参与者博弈参与者 2 最希望看到的结果是：参与者最希望看到的结果是：参与者 1 选择策略选择策略 M，从，从而博弈结束。在这种情况下参与者而博弈结束。在这种情况下参与者 2 可以获得收益可以获得收益 10。但是，。但是，怎样才能让参与者怎样才能让参与者 1 选择策略选择策略 M 呢？呢？2不可置信的威胁不可置信的威胁v 参与者参与者 2 如果放出这样的威胁：如果放出这样的威胁：“如果参与者如果参与者 1 没有选择策没有选择策略略 M，而是选择了策略，而是选择了策略 L 或策略或策

40、略 R，那么参与者，那么参与者 2 必然选择必然选择策略策略 V”。v 参与者参与者 2 的这种威胁如果成立，那么不管参与者的这种威胁如果成立，那么不管参与者 1 选择策略选择策略 L 还是策略还是策略 R，参与者，参与者 1 的收益都只有的收益都只有 0。如果选择策略。如果选择策略 M，参与者参与者 1 可以得到收益可以得到收益 1。v 如果参与者如果参与者 2 的威胁是可置信的，那么参与者的威胁是可置信的，那么参与者 1 就会选择策就会选择策略略 M，得到收益，得到收益 1。参与者。参与者 2 得到收益得到收益 10。v 然而，参与者然而，参与者 2 的这种威胁是不可置信的威胁。的这种威胁

41、是不可置信的威胁。v 参与者参与者 1 知道，如果自己没有选择策略知道，如果自己没有选择策略 M，那么参与者，那么参与者 2 会放弃威胁，理性的选择策略会放弃威胁，理性的选择策略 U。v 博弈均衡为（博弈均衡为（L，U）。）。v 参与者参与者 1 得到收益得到收益 2，高于选择策略，高于选择策略 M 的收益的收益 1。v 参与者参与者 2 怎样将这种空洞的威胁变成可置信的威胁呢？怎样将这种空洞的威胁变成可置信的威胁呢？3可置信的威胁可置信的威胁v 如果参与者如果参与者 2 找到一个具有法律约束力的公正机构，并作出承找到一个具有法律约束力的公正机构，并作出承诺：如果参与者诺：如果参与者 1 没有

42、选择策略没有选择策略 M，那么参与者，那么参与者 2 如果选择如果选择策略策略 U，则捐给出，则捐给出10，口说无凭，立字为据。，口说无凭，立字为据。v 在这种情况下，博弈的收益就相应发生了变化。在这种情况下，博弈的收益就相应发生了变化。v 容易得到：参与者容易得到：参与者 2 选择策略选择策略 U 的收益都低于选择策略的收益都低于选择策略 V 的收的收益。参与者益。参与者 2 会选择策略会选择策略 V。v 根据序贯理性原则，参与者根据序贯理性原则，参与者 1 预期到参与者预期到参与者 2 必然选择策略必然选择策略 V。v 如果参与者如果参与者 1 选择了策略选择了策略 L 或者策略或者策略

43、R，那么参与者，那么参与者 1 只能得只能得到收益到收益 0。v 如果参与者如果参与者 1 选择策略选择策略 M，会得到收益，会得到收益 1。v 因此理性的参与者因此理性的参与者 1 会选择策略会选择策略 M。博弈的均衡为：。博弈的均衡为：(M，V)。v 因此，当参与者因此，当参与者 2 将自己将自己“必然选择策略必然选择策略 V”的威胁变为可置信的威胁变为可置信的威胁时，参与者的威胁时，参与者 1 会选择策略会选择策略 M 而不是策略而不是策略 L。v 博弈只有一个纳什均衡：（博弈只有一个纳什均衡：（M，V）。）。v 这个纳什均衡也是一个精炼贝叶斯纳什均衡。这个纳什均衡也是一个精炼贝叶斯纳什

44、均衡。参与者参与者2策略策略U策略策略V参与者参与者1策略策略L（2，-7）（0，1）策略策略R（1，-6）（0，2）策略策略M（1，10）（1，10）“可置信威胁可置信威胁”下的策略型表达方式下的策略型表达方式第四节第四节不完全信息动态博弈的应用不完全信息动态博弈的应用v 在不完全信息动态博弈中，一个重要的研究领域是：怎样有效在不完全信息动态博弈中，一个重要的研究领域是：怎样有效传递信号（传递信号（Signal）以及存在信号传递条件下的博弈均衡。）以及存在信号传递条件下的博弈均衡。v 迈克尔迈克尔斯宾塞（斯宾塞（Michael Spence）教授研究了劳动力市）教授研究了劳动力市场上的不

45、完全信息、信号传递及均衡问题，为信息经济学的发场上的不完全信息、信号传递及均衡问题，为信息经济学的发展奠定了重要基础。展奠定了重要基础。v 一、劳动力市场信号博弈概述一、劳动力市场信号博弈概述v 在劳动力市场中，雇主不能在招聘时明确知道应聘者的能力。在劳动力市场中，雇主不能在招聘时明确知道应聘者的能力。v 即使被录用者已在工作岗位上时，雇主也往往无法立即获知劳即使被录用者已在工作岗位上时，雇主也往往无法立即获知劳动者的真实能力。动者的真实能力。v 雇主不可能随意解聘一个已经得到雇佣合同的员工。雇主不可能随意解聘一个已经得到雇佣合同的员工。v 劳动力市场可以看作是一个具备不对称信息特征的投资市场

46、。劳动力市场可以看作是一个具备不对称信息特征的投资市场。v 雇主虽然观察不到劳动者的能力，但是能够观察到劳动者的外雇主虽然观察不到劳动者的能力，但是能够观察到劳动者的外部特征。如：性别、年龄、种族、受教育程度等。部特征。如：性别、年龄、种族、受教育程度等。v 雇主可以通过观察劳动者的外部特征来形成对劳动者实际能力雇主可以通过观察劳动者的外部特征来形成对劳动者实际能力的主观信念。的主观信念。v 像性别、年龄、种族这些不受劳动者本身控制的特征，通常被像性别、年龄、种族这些不受劳动者本身控制的特征，通常被称为称为“指标（指标（Indices）”，只有劳动者能自我控制的特征：，只有劳动者能自我控制的特

47、征：如受教育程度，才被称为如受教育程度，才被称为“信号（信号（Signal）”。v 劳动者可以通过向雇主传递信号，还改变雇主的主观信念。劳动者可以通过向雇主传递信号，还改变雇主的主观信念。v 通常说来，劳动者的受教育程度越到，雇主认为其是高能力的通常说来，劳动者的受教育程度越到，雇主认为其是高能力的劳动者的概率越大。劳动者的概率越大。v 因此，劳动者的受教育程度是一个信号。因此，劳动者的受教育程度是一个信号。v 劳动者的受教育程度越高，劳动者得到雇佣的可能性越大。劳动者的受教育程度越高，劳动者得到雇佣的可能性越大。v 如果拿到高学历不需要成本，则所有的劳动者都会选择高学历。如果拿到高学历不需要

48、成本，则所有的劳动者都会选择高学历。v 实际上，受教育需要付出成本：体力、脑力和时间等。实际上，受教育需要付出成本：体力、脑力和时间等。v 为了得到某些有利于自己的信号而付出的成本，通常被称为为了得到某些有利于自己的信号而付出的成本，通常被称为“信号成本（信号成本（Signaling Cost）”。v 假设劳动者取得高学历的成本和他的能力负相关：能力越高的假设劳动者取得高学历的成本和他的能力负相关：能力越高的劳动者获得高学历所需付出的成本越低；能力越低的劳动者获劳动者获得高学历所需付出的成本越低；能力越低的劳动者获得高学历所需付出的成本越高。得高学历所需付出的成本越高。v 由于劳动者获得高教育

49、水平需要付出成本，即由于劳动者获得高教育水平需要付出成本，即“信号成本信号成本”，因此劳动者在决定自己接受多少年教育时，会考虑因此劳动者在决定自己接受多少年教育时，会考虑“多接受一多接受一年教育年教育”所带来的收益和所要付出的成本的相对大小。所带来的收益和所要付出的成本的相对大小。v 在均衡处，应满足边际收益等于边际成本。这就是在均衡处，应满足边际收益等于边际成本。这就是“劳动者的劳动者的信号决策信号决策”过程。过程。劳动力市场和信号传递劳动力市场和信号传递v 虽然雇主认为：受教育程度越高，劳动者为高能力劳动者的概虽然雇主认为：受教育程度越高，劳动者为高能力劳动者的概率越大。率越大。v 但是究

50、竟受教育程度和能力之间是怎样的量化关系呢？但是究竟受教育程度和能力之间是怎样的量化关系呢？v 雇主会根据以往的经验不断修正自己的判断。雇主会根据以往的经验不断修正自己的判断。v 如果以往雇佣的高学历劳动者都是高能力、低学历劳动者都是如果以往雇佣的高学历劳动者都是高能力、低学历劳动者都是低能力，那么雇主会认为受教育程度和能力之间存在很强的相低能力，那么雇主会认为受教育程度和能力之间存在很强的相关性。反之，如果雇主以往雇佣的高学历劳动者能力并不高、关性。反之，如果雇主以往雇佣的高学历劳动者能力并不高、低学历劳动者能力并不低，那么雇主就会逐渐认为受教育程度低学历劳动者能力并不低，那么雇主就会逐渐认为

邮箱/手机：
温馨提示：	系统将以此处填写的邮箱或者手机号生成账号和密码，方便再次下载。如填写123，账号和密码都是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？