博弈动态博弈课件.pptx

上传人(卖家):晟晟文业 文档编号:4775627 上传时间:2023-01-09 格式:PPTX 页数:47 大小:705.52KB
下载 相关 举报
博弈动态博弈课件.pptx_第1页
第1页 / 共47页
博弈动态博弈课件.pptx_第2页
第2页 / 共47页
博弈动态博弈课件.pptx_第3页
第3页 / 共47页
博弈动态博弈课件.pptx_第4页
第4页 / 共47页
博弈动态博弈课件.pptx_第5页
第5页 / 共47页
点击查看更多>>
资源描述

1、3 完全但不完美信息博弈完全但不完美信息博弈:行动的参与者行动的参与者并不知道并不知道这一步之前博弈的整个过程这一步之前博弈的整个过程4 所有动态博弈的所有动态博弈的中心问题是中心问题是可信任性可信任性.在博弈的某些阶段在博弈的某些阶段,要选择要选择第一第一,参与者参与者1选择支付选择支付1000 美元给参与者美元给参与者2,是否是否引爆一颗手雷引爆一颗手雷.看下例,这是一个两步博弈看下例,这是一个两步博弈.或者一分或者一分不给不给;第二第二,参与者参与者2观察到参与者观察到参与者1的选择,然后决定的选择,然后决定 两个参与者如何选择呢?两个参与者如何选择呢?如果参与者如果参与者1相信这一威胁

2、,相信这一威胁,他的最优反应是支付他的最优反应是支付1000美元美元给参与者给参与者2,但参与者但参与者1却不会对这一威胁信以为真,却不会对这一威胁信以为真,它它不可置信不可置信.参与者参与者2 接受,博弈结束接受,博弈结束.完全且完美信息动态博弈完全且完美信息动态博弈 一、动态博弈的表述(初步描述)一、动态博弈的表述(初步描述)1、基本要求、基本要求(1)局中人)局中人 I=1,2,,n(2)局中人的行动次序(有先后之分),)局中人的行动次序(有先后之分),Ai 为为i 的行动集的行动集.(3)每次行动时局中人所进行的选择)每次行动时局中人所进行的选择(4)外生事件的概率分布)外生事件的概率

3、分布(5)局中人在选择行动时所了解的信息)局中人在选择行动时所了解的信息(6)支付函数)支付函数二、二、动态博弈的表示方法和特点动态博弈的表示方法和特点 1、动态博弈的阶段和扩展形表示、动态博弈的阶段和扩展形表示 动态博弈中一个博弈方的一次行动选择称为一个动态博弈中一个博弈方的一次行动选择称为一个“阶段阶段”(Stage).动态博弈也称为动态博弈也称为“序列博弈序列博弈”(Sequential Games)序和博弈的阶段,因此是表示(阶段数和博弈方可选序和博弈的阶段,因此是表示(阶段数和博弈方可选 由于扩展形可以反映动态博弈中博弈方的选择次由于扩展形可以反映动态博弈中博弈方的选择次 行为数量较

4、少的)动态博弈的最佳方法行为数量较少的)动态博弈的最佳方法.动态博弈有动态博弈有时也被称为时也被称为“扩展形博弈扩展形博弈”(Extensive FormGame).而且每个阶段的可能选择也很多,因此很难用扩展形而且每个阶段的可能选择也很多,因此很难用扩展形 注意注意:并不是所有动态博弈都可以用扩展形表示:并不是所有动态博弈都可以用扩展形表示.例如下象棋是动态博弈,但因为它不仅博弈阶段很多,例如下象棋是动态博弈,但因为它不仅博弈阶段很多,式加以表示式加以表示.三、动态博弈的基本特点三、动态博弈的基本特点 分,而且一个博弈方的选择很可能不是只有一次,而分,而且一个博弈方的选择很可能不是只有一次,

5、而在动态博弈中,各个博弈方的选择不仅有先后之在动态博弈中,各个博弈方的选择不仅有先后之 是有几次,并且在不同阶段的多次行为之间有内在联是有几次,并且在不同阶段的多次行为之间有内在联 系,是不能分割的整体系,是不能分割的整体.因此在动态博弈中,因此在动态博弈中,研究某研究某 个博弈方某个阶段的行为,个博弈方某个阶段的行为,裂开来研究是没有意义的裂开来研究是没有意义的.或者将各个阶段的行为割或者将各个阶段的行为割动态博弈中某博弈方的动态博弈中某博弈方的策略策略 是指轮到他选择时,是指轮到他选择时,针对前面阶段的各种情况,以及后续阶段可能的选择针对前面阶段的各种情况,以及后续阶段可能的选择 所作相应

6、选择的所作相应选择的完整计划完整计划.动态动态博弈的结果博弈的结果 包括双方(或多方)采用的策略包括双方(或多方)采用的策略 组合、实现的博路径和各博弈方的收益组合、实现的博路径和各博弈方的收益.四、动态博弈的非对称性四、动态博弈的非对称性 因为动态博弈中各个博弈方的行为选择有先后次因为动态博弈中各个博弈方的行为选择有先后次 序的,且后行为者能观察到此前博弈方的行为选择,序的,且后行为者能观察到此前博弈方的行为选择,因此动态博弈中各博弈方的地位是不对称的因此动态博弈中各博弈方的地位是不对称的.另外,在另外,在动态博弈中各博弈方的阶段选择动态博弈中各博弈方的阶段选择不一定是交替进行的不一定是交替

7、进行的.A AB BA AB B制止制止(-2-2,5 5)不仿冒不仿冒(0 0,1010)不仿冒不仿冒仿冒仿冒制止制止不制止不制止仿冒仿冒(2 2,2 2)(1010,4 4)(5 5,5)5)不制止不制止博弈树(扩展型示意)例:仿冒博弈博弈树(扩展型示意)例:仿冒博弈五、五、完全且完美信息动态博弈解法完全且完美信息动态博弈解法之之逆向归纳法逆向归纳法1、二人动态博弈的逆向归纳法二人动态博弈的逆向归纳法I=1,2,局中人,局中人1先行动,先行动,2根根据据1的行动选择行动的行动选择行动收益函数收益函数),(21aauuii局中人局中人2 的选择的选择)(),(max122221222aRRa

8、aauAa(2对对1的反应函数)的反应函数)局中人局中人1知道知道2 会根据会根据1的选择而做出选择的选择而做出选择 局中人局中人1的选择:的选择:111211)(,(max11aaaRauAa从而得到这一动态博弈的从而得到这一动态博弈的逆向递归解逆向递归解).(,(121aRa21 完全且完美信息动态博弈完全且完美信息动态博弈21 A 理论:逆向归纳法理论:逆向归纳法 手雷博弈属于下面简单类型的完全且完美信息手雷博弈属于下面简单类型的完全且完美信息动态博弈:动态博弈:1 参与者参与者1 从可行集从可行集A1中选择一个行动中选择一个行动a1,2 参与者参与者2 2观察到观察到a1后后,从可行集

9、从可行集A2中选择一个中选择一个 行动行动a1,3 两人的收益分别为两人的收益分别为 和和 ),(211aau).,(212aau逆向归纳法求解此博弈如下:逆向归纳法求解此博弈如下:在博弈的第二阶段在博弈的第二阶段参与者参与者2行动时,由于其前参行动时,由于其前参 与者与者1已选择行动已选择行动a1,他面临的决策问题可用下式表他面临的决策问题可用下式表 示为示为),(max21222aauAa),(max21222aauAa 假定对假定对A1中的每一个中的每一个a1,参与者参与者2的最优化问题的最优化问题 只有只有唯一解唯一解,用用R2(a1)表示表示.由于参与者由于参与者1能和参与能和参与

10、者者2 一样解出一样解出2 的问题的问题,参与者参与者1可以预可以预测到参与者测到参与者 2 对每一个可能行动对每一个可能行动a1所做出的反应,所做出的反应,这样这样1在第一阶在第一阶 段要解决的问题可归结为:段要解决的问题可归结为:)(,(max121111aRauAa 假定参与者假定参与者1的这一最优化问题也有的这一最优化问题也有唯一解唯一解,表示为表示为 1a,我们称我们称 是这一博弈的是这一博弈的逆向归纳解逆向归纳解.)(,(11aRa逆向归纳解不含有不可置信的威胁逆向归纳解不含有不可置信的威胁:因为参与者因为参与者1能够能够 预测到参与者预测到参与者2 对对1的可能选择的最优反应的可

11、能选择的最优反应,这一预测这一预测 排除了参与者排除了参与者2不可置信的威胁不可置信的威胁.逆向归纳法背后的理性假设逆向归纳法背后的理性假设.看下例三阶段两个参与者的动态博弈看下例三阶段两个参与者的动态博弈.三阶段两个参与者的动态博弈的三阶段两个参与者的动态博弈的博弈树博弈树表示表示.(2,0)(1,1)121LRL1R1R2L2(3,0)(0,2)博弈的解或博弈的结果:博弈的解或博弈的结果:参与者选择参与者选择L,博弈结束博弈结束.博弈的逆向归纳解表示为博弈的逆向归纳解表示为(L,X).戴威戴威(Richard H.Thaler)发表在发表在上的一个例子上的一个例子.教授组织同学进行这样的实

12、验教授组织同学进行这样的实验:让让A,B两同学就两同学就一美元进行讨价还价一美元进行讨价还价:首先由首先由A提出方案提出方案,若若B同意同意,就就按照按照A的方案分配这一美元的方案分配这一美元.如果如果B拒绝拒绝A的提议的提议,则双则双方一文不名方一文不名.请讨论实验分配的结果请讨论实验分配的结果.罗森多教授罗森多教授(Robert Rosenthal)1981年发表在年发表在Journal of Economic Theory上的论文中提出的上的论文中提出的:蜈蜈 蚣蚣 博博 弈弈最终最终A得到得到1 1美元钱美元钱,然后然后,自愿自愿地分给地分给B 一半一半.)0,1()2,0()0,3(

13、)4,0()0,5()9998,0()0,9999()10000,0(ABABAAB由逆向归纳法容易得出逆向归纳解为由逆向归纳法容易得出逆向归纳解为:在在A第一次第一次 选择时就结束博弈选择时就结束博弈.双方的收益为双方的收益为(0,1).但是但是,实验的实验的结果如何呢结果如何呢?最终最终B得到得到10000元钱元钱,然后然后自愿自愿地分给地分给A一半一半.动态博弈中可信性和纳什均衡的问题动态博弈中可信性和纳什均衡的问题 相机选择和策略中的可信性问题相机选择和策略中的可信性问题动态博弈中博弈方的策略是动态博弈中博弈方的策略是预先设定的预先设定的.这些策略在博弈过程中究竟哪个会实施,博弈方这些

14、策略在博弈过程中究竟哪个会实施,博弈方会从自身利益的角度出发,会从自身利益的角度出发,针对其他博弈方的策略选针对其他博弈方的策略选择来选择择来选择,我们称这种策略选择行为为动态博弈中的我们称这种策略选择行为为动态博弈中的相机选择相机选择:相机选择的存在使得博弈方的策略中所设相机选择的存在使得博弈方的策略中所设定的各个阶段、各种情况下所采取的行为的可信性有定的各个阶段、各种情况下所采取的行为的可信性有 了疑问了疑问.以以“开金矿博弈开金矿博弈”为例对分析为例对分析相机选择和可信性相机选择和可信性问问题题“开金矿博弈开金矿博弈”甲欲开发一个价值甲欲开发一个价值4万元的金矿万元的金矿,缺少缺少1万元

15、资金万元资金,乙有乙有1 1万元的资金可以投资万元的资金可以投资.甲想说服乙借给他甲想说服乙借给他,并答并答应分给乙应分给乙2万元万元,乙是否应该借给他?乙是否应该借给他?(不借,不借,X )可将此问题看作一个可将此问题看作一个两个阶段两个参与者的动态两个阶段两个参与者的动态博弈博弈.不借不借借借还还不还不还(1,0)P1 1P2 2(2,2)(0,4)版本版本1:无法律无法律保障保障的开金矿博弈的开金矿博弈博弈的逆向归纳解:博弈的逆向归纳解:易知此博弈的逆向归纳解为易知此博弈的逆向归纳解为:乙选择不借乙选择不借,博弈结束博弈结束.表示为表示为(不借,不借,X)直观解释为直观解释为:乙没有理由

16、相信甲的乙没有理由相信甲的“承诺承诺”.上面的博弈可以修正为以下博弈上面的博弈可以修正为以下博弈.(借,还借,还)博弈的结果:博弈的结果:不借不借借借还还不还不还起诉起诉放弃放弃(1 1,0)0)P1 1P2 2P1 1(2,2)(2,2)(1,0)(1,0)(0,4)(0,4)版本版本2:法律保障法律保障充足充足的开金矿博弈的开金矿博弈不借借还不还起诉放弃(1,0)P1P2P1(2,2)(-1,0)(0,4)案例:开金矿博弈案例:开金矿博弈 版本版本3:法律保障不足法律保障不足的开金矿博弈的开金矿博弈纳什均衡在动态博弈分析中的问题纳什均衡在动态博弈分析中的问题 我们通过开金矿博弈的几个不同版

17、本,说明了我们通过开金矿博弈的几个不同版本,说明了动态博弈问题的相机选择引出的可信性问题,以及动态博弈问题的相机选择引出的可信性问题,以及可信性在动态博弈分析中的关键意义可信性在动态博弈分析中的关键意义.但实际上可信性问题最重要的意义,还在于它但实际上可信性问题最重要的意义,还在于它对纳什均衡在动态博弈分析中的有效性提出了质疑!对纳什均衡在动态博弈分析中的有效性提出了质疑!我们用我们用法律保障不足法律保障不足的开金矿博弈的开金矿博弈的开金矿博弈的开金矿博弈来阐明这种质疑的内涵来阐明这种质疑的内涵.根据纳什均衡的定义不难判断,由乙的根据纳什均衡的定义不难判断,由乙的策略策略 “第一阶段第一阶段借

18、借,当甲第二阶段选择,当甲第二阶段选择不还不还时,第三阶时,第三阶段选择段选择起诉起诉”,甲的,甲的策略策略“第二阶段无条件第二阶段无条件还还”,构,构成的成的策略组合策略组合是一个是一个纳什均衡纳什均衡.因为给定对方的策略,因为给定对方的策略,双方的策略都是符合自己最大利益的最佳策略,单独双方的策略都是符合自己最大利益的最佳策略,单独偏离对自己都是不利的偏离对自己都是不利的.在双方上述策略下,乙在第在双方上述策略下,乙在第三阶段的三阶段的“打打”并不需要真正实施,但它是保证第并不需要真正实施,但它是保证第二阶段甲会分的关键,二阶段甲会分的关键,乙的策略中必须包含这个选乙的策略中必须包含这个选

19、择择.既然双方上述策略构成一个纳什均衡,它应该既然双方上述策略构成一个纳什均衡,它应该是具有稳定性的,但事实上乙根本就不会选择是具有稳定性的,但事实上乙根本就不会选择“借借”.为什么会出现这种矛盾呢?为什么会出现这种矛盾呢?主要在于乙第三阶段主要在于乙第三阶段的的“起诉起诉”是不可信的是不可信的.纳什均衡在动态博弈可能缺乏稳定性的根源纳什均衡在动态博弈可能缺乏稳定性的根源在于在于它不能排除博弈方策略中所包含的不可信的行为设定它不能排除博弈方策略中所包含的不可信的行为设定不能解决动态博弈的相机选择引起的可信性问题不能解决动态博弈的相机选择引起的可信性问题.动态博弈的有效分析概念,除了要符合纳什均

20、衡动态博弈的有效分析概念,除了要符合纳什均衡 的基本要求以外,还必须满足另一个关键的要求,那的基本要求以外,还必须满足另一个关键的要求,那就是它(或者它们)必须能够排除博弈方策略中不可就是它(或者它们)必须能够排除博弈方策略中不可 信的行为设定,也就是各种不可信的威胁和承诺信的行为设定,也就是各种不可信的威胁和承诺.只只 有满足这样要求的均衡概念在动态博弈分析中才有真有满足这样要求的均衡概念在动态博弈分析中才有真 正的稳定性,才能对动态博弈作出有效的分析和预测正的稳定性,才能对动态博弈作出有效的分析和预测.21B 斯塔克尔贝里双头垄断模型斯塔克尔贝里双头垄断模型 博弈的时间顺序如下博弈的时间顺

21、序如下;1q1q(2)企业企业2观察到观察到 以后以后,然后然后选择产量选择产量 ;2q)(),(21cQPqqqii21qqQ(市场上的总产量市场上的总产量)(市场出清价格市场出清价格)QaQP)(是生产的边际成本是生产的边际成本(固定成本为固定成本为0).0).c(1)企业企业1选择产量选择产量(3)企业企业i 的收益由下面的利润函数给出:的收益由下面的利润函数给出:为求解此博弈的逆向归纳解,首先计算企为求解此博弈的逆向归纳解,首先计算企2对企业对企业1任意产量的最优反应任意产量的最优反应 应满足:应满足:)(12qRmax),(max2122222cqqaqqqqq由上式可得由上式可得

22、2)(112cqaqR已知已知 ,这与同时行动的古诺模型中得出的这与同时行动的古诺模型中得出的caq1结果相同结果相同.但两者不同之处在于这里的但两者不同之处在于这里的 )(12qR2 2对企业对企业1 1已观测到的产量的真实反应已观测到的产量的真实反应,而在古诺模型而在古诺模型 )(12qR是企业是企业是企业是企业2对对假定的企业假定的企业1的产量的最优反应的产量的最优反应.且且 企业企业1 1的产量选择是和企业的产量选择是和企业2 2同时作出的同时作出的.由于企业由于企业1 1也和企业也和企业2 2一样解出企业一样解出企业2 2的最优反应的最优反应,企业企业1 1就可以预测到他如选择就可以

23、预测到他如选择 ,企业企业2 2将根据将根据 1q)(12qR选择产量选择产量.那么那么,在博弈的第一阶段在博弈的第一阶段,企业企业1 1的问题就可的问题就可表示为表示为)(max)(max1211012,11011cqRqaqqRqqq于是于是 4)(,21221caqRqcaq这就是这就是斯塔克尔贝里双头垄断博弈的斯塔克尔贝里双头垄断博弈的逆向归纳解逆向归纳解.2max1101cqaqq斯塔克尔贝里斯塔克尔贝里产量与古诺产量的比较产量与古诺产量的比较1)古诺产量)古诺产量)(43)(3233*2*1cacacacaqq从而从而在斯塔克尔贝里模型中在斯塔克尔贝里模型中,*CSPP*2*1qq

24、(2)在古诺模型中)在古诺模型中,*2*1在在 S 模型中模型中.*2*1先动优势先动优势:信息占优者往往不利信息占优者往往不利.例子(要挟诉讼,承诺行动与精炼均衡的关系)例子(要挟诉讼,承诺行动与精炼均衡的关系)这个博弈有两个参与者这个博弈有两个参与者:原告原告P和被告和被告D.行动顺序如下:行动顺序如下:(1)原告决定是否对被告提出指控,指控的成本原告决定是否对被告提出指控,指控的成本 为为C 0;(2)如果决定指控,原告要求被告支付如果决定指控,原告要求被告支付S 0以了以了 诉讼;诉讼;(3)被告决定接受还是拒绝原告的要求被告决定接受还是拒绝原告的要求;(4)如果被告拒绝如果被告拒绝,

25、原告决定是放弃指控原告决定是放弃指控还是向法还是向法庭起诉,原告的起诉成本庭起诉,原告的起诉成本(包括律师费用包括律师费用)为为p,被告的,被告的 辩护成为辩护成为d;(5)如果案子到了法庭原告以如果案子到了法庭原告以r 的概率赢的概率赢得得x单位单位诉讼成功可能性非常小诉讼成功可能性非常小,目的是希望和解得到补偿目的是希望和解得到补偿.的支付的支付.P不指控不指控指控指控要求要求S拒绝拒绝接受接受起诉起诉放弃放弃(0,0)PDP),(drxpcrx)0,(c),(scs 原告指控的目的本身意味着原告指控的目的本身意味着rx p,最后阶段最后阶段,因为因为被告知道如果自己拒绝,原告将放弃被告知

26、道如果自己拒绝,原告将放弃,在倒数第二阶段的在倒数第二阶段的最优选择是最优选择是拒绝拒绝;绝绝,原告在第一阶段的原告在第一阶段的最优选择是最优选择是不指控不指控.因此因此,子博弈精炼纳什均衡子博弈精炼纳什均衡是是原告选择原告选择(不指控不指控,要求要求,放弃放弃),被告选择被告选择(拒绝拒绝)均衡结果为均衡结果为:原告不指控原告不指控.那么,在博弈的那么,在博弈的 原告的最优选择是放弃原告的最优选择是放弃.被告被告 原告知道将被拒原告知道将被拒 下面考虑下面考虑承诺行动承诺行动如何改变上述结果如何改变上述结果.假定原告在指控前假定原告在指控前将诉讼费将诉讼费p 支付给律师支付给律师,结果如何结

27、果如何,律师费不能退还律师费不能退还.原告将选择起诉原告将选择起诉.无论无论 那么那么,在博弈的最后阶段在博弈的最后阶段,受原告提出的赔偿要求受原告提出的赔偿要求 ,spcpcrx也即被告将会接受原告提出的赔偿要求,也即被告将会接受原告提出的赔偿要求,因为只要因为只要 ,dxrs),(drxrxs因为因为(假定胜诉概率大于零假定胜诉概率大于零),被告将会接被告将会接rxs 如果如果 的话的话.假定双方的讨价还价能力相同假定双方的讨价还价能力相同,纳什讨价纳什讨价还价解还价解将选择私了而不是上法庭解决争端,将选择私了而不是上法庭解决争端,是双方私了的是双方私了的赔偿区域赔偿区域.原告原告意味着原

28、告要求的赔偿为意味着原告要求的赔偿为 .2drxs因为原告指控成本为因为原告指控成本为C+p,pcdrx2,pcrx(即上即上法庭的期望收益小于诉讼法庭的期望收益小于诉讼 pcdrx2的条件仍可能成立的条件仍可能成立.如果如果显然即使显然即使成本成本),假定这个条件成立,假定这个条件成立,子博弈纳什均衡子博弈纳什均衡结果将是结果将是:原告提出指控要求原告提出指控要求.原告的支付为原告的支付为.2pcdrx.2drx被告的支付为被告的支付为案件私了案件私了.因为被告打官司的成本不仅包括应诉的法律费用因为被告打官司的成本不仅包括应诉的法律费用 该博弈模型的实际背景举例:该博弈模型的实际背景举例:而

29、且涉及而且涉及声誉声誉损失损失(d),所以,被告越大(所以,被告越大(大人物大人物大大pcdrx2这是为什么这是为什么大人物大人物常常受到常常受到无端指控无端指控的原因之一的原因之一.当然当然,大企业大企业,大人物也可以通过他们的承诺行动大人物也可以通过他们的承诺行动使自己避免小企业使自己避免小企业,小人物的无端指控小人物的无端指控.企业企业),d 越大越大,的条件越可能满足的条件越可能满足.办法之一就是办法之一就是在被指控之前就支付律师费用在被指控之前就支付律师费用.假定被告在被指控之假定被告在被指控之前支付律师费用前支付律师费用y,那么那么赔偿赔偿 区域区域为为,ydrxrxs纳什均衡解为

30、纳什均衡解为2)(ydrxspcdrx2成立,成立,pcydrx2)(因为即使因为即使诺诺行动使被告节省成本行动使被告节省成本.2ydrx,2drxy因此,只要因此,只要是是为什么大公司,大人物雇佣律师的原因之一为什么大公司,大人物雇佣律师的原因之一.也可能不满足也可能不满足,从而从而,原告将不会提出指控原告将不会提出指控.承诺行动就值得承诺行动就值得.这就这就 这样的承这样的承 1 12 21 11s拒绝,出拒绝,出),(11s1s)122ss,()1,(ss接受接受接受接受拒绝,出拒绝,出S图图1 1 出出2s讨价还价博弈讨价还价博弈(序贯谈判,(序贯谈判,鲁宾斯坦鲁宾斯坦1982)分钱博

31、弈分钱博弈无贴现因子无贴现因子分钱博弈分钱博弈1211S出出,2S拒绝,出拒绝,出接受接受拒绝,出拒绝,出S),(11s1s接受接受)1(,(22ss)122)(,(ss(序贯谈判,(序贯谈判,鲁宾斯坦鲁宾斯坦1982)有贴现因子有贴现因子的的分钱博弈分钱博弈讨价还价博弈讨价还价博弈分钱博弈分钱博弈21D 讨价还价博弈(讨价还价博弈(分钱博弈)分钱博弈)序贯谈判序贯谈判三阶段谈判:参与人三阶段谈判:参与人1和和2就就一美元的分配进行一美元的分配进行 谈判谈判.他们轮流提出方案他们轮流提出方案:首先参与人首先参与人1 1提出一个分配提出一个分配建议,参与建议,参与人人1 1提出一个分配建议提出一

32、个分配建议,参与参与人人2可以接受可以接受 或拒绝;如或拒绝;如果参与果参与人人2 拒绝,就由参与人拒绝,就由参与人2 提出分配提出分配 建议,参与人建议,参与人1选择接受或拒绝选择接受或拒绝;如此一直进行下去如此一直进行下去.一个条件一旦被拒绝,它就不再有任何约束力,并一个条件一旦被拒绝,它就不再有任何约束力,并 和博弈下面的进行不相关和博弈下面的进行不相关.每个条件都代表一个阶段每个条件都代表一个阶段.参与人都没有足够的耐心参与人都没有足够的耐心:他们对后面阶段得到的收他们对后面阶段得到的收 益进行贴现,每一益进行贴现,每一 个阶段的贴现因子为个阶段的贴现因子为,.10下面是对三阶段谈判博

33、弈时序的更为详细的描述下面是对三阶段谈判博弈时序的更为详细的描述:(1a)在第一阶段时在第一阶段时.参与人参与人1建议他分走建议他分走1美美元的元的S1,留给参与人留给参与人2 的份额为的份额为1-S1.(1b)参与人参与人2或者接受这一条件或者接受这一条件(此时博弈结束此时博弈结束,立即拿到)或立即拿到)或者拒绝这一条件者拒绝这一条件(博弈将继续进行博弈将继续进行,进进 参与者参与者1的收益为的收益为S1,参与人参与人2 的收益为的收益为1-S1,都可都可 入第二阶段)入第二阶段)(2a)在第二阶段的开始,参与人在第二阶段的开始,参与人2 提议参与人提议参与人1 分得分得1美元的美元的S2,

34、留给参与人留给参与人2 的为的为1-S2.(.(请注意在请注意在 阶段阶段 t,St 总是表示分给参与人总是表示分给参与人1的而不论是谁提出的而不论是谁提出 的条件的条件)(2b)参与人参与人1 或者接受条件或者接受条件(此时博弈结束,参此时博弈结束,参 与人与人1的收益为的收益为S2,参与人参与人2 的收益为的收益为1-S2 都可立即拿都可立即拿 走)或者拒绝这一条件走)或者拒绝这一条件(此时博弈继续进行,进入第此时博弈继续进行,进入第 三阶段)三阶段)(3)在第三阶段的开始在第三阶段的开始,参与人参与人1得到得到1美元的美元的S,参与人参与人2 得到得到1-S.下面求解此三阶段博弈的逆向归

35、纳解下面求解此三阶段博弈的逆向归纳解:首先计算首先计算如果博弈进行到第二阶段,参与人如果博弈进行到第二阶段,参与人2 可能提可能提件件S2,可可以在第三阶段得到以在第三阶段得到S,供的最优条件,参与人供的最优条件,参与人1拒绝参与人拒绝参与人2 在这一阶段的条在这一阶段的条 但下一阶段的但下一阶段的S 在当期在当期 的价值为的价值为,S那么当且仅当那么当且仅当 参与人会参与人会1才接受才接受 SS2(我们假定当接受和拒绝无差异时我们假定当接受和拒绝无差异时,参与人总是选择参与人总是选择 2S接受条件)从而参与人接受条件)从而参与人2 在第二阶段的决策问题就可在第二阶段的决策问题就可归于在本阶段

36、收入归于在本阶段收入 (通过向参与人通过向参与人1提出条件给提出条件给 S1他他 )和下阶段收入和下阶段收入 (通过向参与人通过向参与人1提条件提条件SS2S1给他任意给他任意 )之间作出选择之间作出选择.选择的贴现值为选择的贴现值为 SS2小于前一选择可得的小于前一选择可得的 ,于是参与人于是参与人2),1(SS1在第二阶段可以提出的最优条件是在第二阶段可以提出的最优条件是.2SS如果博弈进行到第二如果博弈进行到第二阶段,参与人阶段,参与人2 将提出条件将提出条件也就是说也就是说,2S参与人参与人1 选择接受条件选择接受条件.由于参与人由于参与人1 可以和参与人可以和参与人2 同样地解出参与

37、人同样地解出参与人2在在第二阶段的决策问第二阶段的决策问题,参与人题,参与人1 也知道参与人也知道参与人2 通过通过拒绝参与人拒绝参与人1 的条件的条件在第二阶段在第二阶段 可以得到可以得到 但下一阶段得到的但下一阶段得到的.12S21S的价值只有的价值只有 .那么当且仅当那么当且仅当)1(2S在本阶段的在本阶段的 或者或者 时时参与人参与人2才会接受才会接受 时,时,)1(121SS)1(121SS,11S与人与人1 在第一阶段的决策问题就可归结于在本阶段收在第一阶段的决策问题就可归结于在本阶段收 从而参从而参入入 (通过向参与人通过向参与人2 提条件提条件)1(12SS)1(12S11S2

38、S和下阶段收入和下阶段收入 (通过向参与人通过向参与人2 提出任意的提出任意的)之间作出选择之间作出选择.后一选后一选择的贴现值择的贴现值 小于前一选择可得的小于前一选择可得的2S),1(1)1(12SS于是参与人于是参与人1在第一阶段在第一阶段提出的最优条件为提出的最优条件为)1(1)1(121SSS这样,在此三阶段博弈的逆向归纳解中,参与人这样,在此三阶段博弈的逆向归纳解中,参与人1向参向参 与人与人2 提出分配方案为提出分配方案为)1,(11SS)1(2S,2S,后者接受该方案后者接受该方案.二、无限回合讨价还价博弈二、无限回合讨价还价博弈(Shaked 1984)思路要点:)思路要点:

39、1 对一个无限回合讨价还价博弈来讲,无论从第三回对一个无限回合讨价还价博弈来讲,无论从第三回合开始,还是从第一回合开始结果都是相同的合开始,还是从第一回合开始结果都是相同的.2 求解过程:假设整个博弈有一个逆向归纳解求解过程:假设整个博弈有一个逆向归纳解(S,1-S),),即在第一回合甲出价即在第一回合甲出价S,乙接受是双方,乙接受是双方的收益的收益.3 由由Shaked的思路,解(的思路,解(S,1-S)也是从第三回合开)也是从第三回合开 收益(收益(S,1-S)始博弈的结果始博弈的结果.即第三回合为甲出价即第三回合为甲出价S,乙接受,双方,乙接受,双方4 再把上述第三回合理解成从第一阶段开

40、始的无限再把上述第三回合理解成从第一阶段开始的无限 回合博弈的第三回合,由于甲在第三回合出价是最终出回合博弈的第三回合,由于甲在第三回合出价是最终出 价,价,故可理解为三回合强制性讨价还价博弈故可理解为三回合强制性讨价还价博弈.由前面的讨论:甲在第一回合出价由前面的讨论:甲在第一回合出价 双方收益双方收益 SS2111)1,(11SS),1,11(22SS,1121SSS,11*S111*S从而从而 解得:解得:为逆向递推解为逆向递推解.22 完全非完美信息两阶段博弈完全非完美信息两阶段博弈 22A 理论:子博弈精炼理论:子博弈精炼 和在完全且完美信息动态博弈中相同,假定博弈和在完全且完美信息

41、动态博弈中相同,假定博弈 的进行分为一系的阶段,下一阶段开始前参与者可观的进行分为一系的阶段,下一阶段开始前参与者可观 察到前面所有阶段的行动察到前面所有阶段的行动.与上节分析的不同之处在与上节分析的不同之处在 于于每一阶段中有同时行动每一阶段中有同时行动.我们将以下类型的简单博我们将以下类型的简单博 弈称为弈称为完全非完美信息两阶段博弈:完全非完美信息两阶段博弈:1 参与者参与者1和和2同时从自己的可行集同时从自己的可行集A1和和A2中选择中选择 行动行动a1和和a2,2 参与者参与者3 和和4 观察到第一阶段的结果观察到第一阶段的结果),(21aa后同时从各自的可行集后同时从各自的可行集A

42、3和和A4中选择行动中选择行动a3和和a4,然然,),(4321aaaaui3 收益为收益为.4,3,2,1i使用使用逆向归纳法逆向归纳法解决此类问题,解决此类问题,但这里从博弈的但这里从博弈的 最后阶段逆向推导的第一步就包含了求解一个真正的最后阶段逆向推导的第一步就包含了求解一个真正的 博弈博弈(给定第一阶段结果时,参与者给定第一阶段结果时,参与者3 和和4 在第二阶段在第二阶段 同同时行动的博弈时行动的博弈 ),而不再是前一阶段求解单人最,而不再是前一阶段求解单人最优优 化的决策问题化的决策问题.为使问题简化,我们假设对第一阶段为使问题简化,我们假设对第一阶段 其后其后(参与者参与者3 和

43、和4 之间之间),(21aa博弈每一可能的结果博弈每一可能的结果 的的)第二阶段博弈有第二阶段博弈有唯一纳什均衡唯一纳什均衡,表示为,表示为 ).,(),(214213aaaaaa如果参与人如果参与人1和和2预测到参与人预测到参与人3和和4的行动将由上的行动将由上 面的均衡面的均衡 给出,则参与者给出,则参与者1和和2),(),(214213aaaaaa在第一阶段的问题就可用以下的同时行动博弈表示:在第一阶段的问题就可用以下的同时行动博弈表示:1 参与者参与者1和和2同时从自己的可行集同时从自己的可行集A1和和A2中选择中选择 行动行动a1和和a2,2 收益情况为收益情况为,),(),(,(2

44、1421321aaaaaaaaui.2,1i假定假定 为以上同时行动博弈的唯一纳什均衡,为以上同时行动博弈的唯一纳什均衡,),(21aa则称则称),(),(,(21421321aaaaaaaa为这两阶段博弈为这两阶段博弈 的的子博弈精炼解子博弈精炼解.21B 对银行的挤提对银行的挤提 两个投资者每人存入银行一笔存款两个投资者每人存入银行一笔存款D,银行已将银行已将这这些存款投入一个长期项目些存款投入一个长期项目.如果在该项目到期前银行被如果在该项目到期前银行被迫对投资者变现,共可收回迫对投资者变现,共可收回2r,这里这里 .2DrD不过,如果银行允许投资项目到期,则项目共可取得不过,如果银行允

45、许投资项目到期,则项目共可取得 2R,这里这里 有两个日期有两个日期.投资者可以从银行提款:投资者可以从银行提款:日期日期1在银在银.DR 行的投资项目到期之前,日期行的投资项目到期之前,日期2则在到期后则在到期后.为了讨论方便,假设不存在为了讨论方便,假设不存在贴现贴现.如果两个投资者如果两个投资者 都在日期都在日期1提款,每人可得到提款,每人可得到r,博弈结束,博弈结束.如果只有一如果只有一 个投资者在日期个投资者在日期1 提款,他可得到提款,他可得到D,另一人可得到另一人可得到2r-D,博弈结束,博弈结束.如果两人都在日期如果两人都在日期2提款,每人得到提款,每人得到R,博弈结束,博弈结

46、束.如果只有一个投资者在日期如果只有一个投资者在日期2提款,则他得到提款,则他得到2R-D,另一个人得到,另一个人得到D,博弈结束,博弈结束.如果两人都不在日期如果两人都不在日期1提款,则项目结束后投资者提款,则项目结束后投资者在日期在日期2进行提款决策进行提款决策.最后,如果在日期最后,如果在日期2两个投资者都不提款,则银行两个投资者都不提款,则银行向每个投资者返还向每个投资者返还 R,博弈结束,博弈结束.两个投资者在日期两个投资者在日期1和日期和日期2的收益情况可以用下的收益情况可以用下面的两个标准式博弈表示面的两个标准式博弈表示.下一阶段下一阶段 2rD,D D ,2rD r ,r 提款

47、提款 不提不提提款提款不提不提日期日期1 1 下一阶段下一阶段 2rD,D D ,2rD r ,r 提款提款 不提不提提款提款不提不提日期日期1 1 R ,R D ,2RD 2RD,D R ,R提款提款 不提不提提款提款日期日期2 2不提不提从后往前分析从后往前分析此博弈此博弈.先考虑先考虑日期日期2的标准式博弈的标准式博弈.DR 由于由于 (由此可得由此可得 ),),“提款提款”严格优于严格优于 RDR 2“不提款不提款”,那么这一博弈有唯一纳什均衡,那么这一博弈有唯一纳什均衡:两个投资者两个投资者 都提款,最终收益为都提款,最终收益为).,(RR由于不存在贴现,可以直接用这一收益替入日期由

48、于不存在贴现,可以直接用这一收益替入日期1 R ,R D ,2RD 2RD,D R ,R提款提款 不提不提提款提款日期日期2 2不提不提况就变为况就变为的标准式博弈双方都不提款时的情况于是,日期的标准式博弈双方都不提款时的情况于是,日期1 1的情的情 R ,R 2rD,D D ,2rD r ,r 提款提款 不提不提提款提款不提不提 由于由于 (并且由此可得并且由此可得 ),这一两阶,这一两阶 Dr rDr 2段博弈变形为段博弈变形为单阶段博弈单阶段博弈,存在,存在两个纯战略纳什均衡两个纯战略纳什均衡:(1)两个投资者都提款,两个投资者都提款,最终收益为最终收益为 ).,(rr最初的两阶段银行挤

49、提博弈就有最初的两阶段银行挤提博弈就有两个子博弈精炼解两个子博弈精炼解.(2)两个投资者都不提款最终收益为两个投资者都不提款最终收益为 ).,(RR23 重复博弈重复博弈 23A 理论理论:两阶段重复博弈两阶段重复博弈 重复博弈重复博弈分析在参与者长期重复的相互往来中,分析在参与者长期重复的相互往来中,关于将来行动的威胁或承诺能否影响到当前的行动关于将来行动的威胁或承诺能否影响到当前的行动.考虑将考虑将“囚徒困境囚徒困境”博弈重复进行两次,且在第二博弈重复进行两次,且在第二 过程博弈的收益等于两个阶段各自收益的简单相加,过程博弈的收益等于两个阶段各自收益的简单相加,次次博弈开始前可观察第一次进

50、行的结果,并假设整个博弈开始前可观察第一次进行的结果,并假设整个 (不考虑贴现因素不考虑贴现因素),这叫,这叫两阶段两阶段“囚徒困境囚徒困境”重复重复博弈博弈.4 ,4 0 ,5 5 ,0 1 ,1参与者参与者 2 参与者参与者1 2L2R1L1R图图231 两阶段两阶段“囚徒困境囚徒困境”重复博弈重复博弈属于属于22节的节的完全完全非完美信息两阶段博弈非完美信息两阶段博弈.根据根据22.A节的求解此类博弈精炼解的程序节的求解此类博弈精炼解的程序,第,第 两人的收益为两人的收益为 ),(21LL).1,1(二阶段博弈的结果为所余部分博弈的二阶段博弈的结果为所余部分博弈的纳什均衡纳什均衡,即为,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(博弈动态博弈课件.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|