博弈论经典课件.ppt

上传人(卖家):晟晟文业 文档编号:4291765 上传时间:2022-11-26 格式:PPT 页数:24 大小:1.16MB
下载 相关 举报
博弈论经典课件.ppt_第1页
第1页 / 共24页
博弈论经典课件.ppt_第2页
第2页 / 共24页
博弈论经典课件.ppt_第3页
第3页 / 共24页
博弈论经典课件.ppt_第4页
第4页 / 共24页
博弈论经典课件.ppt_第5页
第5页 / 共24页
点击查看更多>>
资源描述

1、1第三章 完全信息动态博弈一、博弈的扩展式表示1、博弈扩展式描述包括的六要素1)参与人集合;2)参与人的行动次序:谁在什么时候行动;3)参与人的行动空间:在每次行动时,参与人有哪些选择;4)参与人的信息集:每次行动时,参与人知道些什么;5)参与人的支付函数:行动结束后,每个参与人得到些什么;6)外生事件(即自然的选择)的概率分布。22、博弈树(博弈扩展式)1)结结:包括决策结(采取行动的时间)与终点结。2)枝枝:决策结到它直接后接点的连线,它代表参与人的行动、路径。3)信息集信息集:决策结的子集,要满足:信息集中每个结应属于同一参与人;参与人知道博弈进入某信息集,但不知自己处在信息集中的哪一个

2、结(多结点信息集时);参与人在同一个信息集上的每一个结上的行动空间是相同的;信息集中每个结应是同一时点的决策结。例 房地产开发博弈:开发商A首先行动,选择开发或不开发;A决策后,自然选择市场需求大小;开发商B在观测到A的决策和市场需求后,决定开发或不开发。33、静态博弈的扩展式表示例1 囚徒困境例2 四人同时决策,每人有两种选择(L,U),请画出博弈树。练习练习 用博弈树表示下述博弈。第一步:局中人1掷一枚硬币,结果可能是正面H或反面T;第二步:局中人2不知第一步硬币的结果,再掷一次硬币;第三步:局中人1知第一、二步硬币的结果,又掷一次硬币;第四步:局中人2不知第三步的结果,但知一、二两步的结

3、果,最后掷一次硬币,博弈结束(按每步结果,局中人2给1一笔报酬)。4二、扩展型博弈转化为策略型博弈例1 房地产开发博弈A开发不开发BB开发不开发开发不开发(-3,-3)(1,0)(0,1)(0,0)5例2 考虑以下动态博弈。第一步:局中人1从1,2中选择一数x。第二步:局中人2知道x的值,从1,2中选择y。第三步:局中人1不知y,也忘了x,从1,2中选择z,博弈结束。对选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z)U1(1,1,1)=-2;U1(1,1,2)=-1;U1(1,2,1)=3;U1(1,2,2)=-4;U1(2,1,1)=5;U1(2,1,2)=-2;U1(2,2,

4、1)=2;U1(2,2,2)=6。6例3 带有机会选择的动态博弈。第一步:用一个随机装置,从1,2中等可能地选择数x。第二步:局中人1知道x值,从1,2中选择y。第三步:局中人2不知x,但知y,从1,2中选择z,博弈结束。对选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z)U1(1,1,1)=-2;U1(1,1,2)=-1;U1(1,2,1)=3;U1(1,2,2)=-4;U1(2,1,1)=5;U1(2,1,2)=-2;U1(2,2,1)=2;U1(2,2,2)=6。7练习练习 考虑以下动态博弈。第一步:局中人1从1,2中选择一数x。第二步:局中人2知道x的值,从1,2中选择y。

5、第三步:局中人1知道y的值,从1,2中选择z,博弈结束。对选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z)U1(1,1,1)=-2;U1(1,1,2)=-1;U1(1,2,1)=3;U1(1,2,2)=-4;U1(2,1,1)=5;U1(2,1,2)=-2;U1(2,2,1)=2;U1(2,2,2)=6。8三、子博弈精炼纳什均衡子博弈定义子博弈定义:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足如下条件:1)x是一个单结信息集,即h(x)=x;2)对于所有的)(xTx,若 ,则 。xhx xTx 子博弈精炼纳什均衡定义子博弈精炼纳什

6、均衡定义:称扩展式博弈G的策略组合*1*,nissss为子博弈精炼NE,若:1)它是原博弈的NE;2)它在每一个子博弈上给出NE。9定理定理:有限、完美信息的扩展型博弈必存在纯策略意义下的子博弈精炼纳什均衡。子博弈精炼纳什均衡的解法:逆向递推法逆向递推法。例 121LRL1R1L2R2(2,0)(1,1)(3,0)(0,2)10例 海盗分金:五个海盗要分配抢来的100枚金币,方式是,第一个人提出一种分配方案,如果同意这种方案的人达到半数,那么提议通过,否则提议的人就被扔进大海,由剩下的人再进行同样的过程。假设五个人提议的次序已定,金币不能分割,而且海盗的本性让他们觉得,如果对自己的收益没有影响

7、,则很乐意看到别人被扔进大海,这时理性结局应是如何?11例 斯坦克尔伯格(Stackelberg)寡头竞争模型例 讨价还价博弈例 有点数为1,2,3的三张牌,先由A任抽一张,看后反放于桌上,并喊大(H)或小(L)。然后由B从剩下牌中任抽一张,看过后,B有两种选择:弃权,付给A一元;翻A的牌,当A喊H时,点数小者付给对方3元,当A喊L时,点数大者付给对方2元。要求:1)说明A、B各有多少纯策略?2)据理性原则淘汰具有劣势的策略。3)求双方的最优策略及各自的支付值。12例 银行挤提问题(具有同时选择的动态博弈)设有两投资者,每人存入银行一笔存款D,银行将存款投资于一长期项目。若在项目到期前,存款人

8、提前支取,银行被迫变现,共可收回2r,此处Dr。若银行等长期项目到期支取,可回收2R,RD。设有两个提款日期,t=1,项目到期前,两投资者都提款,则每人可得r。若只有一个在t=1提款,他可得D,另一人得2r-D。若两人都未在t=1提款,在t=2,两人都提款,则每人得R;若只有一个人在t=2提款,他得2R-D,另一人得D;若t=2时,两人都不提款,银行向每个投资者返还R。THANK YOUSUCCESS2022-11-26可编辑14例 国际竞争与最优关税(具有同时选择的动态博弈)考虑两个相似的国家,分别用i=1,2表示。每个同家各有一个企业,分别称为企业1、企业2。企业生产既可内销又可出口的同质

9、产品。两个国家中的消费者在各自国家的市场上购买本国产品或外国产品。引入以下记号:1 表示国家i市场上的商品供给量,。这里 表示i国的内销量,表示j国的出口量。2 ,i=1,2表示市场的出清价格。3企业的边际成本为常数c,且无固定成本,则企业i的总成本为:,为j国进口关税,j=1,2。博弈的顺序为:t=1时,政府同时选择关税税率 和 ;t=2时,两国企业观察到关税税率后,同时选择出口产量和提供国内消费量iQjiiehQihjeiiiiQaQppijiietcechjt1t2t11,eh22,eh与。企业i的收益(支付)为其利润额,政府i的的收益则为本国总的福利,包括消费者剩余,本国企业利润,国家

10、关税收入三部分。15例 宏观经济政策的动态一致性考虑一个货币政策模型:博弈的参与人是政府与公众。公众选择预期通胀率,政府在给定预期通胀率的情况下选择实际通胀率。政府不仅关心通胀问题,还关心实际产出y,其效用函数为:22,ykycyM0c1k产出y与通胀 间的关系可用如下菲力普斯曲线描述:eyy016例 工资奖金制度模型基本假设:1)一个雇主有两个雇员,雇员i(i=1,2)的产出为 ,雇员努力的负效用为 ,iiiey 0eg 0 eg。扰动项 从分布密度为 、均值为0的概率分i f布中独立抽取。2)因产出能观察而努力水平无法观察,所以据产量支付报酬。雇主宣布产量高的雇员将得到较高工资 ,产量低的

11、工资为 。3)雇员在已知工资(奖金)制度的情况下,同时独立选择各自的工作努力程度 ,。eghwlwie0ie17四、重复博弈1、基本概念1)重复博弈重复博弈指同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。有限次重复博弈写为G(T),无限次重复博弈写为,G。2)重复博弈的平均得益若一常数 作为重复博弈(有限或无限次重复)各阶段的得益,能产生与得益序列 相同的现值,则称 为,21,21的平均得益。111ttt183)对随机结束的重复博弈,设停止重复的概率为p,重复下去的概率为(1-p),则2232111pp现值tttttttp111111所以,随机停止重复博弈可当作无限次重复博弈进行分析。p

12、 1其中192、有限次重复博弈1)无纯策略NE的两人零和博弈的有限次重复博弈唯一的子博弈完美NE就是所有博弈方始终采用原博弈的混合策略纳什均衡策略。此结论可推广至非零和(常和)或多个博弈方,但博弈方的利益严格对立,无纯策略NE的其他严格竞争博弈中。2)唯一纯策略纳什均衡博弈的有限次重复博弈G(T)有唯一子博弈精炼均衡,即各博弈方每个阶段都采用G的NE策略(平均得益为原博弈G中的得益)。3)多个纯策略NE博弈的有限次重复博弈例1 三价博弈HMLH5,5 0,6 0,2M6,0 3,3 0,2L2,0 2,0 1,120例2 LMRU0,0 3,4 6,0M4,3 0,0 0,0D0,6 0,0

13、5,5例3 ABA3,3 1,4B4,1 0,0214)有限次重复博弈的民间定理设原博弈的一次性博弈有均衡得益数组优于W,则在该博弈的多次重复中,所有不小于个体理性得益的可实现得益,都至少有一个子博弈精炼NE的极限的平均得益来实现。定理中的相关概念:用Wi记局中人i在一次性博弈中最差的均衡得益,W表示各局中人的Wi构成的得益数组。个体理性得益(保留得益)个体理性得益(保留得益):不管其它局中人的行为如何,一局中人在某个博弈中只要自己采取某种特定的策略,保证能获得的得益。可实现得益可实现得益:博弈中所有纯策略组合得益的加权平均(权数非负总和为1)数组。223、无限次重复博弈1)两人零和博弈的无限次重复博弈:每次重复采用原博弈的混合策略NE。此结论可推广至非零和(常和)或多个博弈方的其他严格竞争模型的无限次重复博弈。2)唯一纯策略NE的无限次重复博弈例 囚徒困境式博弈HLH4,4 0,5L5,0 1,1233)无限次重复博弈的民间定理设G是一个完全信息静态博弈,用 记G的纳什均衡得益,用 表示G的任意可实现得益,若 ,而 足够接近1,那么无限次重复博弈 中一定存在一个子博弈精炼NE,各博弈方的平均得益就是 。nee,1nxx,1iiex ni,1nxx,1,G例 无限次重复古诺模型THANK YOUSUCCESS2022-11-26可编辑

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(博弈论经典课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|