第10章贝叶斯博弈与贝叶斯Nash均衡汇编课件.ppt

上传人(卖家):晟晟文业 文档编号:4710015 上传时间:2023-01-03 格式:PPT 页数:144 大小:1.13MB
下载 相关 举报
第10章贝叶斯博弈与贝叶斯Nash均衡汇编课件.ppt_第1页
第1页 / 共144页
第10章贝叶斯博弈与贝叶斯Nash均衡汇编课件.ppt_第2页
第2页 / 共144页
第10章贝叶斯博弈与贝叶斯Nash均衡汇编课件.ppt_第3页
第3页 / 共144页
第10章贝叶斯博弈与贝叶斯Nash均衡汇编课件.ppt_第4页
第4页 / 共144页
第10章贝叶斯博弈与贝叶斯Nash均衡汇编课件.ppt_第5页
第5页 / 共144页
点击查看更多>>
资源描述

1、第三部分:不完全信息静态博弈第十章贝叶斯博弈与贝叶斯第十章贝叶斯博弈与贝叶斯Nash均衡均衡主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释第十章贝叶斯博弈与贝叶斯第十章贝叶斯博弈与贝叶斯Nash均衡均衡Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng一、贝叶斯博弈 前面两部分我们讨论了完全信息博弈问题,但在现实生活中我们遇

2、到更多的可能是不完全信息博弈问题。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng例如 在“新产品开发”博弈中,企业对市场的需求可能并不清楚;在连锁店博弈中,潜在的进入者可能并不知道连锁店在市场上的盈利情况,等等。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 将这种博弈开始时就存在事前不确定性的博弈问题是不完全信息博弈问题。Control Science and Engineering,HUST

3、All Rights Reserved,2007,Luo Yunfeng例如:“斗鸡博弈”考察这样的情形:假设参与人可能有这样的两种性格特征(类型)“强硬”(用s表示)或“软弱”(用w表示)。所谓“强硬”的参与人是指那些喜欢争强好胜、不达目的誓不罢休的决斗者;而“软弱”的参与人是指那些胆小怕事、遇事希望息事宁人的决斗者。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 显然,当具有不同性格特征的决斗者相遇时,所表现出来的博弈情形是不同的。令U表示冲上去;D表示退下去,则每种情况下博弈情形如下图所示

4、。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng当参与人都为强硬者时 博弈存在两个纯战略Nash均衡(U,D)和(D,U)。-4,-42,-2-2,20,0UD21UDControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng当参与人1为强硬者参与人2为软弱者时 博弈存在唯一的Nash均衡(U,D)。-4,-42,0-2,00,1UD21UDControl Science and Engineering,HU

5、ST All Rights Reserved,2007,Luo Yunfeng当参与人1为软弱者参与人2为强硬者时 博弈存在唯一的Nash均衡(D,U)。-4,-40,-20,21,0UD21UDControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng当参与人都为软弱者时 博弈存在唯一的Nash均衡(D,D)。-4,-40,00,01,1UD21UDControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng-4,-42

6、,-2-2,20,0UD21UD-4,-42,0-2,00,1UD21UD-4,-40,-20,21,0UD21UD-4,-40,00,01,1UD21UD(1)参与人都为强硬者(2)参与人1为强硬者参与人2为软弱者(3)参与人1为软弱者参与人2为强硬者(4)参与人都为软弱者Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 在“斗鸡博弈”中,虽然在博弈开始之前每位决斗者都了解(知道)自己的性格特征,但对对手的性格特征往往不甚了解或了解不全。在这种情况下即使所有的决斗者都看到了上面的四个战略式博弈,

7、但对决斗者来讲,仍存在着所谓的事前不确定性即博弈开始之前就不知道的信息。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 对于“强硬”的参与人1来讲,虽然他看到了上面的战略式博弈,但他不知道对手是“强硬”的还是“软弱”的,所以博弈开始之前他无法确定博弈是根据(1)还是(2)进行。这意味着“强硬”的参与人1面临着事前无法确定的信息。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 同样,“软弱”的参与人

8、1也会面临类似的问题。此时,“斗鸡博弈”就是一个不完全信息博弈问题。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 对于不完全信息博弈问题,是不可能应用前面两部分介绍的方法进行求解的。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 这是因为给定参与人1为“强硬”的决斗者,如果对手是“软弱”的,那么博弈就只存在惟一的Nash均衡(U,D),参与人1有惟一的最优选择“冲上去”;如果对手是“强硬”的,则

9、博弈就会出现两个Nash均衡(U,D)和(D,U),参与人1的最优选择取决于对手的选择。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 但由于参与人1不知道对手究竟是“强硬”的还是“软弱”的,因此,此时的参与人1就觉得自己似乎是在与两个决斗者进行决斗,一个是“强硬”的,另一个是“软弱”的。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 当一个参与人并不知道在与谁博弈时,博弈的规则是没有定义的,如何

10、处理不完全信息?Harsanyi提出了Harsanyi转换。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 为了分析,对“斗鸡博弈”进行简化。假设参与人1是“强硬”的决斗者,参与人2可能是“强硬”的也可能是“软弱”的,参与人1不知道但参与人2清楚,而且这一假设为所有的参与人所知道。Control Science and Engineering,HUST All Rights Reserved,2007,Luo YunfengHarsanyi转换 对于简化的“斗鸡博弈”,Harsanyi转换是这样

11、处理的:在原博弈中引入一个“虚拟”参与人“自然”(nature,用N表示),构造一个参与人为两个决斗者和“自然”的三人博弈。Control Science and Engineering,HUST All Rights Reserved,2007,Luo YunfengHarsanyi转换-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220 x1x2xDDDDDUUUUU1“自然”首先行动决定参与人2的性格特征(即选择参与人2是“强硬”的还是“软弱”的),“自然”的选择参与人1不知道,但参与人2知道。Control Science and Engin

12、eering,HUST All Rights Reserved,2007,Luo Yunfeng在“自然”选择后,参与人1和2再进行“斗鸡博弈”。-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220 x1x2xDDDDDUUUUU1Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220 x1x2xDDDDDUUUUU1在新构造的三人博弈中,“自然”的支付不必考虑。参

13、与人1和2的支付由“斗鸡博弈”决定。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220 x1x2xDDDDDUUUUU1如果“自然”选择参与人2的性格特征是“强硬”的,则意味着参与人1与“强硬”的参与人2进行决斗,博弈进入决策结x1,其支付(1)决定;Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng-4,-4

14、2,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220 x1x2xDDDDDUUUUU1如果“自然”选择参与人2的性格特征是“软弱”的,则意味着参与人1与“软弱”的参与人2进行决斗,博弈进入决策结x2,其支付由(2)决定。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng Harsanyi通过引入“虚拟”参与人,将博弈的起始点由x1(或x2)提前至x0,从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性(即参与人1不知道“自然”的选择)。这种通过引入“虚拟”

15、参与人来处理不完全信息博弈问题的方法亦称Harsanyi转换。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng考察不完全信息博弈问题参与人的决策 用p1表示参与人1认为“自然”选择参与人2为“强硬”的概率,v1(U)和v1(D)分别表示参与人1认为自己选择行动U和D时所能得到的期望收益;用x表示“强硬”的决斗者2选择行动U的概率。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 当 即 时,对参与人1

16、来讲,其最优选择是U(即“冲上去”)。由于 ,所以当 即参与人1认为参与人2是“强硬”决斗者的可能性不超过1/2时,就会选择“冲上去”。1111()42(1)2(1()26v Upxxpxp1111()20(1)0(12()v Dpxxpxp 11()()v Uv D11/(2)xp1x 11/2p Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 考察参与人2的选择。用q1表示参与人2关于“参与人1关于自然选择的推断”的推断,即q1表示参与人2认为“参与人1认为参与人2是强硬的”概率。Contr

17、ol Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 由前面的分析可知:如果 ,则参与人2认为“U(即冲上去)是参与人1的最优选择”;与此同时,如果 ,则参与人1的最优选择与参与人2的预测一致。但是,如果 而 ,则参与人1的最优选择就可能与参与人2的预测不一致。11/2q 11/2p 11/2p 11/2q Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 在Harsanyi转换中规定:参与人关于“自然”选择的推断

18、为共同知识。也就是说,两个决斗者不仅同时一起看到了“自然”随机选择参与人2的性格特征,而且同时一起看到了“自然”以一定的概率分布随机选择参与人2的性格特征。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 不完全信息博弈经Harsanyi转换之后得到的完全但不完美信息博弈。(x,y)表示参与人1的性格特征为x,参与人2的性格特征为y;pxy表示“自然”选择(x,y)的概率,这里pxy为共同知识。UDUDUD-4,-42,-2-2,20,012UDUDUD-4,-42,0-2,00,12UDUDUD

19、-4,-40,-20,21,01UDUDUD-4,-40,00,01,1N(s,w)0 x2x3x4x5x(s,s)(w,w)(w,s)SSpSWpWSpWWp2222Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng在应用Harsanyi转换时,需要注意以下问题:1)“自然”的选择。在一般的不完全信息博弈问题中,Harsanyi转换规定“自然”选择的是参与人的类型(type)。除了根据参与人的支付来划分参与人的类型以外,还可以根据参与人的行动空间,甚至根据参与人掌握信息的多少(或程度)来来划分参与

20、人的类型。此外,需要注意的是,参与人的类型必须是其个人特征的一个完备描述。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 用ti表示参与人i的一个特定的类型,Ti表示参与人i所有类型的集合(亦称类型空间,type space),即 ,t=(t1,tn)表示一个所有参与人的类型组合,t-i=(t1,ti-1,tn)表示除参与人i之外其他参与人的类型组合。所以,t=(ti,t-i)。iitTControl Science and Engineering,HUST All Rights Reserve

21、d,2007,Luo Yunfeng 2)参与人关于“自然”选择的推断。用p(t1,tn)表示定义在参与人类型组合上的一个联合分布密度函数,Harsanyi转换假定:对于一个给定的不完全信息博弈问题,存在一个参与人关于“自然”选择的推断p(t1,tn),且p(t1,tn)为共同知识。也就是说,Harsanyi转换假定所有参与人关于“自然”行动的信念(belief)是相同的,并且为共同知识。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 用 表示参与人i在知道自己类型为ti的情况下,关于其他参与人

22、类型的推断(即条件概率),则 其中,为边缘密度函数。()iiip tt(,)(,)()(,)iiiiiiiiiiiitTttttp tttttpppp()ip tControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 假设pss=0.2,psw=0.3,pws=0.25,pww=0.25。虽然决斗者1不知道决斗者2 的类型,但由于决斗者1知道自己的类型,因此他可以根据贝叶斯公式推知决斗者2的类型分布。Control Science and Engineering,HUST All Rights Rese

23、rved,2007,Luo Yunfeng例如 根据贝叶斯规则,“强硬”的决斗者1可以推知:决斗者2是“强硬”的概率为 决斗者2是“软弱”的概率为“软弱”的决斗者1可以推知:决斗者2是“强硬”的概率为 决斗者2是“软弱”的概率为 1(0.2)0.40.20.3p s s1(0.3)0.60.20.3p w s1(0.25)0.50.250.25p s w1(0.25)0.50.250.25p w wControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 这里不同类型的决斗者1所形成的关于“自然”选择的推

24、断是不同的,究其原因,Harsanyi认为:虽然理性的参与人在掌握同样的信息时对同一事件会形成相同的概率推断,但参与人各自掌握的信息不同时对同一事件就会形成不同的概率推断。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 这说明在Harsanyi转换中,参与人对包括自己在内的所有参与人的类型的联合概率推断(分布)都是一样的,但由于参与人掌握的私人信息不同,使得各自对其他参与人的类型的概率分布的推断不同。Control Science and Engineering,HUST All Rights

25、Reserved,2007,Luo Yunfeng 贝叶斯博弈(the static Bayesian game)是关于不完全信息静态博弈的一种建模方式,也是不完全信息静态博弈的标准式描述。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng贝叶斯博弈的定义贝叶斯博弈包含以下五个要素:(1)参与人集合 ;(2)参与人的类型集T1,T2;(3)参与人关于其他参与人类型的推断 (4),;(5)参与人类型相依的行动集A(t1),A(tn);(6)参与人类型相依的支付函数 (7),。1,2,.,n 111()

26、,p tt()nnnp tt112211(),(),();)nna ta ta ttu1122(),(),();)nnnna ta ta ttuControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 参与人的推断 来源于一个共同的参与人关于“自然”选择的推断p(t1,tn),且p(t1,tn)为共同知识。所以,贝叶斯博弈中参与人所具有的关于其他参与人的类型的推断是一致的。()iiip ttControl Science and Engineering,HUST All Rights Reserved,2

27、007,Luo Yunfeng规定贝叶斯博弈的时间顺序如下:(1)“自然”选择参与人的类型组合t=(t1,tn),其中;(2)参与人i观测到“自然”关于自己类型ti的选择;虽然参与人i观测不到“自然”关于其他参与人类型t-i的选择,但参与人i具有关于其他参与人类型的推断 ;(3)参与人同时选择行动,每个参与人i从行动集Ai(ti)中选择行动ai(ti);(4)参与人i得到 。()iiip tt1122(),(),();)nniia ta ta ttuControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng

28、贝叶斯博弈中的战略 在贝叶斯博弈 中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti),它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。;();();();();)iiiiiiGTpA tu a tt Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng“斗鸡博弈”的贝叶斯模型 参与人为决斗者1和2;用s表示决斗者是“强硬”的,w表示决斗者是“软弱”的,所以T1=T2=s,w。用pxy表示“自然”选择类型组合(x,y)的概率,并假设pxy为共同知

29、识,则每位决斗者i关于其对手类型的推断pi(x|y)。每位决斗者i关于类型相依的行动空间Ai(x)=U,D。每位决斗者i的支付由前面的图决定。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng在贝叶斯博弈中参与人的战略可定义为(1)战略 “强硬”的决斗者i选择行动U,“软弱”的决斗者选择行动U,即(U,U);(2)战略 “强硬”的决斗者选择行动U,“软弱”的决斗者选择行动D,即(U,D);(3)战略 “强硬”的决斗者选择行动D,“软弱”的决斗者选择行动U,即(D,U);(4)战略 “强硬”的决斗者选

30、择行动D,“软弱”的决斗者选择行动D,即(D,D)。1is2is3is4isControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释第十章贝叶斯博弈与贝叶斯第十章贝叶斯博弈与贝叶斯Nash均衡均衡Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 用x表示“强硬”的决斗者2选择行动U的概率,y表示决斗

31、者1选择行动U的概率。决斗者1选择行动U和D的期望收益分别为 和 (这里p为“自然”选择决斗者2为“强硬”的概率),所以决斗者1的最优战略为:如果 ,则选择y=1(即选择行动U);如果 ,则选择y=0(即选择行动D);如果 ,则选择 (即选择任一混合战略)。1()26v Uxp1()2v Dxp 1/(2)xp1/(2)xp1/(2)xp0,1yControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 考察“强硬”决斗者2的选择。“强硬”决斗者2选择行动U和D的期望收益分别为 和 所以“强硬”决斗者2的最

32、优战略为:如果y1/2,则选择x=0(即选择行动D);如果y=1/2,则选择 (即选择任一混合战略)。2()26v Uy2()2v Dy 0,1xControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng不完美信息博弈存在如下两个纯战略Nash均衡(1)决斗者1选择行动U,“强硬”决斗者2选择行动D,“软弱”决斗者2选择行动D;(2)决斗者1选择行动D,“强硬”决斗者2选择行动U,“软弱”决斗者2选择行动D。此外,博弈还存在一个混合战略Nash均衡,即决斗者1以1/2的概率选择行动U,“强硬”决斗者2以的概

33、率1/(2p)选择行动U,“软弱”决斗者2选择行动D。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 用 表示给定其他参与人的战略 ,类型为ti的参与人i选择行动ai时的期望效用,则 其中,对 ,为给定t-i时由s-i所确定的其他参与人的行动组合(,;)iiiiv a st111(),(),(),()iiinsssss(,;)()(,();)iiiiiiiiiiiiiitTv a stp tt u a attiitT()iiat111111()(),(),(),()iiiiiinnsts tst

34、sts tControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng“斗鸡博弈”中,“强硬”的决斗者1关于对手类型的推断为1()ssssswp s sppp1()swssswp w spppControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 所以,当决斗者2的战略为 (即(U,U),则“强硬”的决斗者1选择行动U和D时的期望效用分别为12s112(,)(4)(4)4ssswssswssswppv U s sppp

35、p 112(,)(2)(2)2ssswssswssswppv D s spppp Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 当决斗者2的战略为 (即(U,D),则“强硬”的决斗者1选择行动U和D时的期望效用分别为21224(,)(4)2ssswswssssswssswssswppppv U sspppppp 2122(,)(2)0ssswssssswssswssswpppv D sspppppp 22sControl Science and Engineering,HUST All Rig

36、hts Reserved,2007,Luo Yunfeng 在贝叶斯博弈中,对于一个理性的参与人i,当他只知道自己的类型ti而不知道其他参与人的类型时,给定其他参与人的战略s-i,他将选择使自己期望效用(支付)最大化的行动 ,其中()iia t()()arg max(,;)iiiiiiiiiaA ta tv a stControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng纯战略贝叶斯Nash均衡 贝叶斯博弈 的纯战略贝叶斯Nash均衡是一个类型相依的行动组合 ,其中每个参与人在给定自己的类型ti和其他参与

37、人的类型相依行动 的情况下最大化自己的期望效用。也就是,行动组合 是一个纯战略贝叶斯Nash均衡,如果对 ,;();();();();)iiiiiiGTpA tu a tt 1122(),(),()nna ta ta t()iiat1122(),(),()nna ta ta ti()()arg max()(,();)iiiiiiiiiiiiiiiaA ttTa tp tt u a attControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng存在性结论 定理 一个有限的贝叶斯博弈一定存在贝叶斯Nash均衡

38、。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng贝叶斯Nash均衡的求解 先以简化的“斗鸡博弈”为例。用p表示决斗者1关于决斗者2的类型的推断。(x,(y,z):x表示当决斗者2选择该方格所对应的战略时,决斗者1选择该方格所对应的战略规定的行动所得到的期望支付;y和z分别表示当决斗者1选择该方格所对应的战略时,“强硬”决斗者2和“软弱”决斗者2选择该方格所对应的战略规定的行动所得到的期望支付。Control Science and Engineering,HUST All Rights Rese

39、rved,2007,Luo Yunfeng-4,(-4,-4)2-6p,(-4,0)-2,(2,0)-2p,(2,1)(,)U U21UD6p-4,(-2,-4)2,(-2,0)2p-2,(0,0)0,(0,1)(,)U D(,)D D(,)DUControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 给定决斗者1选择战略U,“软弱”决斗者2选择行动D的期望支付为0,选择行动U的期望支付为-4,行动D优于行动U;给定决斗者1选择战略D,“软弱”决斗者2选择行动D的期望支付为1,选择行动U的期望支付为0,所

40、以,行动D优于行动U。这意味着战略和为决斗者2的劣战略。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng2-6p,(-4,0)2,(-2,0)-2p,(2,1)0,(0,1)21UD(,)U D(,)D DControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 下面根据p的大小,求解博弈的纯战略贝叶斯 Nash均衡。1)假设 ,无论决斗者2选择战略(U,D)还是(D,D),决斗者1的最优行动都是U。给定决斗

41、者1的选择U,“强硬”决斗者2的最优行动为D。所以,博弈存在惟一的纯战略贝叶斯Nash均衡决斗者1选择行动U,“强硬”决斗者2选择行动D,“软弱”决斗者2选择行动D。1/2p Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 2)假设 ,博弈存在如下两个纯战略贝叶斯Nash均衡:(1)决斗者1选择行动U,“强硬”决斗者2选择行动D,“软弱”决斗者2选择行动D;(2)决斗者1选择行动D,“强硬”决斗者2选择行动U,“软弱”决斗者2选择行动D。1/2p Control Science and Engi

42、neering,HUST All Rights Reserved,2007,Luo Yunfeng求解“斗鸡博弈”的贝叶斯Nash均衡 假设“强硬”决斗者1关于决斗者2的类型推断 ;“软弱”决斗者1关于决斗者2的类型推断 ;“强硬”决斗者2关于决斗者1的类型推断 ;“软弱”决斗者2关于决斗者1的类型推断 ;0.2,0.3,0.2,0.3ssswwswwpppp11()0.4,)0.6p s sp w s22()0.5,)0.5ps spw s22()0.5,)0.5ps wpw w11()0.4,)0.6p s wp w wControl Science and Engineering,HUS

43、T All Rights Reserved,2007,Luo Yunfeng 的含义是:x1和x2分别表示当决斗者2选择该方格所对应的战略时,“强硬”决斗者1和“软弱”决斗者1选择该方格所对应的战略规定的行动所得到的期望支付;y1和y2分别表示当决斗者1选择该方格所对应的战略时,“强硬”决斗者2和“软弱”决斗者2选择该方格所对应的战略规定的行动所得到的期望支付。1212(,),(,)x xy yControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng(-4,-4),(-4,-4)(-0.4,-1.6),(

44、-4,0)(-4,0),(-1,-2)(-0.4,0.6),(-1,0.5)(,)U U21(-1.6,-2.4),(-2,-4)(2,0),(-2,0)(-1.6,0.4),(-1,-2)(2,1),(-1,0.5)(,)U D(,)D D(,)DU(,)U U(,)U D(-2,-4),(-1,-2)(-0.8,-1.6),(-1,0.5)(-2,0),(2,0)(-0.8,0.6),(2,1)(,)DU(,)D D(-1.2,-2.4),(-1,-2)(0,0),(-1,0.5)(-1.2,0.4),(0,0)(0,1),(0,1)Control Science and Engineer

45、ing,HUST All Rights Reserved,2007,Luo Yunfeng 对于“软弱”决斗者1,无论决斗者2选择什么战略,其最优行动都是D。所以,战略(U,U)和(D,U)为决斗者1的劣战略。基于同样的原因,战略(U,U)和(D,U)为决斗者2的劣战略。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng(-0.4,0.6),(-1,0.5)(2,1),(-1,0.5)(-0.8,0.6),(2,1)(0,1),(0,1)21(,)U D(,)D D(,)U D(,)D DContr

46、ol Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng对于“强硬”决斗者1,无论决斗者2选择什么战略,其最优行动都是U。所以,战略(D,D)为决斗者1的劣战略。给定决斗者1选择战略(U,D),对于决斗者2战略(D,U)和(D,D)是无差异的。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 所以,博弈存在如下两个纯战略Nash均衡:(1)“强硬”的决斗者1和2选择行动U,“软弱”的决斗者1和2选择行动D;(2)“强硬

47、”的决斗者1选择行动U,“软弱”的决斗者1选择行动D;“强硬”的决斗者2和“软弱”的决斗者2选择行动D。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng贝叶斯Nash均衡定义的另一种表示方式 在静态贝叶斯博弈 中,战略组合 是一个纯战略贝叶斯Nash均衡,如果对 及 ,满足 即没有参与人愿意改变自己的战略,即使这种改变只涉及一种类型下的一个行动。;();();();();)iiiiiiGTpA tu a t t*1(,)nsssi*,()iiiis ttT*111111()()()()()()()

48、();max,)()argiiiiiinniiiiiiiiiiiiia tA ttTs tu s tsta tsts tt p ttControl Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng 简化的“斗鸡博弈”的纯战略贝叶斯Nash均衡为:如果p1/2,博弈的纯战略贝叶斯Nash均衡为(U,(D,D);如果p1/2,博弈的纯战略贝叶斯Nash均衡为(U,(D,D)和(D,(U,D)。Control Science and Engineering,HUST All Rights Reserved,2007,L

49、uo Yunfeng “斗鸡博弈”的纯战略贝叶斯Nash均衡为:(U,D),(U,D)和(U,D),(D,D)。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释第十章贝叶斯博弈与贝叶斯第十章贝叶斯博弈与贝叶斯Nash均衡均衡Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng1.不完全信息古诺模

50、型 在Cournot模型中,每一个企业对其他企业的成本和自己的成本是已知的,因而信息是完全的。然而在实际中,企业往往很难知道其他企业的成本。当Cournot模型中至少有一个企业不知道其他企业的成本时所对应的模型即为不完全信息的Cournot模型。参与人类型成本函数。Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng假设:企业1的成本函数为共同知识:企业2的成本函数为私人信息:其中,企业1知道企业2是 的概率为p,是 的的概率是1-p,p和1-p为共同知识。1111()c qc q22222222()

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第10章贝叶斯博弈与贝叶斯Nash均衡汇编课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|