1、2022-7-30中南财经政法大学信息学院1 完全信息静态博弈完全信息静态博弈纳什均衡纳什均衡 设有两人博弈,每个博弈方都有不同的策略,谁都希望自己出“高招”使自己获胜(即寻求效用的最大化),但获胜并不完全依赖于自己的行为能力,还依赖于对手怎么做。2022-7-30中南财经政法大学信息学院2 试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。因此,对每只公鸡来说,最好的结果是,对方退下
2、来,而自己不退,但是此时面临着两败俱伤的结果。经典案例三经典案例三斗鸡博弈斗鸡博弈2022-7-30中南财经政法大学信息学院3经典案例三经典案例三斗鸡博弈斗鸡博弈-3,-32,00,20,0退BA进退进独木桥n对于相当多的博弈,我们无法运用重复剔除劣战略的方法找出均衡解。n显然为了找出这些博弈的均衡解,需要引入纳什均衡。2022-7-30中南财经政法大学信息学院4 例例1 1、选课博弈、选课博弈 钟信陈明德语法语德语3,21,1法语0,02,32022-7-30中南财经政法大学信息学院5例例2 2、性别博弈、性别博弈Battle of sexes足球足球2,10,0-1,-11,2芭蕾芭蕾 足
3、球足球 芭蕾芭蕾girlboy2022-7-30中南财经政法大学信息学院6纳什均衡纳什均衡_哲学思考哲学思考 如果一个博弈问题的所有博弈方事前能达成一个“协议”,并在没有外部强制的情况下,每个博弈方都有积极性遵守这个“协议”。那么,这个协议就是纳什均衡。2022-7-30中南财经政法大学信息学院7 假设假设n n个人参与博弈,给定其他个人参与博弈,给定其他博弈方策略的策略的条件下,每个博弈方选择自己的最优策略。条件下,每个博弈方选择自己的最优策略。纳什均衡指的是纳什均衡指的是“由所有博弈方的最优策略由所有博弈方的最优策略组成的一个组合组成的一个组合”n n个人制订了一个协议,这个人制订了一个协
4、议,这n n个人是否能自愿个人是否能自愿遵守?他们会自觉遵守,这个协议就构成一遵守?他们会自觉遵守,这个协议就构成一个纳什均衡。个纳什均衡。如果一个协议不构成纳什均衡,它就不可能如果一个协议不构成纳什均衡,它就不可能自动实施,而需要外力胁迫,这就是无所谓自动实施,而需要外力胁迫,这就是无所谓的的“协议协议”2022-7-30中南财经政法大学信息学院8 理解纳什均衡的重要性:任何理解纳什均衡的重要性:任何“合理合理”结结果都要满足的条件果都要满足的条件当某一博弈方发现当某一博弈方发现他人单方面改变策略可以获取更多时,他他人单方面改变策略可以获取更多时,他会毫不犹豫地改变自己的策略,博弈自然会毫不
5、犹豫地改变自己的策略,博弈自然就有达到均衡了。就有达到均衡了。思考:一种制度安排要发生效力,为什么思考:一种制度安排要发生效力,为什么必须是纳什均衡。必须是纳什均衡。否则,这种制度安排会有效力吗?否则,这种制度安排会有效力吗?2022-7-30中南财经政法大学信息学院9五、纳什均衡五、纳什均衡定义:定义:在博弈G=s1,sn;u1,un中,如果各博弈方i的某策略si*与其他博弈方的策略s-i*组成策略组合(si*,s-i*),且任一博弈方i的策略si*都是对其余博弈方策略s-i*的最佳反应。则称(si*,s-i*)为该博弈的一个Nash均衡特别,当且仅当(si*,s-i*)是Nash均衡,且对
6、所有纯策略si(sisi*)有ui(si*,s-i*)ui(si,s-i*),又称(si*,s-i*)是严格(强)Nash均衡。)(),(),(*iiiiiiiissssussu即:2022-7-30中南财经政法大学信息学院10纳什均衡与一致预期 纳什均衡:所有博弈方的最优策略的组合:给定该策略中别人的选择,没有人有积极性改变自己的选择。一致预期:基于信念的选择是合理的;支持选择的信念是正确的;预期的自我实现:如果所有人认为这个结果会出现,这个结果就一定会出现。预期是自我实现的,预期不会错误。如果你认为我预期你将选择X,你就真的会选择X。2022-7-30中南财经政法大学信息学院11纳什均衡举
7、例 例如广告博弈 纳什均衡:(做广告,做广告)企业1企业22022-7-30中南财经政法大学信息学院12经典案例三经典案例三斗鸡博弈斗鸡博弈-3,-32,00,20,0退BA进退进独木桥纳什均衡:纳什均衡:A A进,进,B B退;退;A A退,退,B B进进n纳什均衡可以帮我们找出这些博弈的均衡解,2022-7-30中南财经政法大学信息学院13 例如性别博弈 小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)纳什均衡的含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。请同学分析:2022-7-30
8、中南财经政法大学信息学院14(一)Nash均衡的基本求解法1、划线法划线法 基本思想基本思想博弈方先找出自己针对其他博弈方每种策略或策略组合的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得益的策略,然后在此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。2022-7-30中南财经政法大学信息学院15 具体方法具体方法对其他博弈方的任一策略组合,找出博弈方i的最佳策略,并在其得益值下划一小横线;若存在一个这样的策略组合,所有博弈方的得益值下都划了线,则该组策略组合就是该博弈的一个纳什均衡。20
9、22-7-30中南财经政法大学信息学院16例1、性别博弈 小莉 大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)分析:A.如果大海选足球,小莉的“相对优势策略”也是足球,这比她选芭蕾好,这是在小莉的盈利值1下划线。2022-7-30中南财经政法大学信息学院17如果大海选芭蕾,小莉的“相对优势策略”也一定是芭蕾,这时将右下方格中盈利值2下划线。B.如果小莉选足球,大海的“相对优势策略”是足球,这时,在大海的盈利矩阵左上格中盈利值2下划线。如果小莉选芭蕾,大海的“相对优势策略”也是芭蕾,因而在右下格其盈利值2下划线。当双方的相对优势策略确定后,哪个格子里面两个数字都被被划线,那么这
10、个格中所对应的相对优势策略组合就是一个纳什均衡。2022-7-30中南财经政法大学信息学院18例2、囚徒困境博弈 乙 招 不招 招 甲 不招(问题1:甲、乙如何选择?)-8,-80,-15-15,0-1,-12022-7-30中南财经政法大学信息学院19例例3 3“智猪博弈智猪博弈”(boxed(boxed pigs)pigs)有些博弈没有占优均衡,但通过剔除“劣”策略,我们可以预测博弈的结果;还可以通过“纳什均衡”预测博弈的结果。如“智猪博弈”按等待按等待5,14,49,10,0这个博弈中,大猪的最优选择依赖于小猪的选择,但小猪的最优选择与大猪的选择无关。如果大猪知道小猪的理性的,大猪将选择
11、“按”。均衡是“大猪按,小猪等待”。“劣”策略:无论对方选择什么,如果自己选择A得到的总是收益小于选择B得到的收益,A就是相对于B的劣策略。2022-7-30中南财经政法大学信息学院20例例4 4:博弈:博弈G G如右图:如右图:1,01,30,10,40,20,0上博 弈 方 下博弈方 左 中 右解解:该博弈的纳什均衡为(中,上)。上博弈方 下2022-7-30中南财经政法大学信息学院21例例5 5:博弈:博弈G G如下图:如下图:2,81,61,80,80,60,80,81,50,9博弈方 L M R U博弈方SD解解:该博弈有两个纳什均衡(U,L)和(U,R)。2022-7-30中南财经
12、政法大学信息学院22例例6 6、军备竞赛、军备竞赛 苏 美扩军裁军扩军(-3000,-3000)(10000,-)裁军(-,10000)(0,0)结论,这个博弈存在一个Nash均衡(扩军,扩军)2022-7-30中南财经政法大学信息学院23军备考虑为扩军、有限军备、不设防,那么G为:B A扩军有限裁军扩军(-2000,-2000)(-1600,-1500)(8000,-)有限(-1500,-1600)(-500,-500)(9500,-)裁军(-,8000)(-,9500)(0,0)据划线法求得Nash均衡为双方采用有限军备策略。注意注意对每一方,有限军备都是全局优势策略,扩军和不设防都是全局
13、劣势策略。此问题也可用重复剔除的占优均衡求得博弈问题的解为(有限军备,有限军备)。2022-7-30中南财经政法大学信息学院24例例7 7:寻找纳什均衡:寻找纳什均衡C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,2002022-7-30中南财经政法大学信息学院25纳什均衡(纳什均衡(Nash EquilibriumNash Equilibrium)的理解)的理解纳什均衡是一种“僵局”,给定别人不改变策略的情况下,没有人有兴趣改变。囚徒困境是西方经济学中个人理性与集体理性冲突的一个例证。2022-7-30中南财经政法大学信息学院26 基本思
14、路对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加盈利,如能,则从所分析的策略组合对应的盈利数组引一箭头,到改变策略后策略组合对应的盈利数组,最后综合对每个策略组合的分析情况,只有指向、无指离的策略组合形成对博弈的结果。2 2、箭头法、箭头法2022-7-30中南财经政法大学信息学院27具体方法具体方法考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头,到改变策略后策略组合对应的得益数组。若存在一策略组合,其得益数组只有进来的箭头而没有出去的箭头,则该策略组合就是纳什均衡。2022-
15、7-30中南财经政法大学信息学院28例例1 1:博弈:博弈G G如右如右上博弈方 下博弈方 左 中 右0,41,00,00,20,11,3纳什均衡为(上,中)2022-7-30中南财经政法大学信息学院29例例2 2、囚徒困境、囚徒困境 乙甲坦白抵赖坦白(-8,-8)(0,-15)抵赖(-15,0)(-1,-1)因此,策略组合(坦白,坦白)就是唯一具有稳定性的结果。2022-7-30中南财经政法大学信息学院30斗鸡B进攻 退却-3,-32,00,20,0A进攻斗鸡退却经典案例经典案例3 3斗鸡博弈斗鸡博弈 (进,退)和(退,进)是两个纳什均衡。2022-7-30中南财经政法大学信息学院31例例4
16、 4、性别博弈、性别博弈 小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)2022-7-30中南财经政法大学信息学院32(二)纳什均衡与重复剔除的占优均衡(二)纳什均衡与重复剔除的占优均衡 占优均衡肯定是纳什均衡,但反过来纳什均衡不一定是占优均衡,因此占优均衡是比纳什均衡更强、稳定性更高的均衡概念。只是,占优均衡在博弈问题中的普遍性比纳什均衡要差得多。重复剔除的占有均衡和纳什均衡之间的关系要复杂一些,关键是这两者之间是否存在相容性,即严格劣策略反复消去法是否会消去纳什均衡,对于纳什均衡和重复剔出的占优均衡的关系,下面的两个命题基本上给出了我们所希望的答案。2022-7-30
17、中南财经政法大学信息学院33NashNash均衡的特质均衡的特质1)一致预测性“一致”各博弈方的实际行为选择与他们的预测一致。2)与重复剔出的占优均衡的关系 若G=s1,sn;u1,un,通过严格劣策反复消去法排除了除(s1*,sn*)之外的所有策略组合,那么(s1*,sn*)一定是该博弈唯一的Nash均衡。若G=s1,sn;u1,un,如果(s1*,s2*)是G的一个Nash均衡,那么严格劣策反复消去法一定不会将它剔除。2022-7-30中南财经政法大学信息学院34 纳什均衡纳什均衡 构成纳什均衡的策略一定是重复剔除严格劣策略过程中不会被剔除的策略。许多不存在占优策略均衡或重复剔除的占优均衡
18、的博弈却存在纳什均衡。小结与思考:三种均衡的概念:占优均衡重复剔除的占优均衡纳什均衡 三种均衡是什么关系2022-7-30中南财经政法大学信息学院35纳什均衡纳什均衡 纳什均衡与其他概念的关系纳什均衡与其他概念的关系 每一个占优策略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或者重复剔除的占优均衡。纳什均衡一定是在重复剔除严格劣策略过程中没有被剔除掉的策略组合;但没有被剔除的策略组合不一定是纳什均衡,除非它是唯一的。注意:弱劣策略剔除可能剔除掉纳什均衡2022-7-30中南财经政法大学信息学院36不同均衡概念的关系:占优均衡DSE重复剔除占优均衡IEDE纯策略纳
19、什均衡PNE2022-7-30中南财经政法大学信息学院37占优均衡占优均衡重复剔除的占优均衡重复剔除的占优均衡纳什均衡纳什均衡完全信息静态博弈均衡解的思考进程完全信息静态博弈均衡解的思考进程2022-7-30中南财经政法大学信息学院38那么什么是博弈论的均衡呢?所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。纳什均衡是一最常见的均衡。它的含义是:在对方策略确定的情况下,每个参与者的策略都是最好的,此时没有人愿意先改变自己的策略。纳什均衡是博弈论中的重要概念,同纳什均衡是博弈论中的重要概念,同时也是经济学的重要概念。时
20、也是经济学的重要概念。2022-7-30中南财经政法大学信息学院39 纳什均衡的缺点纳什均衡的缺点(1)纳什均衡不唯一。在不唯一的情况下,哪一个才是最可能出现的呢?(允许了不可置信的威胁的存在)(2)没有纳什均衡存在又如何分析?2022-7-30中南财经政法大学信息学院40 例例1 1监督博弈(不存在纳什均衡)监督博弈(不存在纳什均衡)监督不监督偷懒不偷懒1,11,22,32,2给定工人偷懒,老板的最优选择是监督;给定老板监督,工人的最优选择是不偷懒;给定工人不偷懒,老板的最优选择是不监督;给定老板不监督,工人的最优选择是偷懒;形成如此循环。2022-7-30中南财经政法大学信息学院41例例2
21、 2斗鸡博弈(存在两个以上纳什均衡)斗鸡博弈(存在两个以上纳什均衡)-3,-32,00,20,0退BA进退进独木桥纳什均衡:A进,B退;A退,B进2022-7-30中南财经政法大学信息学院42美苏古巴导弹危机 冷战期间美苏争霸最严重的一次危机。苏联:面临将导弹撤回国还是坚持部署在古巴的选择;美国:挑起战争还是容忍苏联的挑衅行为。结果:苏联:将导弹从古巴撤回,做了丢面子的“撤退的鸡”,美国:坚持自己的的策略,做了“不退的鸡”,但是象征性地从土耳其撤回了一些导弹,给苏联一点面子。独木桥2022-7-30中南财经政法大学信息学院43 这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来的结果
22、是丢了面子,但总比战争要好;对美国而言,既保全了面子,又没有发生战争。这就是这两只“大公鸡”博弈的结果。2022-7-30中南财经政法大学信息学院44 在博弈中纳什均衡点如果有两个或两个以上,在博弈中纳什均衡点如果有两个或两个以上,结果就难以预料。这对每个博弈方都是麻烦事,结果就难以预料。这对每个博弈方都是麻烦事,因为后果难料,行动也往往进退两难。因为后果难料,行动也往往进退两难。左边还是右边左边还是右边 例如两个骑自行车的人对面碰头,很容例如两个骑自行车的人对面碰头,很容易互相易互相“向住向住”:因为不知道对方会不会躲、:因为不知道对方会不会躲、往哪边躲,自己也不知该如何反应,于是撞到往哪边
23、躲,自己也不知该如何反应,于是撞到一起。自行车相撞一般不会造成什么大麻烦,一起。自行车相撞一般不会造成什么大麻烦,可是如果换成马车、汽车,就可能出现伤亡。可是如果换成马车、汽车,就可能出现伤亡。所以,应该有一个强制性的规定,来告诉人们所以,应该有一个强制性的规定,来告诉人们该怎么做。该怎么做。2022-7-30中南财经政法大学信息学院45交通博弈与交通规则交通博弈与交通规则靠左行靠右行靠左行靠右行1,11,1-1,-1-1,-12022-7-30中南财经政法大学信息学院46 海上航行也要面临同样的问题,尽管大海辽阔,但是航线却是比较固定的,因此船只交会的机会很多,这些船只属于不同的国家,如何调
24、节谁进谁退的问题呢?先来看一个小笑话:小笑话:一艘军舰在夜航中,舰长发现前方航线上出现了灯光。舰长马上呼叫:“对面船只,右转30度。”对方回答:“请对面船只左转30度。”“我是美国海军上校,右转30度。”“我是加拿大海军二等兵,请左转30度。”舰长生气了:“听着,我是列克星顿号战列舰舰长,这是美国海军最强大的武装力量,右转30度!”“我是灯塔管理员,请左转30度。”2022-7-30中南财经政法大学信息学院47 谁打电话谁打电话上面的例子是通过规定解决了问题,不过,若是遇到电话打到一半突然断了的事,你该怎么办?假如你正在和朋友通话,电话断了,而话还没说完。这时有两个选择,马上打给对方,或等待对
25、方打来。注意:如果你打过去,他就应该等在电话旁,好把自家电话的线路空出来,如果他也在打给你,你们只能听到忙音;另一方面,假如你等待对方打电话,而他也在等待,那么你们的聊天就没有机会继续下去。2022-7-30中南财经政法大学信息学院48 案例案例欧共体在空中客车与波音公司的欧共体在空中客车与波音公司的竞争中对空中客车公司的战略性补贴。竞争中对空中客车公司的战略性补贴。欧共体为了打破美国波音公司对全球民航业的垄断,曾放弃欧洲传统的自由竞争精神而对与波音公司进行竞争的空中客车公司进行补贴。2022-7-30中南财经政法大学信息学院49 当双方都未获得政府的补贴时,两个公司都开发新型飞机会因市场饱和
26、而亏损,但若一家公司开发而另一家公司不开发时,则开发的那家公司会获巨额 利润,见表2。2022-7-30中南财经政法大学信息学院50表2 未补贴时的博弈 空中客车 开发 不开发 开发 波音 不开发 -10,-10100,00,1000,02022-7-30中南财经政法大学信息学院51 此时有两个纳什均衡,即一家开发而另一家不开发。下面,考虑欧共体对空中客车进行补贴20个单位的情况。此时,当两家都开发时,空中客车仍然盈利10单位而不是亏损,博弈矩阵见表3。2022-7-30中南财经政法大学信息学院52表3 有补贴时的博弈 空中客车 开发 不开发 开发 波音 不开发 -10,10100,00,1200,02022-7-30中南财经政法大学信息学院53 这时只有一个纳什均衡,即波音公司不开发和空中客车公司开发的均衡(不开发,开发),这有利于空中客车。在这里,欧共体对空中客车的补贴就是使空中客车一定要开发(无论波音是否开发)的威胁变得可置信的一种“承诺行动”。2022-7-30中南财经政法大学信息学院54课后练习:1、P102 4,5