1、2004-9-221 在纳什均衡中,各方的预期全部会在纳什均衡中,各方的预期全部会实现,所选的策略亦属最佳实现,所选的策略亦属最佳 -1994年宣布诺贝尔经济学奖得主时的新闻稿年宣布诺贝尔经济学奖得主时的新闻稿均衡分析是经济学中的重要分析均衡分析是经济学中的重要分析n均衡即是均衡即是平衡平衡的意思,在英文中是的意思,在英文中是equilibrium。n在经济学中,均衡意即相关量处于在经济学中,均衡意即相关量处于稳定值稳定值。n那么什么是博弈均衡呢?那么什么是博弈均衡呢?博弈均衡是一个稳博弈均衡是一个稳定的博弈结果。均衡是博弈的一种结果,但定的博弈结果。均衡是博弈的一种结果,但不是说博弈的结果都
2、能成为均衡。博弈的均不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,在某种情况下是可以预测的。衡是稳定的,在某种情况下是可以预测的。均衡分析是经济学中的重要分析均衡分析是经济学中的重要分析n均衡即是均衡即是平衡平衡的意思,在英文中是的意思,在英文中是equilibrium。n在经济学中,均衡意即相关量处于在经济学中,均衡意即相关量处于稳定值稳定值。n那么什么是博弈均衡呢?那么什么是博弈均衡呢?博弈均衡是一个稳博弈均衡是一个稳定的博弈结果。均衡是博弈的一种结果,但定的博弈结果。均衡是博弈的一种结果,但不是说博弈的结果都能成为均衡。博弈的均不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,在某种
3、情况下是可以预测的。衡是稳定的,在某种情况下是可以预测的。均衡分析是经济学中的重要分析均衡分析是经济学中的重要分析 根据普利高津的定律,根据普利高津的定律,系统总是处于一个系统总是处于一个平衡态向另一个更高级的平衡态转变的过程,平衡态向另一个更高级的平衡态转变的过程,但是平衡是有条件的,一旦打破这种平衡,系但是平衡是有条件的,一旦打破这种平衡,系统就会进入不平衡的状态,系统要素之间互动,统就会进入不平衡的状态,系统要素之间互动,就有可能进入更高一级的平衡态。就有可能进入更高一级的平衡态。纳什均衡纳什均衡n纳什均衡是一种最常见的均衡。n它的含义是:在对方策略确定的情况下,每个参与人的策略是最好的
4、,此时没有人愿意先改变或主动改变自己的策略。纳什均衡纳什均衡2.1纳什均衡纳什均衡(Nash Equilibrium)n 常用常用G表示一个博弈;表示一个博弈;nG有有n个博弈方;个博弈方;n每个博弈方的全部可选策略的集合称策略空间,每个博弈方的全部可选策略的集合称策略空间,分用分用S1,Sn表示;表示;nsijSi表示博弈方表示博弈方i的第的第j个策略(个策略(j可取有限个可取有限个值(有限策略博弈),也可取无限个值(无穷值(有限策略博弈),也可取无限个值(无穷策略博弈);策略博弈);nUi表示博弈方表示博弈方i的得益;的得益;nG=S1,Sn;u1,un 纳什均衡的定义纳什均衡的定义1n在
5、博弈在博弈 中,如果由各个博弈方的各一中,如果由各个博弈方的各一个策略组成的某个策略组合个策略组成的某个策略组合 中,任一博弈中,任一博弈方方i i的策略的策略 ,都是对其余博弈方策略的组合,都是对其余博弈方策略的组合 的最佳对策,也即的最佳对策,也即对任意对任意 都成立,则称都成立,则称 为为G G的一个的一个“纳什纳什均衡均衡”(Nash Equilibrium)。)。n各博弈方都不愿单独改变策略的策略组合是纳各博弈方都不愿单独改变策略的策略组合是纳什均衡。什均衡。*111111(,.,.,)(,.,.,)iiiiniiijinu sss ssu sss ss11,.,;,.,nnGSS
6、uu*1(,.,)nss*111(,.,.,)iinssssijisS*1(,.,)nss*is2.1纳什均衡纳什均衡(Nash Equilibrium)n某个参与人某个参与人i,用,用-i指指除了除了i之外之外的所有其他参与人的所有其他参与人n将一个策略组合将一个策略组合s分为参与人分为参与人i的策略和其他参与人的策略和其他参与人的策略,可以写为的策略,可以写为:S=(Si,S-i);2004-9-229iiiiiiiiSsssussuis),(),(,有对于任意局中人仅当是一个纳什均衡,当且策略组合*纯策略纳什均衡纳什均衡的定义2:即在一个纯策略组合中,如果给定其他人的策略即在一个纯策略组
7、合中,如果给定其他人的策略不变,任何局中人都没有积极性改变自己的策略,不变,任何局中人都没有积极性改变自己的策略,则该策略组合为一个纳什均衡。则该策略组合为一个纳什均衡。2004-9-2210 纳什均衡的通俗解释:n给定你的策略,我的策略是我最好的策给定你的策略,我的策略是我最好的策略;给定我的策略,你的策略也是你的略;给定我的策略,你的策略也是你的最好的策略衡最好的策略衡。n双方在对方给定的策略下不愿意调整自己的策略n每个参与人所采取的策略都是对于其他每个参与人所采取的策略都是对于其他参与人的策略的最优反应参与人的策略的最优反应*isn定义定义1:在:在G=(S,U)中,)中,Si和和Si”
8、表示表示Pi的两个策的两个策略,若略,若Ui(Si,S-i)Ui(Si”,S-i),对任意对任意S-i S-i,则则称称Si严格超于严格超于Si”,Si”相对于相对于Si是严格劣策略。是严格劣策略。n定义定义2 2:在:在G=(S,U)中,如果存在)中,如果存在S*=(Si*,S-i*),满足满足Ui(Si*,S-i*)Ui(Si,S-i*),对任意对任意S-i S-i*,则则称称S*是是G的一个的一个NE。n定义定义3 3:在一个策略组合:在一个策略组合Si*中,在其他参与人不中,在其他参与人不会改变已有策略的条件下,如果没有参与人用激会改变已有策略的条件下,如果没有参与人用激励去改变自身的
9、策略,则称励去改变自身的策略,则称Si*为为NENE。说明:n理解理解NE的最好办法就是构造一个策略组合,然后看每的最好办法就是构造一个策略组合,然后看每个参与人的策略是否是参其他参与人策略的最好回应。个参与人的策略是否是参其他参与人策略的最好回应。n一个一个NE策略只要是对人其他策略只要是对人其他NE策略的最佳应对,而策略的最佳应对,而不必是对全部可能策略的最佳对。不必是对全部可能策略的最佳对。n每一个优势策略均衡都是每一个优势策略均衡都是NE,但并非每一个,但并非每一个NE都是都是优势策略均衡。如果某一策略是优势的,那么它对于优势策略均衡。如果某一策略是优势的,那么它对于其他参与人选择的任
10、何策略而言都其他参与人选择的任何策略而言都 是最佳应对,这其是最佳应对,这其中也包括其他参与人的均衡策略。而如果某一策略是中也包括其他参与人的均衡策略。而如果某一策略是NE的组成部分,那么它只需对其他参与人的均衡策略的组成部分,那么它只需对其他参与人的均衡策略而言是最佳应对就可以了。而言是最佳应对就可以了。n在许多博弈中,在许多博弈中,NE并不是帕累托有效的。并不是帕累托有效的。nNE有强弱之分。有强弱之分。2.2基本分析思路和方法(NE求解)n2.2.1 2.2.1 占优均衡(上策均衡)占优均衡(上策均衡)nDominant-strategynDominant-strategy equili
11、brium:博弈分析中最基本的均衡概念之一。占优均衡分析是最基本的博弈分析方法。囚徒困境(坦白,坦白)2.2.2 2.2.2 重复剔除严格劣策略(战略)重复剔除严格劣策略(战略)n重复剔除严格劣策略(严格下策反复消去法)iterated elimination of strictly dominated strategiesn严格下策:strictly dominated strategy在一个博弈中,不管其他博弈方的策略如何变化,一个博弈方的某种策略给他带来的支付,总是比另一种策略给他带来的支付要小,那么我们称前一种策略为相对于后一种策略的严格劣策略(严格下策)n重复剔除的占优均衡n 乙 坦
12、白 抵赖 坦白甲 抵赖注:两博弈方同有两种相同的可选策略,策略和得益都对称。两博弈方的唯一目标就是要实现自身价值的最大得益。-3,-3 0,-5-5,0 -1,-116宇宙法则的均衡点宇宙法则的均衡点-1n犹太人的宇宙法则:犹太人的宇宙法则:世界的一切都是按世界的一切都是按 78/22的比例存在的的比例存在的n日本人藤田田在日本人藤田田在犹太人生意经犹太人生意经开篇:开篇:“犹太人生意经里面存在着一条法则。犹犹太人生意经里面存在着一条法则。犹太人正是因循了这条法则,所以做起生意太人正是因循了这条法则,所以做起生意来才得心应手,常胜不败,这条法则就是来才得心应手,常胜不败,这条法则就是”78/2
13、278/22法则法则“,它构成了犹太生意经的根,它构成了犹太生意经的根本。本。”17宇宙法则的均衡点宇宙法则的均衡点-2n美国理查得。考茨提出美国理查得。考茨提出:80/2080/20法则法则,改,改变命运的变命运的黄金法则黄金法则n一个成功企业经营者的成功之处就在于他一个成功企业经营者的成功之处就在于他能从企业发展的过程中找到创造能从企业发展的过程中找到创造78%78%利益的利益的那关键那关键22%22%大1880/20法则n80/20法则:法则:帕累托法则、最省力法则、不帕累托法则、最省力法则、不na 平衡法则平衡法则n管理大师杜拉克:管理大师杜拉克:在一个产品系列中,可能只在一个产品系列
14、中,可能只有其中的一两种是企业利润的真正源泉,而大有其中的一两种是企业利润的真正源泉,而大部分的其他产品可能仅仅是收支平衡,甚至有部分的其他产品可能仅仅是收支平衡,甚至有很多是入不敷出很多是入不敷出n在成千上万的客户中在成千上万的客户中,少数几个大客户的订单少数几个大客户的订单占了订单的大部分,所有新开拓业务中的大部占了订单的大部分,所有新开拓业务中的大部分可能是由数百名销售人员中的几个人发展起分可能是由数百名销售人员中的几个人发展起来的来的n典型的情况是:典型的情况是:80%的收获来自的收获来自20%的努力;的努力;其他其他80%的力气只带来的力气只带来20%的结果的结果大19杜拉克认为管理
15、者首先设立几条杜拉克认为管理者首先设立几条管理的管理的集中原则集中原则-1-1:n要想取得经济效益,管理者的精力应当集中于尽可能少的产品类别上,要想取得经济效益,管理者的精力应当集中于尽可能少的产品类别上,要善于发现要善于发现20%的核心产品,在那些能创造高利润的产品上下功夫的核心产品,在那些能创造高利润的产品上下功夫n企业员工的精力也应当集中于少数几项能真正带来商业效益的活动上,企业员工的精力也应当集中于少数几项能真正带来商业效益的活动上,而在其他方面的投入则越少越好而在其他方面的投入则越少越好n在企业的成本控制工作中,在效的控制也源自管理者将注意力集中于在企业的成本控制工作中,在效的控制也
16、源自管理者将注意力集中于少数几个领域上,它们在成本控制方面的改善可能对整个公司的业绩少数几个领域上,它们在成本控制方面的改善可能对整个公司的业绩产生显著的影响。即在这些领域中,效率方面较小的改善将引起整体产生显著的影响。即在这些领域中,效率方面较小的改善将引起整体经济效益的大大提高经济效益的大大提高n在人力资源管理方面,要精挑细选,发现在人力资源管理方面,要精挑细选,发现“关键少数关键少数”成员成员n人员配置,特别是高级人才的配置必须向能够产生高额经济效益的业人员配置,特别是高级人才的配置必须向能够产生高额经济效益的业务方向倾斜务方向倾斜大20杜拉克认为管理者首先设立几条杜拉克认为管理者首先设
17、立几条管理的管理的集中原则集中原则-2-2:n留住留住20%的关键顾客,如果企业的关键顾客,如果企业80%的利润源自于的利润源自于20%的顾客,的顾客,就应尽力扩大对那就应尽力扩大对那20%顾客的影响力。把注意力分散给所有顾客,顾客的影响力。把注意力分散给所有顾客,是不明智的。作为营销人员,最重要的是确保顾客中关键的是不明智的。作为营销人员,最重要的是确保顾客中关键的20%,并把这并把这20%顾客变成我们的顾客顾客变成我们的顾客n生产线、市场、营销渠道、最终用途等等也都适用这一原则生产线、市场、营销渠道、最终用途等等也都适用这一原则n企业管理中切忌把精力放在那些消耗了企业主要成本,但数量小、利
18、企业管理中切忌把精力放在那些消耗了企业主要成本,但数量小、利润薄的事情上润薄的事情上2.2.2 重复剔除严格劣策略(战略)n应用n博弈方1n博弈方21,01,30,10,40,22,0上下博 弈 方 1左中右博 弈 方 21,01,30,10,40,22,0上下博 弈 方 1左中右博 弈 方 22004-9-2222例例2:博弈博弈G如右图:如右图:1,01,3-1,10,40,20,0下上局中人局中人局中人 左左 中中 右右反复消去反复消去严格被优超策略严格被优超策略2004-9-2223 解:解:局中人局中人的策略的策略“右右”是策略是策略“中中”的严格的严格被优超策略,消去策略被优超策略
19、,消去策略“右右”后为:后为:0,41,00,21,3左左 中中下上 局中人局中人的策略的策略“下下”是策略是策略“上上”的严格被优的严格被优超策略,消去策略超策略,消去策略“下下”后为:后为:1,01,3左左 中中上上 局中人局中人的策略的策略“左左”是是策略策略“中中”的严格被优超策的严格被优超策略,消去策略略,消去策略“左左”后为可后为可知(知(上,中上,中)就是该博弈)就是该博弈反反复消去严格被优超策略均衡。复消去严格被优超策略均衡。1,01,3-1,10,40,20,0132004-9-2224 严格被优超策略反复消去法中每次消严格被优超策略反复消去法中每次消去的必须是去的必须是严格
20、严格优超策略,否则会出现一优超策略,否则会出现一些意想不到的结果。些意想不到的结果。例例2:博弈博弈G如下图:如下图:1,81,62,80,80,80,91,50,80,6局中人局中人 L M R U博弈方SD注意2004-9-22251,81,62,80,80,80,91,50,80,6 解:解:1)局中人)局中人的策的策略略“L”和和“M”都是策略都是策略“R”的被优超策略的被优超策略(不是严不是严格被优超策略格被优超策略),消去策略,消去策略“L”和和“M”后为:后为:USD0,90,81,8 R 局中人局中人的策略的策略“S”和和“D”都是都是策略策略“U”的严格被优超策略,消去的严格
21、被优超策略,消去策略策略“S”和和“D”后后剩下唯一策略组剩下唯一策略组合合(U,R)。L M R2004-9-2226 2)局中人的策略“S”和“D”都是策略“U”的被优超策略(不是严格被优超策略),消去策略“S”和“D”后为:1,81,62,8L M RU 局中人的策略“M”和“R”都是策略“L”的被优超策略(不是严格被优超策略),消去策略“M”和“L”后剩下唯一策略组合(U,L)。1,81,62,80,80,80,91,50,80,6USD例:俾斯麦之战n“俾斯麦之战”发生在1943年的南太平洋上。日本海军上将木村受命将日本陆军运抵新几内亚,其间要穿越俾斯麦海通往新几内亚有两条航线:较短
22、的北线和较长的南线,木村必须从中选择一条。而肯尼则必须决定将其飞机派往何处去搜索日军。如果肯尼将他的飞机派到了错误的航线上,他虽然可以召回它们,但可供轰的天数就会减少。双方行动集相同:北,南n 木村 北 南 北肯尼 南注:弱优势策略均衡:在剔除了每个参与人的全部弱劣势策略后所得到的一个策略组合。重复剔除优势均衡:首先从一参与人的策略集里剔除掉一个弱劣策略,再重新考察各个参与人剩下的策略中哪些是弱劣的并剔除其中之一,继续这一过程直到每一个参与人都仅剩一个策略。这样得到的策略组合就称之为重复剔除优势均衡。2,-2 2,-21,-1 3,-32.2.3 2.2.3 划线法划线法n博弈方的最终目标:实
23、现自身利益的最大化n取决于自己选择的策略,也取决于其他博弈方的策略选择n决策思路:先找出自己针对其他博弈方每种策略或策略组合(对于多人博弈)的最佳对策(不一定惟一),然后,在此基础之上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。2004-9-2230划线法划线法 对其他局中人的任一策略组合,找出局中人i的最佳策略,并在其得益值下划线。若存在一个策略组合,使得所有局中人的得益值下都划了线,则该策略组合就是一个纳什均衡。2004-9-2231例:博弈G如右图:0,41,00,00,20,11,3下上博弈方局中人 左 中 右解:该
24、博弈的纳什均衡为(上,中)。1,01,30,10,40,22,0上下博 弈 方 1左中右博 弈 方 2划 线 法2004-9-2232例:例:博弈博弈G如下图:如下图:2,81,61,80,80,60,80,81,50,9局中人局中人 L M R U博弈方SD解:解:该博弈有两个纳什均衡该博弈有两个纳什均衡(U,L)和和(U,R)。n 乙 坦白 抵赖 坦白甲 抵赖-3,-3 0,-5-5,0 -1,-1划线法总结:n1、划线法,以策略之间的相对优劣关系为基础,在分析支付矩阵表示的博弈问题时具有普遍性n2、不是每个支付矩阵都能用划线法求出确定性的博弈结果,例:猜硬币博弈。n3、许多博弈根本不存在
25、确定性的结果n4、有时存在不止一个的策略组合 例:情人博弈n 猜硬币方 正面 反面 正面盖方 反面结论:不存在所有数字下都划有短线的得益数组,意味着该博弈中没有一种策略组合中的双方策略正好相互都是关于对方策略的最佳对策,即没有一个策略组合会是双方都自愿接受的,该博弈不可能有确定的,或者至少具有稳定性的结果。-1,1 1,-11,-1 -1,1不会漏过不会漏过NENE的相对优势策略圈定法的相对优势策略圈定法n 丽娟 足球 芭蕾 足球大海 芭蕾结论1:该博弈有稳定性的解却没有确定性的解。结论2:双方的相对优势策略都圈定以后,如果哪个格子里面两个数字都被圈住,这个格子所对应的相对优势策略组合,就是N
26、E.2,1 0,00,0 1,22.2.4 箭头法n思路:对博弈中的每个策略组合,判断各博弈方能否通过单独改变自己的策略而改善自己的得益,如能,则从所考察的策略组合的得益引一箭头到改变策略后的策略组合对应的得益。这样对每个可能的策略组合都考察过以后,根据箭头反映的情况来判断博弈的结果。-5,-50,-8-8,0-1,-1坦白抵赖坦白抵赖囚徒2囚徒1囚徒困境2.2.4 箭头法n只有指向的箭头,没有指离的箭头n惟一具有稳定性的策略组合1,01,30,10,22,00,4左中右上下博弈方1博弈方22.2.4 箭头法n箭头法与划线不同,但二者都是基于策略之间相对优劣关系进行分析,得到的结论一致,是两种
27、可以相互替代的方法。n猜硬币博弈n情人博弈n 猜硬币方 正面 反面 正面盖方 反面结论:取胜的关键都是不能让另一方猜到自己的策略而同时自己又要尽可能猜出对方的策略。-1,1 1,-11,-1 -1,1n 丽娟 足球 芭蕾 足球大海 芭蕾结论:在情侣博弈中,双方都没有严格优势策略和严格劣势策略。2,1 0,00,0 1,2例:“智猪博弈”和“搭便车”行为 “game of boxed pigs”n笼子里有一只大猪,一只小猪。笼子的一头有一按钮,另一头是饲料的出口和食槽。按一下按钮,将有相当于10个单位的猪食进槽,但是按按钮所需要付出劳动,要消耗相当于2个单位的猪食。问题是按钮和食槽分置笼子的两端
28、,付出劳动按按钮的猪跑到食槽的时候,坐享其成的另一头猪早已吃了不少。n如果大猪先到,大猪吃到如果大猪先到,大猪吃到9 9个单位,小猪只能吃到个单位,小猪只能吃到1 1个单位;个单位;n如果同时到达,大猪吃到如果同时到达,大猪吃到7 7个单位,小猪吃到个单位,小猪吃到3 3个单位;个单位;n如果小猪先到,小猪可以吃到如果小猪先到,小猪可以吃到4 4个单位,而大猪吃到个单位,而大猪吃到6 6个单位。个单位。2004-9-2243例:例:智猪博弈智猪博弈东奔西走,要喝宋河老酒东奔西走,要喝宋河老酒 大猪大猪有了有了XXXX老酒,何必东奔西走老酒,何必东奔西走小猪小猪 小猪小猪按按 等待等待(先到先到
29、)0,09,14,45,1大猪大猪按按等待等待n 小猪 按 等 按大猪 等结论:大猪选择在主观上是为了自己的利益,但在客观上小猪也享受到了好处5,1 4,49,-1 0,0“搭便车”n智猪博弈有许多应用。如美国的大湖地区,你可以看到许多灯塔。大航运公司因为船舶多,航班频密,迫切需要建灯塔,但是小航运公司在这方面的积极性就比较低。结果大公司花钱建灯塔,公司从设置灯塔所获得的效益超过了灯塔的花费,所以这项投资对于大公司是值得的。小公司因此就可以“搭便车”,也得到好处。“搭便车搭便车”原理原理n原理:亚当原理:亚当.斯密斯密“看不见的手看不见的手”n社会上每个人为了自己的利益而采取行社会上每个人为了
30、自己的利益而采取行动,但这些行动在客观上也为社会上其动,但这些行动在客观上也为社会上其他的人带来了好处。他的人带来了好处。n搭便车行为的产生,很大程度上与缺乏搭便车行为的产生,很大程度上与缺乏产权界定或产权配置的无效率有关。产权界定或产权配置的无效率有关。n在发达国家,除了日本许多人口稠密的地区和纽约这在发达国家,除了日本许多人口稠密的地区和纽约这样人口稠密的城市以外,大部分家庭都有自己的汽车。样人口稠密的城市以外,大部分家庭都有自己的汽车。人们出门,都要自己开车。在那样的地月,公共交通人们出门,都要自己开车。在那样的地月,公共交通一般都不发达,如果你没有自己的汽车,往往就会寸一般都不发达,如
31、果你没有自己的汽车,往往就会寸步难行。我们在美国的留学生,哪怕经济很不富裕,步难行。我们在美国的留学生,哪怕经济很不富裕,也要先买辆二手车来用,就是这个道理。也要先买辆二手车来用,就是这个道理。n你早就想到一个地方去,因为没有车子一直未能成行,你早就想到一个地方去,因为没有车子一直未能成行,碰巧某一天你的一位有车的朋友要去那个地方,并且碰巧某一天你的一位有车的朋友要去那个地方,并且车子有空位,你就可以搭他的车子有空位,你就可以搭他的“顺风车顺风车”了结你的宿了结你的宿愿。这就是:愿。这就是:“搭便车搭便车”说法的由来。在经济生活中,说法的由来。在经济生活中,如果不考虑朋友这样的关系,只有公共品
32、才会发生如果不考虑朋友这样的关系,只有公共品才会发生”搭便车搭便车“问题。问题。n(中小股民,郎咸平引风波,大陆经济学家怎么啦?)为什么大股东挑起监督经理的重任为什么大股东挑起监督经理的重任n监督成本监督成本n在大小股东在大小股东 是否密切监督经理工作是否密切监督经理工作 的博弈中,大股东的博弈中,大股东因为利益攸关会担当起得益因为利益攸关会担当起得益n启示:启示:一项改革,总是得益最多的一方最乐意力促其一项改革,总是得益最多的一方最乐意力促其成成智猪博弈的解决办法智猪博弈的解决办法n小股东与大股东小股东与大股东nAA制制n广告便车广告便车n技术创新便车技术创新便车n公司员工的搭便车行为公司员
33、工的搭便车行为n公司并购中的搭便车行为公司并购中的搭便车行为n郎咸平引风波,大陆经济学家怎么小啦?n智猪博弈的解决办法:智猪博弈的解决办法:合理地界定权利改革与合理地界定权利改革与制度锁定制度锁定总结:n求解博弈的主要关键在于寻找各博弈方都不愿或不会单独改变自己策略的策略组合,只要这种策略组合存在且是唯一的,博弈就有绝对确定的解。n这种各博弈方都不愿单独改变策略的策略组合就是博弈论中最重要的概念“NE”。2.3 纳什均衡的一致预测性质纳什均衡的一致预测性质n一致预测性质:如果所有博弈方都预测一个特定的博弈结果会出现,那么,所有博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,
34、即没有哪个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终真会称为博弈的结果。n一致预测性在博弈分析中具有重要地位n只有纳什均衡才具有一致预测的性质只有纳什均衡才具有一致预测的性质n稳定的,自我实施的(self-enforcing,自我强制的)2.3 纳什均衡的意义纳什均衡的意义n 它是关于博弈结局的一致性预测,如果所有它是关于博弈结局的一致性预测,如果所有局中人预测一个特定的局中人预测一个特定的NENE会出现,那么这种均衡会出现,那么这种均衡就会出现,预测之间没有矛盾,不会因为有的局就会出现,预测之间没有矛盾,不会因为有的局中人认为不符合自己的利益要求而失败中人认为不符合自己的利益要求而
35、失败2.4 纳什均衡(严格下策反复纳什均衡(严格下策反复消去法)消去法)n占优均衡(上策均衡)与纳什均衡n划线法、箭头法与纳什均衡n纳什均衡与重复剔除严格劣策略(严格下策反复消去法):二者之间是否存在相容性,严格下策反复消去法是否会消去纳什均衡?n命题2.1 在个博弈方的博弈 中,如果严格下策反复消去法排除 了 之外的所有策略组合,那么 一定是该博弈的惟一纳什均衡。n命题2.2 在个博弈方的博弈 中,如果 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去。n(反证法)11,.,;,.,nnGSS uu*1(,.,)nss*1(,.,)nss*1(,.,)nss11,.,;,.,nnGSS
36、 uu案例:银行挤兑的成因和预防n一假定有一人银行,只有两个存户,银行的一假定有一人银行,只有两个存户,银行的全部资金就是这两个储户的存款。每个存户全部资金就是这两个储户的存款。每个存户存了存了100万的定期存款,银行就拿总数为万的定期存款,银行就拿总数为200万的这笔钱做投资。项目完成投资收回后,万的这笔钱做投资。项目完成投资收回后,银行可拿出银行可拿出240万元偿还给存户,每个存户万元偿还给存户,每个存户得到得到120万。但未到期抽回存款,银行只可万。但未到期抽回存款,银行只可拿出拿出140万付给储户。万付给储户。n如果双方同时提前抽调存款,每人只能得70万;n如果双方期满支取存款,每人可
37、得120万;n如果只有一方提前支取,那么他得到原来的存额100万,而银行被迫提前抽回投资,可动用资金只有140万,而另一储户期满时来兑现其存款时,银行就要破产,他只能得到40万的补偿;n 储户乙 提前取款 到期取款 提前储户甲 到期结论结论:两个NE:一个是到好的,即到期取款各得(120,120);另一个就很不好,双方争先都要同时提前取款各得(70,70),这就是银行挤兑。70,70 100,4040,100 120,120总结:n银行一定要使自己的资金来源多元化;n一定要使自己的投资适当分散;n一定要注意良好的经营业绩;n一定要掌握相当比例的准备金n中央银行一定要规范商业银行的运作“控制谣言
38、”是防止银行挤兑的有效的策略案例:如何让禁鸣喇叭成为交通顺畅的开始n广州市区禁止机动车喇叭叫鸣。汽车有喇叭,广州市区禁止机动车喇叭叫鸣。汽车有喇叭,但是不许叫,可算是中国特色的制度创新。但是不许叫,可算是中国特色的制度创新。n行人和车辆守与不守交通规则问题研究,即行人和车辆守与不守交通规则问题研究,即“交通博弈交通博弈”式的式的“囚徒困境囚徒困境”。n如果对方礼让我也礼让,大家顺畅都得8;n如果我抢行占了便易得9,对方礼让寸步难得只得1;n如果都抢行,大家 挤死只能得2;n如果对方抢行占了便得9,我礼让寸步难行只得1;n 行人 礼让 抢行 礼让汽车 抢行结论:结论:NE得(2,2)。但禁鸣礼让
39、最后是否能同时达到交通改善的结果?是否能真正把交通引导到规矩礼让大家受益的“双赢对局”(8,8)中呢?8,8 1,99,1 2,2案例:美苏争霸的“囚徒困境”n从军事上看,从军事上看,20年前美国和苏联是世界上两年前美国和苏联是世界上两个超级大国,他们相互对垒。假定每一方都个超级大国,他们相互对垒。假定每一方都有两种策略选择,一个是扩军,发展战略核有两种策略选择,一个是扩军,发展战略核武器,实施武器,实施“星球大战星球大战”计划等等,另一个计划等等,另一个是彻底裁军,直到不设军备。是彻底裁军,直到不设军备。n如果双方都扩军,各花2000亿美元用于军费,赢利为-2000;n如果双方彻底裁军,则军
40、费为零;n如果美国裁军不设防但苏联扩军,苏联就可以任意斯侮和损害美国,苏联赢利8000亿美元(得10000亿成本2000亿=8000亿),而美国会受到很大损失,甚至丧失主权,则得负无穷-;反之亦然。n 苏联 扩军 裁军 扩军美国 裁军结论结论:两方都扩军是争霸博弈唯一的NE。思考:人类为何那么愚蠢,不和平共处于不花费军费的右下角呢?2000,-2000 8000,-,8000 0,0案例:串谋博弈和风险优势n甲有上策略和下策略,乙有左策略和右策略甲有上策略和下策略,乙有左策略和右策略n在一名涉及名额挑选的十分制考试中,考官在一名涉及名额挑选的十分制考试中,考官规定一旦发现谁作弊将给予规定一旦发
41、现谁作弊将给予0分,揭发他人作分,揭发他人作弊,得奖励弊,得奖励1分;甲乙功课相当,者得分;甲乙功课相当,者得7+1=8n都不作弊可得都不作弊可得7分分;n若串谋作弊没给发现,每人可得若串谋作弊没给发现,每人可得9分;分;n如果一人作弊另一人告发,作弊者得如果一人作弊另一人告发,作弊者得0,告发者得,告发者得7+1=8n 乙 左 右 上甲 下结论结论:两个NE:“甲上乙左”得(9,9)和“甲下乙右”得(7,7);但“甲下乙右”得(7,7)的NE具有风险优势。(风险优势不是表示风险大,恰是风险比较小的优势。)9,9 0,88,0 7,7n 乙 作弊 不作弊 作弊甲 不作弊结论结论:两个NE:一个
42、双方都作弊,各得(90,90);另一个都不作弊,双方各得(7,7),这就是风险优势。9,9 0,88,0 7,7案例:营造克已奉公的制度环境n“高薪养廉高薪养廉”是公务员制度方面的一种理论。是公务员制度方面的一种理论。n甲乙是关系密切的国家公务员,甲乙是关系密切的国家公务员,7是政府所发是政府所发高薪;双方串谋受贿每人可得高薪;双方串谋受贿每人可得9;一旦发现受;一旦发现受贿将给予贿将给予0分;揭发他人,得奖励分;揭发他人,得奖励1分;分;n都不受贿可得都不受贿可得7;n若受贿,因串谋没给发现,每人可得若受贿,因串谋没给发现,每人可得9;n如果一旦东窗事发,就要撤职查办如果一旦东窗事发,就要撤
43、职查办0;n 乙 受贿 不受 受甲 不受结论结论:两个NE:(受,受)和(不受,不受);但(不受,不受)的NE具有风险优势。9,9 0,88,0 7,7改变数据:薪水只有2n 乙 受贿 不受 受甲 不受结论结论:两个NE:(受,受)和(不受,不受);但(不受,不受)的NE具有风险优势。9,9 0,33,0 2,2改变数据:加重惩罚为-20n 乙 受贿 不受 受甲 不受结论结论:两个NE:(受,受)和(不受,不受);但(不受,不受)的NE具有风险优势。9,9 -20,33,-20 2,2案例:猎人博弈(法国哲学家卢梭)和帕累托优势n在古代的一个地方,有两个猎人,狩猎是主在古代的一个地方,有两个猎
44、人,狩猎是主要生计。要生计。n假设猎物只有两种:鹿和兔子;假设猎物只有两种:鹿和兔子;n假设两个猎人一起去猎鹿,才能猎获一只鹿,假设两个猎人一起去猎鹿,才能猎获一只鹿,如果一个猎人单兵作战,他只能打到四个兔如果一个猎人单兵作战,他只能打到四个兔子。子。n从填从填 饱肚子的角度说,饱肚子的角度说,4只兔子算它能管只兔子算它能管4天,天,一只鹿却差不多解决一个月的问题。一只鹿却差不多解决一个月的问题。n 乙 猎鹿 打兔子 猎鹿甲 打兔子结论结论1:两个NE:一个是两人一起去猎鹿,得(10,10);另一个是两人各去打兔子,得(4,4)。结论2:两家一起去猎鹿的赢利比各自去打兔子的赢利要大得多。即甲乙
45、一起去猎鹿得(10,10)的NE,比两人各自去打兔子得(4,4)的NE,具有帕累托优势。10,10 0,44,0 4,4帕累托最优:n帕累托是法国巴黎出生的意大利经济学家。n帕累托效率准则:经济的效率体现于配置社会资源以改善人们的境况,主要看资源是否已被充分利用。如果资源已被充分利用,要想再改善任何人都必须损害别的人,这时候就说一个经济已经实现了帕累托效率。相反,如果还可以在不损害别人的情况下改善任何人,就是说经济资源淌未充分利用,经济没有达到帕累托最优。帕累托最优和风险优势的关系:n帕累托最优和风险优势之间,理论给帕累托优势以优先权,而风险优势只有在局中人面临不知道选哪个均衡好的不确定性的是
46、时候才变得重要2.4 混合策略和混合策略纳什均衡 n2.4.1 严格竞争博弈和混合策略的引进严格竞争博弈和混合策略的引进n各博弈方的利益和偏好始终不一致,在通常策略的基础上没有纳什均衡的博弈,就称为“严格竞争博弈”。nNe在解博弈时的弱点:即只在当博弈中有唯一的NE时才能解出博弈的结果,才能说出各博弈方的做法。但许多现实中决策问题构成的博弈中,根本不存在具有稳定性的各博弈方都接受的NE策略组合;而另一些博弈却有多于一个没有哪个博弈方愿意单独改变策略的NE策略组合2004-9-2274双矩阵博弈的混合扩张1.二人有限博弈的纯策略形式设G=(S,U)1n1a11,b11a1n,b1nmam1,bm
47、1amn,bmn可表为:G=(S1,S2,A,B),其中:mnmnmnmnbbbbaaaaA.B .11111111,2004-9-22751,0|1,0|1*21*1njjimiiiyyYsxxXsBYXyxbYXEAYXyxaYXETminjjiijBTminjjiijA1111),(),(G*=(BAEESS,*2*1)2.二人有限博弈的混合策略形式2004-9-2276G),(*2*1*BAEESSG*2*1*,SYSX)4(),(),()3(),(),(*2*1*SYYXEYXESXYXEYXEBBAA),(*YX将扩充为,因此,如果,满足 则是该博弈的一个纳什均衡。例2:猜硬币博弈
48、n两人通过猜硬币的正反面赌输赢,其中两人通过猜硬币的正反面赌输赢,其中一人用手盖住硬币,由另一方猜是正面一人用手盖住硬币,由另一方猜是正面朝上还是反面朝上:朝上还是反面朝上:n如果猜对,则猜者赢如果猜对,则猜者赢1 1元,盖硬币者元,盖硬币者输输1 1元;元;n否则,猜者输否则,猜者输1 1元,盖硬币者赢元,盖硬币者赢1 1元;元;n 猜硬币方 正面 反面 正面盖方 反面第一个原则:自己的策略选择千万不能预先被另一方侦知或猜到。第二个原则:博弈方必随机地选择策略。-1,1 1,-11,-1 -1,1n博弈方如何避免自己的选择带有规律性?n随机选择的方法n设盖硬币方出正面的概率为p,出反面的概率
49、就是1-p,出正面多于出反面意味着p1-p或p1/2。在这种情况下,如果猜硬币方全猜正面,则其期望支付为:nPg+(1-p)g(-1)=2p-1=2(p-1/2)02.4.2 2.4.2 混合策略、混合策略博混合策略、混合策略博弈和混合策略纳什均衡弈和混合策略纳什均衡n混合策略(mixed strategies):博弈方以一定的概率分布在可选策略中随机选择的决策方式,在分析原来没有纳什均衡的博弈和有多个纳什均衡的博弈时有非常重要的意义。这种策略选择方式为“混合策略”。n混合策略,不是纯粹这样做或纯粹那样做,而是百分混合策略,不是纯粹这样做或纯粹那样做,而是百分之多少选择这样做,百分之多少选择那
50、样做,这两个之多少选择这样做,百分之多少选择那样做,这两个百分数加起来,应该是一,即百分之一百。百分数加起来,应该是一,即百分之一百。n纯策略(pure strategies):相对于这种以一定概率分布在一些策略中随机选择的混合策略,确定性的具体的策略,称之为:纯策略;任何博弈方都不愿单独改变策略的纯策略组成的策略组合称为“纯策略NE”。n定义定义 在博弈 中,博弈方i的策略空间 ,则博弈方i以概率分布 随机在其k个可选策略中选择的“策略”,称为一个“混合策略”,其中0pij1/2 p=0,1 若若q=1/2 1 若若q1/2 q=0,1 若若p=1/2 0 若若p1/4 p=0,1 若若q=