1、第二章完全信息静态博弈 2.1 基本分析思路和方法基本分析思路和方法2.2 纳什均衡纳什均衡2.3 无限策略博弈分析和反应函数无限策略博弈分析和反应函数2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡2.5 纳什均衡的存在性纳什均衡的存在性2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展完全信息静态博弈主要内容 2.1 基本分析思路和方法1)上策均衡法2)严格下策反复消去法3)划线法4)箭头法上策均衡法n上策均衡法的基本思路上策均衡法的基本思路n好的策略好的策略,上策上策(Dominant Strategy):在某些博弈中,如果无论其他博弈方选择什么策略,一博弈方的
2、某个策略给他带来的收益始终高于其他策略,至少不低于其他策略,称为-n上策的例子上策的例子 囚徒困境囚徒囚徒2坦白抵赖囚徒囚徒1坦白(5,5)(0,8)抵赖(8,0)(1,1)上策均衡n上策均衡上策均衡(Dominant-strategy Equilibrium):如果一个博弈的某个策略组合中,所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈的稳定结果,称这样的策略组合为-n上策均衡分析是最基本最基本的博弈分析方法n上策均衡非常稳定非常稳定,根据上策均衡可以做出最肯定的预测,因为它反映了博弈方对策略的绝对偏好n上策均衡不是普遍存在的上策均衡不是普遍存在
3、的。这正是一般博弈理论的价值所在上策均衡n不存在上策均衡的博弈例子不存在上策均衡的博弈例子甲甲石头石头剪子剪子布布乙乙石头石头0,01,11,1剪子剪子1,10,01,1布布1,11,10,0严格下策反复消去法n严格下策反复消去法基本思路严格下策反复消去法基本思路n选择法,排除法选择法,排除法n坏的策略:严格下策坏的策略:严格下策(Strictly Dominated):如果在一个博弈中,无论其他博弈方策略如何变化,一博弈方的某个策略给他带来的收益始终比另一个策略带来的收益要下,那么称前一个策略为相对于后一个策略的-n任何理性的博弈方都不可能采取严格下策不可能采取严格下策,所以博弈方总会先排除
4、掉严格下策。严格下策反复消去法n严格下策反复消去法严格下策反复消去法 反复寻找各个博弈方的,在策略之间两两比较意义上“严格下策”,并消去他们的方法,直到找不出任何严格下策为止。称为-n例子例子博弈方博弈方2 2左左中中右右博弈博弈方方1 1上上1,01,30,1下下0,40,22,0严格下策反复消去法n严格下策反复消去法例子严格下策反复消去法例子博弈方博弈方2 2左左中中博弈博弈方方1 1上上1,01,3下下0,40,2博弈方博弈方2 2左左中中博弈方博弈方1 1上上1,01,3博弈方博弈方2 2中中博弈方博弈方1 1 上上1,3严格下策反复消去法n严格下策反复消去法比上策均衡适用范围大些。同
5、样不能解决所有博弈的分析问题。如:猜拳游戏n在策略数较多的博弈中,该法只能消去部分策略,不能消去的策略组合不唯一,仍然不能完全解决这些博弈问题,仍然是一种标准的博弈分析工具之一n严格下策反复消去法失效的原因:博弈的不同策略组合之间往往不存在绝对的优劣关系,而只存在相对的,有条件的优劣关系。所以,不能基于绝对的优劣关系找分析方法,能否找到依赖于相对优劣关系的分析方法呢?划线法n划线法分析的基本思路n先找出博弈的一方针对其他博弈方每种策略或策略组合(对多人博弈)的最佳对策(即该博弈方的可选策略中与其他博弈方的策略或策略组合配合,给其带来最大得益的策略),并在其对应的支付下划一短线“_”;n对其他所
6、有博弈方均实施上述过程;n与每一个元素均划线的支付组合所对应的策略组合为博弈的结果。划线法例(一)囚徒囚徒2 2坦白抵赖囚徒囚徒1 1坦白(5,5)(0,8)抵赖(8,0)(1,1)囚徒困境囚徒困境划线法例(一)囚徒囚徒2 2坦白抵赖囚徒囚徒1 1坦白(5,5)(0,8)抵赖(8,0)(1,1)划线法分析囚徒困境博弈划线法分析囚徒困境博弈 划线法例(二)博弈方博弈方2 2石头剪子布博弈方博弈方1 1石头(0,0)(1,1)(1,1)剪子(1,1)(0,0)(1,1)布(1,1)(1,1)(0,0)划线法分析划线法分析“石头石头剪子剪子布布”博弈博弈 划线法例(三)划线法分析性别之战博弈划线法分
7、析性别之战博弈 女女足球足球芭蕾芭蕾男男足球足球(2,1)(0,0)芭蕾芭蕾(0,0)(1,2)箭头法 n箭头法的基本分析思路 n对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加支付。如能,则从所分析的策略组合对应的得益数组引出一箭头,指向改变策略后策略组合对应的支付组合。那些没有箭头指出,只有箭头指入的支付组合对应的策略便是该博弈的稳定策略组合或结果。箭头法例(一)(5,5)(0,8)囚徒囚徒2 2坦白抵赖囚徒囚徒1 1坦白抵赖(8,0)(1,1)箭头法分析囚徒困境博弈箭头法分析囚徒困境博弈 箭头法例(二)(1,1)(1,1)猜硬币方猜硬币方猜正
8、面猜反面盖硬币方盖硬币方盖正面盖反面(1,1)(1,1)箭头法分析猜硬币博弈箭头法分析猜硬币博弈 箭头法例(三)猎人猎人IIII猎鹿猎兔猎人猎人I I猎鹿(2 2,2 2)(0,1)猎兔(1,0)(1 1,1 1)卢梭博弈卢梭博弈 生活中的博弈问题(一一)还钱问题还钱问题 A和和B都从我这里借走都从我这里借走200元钱,并且他们元钱,并且他们都向我承诺:只要另一个人还钱,自己也还钱。都向我承诺:只要另一个人还钱,自己也还钱。但是他们背地里结成了但是他们背地里结成了“还钱联盟还钱联盟”。即,。即,A和和B相互约定,谁也不会主动还钱。这个相互约定,谁也不会主动还钱。这个“联联盟盟”是稳定的吗?我如
9、何才能要回我的是稳定的吗?我如何才能要回我的400400元元钱?钱?生活中的博弈问题(二二)MM变心的博弈变心的博弈 前些时候前些时候,我的同学失恋了我的同学失恋了.我怎么劝他都没办法我怎么劝他都没办法,他说不甘心他说不甘心,就象刘德华的歌里唱的就象刘德华的歌里唱的,“,“好好的一份爱好好的一份爱,怎么会慢慢变坏?!怎么会慢慢变坏?!”呵呵呵呵.后来我用一个简单的后来我用一个简单的博弈帮他分析了一下博弈帮他分析了一下,希望他能看懂希望他能看懂?(可惜他不是学(可惜他不是学经济的,也不是经济的,也不是economic man)(我的同学有两种选择我的同学有两种选择,继续追继续追,还是放弃不追还是
10、放弃不追,追用追用P(pursue),不追用不追用DP(Do not Pursue)表示表示.而他的女友也有两个选择而他的女友也有两个选择,接受接受,A(accept),),和不接受和不接受DA(Do not accept)生活中的博弈问题(三三)中国中国彩电企业联盟彩电企业联盟 中国彩电企业经过数年的发展,其生产实力已经非常中国彩电企业经过数年的发展,其生产实力已经非常强大,世界产量前两位的彩电企业均在中国。中国家电市强大,世界产量前两位的彩电企业均在中国。中国家电市场竞争激烈,仅中国本土家电品牌有场竞争激烈,仅中国本土家电品牌有200200多家(还有众多的多家(还有众多的洋品牌),很多家电
11、企业产能严重过剩,库存积压严重,洋品牌),很多家电企业产能严重过剩,库存积压严重,为了生存,经常大打价格战,使得家电业利润微薄。在这为了生存,经常大打价格战,使得家电业利润微薄。在这种情况下种情况下,8,8家主要彩电巨头齐聚广州,组成家主要彩电巨头齐聚广州,组成“价格联盟价格联盟”,即约定谁都不首先降价,请分析这种即约定谁都不首先降价,请分析这种“联盟联盟”的稳定性。的稳定性。2.2 纳什均衡 通过划线法和箭头法找出的具有稳定性的策通过划线法和箭头法找出的具有稳定性的策略组合,不管是否唯一,都有一个共同的特性,略组合,不管是否唯一,都有一个共同的特性,就是其中就是其中每个博弈方每个博弈方的策略
12、都是针对其他博弈方的策略都是针对其他博弈方策略或策略组合的策略或策略组合的最佳对策最佳对策。实际上具有这种性。实际上具有这种性质的策略组合,正是非合作博弈理论中最重要的质的策略组合,正是非合作博弈理论中最重要的一个概念,即博弈中的一个概念,即博弈中的“纳什均衡纳什均衡”。2.2 纳什均衡1)博弈的策略式表示博弈的策略式表示2)纳什均衡的定义纳什均衡的定义3)纳什均衡的一致预测性质纳什均衡的一致预测性质4)纳什均衡与严格下策反复消去法纳什均衡与严格下策反复消去法博弈的策略式表示n博弈的策略式表示:博弈的策略式表示:111,(1,2,);21,2,;3,1,2,;4;,iijiinninSin s
13、Su inGSSuu 、博弈的参与人集合:、每个参与人的有一个策略空间,用 表示i的策略空间,表示i的第j个策略,j为有限或无限、每个参与人的得益函数它是策略的多元函数、用,代表n人博弈。无限博弈的表示n寡头产量博弈中,企业是参与人,产量是策略空间,利润是支付;战略式表述博弈为:个企业的产量和利润分别表示第和ilqqqlqqlqqGii),(),(;0,021221121有限博弈一般可以用矩阵形式表示40004000,4000400080008000,0 00 0,800080000 0,0 0不开发开发商A开发不开发开发开发商B需求需求大大的情况的情况-3000-3000,-3000-300
14、010001000,0 00 0,100010000 0,0 0不开发开发商B开发商A开发不开发开发需求需求小小的情况的情况纳什均衡n纳什均衡纳什均衡:在博弈在博弈 中,如果由各个博中,如果由各个博弈方各出一个策略组成的某个策略组合弈方各出一个策略组成的某个策略组合 中,任中,任一博弈方一博弈方 的策略的策略 ,都是对其余博弈方策略的组合,都是对其余博弈方策略的组合 的最佳对策,亦即对于任意的最佳对策,亦即对于任意 ,都,都成立:成立:则称则称 为博弈为博弈G的一个的一个“略纳什均衡略纳什均衡”。1212,;,nnGS SS u uu*12,ns ssi*is*1211,iins ssssij
15、isS*12111211,iiiiniii jinussssssussssss*12,ns ss纳什均衡的一致预测性质n所谓“一致预测性”指:如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,即博弈方没有偏离预测结果的愿望。n“一致”是指,各博弈方的实际行为选择与他们的预测一致,而不是不同博弈方的预测相同、无差异,因为有些博弈可能没有纳什均衡,而有些又有多个纳什均衡,而且无显著优劣。纳什均衡的一致预测性质n由纳什均衡的一致预测,可以得出以下性质:(1)各博弈方可以预测纳什均衡,可以预测他们的对手可以预测它,还可以预测他们
16、的对手预测自己会预测它 (2)预测任何非纳什均衡策略组合将是博弈最终结果,意味着至少一个博弈方要“犯错误”,包括对博弈结构理解错误,对其他博弈方策略预测错误,理性和计算能力有问题,或实施策略出错。纳什均衡与其他“稳定结果”n纳什均衡与画线法、箭头法的关系 画线法、箭头法用于求解有限博弈纳什均衡。n纳什均衡与上策均衡的关系 上策均衡比纳什均衡更强、更稳定。n纳什均衡与严格下策反复消去法 关系比较复杂纳什均衡与严格下策反复消去法n命题2.1 在n个博弈方的博弈中,如果是的一个纳什均衡,那么严格下策反复下去法一定不会将其消去n命题2.2 在n个博弈方的博弈中,如果严格下策反复下去法消去了除之外的所有策略组合,那么一定是该博弈的唯一纳什均衡。1212,;,nnGS SS u uu*12,nsss1212,;,nnGS SS u uu*12,nsss*12,nsss