完全信息静态博弈博弈论课件.ppt

上传人(卖家):晟晟文业 文档编号:4106955 上传时间:2022-11-11 格式:PPT 页数:118 大小:1.56MB
下载 相关 举报
完全信息静态博弈博弈论课件.ppt_第1页
第1页 / 共118页
完全信息静态博弈博弈论课件.ppt_第2页
第2页 / 共118页
完全信息静态博弈博弈论课件.ppt_第3页
第3页 / 共118页
完全信息静态博弈博弈论课件.ppt_第4页
第4页 / 共118页
完全信息静态博弈博弈论课件.ppt_第5页
第5页 / 共118页
点击查看更多>>
资源描述

1、第二章 完全信息静态博弈 本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。本章分六节2.1基本分析思路和方法2.2纳什均衡2.3无限策略博弈分析和反应函数2.4混合策略和混合策略纳什均衡2.5纳什均衡的存在性2.6纳什均衡的选择和分析方法扩展2.1 基本分析思路和方法2.1.1 上策均衡2.1.2 严格下策反复消去法2.1.3 划线法2.1.4 箭头

2、法2.1.1 上策均衡上策上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低价”。上策均衡上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果n上策均衡不是普遍存在的 2.1.2 严格下策反复消去法严格下策严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略严格下策反复消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中2.1.3 划线法1,01,30,10,

3、40,22,0-5,-50,-8-8,0-1,-1囚囚徒徒困困境境-1,11,-11,-1-1,1猜猜硬硬币币2,10,00,01,3夫夫妻妻之之争争2.1.4 箭头法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚囚徒徒困困境境-1,11,-11,-1-1,1猜猜硬硬币币2,10,00,01,3夫夫妻妻之之争争2.2 纳什均衡2.2.1 纳什均衡的定义2.2.2 纳什均衡的一致预测性质2.2.3 纳什均衡与严格下策反复消去法2.2.1 纳什均衡的定义n策略空间:n博弈方 的第 个策略:n博弈方 的得益:n博弈:纳什均衡纳什均衡:在博弈 中,如果由各个博弈方的各一个策

4、略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡nSS,1ijiSsiu,;,11nnuuSSG,;,11nnuuSSG),(*niss i),.,(*1*1*niiissss),.,(),.,(*1*1*1*1*1*1niijiiniiiisssssusssssuLLijiSs),(*nissGiijq策略型博弈的实例和解(性别战)例.性别战(battle of the sexes)一男一女恋爱,有些业余活动要安排,或者去看足球比赛,或者去看芭蕾舞演出。男的偏好足球,女的则更喜欢芭蕾舞,但他们都宁愿在一起,不

5、愿分开。下表给出收益矩阵:女足球芭蕾男足球2,10,0芭蕾0,01,2q策略型博弈的实例和解(性别战)例.性别战(battle of the sexes)这个博奕中有两个纳什均衡两个纳什均衡:(足球,足球)和(芭蕾,芭蕾)。就是说,一方去足球场,另一方也会去足球场;类似地,一方去看芭蕾,另一方也会去看芭蕾。在实际生活中,也许是这一次看足球,下一次看芭蕾,如此循环,形成一种默契。这在实际生活中是指,两种互补的活动应该配合,尽管配合的方式可能有很多种。比如,两家工厂生产的产品可能是互补的,一家为另一家提供零配件,这里有一个标准的选择问题,由于种种原因,很可能在产品标准的选择上,生产成品的厂家与生产

6、零配件的厂家之间有冲突。这就需要相互妥协,但妥协的结果有两种可能,或者是生产零配件的厂家适应生产成品的厂家,或者是生产成品的厂家适应于生产零配件的厂家。q策略型博弈的实例和解(性别战)例.性别战(battle of the sexes)博弈论和对策行为 q策略型博弈的实例和解(性别战)例.性别战(battle of the sexes)性别战的例子中有两个纳什均衡,那么,究竟那一个纳什均衡会实际发生?我们不知道。这里还有一个先动优势(first-mover advantage),比如说,若男的先买票,两人就会出现在足球场,若女的买票,两人就会出现在芭蕾舞剧院。博弈论和对策行为 q性别战在经济学

7、上的应用 下表是两个竞争企业是否推出新产品的利益矩阵。这个博奕中有两个纳什均衡:一家推出新产品,一家无新产品。推出新产品的企业赢利为10,无新产品的企业赢利为-5。究竟是企业1还是企业2赢利,要看是哪一家企业首先行动。假定企业1具有较高的研究和开发优势,率先在市场上推出新产品,那么企业2的最佳反应就是不跟进,因为跟进的损失是7,不跟进的损失只有5。企业2无新产品推出新产品企业1无新产品2,2-5,10推出新产品10,-5-7,-7p231 q最大最小策略(Max-min strategy)冯.诺依曼和摩根斯坦认为策略的选择与决策者的性格有关。某些决策者可能认为,冒失行动容易造成重大失误,最好还

8、是从最不利的情况出发,从最不利的情况出发,向最好的方向努力向最好的方向努力,力求做到有备无患。这样的决策者属于风险厌恶型的,他首先想到的是各种不利因素和风险,所以他先要考虑各种最坏的结果,然后从最坏结果中选出一个最好结果。按这种原则选取的策略可以称为最大最小策略。博弈论和对策行为 q最大最小策略(Max-min strategy)例:假如企业1的决策者是求稳型的,他会这样考虑:不管对方采取什么策略,我不推出新产品最少可以得到收益-5,推出新产品最少可以得到收益-7,比较这两种策略,还是不推出新产品为好。假如企业2的决策者也是风险厌恶型的,他也有同样的思维方式:先从无新产品的决策中找出最小收益-

9、5,再从有新产品的决策中找出最小收益-7,然后从两个最小收益中找最大收益为-5,相应的策略为无新产品。如果两家寡头企业的决策者都是这种风险厌恶型的,市场就没有新产品推出了。但是,(无新产品,无新产品)不是纳什均衡,所以,这种对策结构是不稳定的。博弈论和对策行为 q最大最小策略(Max-min strategy)按最大最小原则选择的策略是一种求稳型策略,它不保证利润最大化,却能保证风险最小化不保证利润最大化,却能保证风险最小化。在表11-2表示的企业价格博奕中,假如企业1按最大最小原则选择策略,它的最大最小策略是“价格不变”,企业2的最大最小策略也是“价格不变”。(价格不变,价格不变)正是纳什均

10、衡。【经典案例】豪泰林豪泰林(Hotelling)(Hotelling)价格竞争模型价格竞争模型(王则柯王则柯 第七章第七章 第六节第六节 P254)P254)政治观点、电视广告、水果摊政治观点、电视广告、水果摊夏季某海滨浴场有两个冰激凌销售商,冰激夏季某海滨浴场有两个冰激凌销售商,冰激凌是由同一个工厂供应(产品无差异),价凌是由同一个工厂供应(产品无差异),价格由厂家统一确定。那么消费者会就近购买。格由厂家统一确定。那么消费者会就近购买。问:两个销售商将选址何处?问:两个销售商将选址何处?“选址问题选址问题”一个关于选址的豪泰林一个关于选址的豪泰林(Hotelling)竞争模型竞争模型豪泰林

11、豪泰林(Hotelling)(Hotelling)价格竞争模价格竞争模型型标准式表述在该模型中,产品在物质形态上无差异,但在空间上处在该模型中,产品在物质形态上无差异,但在空间上处于不同的位置。于不同的位置。n令该线性城市的长度为令该线性城市的长度为1,消费者均匀地分布,消费者均匀地分布n在在0,1的区间里,分布密度为的区间里,分布密度为1;商店;商店1位于位于n0处,商店处,商店2位于位于1处。处。x为为0,1上的任意一点。上的任意一点。01商店商店1商店商店2xn1、参与人:商店、参与人:商店1与商店与商店2。他们分别。他们分别位于一线性城市的两端,出售同质的商位于一线性城市的两端,出售同

12、质的商品;品;n2、他们要决定的是各自商品的售价、他们要决定的是各自商品的售价pi,n Si=pj:pj0;案例 豪泰林(Hotelling)价格竞争模型3、他们的支付函数就是利润函数:、他们的支付函数就是利润函数:u1=D1p1-D1cu2=D2p2-D2c注:设两家商店商品的单位成本相同为注:设两家商店商品的单位成本相同为c。设消费者购买商品的单位旅行成本为设消费者购买商品的单位旅行成本为t,并且每个消,并且每个消费者都具有单位需求,即每个消费者只要认为费者都具有单位需求,即每个消费者只要认为价格价格“足够低足够低”就会(也仅仅)购买一个单位的就会(也仅仅)购买一个单位的商品,这意味着如果

13、商店商品,这意味着如果商店i的价格的价格“不太高不太高”,对,对商店商店i的需求等于发现从商店的需求等于发现从商店i购买更为便宜的顾购买更为便宜的顾客的数量。客的数量。案例 豪泰林(Hotelling)价格竞争模型住在住在x的消费者到商店的消费者到商店1购买的旅行成本是购买的旅行成本是tx,到商店到商店2购买的成本是购买的成本是t(1-x);如果住在;如果住在x的消费的消费者在两个商店之间购买的成本是无差异的,那者在两个商店之间购买的成本是无差异的,那么所有住在么所有住在x左边的消费者在商店左边的消费者在商店1购买,所有购买,所有住在住在x右边的消费者在商店右边的消费者在商店2购买,即有:购买

14、,即有:D1=x,D2=1-x。这里。这里x满足:满足:01商店商店1商店商店2x案例 豪泰林(Hotelling)价格竞争模型P1+tx=P2+t(1-x)x=(P2-P1+t)/2t 所以有需求函数:所以有需求函数:D1=x=(P2-P1+t)/2t ;D2=1-x=(P1-P2+t)/2t u1=D1p1-D1c=(p1-c)(P2-P1+t)/2t u2=D2p2-D2c=(p2-c)(P1-P2+t)/2t 案例 豪泰林(Hotelling)价格竞争模型U1和和u2分别对分别对P1和和p2求导令求导令为为0,得反应函数:,得反应函数:P1=R1(p2)=2p2-c-tP2=R2(p1

15、)=2p2-c-t解两个反应函数组成的方程组,得:解两个反应函数组成的方程组,得:p1*=p2*=c+tu1*=u2*=t/2商店的利润与消费者的旅行成本成正比。商店的利润与消费者的旅行成本成正比。更一般地讨论更一般地讨论案例 豪泰林(Hotelling)价格竞争模型对于对于Hotelling的价格竞争模型,可以一般地讨的价格竞争模型,可以一般地讨论两家商店位于论两家商店位于0,1区间内任意位置时的情区间内任意位置时的情形:形:01ab商店商店1商店商店2x案例 豪泰林(Hotelling)价格竞争模型若住在若住在x处的消费者到商店处的消费者到商店1与商店与商店2无差异,那无差异,那么有么有D

16、1=x,D2=1-x;x满足:满足:设旅行成本为设旅行成本为td2,d为消费者到商为消费者到商店的距离。店的距离。P1+t(x-a)2=P2+t(1-x-b)2x=a+(1-a-b)/2+(P2-P1)/2t(1-a-b)案例 豪泰林(Hotelling)价格竞争模型所以有需求函数:所以有需求函数:D1=x=a+(1-a-b)/2+(P2-P1)/2t(1-a-b)D2=1-x=b+(1-a-b)/2+(P1-P2)/2t(1-a-b)进一步可解得进一步可解得NE为:为:P1*(a,b)=c+t(1-a-b)(3+a-b)/3P2*(a,b)=c+t(1-a-b)(3+b-a)/3案例 豪泰林

17、(Hotelling)价格竞争模型当当a=0、b=0,即商店,即商店1位于位于0、商店、商店2位于位于1,P1*(0,1)=P2*(0,1)=c+t;当当a=1-b,即商店即商店1 1与商店与商店2 2同时位于线性城市的正中央同时位于线性城市的正中央,P1*(a,1-a)=P2*(a,1-a)=c。01ab商店商店1商店商店2x2.2.2 纳什均衡的一致预测性质一致预测一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果n只有纳什均衡才具有一致预测的

18、性质n一致预测性是纳什均衡的本质属性n一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能旅行者困境-做人不要太精明n哈佛大学巴罗教授:n两个旅行者从一个以生产细瓷花瓶闻名的地方旅行回来,在提取行李的时候,发现花瓶被摔坏了,就向航空公司索赔。航空公司知道花瓶的价格大概杂八、九十元,但不知道他们购买的确切价格。因此航空公司请两位旅客在100元以内写出花瓶的价格,如果两个人写得一样,就按照写的数额赔偿,如果不一样,原则上按照低的价格赔偿,并认为该旅客讲了真话,奖励2元,而讲假话的罚款2元。n这个博弈的最终结果将是什么?2.2.3 纳什均衡与严格下策反复消去法n上策均衡肯定是纳什均衡,

19、但纳什均衡不一定是上策均衡命题命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡命题命题2.2:在n个博弈方的博弈中 中,如果 是 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的),(*niss,;,11nnuuSSG),(*niss),(*niss,;,11nnuuSSGG2.3 无限策略分析和反应函数2.3.1 古诺的寡头模型2.3.2 反应函数2.3.3 伯特兰德寡头模型2.3.4 公共资源问题2.3.5 反应函数的问题和局限性2

20、.3.1 古诺的寡头模型基本模型 古诺模型中,两家公司,假设逆需求函数为P=a b Q假设成本函数相同,并且每单元成本不随生产的单元数变化。更正规一些,;生产数量Qi的成本为cQi(每家公司具有常数边际成本函数),其中c 0是常数边际成本,i=1,2。古诺-纳什均衡 n最大化利润的生产量 n公司1最优反应函数*121)(1QcQQbaMaxQbcaQbcaQbbQcaQR22221,0,2)(如果如果nq1=q2=a-c/3b Q2(a-c)/2b 0 R1 R2 Q1(a-c)/2b(a-c)/b(a-c)/b 卡特尔解 作为对比,如果两个公司如卡特尔那样地运作,即,如果它们对于它们的生产决

21、策进行协调,我们来计算它们将生产的产量,如果公司经营为卡特尔,可以合理地假设它们以最大化它们的联合利润或总利润这样的方式来设置生产目标。预先指定生产“配额”为Q1与Q2;它们的选择是使得总利润最大化:QcbQabcaQ2每家公司的价格每家公司的生产数量利润注意到如果公司如卡特尔那样经营,它们比起在纳什均衡里的产量生产得少一些;卡特尔的产量是古诺特-纳什均衡产量水平的75%。在纳什均衡中,两家公司比起它们象卡特尔那样经营来利润较低(因为在纳什均衡里,它们过度地生产)。bca42ca bca8)(2案例:寡头产量竞争以两厂商产量竞争为例QQPPqqQ8)(21121111112)(8)(qqqqq

22、cQPqu212116qqqq221 cc221222222)(8)(qqqqqcQPqu222126qqqqQQPPqqQ8)(21121111112)(8)(qqqqqcQPqu212116qqqq221 cc221222222)(8)(qqqqqcQPqu222126qqqq以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.54.5,4.55,3.753.75,54,4不突破突破厂商厂商2不突破 突破厂厂商商1以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5两寡头间

23、的囚徒困境博弈该古诺模型的反应函数)6()()6()()6max(max1211222212112121111qqRqqqRqqqqquq1q(3,0)(6,0)(0,3)(0,6)2q)(21qR)(12qR古诺模型的反应函数图示理性局限和古诺调整2.3.3 伯特兰德寡头模型n价格竞争寡头的博弈模型价格竞争寡头的博弈模型n产品无差别,消费者对价格不十分敏感产品无差别,消费者对价格不十分敏感2.3.3 伯特兰德寡头模型n价格竞争寡头的博弈模型价格竞争寡头的博弈模型n产品有差别,消费者对价格不十分敏感产品有差别,消费者对价格不十分敏感122222122211112111),(),(PdPbaPP

24、qqPdPbaPPqq2.3.3 伯特兰德寡头模型n价格竞争寡头的博弈模型价格竞争寡头的博弈模型n产品无差别,消费者对价格不十分敏感产品无差别,消费者对价格不十分敏感122222122211112111),(),(PdPbaPPqqPdPbaPPqq11111112111)(),(qcPqcqPPPuu22222222122)(),(qcPqcqPPPuu)(2111111PdPbacP)(1222222PdPbacP2.3.3 伯特兰德寡头模型n价格竞争寡头的博弈模型价格竞争寡头的博弈模型n产品无差别,消费者对价格不十分敏感产品无差别,消费者对价格不十分敏感12222212221111211

25、1),(),(PdPbaPPqqPdPbaPPqq11111112111)(),(qcPqcqPPPuu22222222122)(),(qcPqcqPPPuu)(2111111PdPbacP)(1222222PdPbacP)(21)(21*122222*2*211111*1PdcbabPPdcbabP2.3.4公共草地养羊问题(公共资源问题)有三个农户,养羊分别为,q1,q2,q3.各农户养羊边际成本 c=4有三个农户,养羊分别为,q1,q2,q3.各农户养羊边际成本 c=4321,100)(qqqQQQVVV:每只羊的价格:每只羊的价格323211212148),(qqqqRq3131222

26、12148),(qqqqRq212133212148),(qqqqRq17287257624*3*2*1*3*2*1uQuuuqqqQQQQu964)100(1728576323047224348uQ合作:总体利益最大化合作:总体利益最大化有三个农户,养羊分别为,q1,q2,q3.各农户养羊边际成本 c=42.3.4公共草地养羊问题一般化(公共资源问题))(1QVVqqQncqQVquiii)(2.4 混合策略和混合策略纳什均衡2.4.1 严格竞争博弈和混合策略的引进2.4.2 多重均衡博弈和混合策略2.4.3 混合策略和严格下策反复消去法2.4.4 混合策略反应函数2.4.1 严格竞争博弈和

27、混合策略的引进一、猜硬币博弈-1,11,-11,-1-1,1正 面反 面猜硬币方猜硬币方盖盖硬硬币币方方正 面反 面(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念这类博弈很多,引出混合策略纳什均衡概念二、混合策略、混合策略博弈 和混合策略纳什均衡 混合策略混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。

28、混合策略纳什均衡混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。,;,11nnuuSSGi,1ikiissSki),(1ikiippp10ijpkj,111ikipp课堂练习求出下面博弈的纳什均衡求出下面博弈的纳什均衡(含纯策略和混合策略含纯策略和混合策略)。乙乙L LR R甲甲U U5 5,0,00,0,8 8D D2,2,6 64 4,5,5三、一个例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析5213BABApppp1352DCDCpppp博弈方1的混合策略博弈方2的混合策略2,35,23,11,5CDAB博弈方博弈方2博博弈弈方方1 策略 得益博弈方1 (0.8,0.2)

29、2.6博弈方2 (0.8,0.2)2.6四、齐威王田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田田 忌忌齐齐威威王王得益矩阵五、悖论1:小偷和守卫的博弈 小偷与守卫的博弈小偷与守卫的博弈 由于对博弈论有卓越贡献而成为1994年诺贝尔经济学奖获得者的泽尔顿教授,1996年3月

30、在上海的一次演讲中,举了这个小偷与守卫之间博弈的例子。故事的背景是这样的:一守卫看守一个仓库,一小偷要在夜晚去偷仓库的东西。但是守卫有可能晚上睡觉也可能不睡,如果守卫睡觉,小偷偷窃就会成功,他将获得正效用V,而守卫由于失职,他将获得负效用D;而守卫如果不睡,守卫能抓住小偷,小偷将获得负效用P;而小偷也有可能不去偷,那样守卫如果睡觉,他获得正效用S。例例2.3.3 小偷与守卫的博弈小偷与守卫的博弈(续续)所以守卫有睡和不睡两种策略选择,小偷也有偷和不偷所以守卫有睡和不睡两种策略选择,小偷也有偷和不偷两种策略选择,他们的收益矩阵如下:两种策略选择,他们的收益矩阵如下:表表2.3.1 小偷与守卫的收

31、益矩阵小偷与守卫的收益矩阵 例例2.3.3 小偷与守卫的博弈小偷与守卫的博弈(续续)在该例中,显然不存在占优策略,则按本节介绍的方在该例中,显然不存在占优策略,则按本节介绍的方法来求纳什均衡。法来求纳什均衡。例例2.3.3 小偷与守卫的博弈小偷与守卫的博弈(续续)n设Pg 为守卫睡的概率n Pt为小偷偷的概率 小偷与守卫的博弈(续)小偷与守卫的博弈(续)可在上图中分别作出(可在上图中分别作出(2.3.272.3.27)和()和(2.3.282.3.28)折线。同时满足()折线。同时满足(2.3.272.3.27)和)和(2.3.282.3.28)的点对只有唯一点)的点对只有唯一点N N。于是,

32、我们得到一个混合策略的纳什均衡。于是,我们得到一个混合策略的纳什均衡点点 。小偷将以小偷将以 的概率偷,以的概率偷,以 的概率不偷;守卫以的概率不偷;守卫以 的概率去睡觉,的概率去睡觉,以以 的概率不睡觉。也就是说,小偷去偷与否和守卫得到的效用有关,的概率不睡觉。也就是说,小偷去偷与否和守卫得到的效用有关,守卫睡觉与否和小偷得到的效用有关。比如说,如果小偷偷窃成功得到的效守卫睡觉与否和小偷得到的效用有关。比如说,如果小偷偷窃成功得到的效用用V V越大,间接说明仓库储藏的物品越重要,守卫越不去睡觉。其它情况可以越大,间接说明仓库储藏的物品越重要,守卫越不去睡觉。其它情况可以类似分析。类似分析。(

33、,),(,)SDPVSD SDVP VPSSDDSDPVPVVPV,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒0-P-P小偷得益(偷)VPg 守卫睡的概率1V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对守卫的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概略0-D-D守卫得益(睡)SPt 小偷偷的概率1悖论2n 法学有时是一个悖论。例如,为了限制与毒品相关的犯罪,维护正常的经济秩序,立法者决定严厉打击贩毒、吸毒,这是否就能抑制与毒品相关的犯罪(这里

34、所说的与毒品相关的犯罪是指为获得吸毒资金而采取的偷盗、抢劫、绑架等行为)呢?答案刚好相反。打击贩毒无形间提高了毒犯贩毒的机会成本。所谓机会成本是指人们为了获取某样东西而不得不放弃的东西。犯罪分子贩毒的机会成本可能是自由或生命。于是毒品市场上毒品的供给会因贩毒者心理的恐惧而减少,与此相反毒品的价格会大幅上升。瘾君子们为了获得毒品,不得不更多地冒险去用犯罪的手段获得金钱,这样与毒品相关的犯罪反而会日益猖獗,因为法学的思想不能解释毒品是没有弹性的商品,瘾君子一旦身陷其中,便难以自拔。毒品不像水果那样,价格贵的时候大家就先不吃,等价格降下来再吃。无论毒品价格多高,毒品的需求量变动都不大,而价格升高必然

35、使本来囊中羞涩的瘾君子“另谋它路”。2.4.2 多重均衡博弈和混合策略一、夫妻之争的混合策略纳什均衡2,10,00,01,3时 装足 球时装足球丈丈 夫夫妻妻子子夫妻之争夫妻之争3)(0)(0)(1)(FpCpFpCpwwww1)(0)(0)(2)(FpCpFpCphhhh妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡 策略 得益博弈方1 (0.75,0.25)0.67博弈方2 (1/3,2/3)0.75二、制式问题1,30,00,02,2ABAB厂商厂商2厂厂商商1制式问题制式问题 制式问题混合策略纳什均衡 A B 得益厂商1:0.4 0.6 0.664厂商2:0.67 0.33

36、 1.296三、市场机会博弈-50,-50100,00,1000,0进不 进进不进厂商厂商2厂厂商商1市场机会市场机会 进 不进 得益厂商1:2/3 1/3 0厂商2:2/3 1/3 02.4.4 混合策略反应函数(法)P84-1,11,-11,-1-1,1正 面反 面猜硬币方猜硬币方正面反面猜硬币博弈猜硬币博弈盖盖硬硬币币方方ABEUA=-1,11,-11,-1-1,1正 面反 面猜硬币方猜硬币方正面反面猜硬币博弈猜硬币博弈盖盖硬硬币币方方ABEUA=1 p q+(-1)p(1-q)+(-1)(1-p)q+1(1-p)(1-q)1,-1-1,1-1,11,-1正 面反 面猜硬币方猜硬币方正面

37、反面猜硬币博弈猜硬币博弈盖盖硬硬币币方方ABEUA=1 p q+(-1)p(1-q)+(-1)(1-p)q+1(1-p)(1-q)=p q-p+p q-q+p q+1-p-q+p q =4 p q-2 p-2 q+1 =2 p(2 q-1)+(1-2 q),EUA=2 p(2 q-1)+(1-2 q)1,if q 1/2,p=0,if q 1/2,q=1,if p 1/2,q=1,if p 13c1时,时,A A将将增加增加r,r,如果如果3c13c2/3r2/3时,时,B B增加增加c c将增加收益;当将增加收益;当r2/3r10,000,则该笔钱就没收。n问该博弈的纳什均衡是什么?城市博弈

38、:聚点均衡的例子城市博弈:聚点均衡的例子n这四个城市是:这四个城市是:n上海、长春、哈尔滨、南京上海、长春、哈尔滨、南京四、相关均衡5,14,40,01,5LR博弈方博弈方2UD博博弈弈方方1相关均衡例子相关均衡例子三个纳什均衡三个纳什均衡:(U,L)、(D,R)和混合策略均衡(1/2,1/2),(1/2,1/2)结果都不理想,不如(D,L)。可利用聚点均衡(天气,抛硬天气,抛硬币)币),但仍不理想。相关装置:1、各1/3概率A、B、C2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。相关均衡要点:1、构成纳什均衡2、有人忽略不造成问题一、多

39、人博弈中的共谋问题本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B)前者帕累托优于后者。博弈的结果会是什么呢?(U,L,A)有共谋(Coalition)问题:博弈方1和2同时偏离。0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3B2.6.2 共谋和防共谋均衡二、防共谋均衡 如果一个博弈的某个策略组合满足下列要求:(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;(2)给定选择偏离的博弈方有再次偏离的自由时

40、,没有任何两个博弈方的串通会改变博弈的结果;(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。称为“防共谋均衡”。前面例子中:(D,R,B)是防共谋均衡 (U,L,A)不是防共谋均衡nend练习:n1、假设双头垄断企业的成本函数分别为:,市场需求曲线为,为,n n其中,其中,。n求出古诺(Cournot)均衡情况下的产量、价格和利润。1120QC 2222QC QP240021QQQ2.画出夫妻之争博弈混合策略反应函数曲线.2,10,00,01,3时装足球丈夫丈夫时装足球妻妻子子夫妻之争夫妻之争2.夫妻之争博弈混合策略反应函数曲线.2,10,00,01,3时装足球丈夫丈夫时装足球

41、妻妻子子夫妻之争夫妻之争rq111/31/3(r,1-r):丈夫的混合策略概率分布(q,1-q):妻子的混合策略概率分布)(2rRq)(1rRr 小偷与守卫的博弈(续)小偷与守卫的博弈(续)由由 得得 (2.3.27)由由 得得 (2.3.28),QadbcVP qdbPqQyxqQyxqQyx,1,10,00,RadbcSDrdcS 0,01,1,yRxryRxryRxr图图2.3.3 小偷与守卫的纳什均衡点小偷与守卫的纳什均衡点 2.4.3 混合策略和严格下策反复消去法3,10,20,23,31,31,1LRUMD博弈方博弈方2博博弈弈方方12.4.3 混合策略和严格下策反复消去法3,10,20,23,31,31,1LRUMD博弈方博弈方2博博弈弈方方123212111003eu23212111030eu博弈方2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用纯策略R时,博弈方1采用混合策略(1/2,1/2,0)的得益

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(完全信息静态博弈博弈论课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|