博弈论及其在经济管理中的应用课件.ppt

上传人(卖家):晟晟文业 文档编号:3898815 上传时间:2022-10-23 格式:PPT 页数:61 大小:627.81KB
下载 相关 举报
博弈论及其在经济管理中的应用课件.ppt_第1页
第1页 / 共61页
博弈论及其在经济管理中的应用课件.ppt_第2页
第2页 / 共61页
博弈论及其在经济管理中的应用课件.ppt_第3页
第3页 / 共61页
博弈论及其在经济管理中的应用课件.ppt_第4页
第4页 / 共61页
博弈论及其在经济管理中的应用课件.ppt_第5页
第5页 / 共61页
点击查看更多>>
资源描述

1、博弈论及其在经济管理中的应用博弈论及其在经济管理中的应用 教学课件10/23/20221第2章 纳什均衡 本章分析博弈论的解。所谓 本章考虑的是:首先,局中人同时选择行动,然后根据局中人的选择,每个局中人得到各自的得益(一定的收益或支出)。在这类静态(或同时行动)博弈中,我们的分析只局限于完全信息博弈,即对所有局中人,每个局中人的得益函数(该函数决定了局中人从选择的行动组合中得到的得益)是共同知识。10/23/20222本章分3节u2.1 囚徒困境与占优均衡 u2.2 纳什均衡 u2.3 混合战略 10/23/202232.1囚徒困境与占优均衡 2.1.1 囚徒困境囚徒困境 2.1.2 重复剔

2、除严格劣策略和占优均重复剔除严格劣策略和占优均衡衡10/23/20224-5,-50,-8-8,0-1,-1沉默招供沉默招供两个两个囚徒囚徒的得益矩阵的得益矩阵囚徒囚徒2囚徒囚徒1囚徒1:招供囚徒2:招供囚徒困境的标准型表述囚徒困境的标准型表述:-5,-50,-8-8,0-5,-50,-8-6,-60,-9-1,-1-9,02.1.1囚徒困境10/23/20225解博弈的第一个方法就是划线法划线法 在两人博弈中,我们首先给定一个局中人的选择,考察另一个局中人的最优策略选择,在其最优策略选择的得益数字下面划一横线。然后,在给定另一个局中人的策略选择,看看前一个局中人的最优策略选择,在其最优策略选

3、择的得益数字下面划一横线。两个囚徒的得益矩阵两个囚徒的得益矩阵-6,-60,-9-9,0-1,-1囚徒囚徒2招供沉默招供沉默囚徒囚徒1根据划线法对囚徒困境得根据划线法对囚徒困境得益矩阵解得的博弈如右图益矩阵解得的博弈如右图所示所示10/23/20226囚徒困境-6,-60,-9-9,0-1,-1囚徒A囚徒 B坦白抵赖坦白抵赖-8大于-100大于-1-8大于-100大于-1抵赖是A的严格劣战略抵赖是B的严格劣战略10/23/20227n含义:囚徒困境反应了一个很深刻的问题,即个人理性与集体理性之间的矛盾。显然,如果每个人都选择沉默抵赖,各判刑一年,比都判刑6年要好。不过,这个帕累托改进做不到,因

4、为它不满足个人理性的要求,(沉默,沉默)不是一个均衡。10/23/202282.1.2 重复剔除严格劣策略和占优均衡n占优策略(占优策略(dominant strategy):):在囚徒困境中,我们发现,一个局中人的最优策略选择不依赖另一个局中人的策略选择,即无论其他局中人选择什么策略,他的最优策略是唯一的(在囚徒困境中,如果双变量矩阵中的得益的具体数字0,-1,-6,-9换成任意的T、R、P、S,只要满足T R P S,上述结论依然成立),我们把这样的最优策略称为“占优策略”(dominant strategy)。在这里,招供是两个嫌疑犯的占优策略。10/23/20229占优战略均衡(Dom

5、inant-Strategy)n占优策略:不论其他人选择什么战略,参与人的最优战略是唯一的,这样的最优战略称为“占优策略”(dominant strategy)。被称为劣策略对应的,所有向量。所有参与人的策略组成之外的表示由除,(优策略,个参与人的(严格)占是第*,111*),()(),iiiiiiiiiiniiiissssssussuisssssis10/23/202210n占优策略均衡n定义:在博弈的策略表达式中,如果对于所有的i,Si*是i的占优策略,下列策略组合称为占优策略均衡:),(*1*nsss10/23/202211定义定义2.1严格劣策略严格劣策略:在标准型博弈GS1,Sn;u

6、1,un中,令si和si代表局中人i的两个可行策略(即是Si中的元素)。如果对其他局中人每一个可能的策略组合,i选择si的收益都小于其选择si的收益,则称策略si相对于策略si是严格劣策略:对其他局中人在其策略空间S1,S i1,,Sn中每一组可能的策略(s1,si1,,sn)都成立。),(),(11111niiiiniisssssusssu 10/23/202212 5,14,49,-10,0等待小猪大猪按等待按案例:智猪博弈等待是小猪的严格占优策略大猪有无严格占优策略?4大于10大于-110/23/202213重复剔除严格劣策略博弈的例子重复剔除严格劣策略博弈的例子:局中人局中人左中右上,

7、1,2 0,1 下0,2 2,0 0 局中人局中人左右上,下,局中人局中人左右下,剔除顺序由箭头所示剔除顺序由箭头所示10/23/202214定义定义2.2占优均衡:占优均衡:在标准型博弈GS1,Sn;u1,un中,如果对于所有的i,si是局中人i的占优策略,那么,策略组合s=(s1,sn)称为占优均衡(dominantstrategy equilibrium)。如果它是重复剔除严格劣策略后剩下的策略组合,策略组合s=(s1,sn)称为重复剔除的占优均衡。如果这种唯一的策略组合是存在的,我们就说该博弈是重复剔除占优可解的。10/23/202215重复剔除的占优均衡(Iterated Elimi

8、nation of Strictly Dominated Strategies)1,01,20,30,1M列先生行先生UDL0,12,0R行:没有占优策略列:M严格优于R剔除 R行:L优于D列:无占优策略剔除 DM优于L(U,M)是重复剔除的占优均衡10/23/202216n练习:在下列策略式表达中,找出重复剔除的占优均衡4,35,16,22,18,43,63,09,62,8C2R1R2C1C3R310/23/202217u重复剔除严格劣策略过程建立在理性局中人不会选择严格劣策略这一合情合理的原则之上,每一步剔除都需要局中人间相互了解的更进一步假定,如果我们要把这一过程应用到任意多步,就需要假

9、定“局中人是理性的”是共同知识。u重复剔除严格劣策略的第二个缺陷在于这一方法对博弈结果的预测经常是不准确的。左中上0,44,0中4,00,4下3,53,510/23/2022182.2纳什均衡 2.2.1 纳什均衡的定义2.2.2 纳什均衡的性质 10/23/202219u纳什均衡概念是现代博弈论的核心概念。它是以美国数学家、经济学家纳什(Nash)的名字命名的,纳什在1950年的一篇论文中提出了纳什均衡的概念。10/23/202220纳什均衡(Nash Equilibrium)n通俗地说,纳什均衡的含义就是:n给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即双

10、方在给定的策略下不愿意调整自己的策略。10/23/2022212.2.1 纳什均衡的定义n策略空间:n局中人 的第 个策略:n局中人 的得益:n博弈:纳什均衡纳什均衡:在n个局中人标准型博弈 中,如果由各个局中人的各一个策略组成的某个策略组合 中,任一局中人 的策略,都是对其余局中人策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡nSS,1ijiSsiu,;,11nnuuSSG,;,11nnuuSSG),(*niss i),.,(*1*1*niiissss),.,(),.,(*1*1*1*1*niijiiiniiiiisssssusssssuijiSs),(*nissGi

11、ij10/23/202222例例1 根据划线法得出纳什均衡根据划线法得出纳什均衡下中上6,65,35,3右中4,00,43,53,54,00,4左 如果在一对策略中,每一局中人的策略都是对方策略的最优反应策略,则这对策略满足不等式的条件(亦即双变量矩阵相应单元的两个收益值下面都被划了横线)。这样,(下,右)是惟一一对满足纳什均衡的策略组合。10/23/202223n寻找纳什均衡0,44,05,34,00,45,33,53,56,6C2R1R2C1C3R3参与人B参与人A(R3,C3)是纳什均衡是纳什均衡10/23/202224n练习:n找出下列两队夫妻的纳什均衡2 2,2 2-6-6,0 00

12、 0,-6-60 0,0 0死了恩爱夫妻活着死了活着0 0,0 06 6,0 00 0,6 60 0,0 0死了妻子相互仇恨夫妻活着死了活着妻子丈夫丈夫10/23/202225n市场进入阻挠40,50-10,00,3000,300斗争在位者进入者进入不进入默许纳什均衡:进入,默许;不进入,斗争用重复剔除弱劣策略的方法找均衡10/23/2022262.2.2 纳什均衡的性质纳什均衡与占优均衡的关系纳什均衡与占优均衡的关系 命题2.1:在有n个局中人的标准型博弈GS1,Sn;u1,un中,如果重复剔除严格劣策略剔除除策略组合s1*,,sn*外的所有策略,那么这一策略组合为该博弈的惟一纳什均衡,反之

13、则不一定。即纳什均衡一定是重复剔除严格劣策略的过程完成后没有被剔除的策略组合,但没有被剔除的策略组合不一定是纳什均衡,除非它是唯一的。10/23/202227纳什均衡与严格剔除劣战略n占优均衡肯定是纳什均衡,但纳什均衡不一定是占优均衡n在n个博弈方的博弈 中,如果严格剔除劣战略排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡n在n个博弈方的博弈中 中,如果 是 的一个纳什均衡,那么严格剔除劣策略一定不会将它剔除 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的),(*niss,;,11nnuuSSG),(*niss),(*niss,;,11nnuu

14、SSGG10/23/202228不同均衡概念的关系占优均衡DSE重复剔除占优均衡IEDE纯战略纳什均衡PNE10/23/202229纳什均衡的存在性纳什均衡的存在性 命题2.2:在n个局中人的标准型博弈GS1,Sn;u1,un中,如果n是有限的,且对每个i,Si是有限的,则博弈存在至少一个纳什均衡,均衡可能包含混合策略。10/23/202230纳什均衡的多重性-5,-5-10,88,-1010,10芭蕾足球小红小红芭蕾足球小小张张情侣博弈情侣博弈例2-在此情侣博弈中 有两个均衡:(芭蕾,芭蕾)和(足球,足球)都是纳什均衡 例3-市场进入博弈 这个博弈也有两个纳什均衡:(进入,默许)和(不进入,

15、斗争)40,500,300-10,00,300默许斗争在位者在位者默许斗争进进入入者者市场进入博弈市场进入博弈10/23/2022312.3 混合策略n2.3.1 混合策略的含义混合策略的含义n2.3.2 纳什均衡的扩展纳什均衡的扩展10/23/202232n社会福利博弈 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作没有一个战略组合构成纳什均衡10/23/202233 1-1,-11,-11,1-1,反面正面反面正面猜谜游戏v两个儿童各拿一枚硬币,v若同时正面朝上或朝下,A给B 1分钱,v若只有一面朝上,B给A 1分钱。零和博弈博弈参与者有输有赢,但结果永远是0。没有一个战略组

16、合构成纳什均衡10/23/202234n警察与小偷银行酒馆警察小偷2万元1万元东边西边警察与小偷的最优策略各是什么?10/23/202235n上述博弈的特征是:n在这类博弈中,都不存在纯纳什均衡。n参与人的支付取决于其他参与人的战略;以某种概率分布随机地选择不同的行动n每个参与人都想猜透对方的战略,而每个参与人又不愿意让对方猜透自己的战略。这种博弈的类型是什么?如何找到均衡?10/23/202236n请举一些这样的例子:石头、剪子、布游戏老虎、杠子、鸡、虫子游戏扑克游戏橄榄球赛战争中10/23/202237u策略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,

17、是参与人的“相机行动方案”。纯策略:如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动,该战略为纯策略。混合策略:如果一个策略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动,则该策略为混合策略。纯策略可以理解为混合策略的特例,即在诸多策略中,选该纯策略si的概率为1,选其他纯策略的概率为0。10/23/2022382.3.1 混合策略的含义混合策略的含义混合策略的含义假设局中人i有K个纯策略:Si=sil,sik,则局中人i的一个混合策略是一个概率分布(Pil,Pik),其中Pik表示对所有k=1,,K,局中人i选择策略sik的概率,由于pik是一个概率,对所有k

18、=1,K,有0pik1且Pil+Pik=1。我们用Pi表示基于Si的任意一个混合策略,其中包含了选择每一个纯策略的概率,正如我们用si表示Si内任意一个纯策略一样。定义定义2.4混合策略混合策略:对标准型博弈G=S1,,Sn;u1,un,假设Si=sil,,sik。那么,局中人i的一个混合策略为概率分布pi=(pil,pik),其中对所有k=1,,K,0Pik1,且pil+pik=1。10/23/202239 1-1,-11,-22,2-2,西边东边西边东边警察抽签决定去银行还是酒馆,2/3的机会去银行,1/3的机会去酒馆;同样,小偷也抽签决定去银行还是酒馆,2/3的机会去酒馆,1/3的机会去

19、银行。10/23/202240n社会福利博弈 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作设:政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的期望效用:1/22+1/2 1=1.5 流浪的期望效用:1/23+1/2 0=1.5因此,流浪汉的任何一种战略都是都是对政府混合战略的最优反应10/23/202241n社会福利博弈 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作设:政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的概率:流浪汉:寻找工作的概率:0.2;流浪的概率:;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战

20、略10/23/202242 1-1,-11,-11,1-1,反面正面反面正面猜谜游戏v两个小孩的最优策略是采取每个策略的可能性均为1/2;v每个小孩各取策略的1/2是纳什均衡。零和博弈10/23/202243猜硬币博弈-1,11,-11,-1-1,1正 面反 面猜硬币方猜硬币方盖盖硬硬币币方方正 面反 面猜硬币博弈一个非常突出的特点猜硬币博弈一个非常突出的特点每个局中人都试图能先猜中对方的策略每个局中人都试图能先猜中对方的策略 10/23/2022442.3.2 纳什均衡的扩展猜硬币博弈严格竞争博弈和混合策略的引进-1,11,-11,-1-1,1正 面反 面猜硬币方猜硬币方盖盖硬硬币币方方正

21、面反 面(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念这类博弈很多,引出混合策略纳什均衡概念10/23/202245扩展的纳什均衡的正式定义 如果局中人1推断局中人2将以(P21,P2k)的概率选择策略(s21,s2k),则局中人1选择纯策略s1j的期望收益为:(2.1)且局中人1选择混合策略p1(p11,p1J)的期望收益为:(2.2)其中,这p1jp2k表示局中人1选择s1j且局中人2选择s2k的概率。Kkjjkssup12112,JjJjKkkjkjKkkjkjssuppssuppppv11 121121121121211,

22、10/23/202246如何寻找混合策略纳什均衡?n支付最大化法n支付等值法n由于混合战略伴随的是支付的不确定性,因此参与人关心的是其期望效用。n最优混合策略:是指使期望效用函数最大的混合战略(给定对方的混合战略)n在两人博弈里,混合策略纳什均衡是两个参与人的最优混合策略的组合。10/23/202247 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作2.00151510111311*故化的一阶条件:求微分,得到政府最优)()()()(),(:政府的期望效用函数为)。,(流浪汉的混合战略是);,(假定政府的混合战略是GLGLGvv即:流浪汉以0.2的概率选择寻找工作,0.8的概率选

23、择游荡同样,可以根据流浪汉的期望效用函数找到政府的最优混合战略。?支付最大化法10/23/202248n社会福利博弈 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作设:政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的概率:0.2;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战略10/23/202249n假定最优混合战略存在,给定流浪汉选择混合战略,n政府选择纯战略救济的期望效用为:n选择纯战略不救济的效用为:n如果一个混合战略(而不是纯战略)是政府的最优选择,一定意味着政府在救济与不救济之间是无差异的。)1,(23,3-1,1-1,00,流浪流浪

24、汉政府救济不救济寻找工作支付等值法14)1)(1(3)1(010.2 1410/23/202250n社会福利博弈 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作设:政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的概率:0.2;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战略10/23/202251n对 的解释:如果流浪汉以找工作的概率小于0.2,则政府选择不救济,如果大于0.2,政府选择救济,只有当概率等于0.2时,政府才会选择混合战略或任何纯战略.n对*=0.5的解释:如果政府救济的概率大于0.5,流浪汉的最优选择是流浪,如果政府救济的概率小于

25、0.5,流浪汉的最优选择是寻找工作.2.0*10/23/202252n混合战略纳什均衡的含义:n纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利博弈中,*=0.5是唯一的混合战略纳什均衡。n从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于0.2,那么政府的唯一最优选择是纯战略:不救济;n如果政府以1的概率选择不救济,流浪汉的最优选择是寻找工作,这又将导致政府选择救济的战略,流浪汉则选择游荡。如此等等。2.0*10/23/202253流浪汉寻找工作的概率小于0.2政府概率为1:不救济流浪汉寻找工作政府救济10/23/202254n扩展的纳什均衡的正式定义扩

26、展的纳什均衡的正式定义:n定义定义2.5:在两个局中人标准型博弈G=S1,S2;u1,u2中,混合策略(p1*,p2*)是纳什均衡的充要条件为:每一局中人的混合策略是另一局中人混合策略的最优反应,即(2.4)和(2.5)必须同时成立。10/23/202255n练习:模型化下述划拳博弈:n两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降虎鸡,虎吃鸡,鸡吃虫子,虫子降杠子,两人同时出令。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,这个博弈有纯策略均衡吗?计算其混合战略纳什均衡。10/23/202256不同均衡概念的关系占

27、优均衡DSE重复剔除占优均衡IEDE纯战略纳什均衡PNE混合战略纳什均衡MNE10/23/202257总结:求解一个博弈的一般的思路n在任何一个博弈中,每个局中人决策的根本原则是最大化自己的效用(或得益)。由于一个局中人的得益不仅取决于自己所选择的策略,还决定于其他局中人所选择的策略,因此,每个局中人在决策时必须考虑其他局中人的存在和他们的反应。据此,一个局中人能够做的是针对其他局中人的每种策略(在多个局中人参加的博弈中,则是他们的每种策略组合),找出自己的最佳对策,即自己所有的可选择策略中与其他局中人的该种策略或策略组合配合使自己得益(效用)最大的一种策略(有时可能有几种)。10/23/20

28、22582.4 习 题1占优均衡、重复剔除劣策略占优均衡和纳什均衡相互之间的关系是什么?2求解如图1所示的策略式博弈的纯策略纳什均衡。1,3 4,1 1,3 4,1 L R U D 参与人 2 参与人 1 5,6 4,1 2,5 6,2 L R U D 参与人 2 参与人 1(a)(b)10/23/2022593试用重复剔除劣策略的方法求解如图2所示的策略型博弈的纯策略纳什均衡。n4在如图3所示的策略式博弈中,当a,b,c之间满足什么条件时,该博弈:n(1)存在占优策略纳什均衡;n(2)存在重复剔除的占优策略纳什均衡;n(3)存在纯策略纳什均衡;n(4)存在混合策略纳什均衡。1,0 0,1 L

29、 R U D 参与人 2 参与人 1(a)(b)2,0 2,1 1,2 1,1 1,0 2,1 0,2 M M 4,4 2,5 L R U D 参与人 2 参与人 1 3,0 3,3 5,2 2,3 5,0 4,6 3,5 M M 0,0 c,a a,c b,b M R M R 参 与 人 2 参 与 人 1(a)10/23/2022605考察“智猪博弈”猪圈里圈养两头猪,一头大猪、一头小猪。猪圈的一端有一个猪食槽,另一头安装一个按钮,控制着猪食的供应,按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就需要付出2个单位的成本且比对方晚到食槽。若大猪先到食槽,大猪吃9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。(1)试给出上述博弈的策略式描述(2)求解该博弈的纳什均衡;(3)试用上述博弈模型解释为什么在市场上只有大 企业才会花钱打广告。10/23/202261

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(博弈论及其在经济管理中的应用课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|