第一章:完全信息静态博弈课件.ppt

上传人(卖家):晟晟文业 文档编号:4107455 上传时间:2022-11-11 格式:PPT 页数:74 大小:406.01KB
下载 相关 举报
第一章:完全信息静态博弈课件.ppt_第1页
第1页 / 共74页
第一章:完全信息静态博弈课件.ppt_第2页
第2页 / 共74页
第一章:完全信息静态博弈课件.ppt_第3页
第3页 / 共74页
第一章:完全信息静态博弈课件.ppt_第4页
第4页 / 共74页
第一章:完全信息静态博弈课件.ppt_第5页
第5页 / 共74页
点击查看更多>>
资源描述

1、2022-11-11博弈论(陈艳)第一章:完全信息静态博弈本章内容:博弈论的基本概念及战略式表述纳什均衡纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性与多重性2022-11-11博弈论(陈艳)第一节 博弈论的基本概念与战略式表述博弈论的基本概念战略式表述2022-11-11博弈论(陈艳)1.1-1基本概念o 1、参与人:一个博弈中的决策主体,其目的是通过选择行动(或战略)以最大化自己的支付(效用)水平。o“自然”作为虚拟参与人来处理。是指决定外生的随机变量的概率分布的机制。o i=1,n代表参与人,N代表自然2022-11-11博弈论(陈艳)o2 2、行动:行动是指参与人在博弈的某个时点的决

2、策变量。用、行动:行动是指参与人在博弈的某个时点的决策变量。用a ai i表示第表示第i i个参与人的一个特定行动,个参与人的一个特定行动,A Ai i=a=ai i 表示可供表示可供i i选择的所有行动的集合。选择的所有行动的集合。o3 3、信息:是参与人有关博弈的知识,特别是有关、信息:是参与人有关博弈的知识,特别是有关“自然自然”的选择、其的选择、其他参与人的特征和行动的知识。他参与人的特征和行动的知识。o信息集信息集o完美信息:一个参与人对其他参与人(包括虚拟参与人完美信息:一个参与人对其他参与人(包括虚拟参与人“自然自然”)的行)的行动选择有准确了解的情况,即每个信息集只包含一个值动

3、选择有准确了解的情况,即每个信息集只包含一个值o完全信息:自然不首先行动或自然的初始行动被所有参与人准确观察到完全信息:自然不首先行动或自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性。的情况,即没有事前的不确定性。o共同知识:所有参与人知道,所有参与人知道所有参与人知道,所有参共同知识:所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道与人知道所有参与人知道所有参与人知道的知识。的知识。o一致信念:即使所有参与人一致信念:即使所有参与人“共同共同”享有某种知识,每个参与人也可能享有某种知识,每个参与人也可能不知道其他参与人知道这些知识,或

4、者并不知道其他人知道自己拥有这不知道其他参与人知道这些知识,或者并不知道其他人知道自己拥有这些知识。些知识。2022-11-11博弈论(陈艳)o 4 4、战略:是参与人在给点信息集的情况下的行动规则,它、战略:是参与人在给点信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。规定参与人在什么时候选择什么行动。o 用用s si i表示第表示第i i个参与人的一个特定战略,个参与人的一个特定战略,S Si i=s=si i 代表第代表第i i个个参与人的所有可选择的战略集合。参与人的所有可选择的战略集合。o 5 5、支付:在博弈论中,支付或者是指在一个特定的战略组、支付:在博弈论中,支付

5、或者是指在一个特定的战略组合下参与人得到的确定效用水平,或者是指参与人得到的合下参与人得到的确定效用水平,或者是指参与人得到的期望效用水平。期望效用水平。o 令令u ui i为第为第i i个参与人的支付(效用水平),个参与人的支付(效用水平),u=(uu=(u1 1,u,ui i,u,un n)为为n n个参与人的支付组合。于是个参与人的支付组合。于是u ui i=u=ui i(s(s1 1,s,si i,s,sn n),),即即u ui i是所有参与人的战略选择的是所有参与人的战略选择的函数。函数。2022-11-11博弈论(陈艳)o 6 6、结果:是博弈分析者所感兴趣的所有东西,如均衡战、

6、结果:是博弈分析者所感兴趣的所有东西,如均衡战略组合、均衡行动组合、均衡支付组合等。略组合、均衡行动组合、均衡支付组合等。o 7 7、均衡:是所有参与人的最优战略的组合,一般记为:、均衡:是所有参与人的最优战略的组合,一般记为:s s*=(s=(s1 1*,s,si i*,s,sn n*)。o 为了把一个特定参与人与其他参与人相区别,我们将用为了把一个特定参与人与其他参与人相区别,我们将用s s-i-i=(s=(s1 1,s,si-1i-1,s,si+1i+1,s,sn n)表示由除表示由除i i之外的所有参与之外的所有参与人的战略组成的向量。人的战略组成的向量。o 博弈论(博弈论(game

7、theorygame theory)是研究决策主体的行为发生直接)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。相互作用时候的决策以及这种决策的均衡问题。2022-11-11博弈论(陈艳)1.1-2博弈论的战略式表达o 一个博弈可以用两种不同的方式来表述,一种是战略式一个博弈可以用两种不同的方式来表述,一种是战略式表述,另一种是扩展式表述。尽管从理论上讲,这两种表述,另一种是扩展式表述。尽管从理论上讲,这两种表述形式几乎是完全等价的,但从分析的方便性的角度表述形式几乎是完全等价的,但从分析的方便性的角度看,战略式表述更适合于静态博弈,而扩展式表述更适看,战略式表述更适合

8、于静态博弈,而扩展式表述更适合于讨论动态博弈。合于讨论动态博弈。o 博弈的战略式表述:博弈的战略式表述:G=N,(SG=N,(Si i)i i N N,(U,(Ui i)i i N N o 有三个基本要素有三个基本要素:(1 1)参与人(参与人(playersplayers)i i N=1,2,N=1,2,n,n;(2 2)战略()战略(strategiesstrategies),s,si i S Si i(战略空间战略空间);(3 3)支付()支付(payoffspayoffs),u,ui i=u=ui i(s(s-i-i,s,si i)。2022-11-11博弈论(陈艳)案例案例1 1:囚

9、犯困境:囚犯困境抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A2022-11-11博弈论(陈艳)均衡与均衡结果均衡战略(坦白,坦白)均衡支付(-6,-6)2022-11-11博弈论(陈艳)第二节 纳什均衡占优战略均衡重复剔除的占优战略均衡纳什均衡2022-11-11博弈论(陈艳)1.21.2-1 1完全信息静态博弈的几点特性完全信息静态博弈的几点特性o 1 1、每个参与人对所有其他参与人的特征(包括战略空间、每个参与人对所有其他参与人的特征(包括战略空间、支付函数等)有完全的了解,即知道博弈结构与游戏规支付函数等)有完全的了解,即知道博弈结构与游戏规则(共同知识)但不

10、知道其他人的行动。则(共同知识)但不知道其他人的行动。o 2 2、所有参与人同时选择行动且只行动一次。同时行动,、所有参与人同时选择行动且只行动一次。同时行动,是一个信息概念而非时间概念:只要每个参与人在选择是一个信息概念而非时间概念:只要每个参与人在选择自己的行动时不知道其他参与人的选择,我们就说他们自己的行动时不知道其他参与人的选择,我们就说他们在同时行动。在同时行动。o 3 3、不管是否沟通过,无法做出有约束力的承诺(非合作)、不管是否沟通过,无法做出有约束力的承诺(非合作)2022-11-11博弈论(陈艳)1.21.2-1 1占优战略均衡o 占优战略:不管对手战略为何,该参与人可找到一

11、最佳占优战略:不管对手战略为何,该参与人可找到一最佳战略。一般地,战略。一般地,s si i*称为参与人称为参与人i i的(严格)占优战略。的(严格)占优战略。o 定义:在博弈定义:在博弈G=N,(SG=N,(Si i)i i N N,(U,(Ui i)i i N N 中,如果对所有的中,如果对所有的参与人参与人i,si,si i*是它的占优战略,那么所有参与人选择的战是它的占优战略,那么所有参与人选择的战略组合(略组合(s s1 1*,s,sn n*)成为该对策的占优战略均衡。)成为该对策的占优战略均衡。2022-11-11博弈论(陈艳)案例案例1 1:囚犯困境:囚犯困境抵赖坦白抵赖-1,-

12、1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A2022-11-11博弈论(陈艳)囚犯困境的扩展囚犯困境的扩展o 应该指出,占优战略均衡只要求每个参与人是理性的,而并应该指出,占优战略均衡只要求每个参与人是理性的,而并不要求每个参与人知道其他参与人是理性的不要求每个参与人知道其他参与人是理性的o 从从“纳什均衡纳什均衡”引出引出“看不见的手看不见的手”的一个悖论:从利己目的一个悖论:从利己目的出发,结果损人不利己。的出发,结果损人不利己。“纳什均衡纳什均衡”提出的悖论动摇了提出的悖论动摇了经济学的基石。经济学的基石。o 两个寡头企业选择产量两个寡头企业选择产量o 公共产品的供给公共产品的供

13、给o 军备竞赛军备竞赛o 经济改革经济改革 结论:一种制度安排,要发生效力。必须是一种纳什均衡;否结论:一种制度安排,要发生效力。必须是一种纳什均衡;否则,制度安排便不能成立。则,制度安排便不能成立。2022-11-11博弈论(陈艳)价格大战低价高价低价3,36,1高价1,65,5百事可乐可口可乐支付2022-11-11博弈论(陈艳)1.21.2-2 2重复剔除的占优战略均衡o 绝对劣势战略:绝对劣势战略:s si i是一绝对劣势战略当且仅当存在另一是一绝对劣势战略当且仅当存在另一战略战略s si i S Si i使得使得u ui i(s(si i,s,s-i-i)u)ui i(s(si i,

14、s,s-i-i)对所有对所有s s-i i S S-i-i均成立。(均成立。(s si i 未必是优势战略)未必是优势战略)o 重复剔除的占优战略均衡:逐次删去绝对劣势战略得到重复剔除的占优战略均衡:逐次删去绝对劣势战略得到唯一的占优战略。唯一的占优战略。o 首先找出某个参与人的劣战略,剔除之,再找,再剔除,首先找出某个参与人的劣战略,剔除之,再找,再剔除,直到最后的一个直到最后的一个2022-11-11博弈论(陈艳)案例2:智猪博弈o 猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一头有猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。一个猪食槽,

15、另一头安装一个按钮,控制着猪食的供应。按一下按钮会有按一下按钮会有1010个单位的猪食进槽,但谁按按钮谁就个单位的猪食进槽,但谁按按钮谁就要付出要付出2 2个单位的成本。若大猪先到,大猪吃到个单位的成本。若大猪先到,大猪吃到9 9个单位,个单位,小猪只能吃小猪只能吃1 1个单位;若同时到,大猪吃个单位;若同时到,大猪吃7 7个单位,小猪个单位,小猪吃吃3 3个单位;若小猪先到,大猪吃个单位;若小猪先到,大猪吃6 6个单位,小猪吃个单位,小猪吃4 4个个单位。支付如表。单位。支付如表。2022-11-11博弈论(陈艳)案例案例2 2:智猪博弈:智猪博弈0,09,-1等待4,45,1按等待按支付小

16、猪大猪2022-11-11博弈论(陈艳)智猪博弈的扩展o 股份公司承担监督经理职能的大股东与小股东股份公司承担监督经理职能的大股东与小股东o 股票市场上炒股票的大户与小户股票市场上炒股票的大户与小户o 市场中大企业与小企业在研发、广告上的博弈市场中大企业与小企业在研发、广告上的博弈o 公共产品的提供(富户与穷户)公共产品的提供(富户与穷户)o 改革中不同利益分配对改革的推动改革中不同利益分配对改革的推动2022-11-11博弈论(陈艳)例:重复剔除的占优战略均衡例:重复剔除的占优战略均衡首先剔除首先剔除R R1,01,20,10,30,12,0 参与人2 L M R参与人1UD2022-11-

17、11博弈论(陈艳)例:重复剔除的占优战略均衡例:重复剔除的占优战略均衡其次剔除其次剔除D D1,01,20,30,1 参与人2 L M参与人1UD2022-11-11博弈论(陈艳)例:重复剔除的占优战略均衡例:重复剔除的占优战略均衡最后剔除最后剔除L L1,01,2 参与人2 L M参与人1 U 最后均衡结果:(U,M)2022-11-11博弈论(陈艳)例 重复剔除的占优战略均衡4,35,16,22,18,43,63,09,62,8 参与人2L M R参与人1UDN2022-11-11博弈论(陈艳)例 重复剔除的占优战略均衡 参与人2L M R参与人1UDN1,01,33,00,20,13,0

18、0,22,45,32022-11-11博弈论(陈艳)1.21.2-3 3纳什均衡纳什均衡o 定义:指一战略组合有以下特性:当参与人持此战略后,定义:指一战略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;任一参与人均无诱因偏离这一均衡;s s*=(s=(s1 1*,s,sn n*)=(s)=(si i*,s,s-i-i*)是一纳什均衡,当且仅当对是一纳什均衡,当且仅当对所有参与人而言,所有参与人而言,u ui i(s(si i*,s,s-i-i*)u ui i(s(si i,s,s-i-i*)对所有对所有s si i S Si i 均成立。简单而言,当均成立。简单而言,当s

19、 s1 1*是对是对s s2 2*的最适反应,的最适反应,s s2 2*也是也是s s1 1*的最适反应时,(的最适反应时,(s s1 1*,s,s2 2*)就是二人博弈的)就是二人博弈的纳什均衡。纳什均衡。o 命题命题1 1:纳什均衡在占优战略重复剔除解法中不会被剔除:纳什均衡在占优战略重复剔除解法中不会被剔除o 命题命题2 2:重复剔除的严格占优战略均衡一定是纳什均衡。:重复剔除的严格占优战略均衡一定是纳什均衡。2022-11-11博弈论(陈艳)例 纳什均衡求解0,44,05,34,00,45,33,53,56,6 参与人2L M R参与人1UDN2022-11-11博弈论(陈艳)三者之間

20、的關系o 1 1、每一个占优战略均衡、重复剔除的占优均衡一定是、每一个占优战略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或纳什均衡,但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优均衡。重复剔除的占优均衡。o 2 2、纳什均衡一定是在重复剔除严格劣战略过程中没有、纳什均衡一定是在重复剔除严格劣战略过程中没有被剔除掉的战略组合,但没有被剔除的战略组合不一定被剔除掉的战略组合,但没有被剔除的战略组合不一定是纳什均衡,除非它是唯一的。是纳什均衡,除非它是唯一的。2022-11-11博弈论(陈艳)作业7,76,67,65,75,88,56,65,84,8 乙 左

21、中 右上中下甲一个两人同时博弈的支付竞争如下所示,试求纳什均衡。是否存在重复剔除占优战略均衡?2022-11-11博弈论(陈艳)第三节 纳什均衡应用举例古诺(Cournot)寡头模型沙滩卖冰豪泰林(Hotelling)价格竞争模型公共地的悲剧2022-11-11博弈论(陈艳)1.3-1古诺寡头模型o 特点:存在两家厂商;同时行动确定产量。特点:存在两家厂商;同时行动确定产量。o 通过预测另一家厂商的产量来选择自己的利润最大化产通过预测另一家厂商的产量来选择自己的利润最大化产量,寻求预测均衡。量,寻求预测均衡。o 厂商厂商1 1表示为:表示为:max qmax qi iP(qP(q1 1+q+q

22、2 2)-c)-ci i(q(qi i),得出,得出q q1 1=f=f1 1(q(q2 2),同理得出同理得出q q2 2=f=f2 2(q(q1 1),称为反应函数,两条曲线的交点为,称为反应函数,两条曲线的交点为古诺模型的解。古诺模型的解。2022-11-11博弈论(陈艳)古诺寡头模型的纳什均衡反应函数反应函数 q q1 1=f=f1 1(q(q2 2)q q2 2=f=f2 2(q(q1 1)(q q1 1*,q,q2 2*)是该对策的是该对策的纳什均衡解。纳什均衡解。q1*q12q11 q10q2*q22q21q1oq2f1(q2)f2(q1)2022-11-11博弈论(陈艳)例题:

23、古诺模型的解假设假设p=a-(qp=a-(q1 1+q+q2 2),C C1 1=q=q1 1c c,C C2 2=q=q2 2c c则根据利润最大化的一阶条件分别得到反应函数则根据利润最大化的一阶条件分别得到反应函数q q1 1=f=f1 1(q(q2 2)=(a-q)=(a-q2 2-c-c)/2)/2,q q2 2=f=f2 2(q(q1 1)=(a-q)=(a-q1 1-c-c)/2)/2,求出均衡产量为(求出均衡产量为(1/3(a-c)1/3(a-c),1/3(a-c)1/3(a-c)),为纳什均衡,),为纳什均衡,均衡利润为(均衡利润为(1/9(1/9(a-c)a-c)2 2,1/

24、9(a-c)1/9(a-c)2 2)2022-11-11博弈论(陈艳)古诺模型的解:与垄断市场的比较古诺模型的解:与垄断市场的比较o 假设为一垄断企业,则有:假设为一垄断企业,则有:Max Max =q(a-q-c=q(a-q-c),),得到垄断企业的最优产量得到垄断企业的最优产量 q=1/2(a-cq=1/2(a-c)q q1 1+q+q2 2=2/3(a-c=2/3(a-c)垄断利润为垄断利润为=1/4(a-c)=1/4(a-c)2 2 2/9(a-c)2/9(a-c)2 2o 寡头竞争的总产量大于垄断产量的原因在于每个寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己的最优产量时,

25、只考虑对本企业企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。利润的影响,而忽视对另一个企业的外部负效应。2022-11-11博弈论(陈艳)寡头厂商与垄断厂商的比较 1/3(a-c)1/2(a-c)1/2(a-c)q1oq2f1(q2)f2(q1)1/3(a-c)2022-11-11博弈论(陈艳)1.3-2 沙滩卖冰o 假设游客沿沙滩0,1间均匀分布,现有两位卖冰者,他们会将摊位选在哪个位置?假设游客就近购买。o 生活中还有哪些类似的例子?0 12022-11-11博弈论(陈艳)1.3-3豪泰林模型o 寡头企业竞争战略是价格o 伯川德(Bertrand)模

26、型:产品同质,均衡价格等于边际成本,类似于完全竞争市场均衡。o 豪泰林(Hotelling)模型:存在产品差异,均衡价格不等于边际成本,垄断性提高2022-11-11博弈论(陈艳)假定长度为假定长度为1 1的线性城市,消费者均匀分布在的线性城市,消费者均匀分布在00,11区区间内,分布密度为间内,分布密度为1 1;两个商店;两个商店1 1、2 2分别位于分别位于x=0 x=0,x=1x=1,即城市的两端;消费者购买商品的旅行成本与商店的距即城市的两端;消费者购买商品的旅行成本与商店的距离成比例,单位距离的成本为离成比例,单位距离的成本为t t;住在;住在x x的消费者在两个的消费者在两个商店之

27、间是无差异的,需求商店之间是无差异的,需求D D1 1=x=x,D D2 2=1-x=1-x,x x满足:满足:p p1 1+tx+tx=p=p2 2+t(1-x),+t(1-x),解得解得x=(px=(p2 2-p-p1 1+t)/2t+t)/2t。豪泰林模型:以空间上差异为例2022-11-11博弈论(陈艳)豪泰林模型:以空间上差异为例o 根据两个商店的利润函数,根据两个商店的利润函数,1 1=(=(p p1 1-c)x,-c)x,2 2=(=(p p2 2-c)(1-x)-c)(1-x)选择使利润最大化的价格,得到一阶条件,求得选择使利润最大化的价格,得到一阶条件,求得p p1 1*=p

28、=p2 2*=c+t=c+t,均衡利润,均衡利润 1 1=2 2=t/2t/2o 旅行成本越高,产品差异越大,均衡价格从而均衡利润旅行成本越高,产品差异越大,均衡价格从而均衡利润也越高。也越高。o 原因:随着旅行成本上升,不同商店出售的产品之间的原因:随着旅行成本上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断能力加强,替代性下降,每个商店对附近的消费者的垄断能力加强,o 当旅行成本为零时,不同商店的产品之间具有完全的替当旅行成本为零时,不同商店的产品之间具有完全的替代性,则为伯川德均衡结果。代性,则为伯川德均衡结果。2022-11-11博弈论(陈艳)1.3-4公共地的悲

29、剧o 生物学家和生态学家哈丁(生物学家和生态学家哈丁(Garrett HardenGarrett Harden)在)在科学科学(19681968年,第年,第162162卷)发表卷)发表公地的悲剧公地的悲剧。o 考虑一块对所有的人都开放的牧场,在该制度下,可以预考虑一块对所有的人都开放的牧场,在该制度下,可以预期,每一个放牧的人都会在公地上放牧尽可能多的牲口。期,每一个放牧的人都会在公地上放牧尽可能多的牲口。o 增加一头牲口既有正效用,也有负效用。增加一头牲口既有正效用,也有负效用。o 正效用是牲口的销售收入,增加一头为正效用是牲口的销售收入,增加一头为+1+1o 负效用使每增加一头带来的过度放

30、牧的损失,每一个放牧负效用使每增加一头带来的过度放牧的损失,每一个放牧着承担着承担-1/n-1/no 放牧者合理的决策是增加牲口,直至马瘦毛长,公地毁灭。放牧者合理的决策是增加牲口,直至马瘦毛长,公地毁灭。2022-11-11博弈论(陈艳)o 资源没有排他性产权:草地放牧、公海捕鱼、小煤窑的过度资源没有排他性产权:草地放牧、公海捕鱼、小煤窑的过度开发;另一类是人们向其中排放废物的公地。开发;另一类是人们向其中排放废物的公地。o 草地放牧:草地放牧:n n个农民,每个拥有羊的数量为个农民,每个拥有羊的数量为g gi i,G G=g gi i,v(Gv(G)代表每只羊的价值,与草地上放牧的总数代表

31、每只羊的价值,与草地上放牧的总数G G相关,饲养量增加相关,饲养量增加到一定程度,随着数量继续增加,羊的价值会下降,即到一定程度,随着数量继续增加,羊的价值会下降,即v v(G)0(G)-p,p0.2p-1-p,p0.2o 或者或者4 4p-1-p,p0.2p-1-p,p3q,q3q,q0.52022-11-11博弈论(陈艳)基本概念基本概念o 纯战略:参与人在每一个给定信息的情况纯战略:参与人在每一个给定信息的情况下只选择一个特定的行动下只选择一个特定的行动o 混合战略:参与人在每一个给定信息的情混合战略:参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行况下以某种概率分布随机地

32、选择不同的行动动o 纯战略可视为混合战略的特例纯战略可视为混合战略的特例o“流浪汉流浪汉”的纳什均衡:政府以的纳什均衡:政府以0.50.5救济,救济,流浪汉以流浪汉以0.20.2找工作找工作2022-11-11博弈论(陈艳)o 一个参与人使用混合策略的好处是给对方造成不确定一个参与人使用混合策略的好处是给对方造成不确定性,浑水摸鱼性,浑水摸鱼o 海萨尼对混合战略的解释:混合战略等价于不完全信海萨尼对混合战略的解释:混合战略等价于不完全信息下的纯战略均衡息下的纯战略均衡o 如税收检查,检查则不偷税,不检查则偷税。但税务如税收检查,检查则不偷税,不检查则偷税。但税务局检查有成本,企业在知道税务局可

33、能检查的情况下,局检查有成本,企业在知道税务局可能检查的情况下,偷税有风险。此时,可以根据某些参数寻找一个混合偷税有风险。此时,可以根据某些参数寻找一个混合策略的纳什均衡策略的纳什均衡o 几乎所有有限博弈都有有限奇数个纳什均衡。几乎所有有限博弈都有有限奇数个纳什均衡。o 如果一个博弈有两个纯战略纳什均衡,那么,一定存如果一个博弈有两个纯战略纳什均衡,那么,一定存在第三个混合战略纳什均衡在第三个混合战略纳什均衡2022-11-11博弈论(陈艳)1.4-1混合战略(mixed strategies)o 定义:定义:*=(=(1 1*,n n*)=()=(i i*,-i i*)是一纳什混合是一纳什混

34、合战略均衡,当且仅当对所有参与人而言,战略均衡,当且仅当对所有参与人而言,i i*是是-i i*的最适反应,的最适反应,u ui i(i i*,-i i*)u ui i(I I,-i i*),对,对所有所有 i ii i成立成立)。o 持混合战略的前提是在均衡时两种战略的报酬会相持混合战略的前提是在均衡时两种战略的报酬会相等,是预期支付最大化的推导结果。等,是预期支付最大化的推导结果。2022-11-11博弈论(陈艳)掷硬币-1,11,-1反面1,-1-1,1正面反面正面12支付 p 1-pq1-q参与人参与人1:max Eu=q(p(-1)+(1-p)1)+(1-q)(p1+(1-p)(-1

35、)=-pq+q-pq+p-pq-1+q+p-pq =-4pq+2q+2p-1一阶条件为零求得:一阶条件为零求得:p=1/22022-11-11博弈论(陈艳)掷硬币的分析o 给定参与人给定参与人1 1(q,1-qq,1-q),参与人),参与人2 2的支付是:的支付是:q+(-1)(1-q)q+(-1)(1-q)(正面)(正面)=(-1)q+(1-q)=(-1)q+(1-q)(反面)(反面);o 给定参与人给定参与人2 2(p,1-pp,1-p),参与人),参与人1 1的支付为:的支付为:p(-1)+(1-p)p(-1)+(1-p)(正面)(正面)=p+(-1)(1-p)=p+(-1)(1-p)(

36、反面);(反面);o 求得(求得(1/21/2,1/21/2)是纳什混合战略均衡)是纳什混合战略均衡 如果两种战略报酬不相等,那么就变为如果两种战略报酬不相等,那么就变为 纯战略(纯战略(pure strategiespure strategies)了。了。2022-11-11博弈论(陈艳)1.4-2混合战略均衡的博弈原则o 两博弈方不能让对方知道或猜到自己的选择,因两博弈方不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性;而必须在决策时利用随机性;o 两博弈方选择每种策略的概率一定要恰好使对方两博弈方选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过针对性地倾向某一无机可

37、乘,即让对方无法通过针对性地倾向某一策略而在博弈中占上风。策略而在博弈中占上风。o 例:在掷硬币的博弈中,参与人例:在掷硬币的博弈中,参与人1 1选正面、反面选正面、反面的概率的概率q,1-qq,1-q,一定要使参与人,一定要使参与人2 2选正面的和反面选正面的和反面的期望得益相等。的期望得益相等。2022-11-11博弈论(陈艳)单纯战略与混合战略的定义o G=N,S,UG=N,S,U是一个战略式有限博弈,参与人是一个战略式有限博弈,参与人i i的战略空的战略空间间S S中的任一元素中的任一元素s si i称为称为i i的一个单纯战略(的一个单纯战略(pure pure strategyst

38、rategy);定义在);定义在S Si i上的一个概率分布函数上的一个概率分布函数p pi i(s(si i)代代表了一个混合战略(表了一个混合战略(mixed strategymixed strategy)这个战略这个战略的内容是:参与人的内容是:参与人i i以概率以概率p pi i(s(si ij j)选择单纯战略选择单纯战略s si ij j,而,而 p pi i(s(si ij j)=1)=1。o 单纯战略是混合战略的特例,因为任一单纯战略单纯战略是混合战略的特例,因为任一单纯战略s si i都都可以理解为可以理解为i i以概率以概率1 1选择选择s si i,以,以0 0概率选取其

39、他所有单概率选取其他所有单纯战略。纯战略。o 引入混合战略,参与人的目标需要修改为引入混合战略,参与人的目标需要修改为“最大化自最大化自己的期望支付己的期望支付”2022-11-11博弈论(陈艳)Selton:小偷和守卫的博弈:小偷和守卫的博弈 一小偷欲偷窃有一守卫看守的仓库,如果小偷偷窃一小偷欲偷窃有一守卫看守的仓库,如果小偷偷窃时守卫在睡觉,则小偷就能得手,偷得价值为时守卫在睡觉,则小偷就能得手,偷得价值为V V的赃物;的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。设如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。设小偷被抓后要坐牢,负效用为小偷被抓后要坐牢,负效用为-P-P,守卫睡

40、觉而未遭偷窃,守卫睡觉而未遭偷窃有有S S的正效用,因睡觉被窃要被解雇,其负效用为的正效用,因睡觉被窃要被解雇,其负效用为-D-D。而如果小偷不偷,则他既无得也无失,守卫不睡意味着而如果小偷不偷,则他既无得也无失,守卫不睡意味着出一份力挣一分钱,他也没有得失。出一份力挣一分钱,他也没有得失。2022-11-11博弈论(陈艳)睡不睡偷V,-D-P,0不偷0,S0,0小偷小偷守卫守卫支付支付小偷与守卫的博弈小偷与守卫的博弈2022-11-11博弈论(陈艳)守卫得益(睡)守卫得益(睡)S01pt(小偷偷的概率)(小偷偷的概率)pt*pt*/-D-D/小偷的混合策略小偷的混合策略S到到-D连线的纵坐连

41、线的纵坐标是在横坐标对应标是在横坐标对应的小偷的小偷“偷偷”窃概窃概率下的守卫选择率下的守卫选择“睡睡”的期望得益,的期望得益,即即S(1-pt)+(-D)pt加重对守卫的处罚在短期加重对守卫的处罚在短期中的效果是使守卫真正尽中的效果是使守卫真正尽职,但在长期中恰恰是会职,但在长期中恰恰是会降低盗窃发生的概率(激降低盗窃发生的概率(激励的悖论)励的悖论)2022-11-11博弈论(陈艳)小偷得益(偷)小偷得益(偷)V01Pg(守卫睡的概率)(守卫睡的概率)Pg*Pg*/-P-P/守卫的混合策略守卫的混合策略小偷的混合策小偷的混合策略分布不受略分布不受P的影响,因此的影响,因此政府加重对小政府加

42、重对小偷的惩罚在长偷的惩罚在长期中并不能抑期中并不能抑制盗窃,最多制盗窃,最多只能抑制短期只能抑制短期的盗窃发生率,的盗窃发生率,它的作用主要它的作用主要是使守卫可以是使守卫可以更多地偷懒更多地偷懒2022-11-11博弈论(陈艳)齐威王田忌赛马齐威王田忌赛马o 古代齐威王与大将田忌赛马,田忌的谋士孙膑运用古代齐威王与大将田忌赛马,田忌的谋士孙膑运用计谋帮助田忌以弱胜强。计谋帮助田忌以弱胜强。o 比赛规则:田忌与齐威王各出三匹马,一对一比赛比赛规则:田忌与齐威王各出三匹马,一对一比赛三场,每一场的输方要赔三场,每一场的输方要赔10001000斤铜给赢方。双方的斤铜给赢方。双方的马按实力都可以分

43、为上、中、下,但齐威王的上、马按实力都可以分为上、中、下,但齐威王的上、中、下均优于田忌的上、中、下。实际上,田忌的中、下均优于田忌的上、中、下。实际上,田忌的上马、中马要优于齐威王的中马、下马。上马、中马要优于齐威王的中马、下马。o 比赛结果:田忌连输三场;后孙膑建议,以上对中、比赛结果:田忌连输三场;后孙膑建议,以上对中、以中对下、以下对上,结果以以中对下、以下对上,结果以2 2:1 1赢得比赛。赢得比赛。2022-11-11博弈论(陈艳)o 前述为单方面运用策略的故事,如果齐威王预料到田忌前述为单方面运用策略的故事,如果齐威王预料到田忌的做法,必然会改变各匹马出场的次序。的做法,必然会改

44、变各匹马出场的次序。o 本博弈中博弈双方的利益是完全对立的,是严格竞争的本博弈中博弈双方的利益是完全对立的,是严格竞争的零和博弈,不会有纯策略纳什均衡,必然是一个混合策零和博弈,不会有纯策略纳什均衡,必然是一个混合策略均衡。略均衡。o 假设齐威王采取六种战略的概率分别为假设齐威王采取六种战略的概率分别为p pa a,p,pb b,p,pc c,p,pd d,p,pe e,p,pf f(加总为(加总为1 1),则田忌采取六种战略的则田忌采取六种战略的期望得益相等,则得出齐威王与田忌均以期望得益相等,则得出齐威王与田忌均以1/61/6的相同概的相同概率随机选择各自的六个纯策略,构成本博弈唯一的混合

45、率随机选择各自的六个纯策略,构成本博弈唯一的混合策略纳什均衡。策略纳什均衡。齐威王田忌赛马齐威王田忌赛马2022-11-11博弈论(陈艳)上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3齐齐威威王王田忌田忌齐威王田忌赛马齐威王田忌赛马2022-11-11博弈论(陈艳)齐威王田忌赛马 在上

46、述混合策略下,齐威王的期望得益为在上述混合策略下,齐威王的期望得益为1/61/6(3+1+1+1+1-13+1+1+1+1-1)=1=1;田忌的期望得益为;田忌的期望得益为1/61/6(1-3-1-1-1-11-3-1-1-1-1)=-1=-1,即多次进行这样的赛马,齐,即多次进行这样的赛马,齐威王平均每次能赢田忌威王平均每次能赢田忌10001000斤铜,这是因为齐威王斤铜,这是因为齐威王三匹马的总体实力略胜田忌三匹马总体实力的缘故三匹马的总体实力略胜田忌三匹马总体实力的缘故2022-11-11博弈论(陈艳)1.4-3混合策略反应函数o 将博弈方的策略空间扩展到包括混合策略,将纳什将博弈方的策

47、略空间扩展到包括混合策略,将纳什均衡扩展到包括混合策略纳什均衡以后,求纳什均均衡扩展到包括混合策略纳什均衡以后,求纳什均衡反应函数的分析方法也可以扩展到求混合策略纳衡反应函数的分析方法也可以扩展到求混合策略纳什均衡。什均衡。o 反应函数即一博弈方对另一博弈方每种可能的决策反应函数即一博弈方对另一博弈方每种可能的决策内容的最佳反映决策构成的函数。在纯策略的范畴内容的最佳反映决策构成的函数。在纯策略的范畴内,反应函数是各博弈方选择的纯策略对其他博弈内,反应函数是各博弈方选择的纯策略对其他博弈方纯策略的反应。在混合策略的范畴内,博弈方的方纯策略的反应。在混合策略的范畴内,博弈方的决策内容为选择概率分

48、布,反应函数就是一方对另决策内容为选择概率分布,反应函数就是一方对另一方的概率分布的反应。一方的概率分布的反应。2022-11-11博弈论(陈艳)掷硬币-1,11,-1反面1,-1-1,1正面反面正面12支付 q 1-q1-pp2022-11-11博弈论(陈艳)pq01/2111/2p1=f(q)q2=f(p)当当2 2出正面的概出正面的概率率q q 1/21/2,1 1出正出正面的概率为面的概率为1 1,因为他出正面得因为他出正面得到的预期收益大到的预期收益大于他出反面;当于他出反面;当2 2出正面的概率出正面的概率q q 1/21/2,1 1出正面出正面的概率为的概率为0 0,因,因为他出

49、反面的期为他出反面的期望收益大于他出望收益大于他出正面。正面。2022-11-11博弈论(陈艳)第五节 纳什均衡的存在性与多重性2022-11-11博弈论(陈艳)混合战略纳什均衡纯战略纳什均衡重复剔除占优均衡占优均衡不同均衡概念之间的关系2022-11-11博弈论(陈艳)o 纳什均衡的存在性纳什均衡的存在性 每个有限战略式博弈(参与人与战略数目均为每个有限战略式博弈(参与人与战略数目均为有限)都有纳什均衡存在,这均衡有可能是混有限)都有纳什均衡存在,这均衡有可能是混合战略均衡合战略均衡o 纳什均衡的多重性纳什均衡的多重性 纳什均衡不唯一,如性别战纳什均衡不唯一,如性别战2022-11-11博弈

50、论(陈艳)案例 性别战1,30,0足球0,02,1时装足球时装妻子支付 p 1-pq1-q丈夫2022-11-11博弈论(陈艳)性别战:混合策略均衡o 给定妻子分别以给定妻子分别以q,1-qq,1-q的概率选择时装、足球,则丈夫的概率选择时装、足球,则丈夫选择时装、足球的期望收益相等,即选择时装、足球的期望收益相等,即1.q+0.(1-1.q+0.(1-q)=0.q+3.(1-q)q)=0.q+3.(1-q),解得妻子选择时装、足球的概率分,解得妻子选择时装、足球的概率分别为(别为(3/43/4,1/41/4)o 给定丈夫分别以给定丈夫分别以p,1-pp,1-p的概率选择时装、足球,则妻子的概

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第一章:完全信息静态博弈课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|