1、第一章第一章完全信息静态博弈完全信息静态博弈 本章主要内容:本章主要内容:n占优策略均衡占优策略均衡n重复剔除的占优均衡重复剔除的占优均衡n纳什均衡纳什均衡n三种均衡之间的关系三种均衡之间的关系 n纳什均衡应用举例纳什均衡应用举例n混合策略纳什均衡混合策略纳什均衡n纳什均衡的多重性纳什均衡的多重性n纳什均衡的存在性纳什均衡的存在性一、占优策略均衡占优策略均衡 n例子:囚徒困境囚徒B坦白抵赖囚徒A坦白10,101,15抵赖15,12,2占优策略占优策略n参与者的最优选择不依赖于其他参与者的策略选择(一般情况下,应该依赖于其他参与者的策略选择),即不论其他参与者选择什么策略,其最优策略是唯一的。这
2、样的最优策略被称为占优策略占优策略。一般地,如果对应所有的一般地,如果对应所有的 ,是是i 的严的严格最优选择,即格最优选择,即 则则 被称为参与者被称为参与者i的(严格)占优策的(严格)占优策略。对应地,所有的略。对应地,所有的 ()被称)被称为劣策略。其中为劣策略。其中 是是i之外所有参与者策略的组合。之外所有参与者策略的组合。is*is*is,*(,)(,)iiiiiiu s su s s*,iiisss)is*iiss111(,)iiinsssss占优策略均衡占优策略均衡由所有参与者的占优策略构成的策略组合就是占优策略均衡占优策略均衡。如果对于所有的i,被称为参与者i的占优策略,策略组
3、合 被称为占优策略均衡占优策略均衡。*1(,)nsss*is二、重复剔除的占优均衡重复剔除的占优均衡 n智猪博弈:小猪小猪踩踩等等大猪大猪踩踩3,12,4等等7,-10,0定义n首先找到某个参与者的劣策略,剔除之,把剔除劣策略后的博弈组成一个新的博弈,然后再剔除这个新博弈中某个参与者的劣策略,反复如此,直到剩下惟一策略组合为止。这个策略组合就被称为重复剔除的重复剔除的占优均衡占优均衡。n令令 ,如果,如果 ,我们就说我们就说 严格劣于严格劣于 。被称为相被称为相 对于对于 的占优策略,的占优策略,被称为相对于被称为相对于 的劣策略。的劣策略。n如果策略组合如果策略组合 是重复剔是重复剔除劣策略
4、后剩下的唯一的策略组合,则除劣策略后剩下的唯一的策略组合,则该策略组合被称为重复剔除的占优均衡。该策略组合被称为重复剔除的占优均衡。,iiis sS(,)(,),iiiiiiiu s su s ssisisisisisis*1(,)nsss三、纳什均衡B400600800A40045,4515,5010,4060050,1540,4015,4580040,1045,1535,35定义如果对于任意一个参与者如果对于任意一个参与者i,是参与者是参与者i的的在给定其他参与者的策略选择在给定其他参与者的策略选择 的 情 况 下 的的 情 况 下 的最优策略,即最优策略,即则策略组合则策略组合是一个纳什
5、均衡。是一个纳什均衡。*is*111(,)iiinsssss*(,)(,),iiiiiiiiu s su s ssSi*1(,)nsss四、三种均衡之间的关系n每个占优策略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每个纳什均衡都是占优策略均衡或重复剔除的占优均衡。n纳什均衡一定是在重复剔除严格严格劣策略过程中没有被剔除掉的策略组合,但没有被剔除的策略组合不一定是纳什均衡,除非它是惟一的。因被剔除的策略不可能是对其他参与者均衡策略的最优选择。n如果采取弱劣策略剔除的方法,弱劣策略剔除可能剔除纳什均衡。这说明弱纳什均衡允许弱劣策略的存在。五、纳什均衡应用举例n古诺(Cournot)寡头竞争模型
6、n伯川德(Bertrand)价格竞争模型六、混合策略的纳什均衡猜硬币方猜硬币方正面正面反面反面掷硬掷硬币方币方正面正面-1,11,-1反面反面1,-1-1,1例子:猜硬币博弈1.混合策略的定义n如果一个策略规定参与者在给定信息情况下以某种概率分布随机选择不同的行动,该策略就被称为混合策略混合策略。在博弈的策略式表示中,混合策略可以定义为纯策略空间上的概率分布。n与此相对,把博弈中原来意义上的策略,即每一给定信息下只选择一种特定行动,称为纯策略纯策略。n纯策略可以看作混合策略的特例。n混合策略可看作是纯策略的扩展。混合策略的定义n在在n个参与者博弈的策略式表示个参与者博弈的策略式表示 中,假定参
7、与者中,假定参与者i有有K个纯策略,个纯策略,则概率分布则概率分布 被称为参与者被称为参与者i的一个混合策略,这里的一个混合策略,这里 是是i选择选择 的概率,对于所有的的概率,对于所有的 11,;,nnGSS uu1,iiiKSss1(,)iiiKiks11,01,1KikikkK()ikiks2.混合策略纳什均衡的定义n混合策略纳什均衡是参与者最优混合策略的组混合策略纳什均衡是参与者最优混合策略的组合。最优混合策略是指给定其他参与者的混合合。最优混合策略是指给定其他参与者的混合策略,使期望支付函数最大化的混合策略。策略,使期望支付函数最大化的混合策略。n在在n个参与者博弈的策略式表示个参与
8、者博弈的策略式表示中,如果对于所有的中,如果对于所有的 ,混合策略组合,混合策略组合 就是一个纳什均衡。就是一个纳什均衡。11,;,nnGSS uu1,2,in*(,)(,),iiiiiiiivv*1(,)in3.混合策略纳什均衡的求解方法n支付最大化法n支付等值法n图解法例子:监督博弈纳税人纳税人逃税逃税 不逃税不逃税1-税务税务部门部门检查检查 a-c+F,-a-Fa-c,-a不查不查1-0,0a,-a七、纳什均衡的多重性n例子:性别战博弈男歌剧足球女歌剧2,10,0足球0,01,2纳什均衡的多重性n对于有多个纳什均衡的博弈,博弈论并没有一个一般性理论证明纳什均衡结果一定会出现。现实中,多
9、重纳什均衡的选择可能有以下几种情况:n帕累托最优纳什均衡n风险占优均衡n聚点均衡n相关均衡八、纳什均衡的存在性n定理I:每个有限博弈至少存在一个(纯策略或混合策略的)纳什均衡。n定理II:在n人策略式博弈中,如果每个参与者的纯策略空间是欧氏空间上一个非空的、闭的、有界的凸集,支付函数是连续的,且对其策略是拟凹的,则存在一个纯策略纳什均衡。(I可看作II的特例)n定理III:在n人策略式博弈中,如果每个参与者的纯策略空间是欧氏空间上一个非空的、闭的、有界的凸集,支付函数是连续的,则存在一个混合策略纳什均衡。nKuhn证明,每个完美信息的n人有限博弈都有一个纯策略纳什均衡。nWilson证明,几乎所有有限博弈都有有限奇数个纳什均衡(故称为奇数定理)。