1、第二十八章博弈论博弈论博弈论n博弈论能够帮助我们来对市场中主体的行为受到其他主体行为的影响的策略行为进行建模。博弈论的一些应用n寡头垄断的研究(行业中仅包含几个厂商)n卡特尔的研究;例如 OPECn外部性的研究;例如对于公共资源的使用比如捕鱼。n对于军事策略的研究。n讨价还价。n市场的运行机制。博弈是什么?n一个博弈博弈包含:n一些参与者参与者n每个参与者的策略策略n每个参与者选择不同决策行为的收益矩阵。收益矩阵。两人博弈n一个仅包含两个参与者的博弈称为两人博弈两人博弈。n我们研究的博弈仅包含两个参与者,每个参与者可以选择两种不同的行为策略。两人博弈的一个例子n参与者A 和 B。nA 可以采取
2、两种行为:“上”和“下”。nB 可以采取两种行为:“左”和“右”。n包含了四种可能决策组合支付的表格称为博弈的收益矩阵收益矩阵。两人博弈的一个例子这是博弈的收益矩阵参与者 B参与者 A左边显示A的收益右边显示B的收益LRUD(3,9)(0,0)(1,8)(2,1)两人博弈的一个例子博弈的一组策略为一对决策组合如(U,R),其中第一个元素为参与者A的策略,第二个元素为参与者B的策略。LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A两人博弈的一个例子例如.假如A采取上上而B采取右右的策略,那么A的收益为1,B的收益为8。博弈收益矩阵LRUD(3,9)(0,0)(1,8)(2,1
3、)参与者 B参与者A两人博弈的一个例子假如A采取下下的策略而B采取右右的策略,那么A的收益为2,B的收益为1。博弈的收益矩阵LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A两人博弈的一个例子我们可能看到哪种策略组合结果?LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A两人博弈的一个例子(U,R)是否为一个有可能的策略组合结果?LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A两人博弈的一个例子假如B采取右的策略那么A的最优策略为下,因为它能使得A的收益从1变为2。因此(U,R)不是一个有可能出现的策略组合结果。LRUD(3,9)(0,0
4、)(1,8)(2,1)(U,R)是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子LRUD(3,9)(0,0)(1,8)(2,1)(U,R)是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子假如B采取右的策略,A的最佳策略为下。LRUD(3,9)(0,0)(1,8)(2,1)(D,R)是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子假如B采取右的策略,A的最佳策略为下。假如A采取下的策略,B的最佳策略为右。因此(D,R)是一个可能出现的策略组合结果。LRUD(3,9)(0,0)(1,8)(2,1)(D,R)是否为一个有可能的策略组合
5、结果?参与者 B参与者 A两人博弈的一个例子LRUD(3,9)(0,0)(1,8)(2,1)(D,L)是否为一个有可能的策略组合结果?参与者B参与者 A两人博弈的一个例子假如A采取下的策略,B的最佳策略为右。因此(D,L)不是一个可能出现的策略组合结果。LRUD(3,9)(0,0)(1,8)(2,1)(D,L)是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子LRUD(3,9)(0,0)(1,8)(2,1)(U,L)是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子假如A采取上的策略,B的最佳策略为左。LRUD(3,9)(0,0)(1,8)(2,1)(U
6、,L)是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子假如A采取上的策略,B的最佳策略为左。假如B采取左的策略,A的最佳策略为上。因此(U,L)为一个可能出现的策略组合结果。LRUD(3,9)(0,0)(1,8)(2,1)(U,L)是否为一个有可能的策略组合结果?参与者 B参与者 A纳什均衡n博弈论中的策略组合中,每个参与者的决策都是对其它参与者决策的最佳反应决策时所达到的均衡称为 纳什均衡。纳什均衡。n我们的例子中有两个纳什均衡(U,L)和(D,R)。两人博弈的例子(U,L)和(D,R)为此博弈的纳什均衡。LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者
7、 A两人博弈的例子(U,L)和(D,R)为此博弈的纳什均衡。但是我们发现:对两个参与者来说,(U,L)比(D,R)更受偏好。我们是否一定仅会看到(U,L)的博弈均衡结果?LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A囚徒困境n为了了解帕累托偏好结果是否一定就是一个博弈的结果。考虑一个很有名的囚徒困境囚徒困境博弈问题。囚徒困境这个博弈的可能结果是什么样子?克莱德邦妮(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC囚徒困境假如邦妮选择沉默,克莱德的最佳策略为供认。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克莱德邦妮囚徒困境
8、假如邦妮选择沉默,克莱德的最佳策略为供认。假如邦妮选择供认,克莱德的最优策略为供认。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克莱德邦妮囚徒困境因此不论邦妮选择什么策略,克莱德的最优策略总是供认。供认对于克莱德来说是一个占优策略占优策略。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克莱德邦妮囚徒困境同样地,不论克莱德选择什么策略,邦妮的最佳策略为供认。供认对于邦妮来说也是占优策略。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克莱德邦妮囚徒困境唯一的纳什均衡为(C,C),尽管(S,S)能使得邦妮和克莱德的处罚更
9、轻。这个唯一的纳什均衡是无效率的。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克莱德邦妮决策时机n在上面来两个例子中,参与者同时做出他们的决策。n这样的博弈称为同步博弈同步博弈。决策时机n在上面来两个例子中,参与者同时做出他们的决策。n这样的博弈称为同步博弈同步博弈。n首先行动的参与者称为领导者领导者,后行动的参与者称为追随者追随者。序贯博弈的例子n有时一个博弈可能含有几个纳什均衡,很难确定哪一种均衡结果更有可能发生。n当一个博弈为一个序贯博弈时,那么就有可能其中的一个纳什均衡比其它均衡更有可能发生。序贯博弈的例子参与者 B参与者 A(U,L)和(D,R)都为同时决
10、策时的纳什均衡,我们无法判断哪种均衡更有可能发生。LRUD(3,9)(0,0)(1,8)(2,1)序贯博弈的例子假设这个博弈为序贯博弈,A为领导者而B为追随者。我们可以把这个博弈的拓展形式拓展形式写出来。LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A序贯博弈的例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动序贯博弈的例子(U,L)为一个纳什均衡。为一个纳什均衡。UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动序贯博弈的例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动(U,L)
11、为一个纳什均衡。(D,R)也是一个纳什均衡。这两个均衡哪个更有可能发生?序贯博弈的例子假如A先选择决策U,B后选择策略L;A 所得收益为3。UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动序贯博弈的例子假如A先选择决策U,B后选择策略L;A 所得收益为3。假如A先选择策略D,B后选择策略R;A 所得收益为2。UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动序贯博弈的例子假如A先选择决策U,B后选择策略L;A 所得收益为3。假如A先选择策略D,B后选择策略R;A 所得收益为2。UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA
12、 先行动B 后行动因此(U,L)很可能为均衡结果。序贯博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A在考虑我们之前的例子。假设博弈是同步的,我们发现这个博弈有两个纳什均衡;(U,L)和(D,R)。序贯博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A参与者A 已经被考虑了上或者下的决策,但没有把这两种策略联合起来考虑。例如,仅做出单纯的上或下决策。上和下为参与者A的纯策略纯策略。序贯博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)参与者B参与者A类似地,左和右为参与者B的纯策略纯策略。序贯博弈的例子LRUD(3,9)(0,0
13、)(1,8)(2,1)参与者 B参与者 A因此,(U,L)和(D,R)为纯策略纳什均衡纯策略纳什均衡。是否每一个博弈都至少有一个纯策略纳什均衡?纯策略参与者 B参与者 A这是一个新的博弈。是否存在纯策略的纳什均衡?(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者 A(U,L)是否为一个纳什均衡?(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者 A(U,L)是否为一个纳什均衡?不是。(U,R)是否为一个纳什均衡?(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者 A(U,L)是否为一个纳什均衡?不是。(U,R)是否为一个纳什均衡?不
14、是。(D,L)是否为一个纳什均衡?(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者A(U,L)是否为一个纳什均衡?不是。(U,R)是否为一个纳什均衡?不是。(D,L)是否为一个纳什均衡?不是。(D,R)是否为一个纳什均衡?(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者 A(U,L)是否为一个纳什均衡?不是。(U,R)是否为一个纳什均衡?不是。(D,L)是否为一个纳什均衡?不是。(D,R)是否为一个纳什均衡?不是。(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者 A因此但采取纯策略时,该博弈没有纳什均衡。但是这个博弈在采取混合策
15、略混合策略时有一个纳什均衡。(1,2)(0,4)(0,5)(3,2)UDLR混合策略n参与者A选择一个概率分布(pU,1-pU),表示参与者A有pU的概率选择策略上,有1-pU的概率选择策略下;而不是单纯的选择上或者下的策略。n参与者A混合混合了上和下的纯策略。n概率分布概率分布(pU,1-pU)为参与者为参与者A的混合策略。的混合策略。混合策略n类似地,参与者B选择概率分布(pL,1-pL),表示有pL的概率他会选择左,有1-pL的概率他会选择右。n参与者B混合混合了左和右的纯策略。n概率分布概率分布(pL,1-pL)为参与者为参与者B的混合策略。的混合策略。混合策略参与者 B参与者 A这个
16、博弈没有纯策略纳什均衡,当有混合策略纳什均衡。混合纳什均衡结果是如何计算的?(1,2)(0,4)(0,5)(3,2)UDLR混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pL混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLA选择上策略时的预期收益为多少?混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLA选择上策略的预期收益为pL。A选择下策略的预期收益为多少?混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(
17、3,2)U,pUD,1-pUL,pLR,1-pLA选择上策略的预期收益为pL。A选择下策略的预期收益为3(1-pL)。A选择上策略的预期收益为pL。A选择下策略的预期收益为3(1-pL)。假如 pL 3(1-pL)那么A仅选择上的策略,但是当A采用上的纯策略时没有纳什均衡。混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pL混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLA选择上策略的预期收益为pL。A选择下策略的预期收益为3(1-pL)。假如 pL 4pU+2(1-pU)那么B
18、仅选择左的策略,但是当B仅采用左的策略时不存在纳什均衡。混合策略参与者B参与者 A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,3/4R,1/4B选择左的策略的预期收益为2pU+5(1-pU)。B选择右的策略的预期收益为4pU+2(1-pU)。假如2pU+5(1-pU)4)。最佳反应决策nUA(aA1,aB1)=6 和 UB(aA1,aB1)=4UA(aA1,aB2)=3 和 UB(aA1,aB2)=5UA(aA2,aB1)=4 和 UB(aA2,aB1)=3UA(aA2,aB2)=5 和 UB(aA2,aB2)=7.n假设B选择决策aB1,那么A的最佳反应决策为aA1(因为
19、 6 4)。n假设B选择决策aB2,那么A的最佳反应决策为什么?最佳反应决策nUA(aA1,aB1)=6 和 UB(aA1,aB1)=4UA(aA1,aB2)=3 和 UB(aA1,aB2)=5UA(aA2,aB1)=4 和 UB(aA2,aB1)=3UA(aA2,aB2)=5 和 UB(aA2,aB2)=7.n假设B选择决策aB1,那么A的最佳反应决策为aA1(因为 6 4)。n假设B选择决策aB2,那么A的最佳反应决策为aA2(因为 5 3)。最佳反应决策n假设 B 选择策略 aB1 那么A选择策略 aA1。n假设B 选择策略 aB2 那么 A 选择策略aA2。nA的最佳反应曲线最佳反应曲
20、线为:A的最佳反应决策aA1aA2aB2aB1B的决策+最佳反应决策nUA(aA1,aB1)=6 和 UB(aA1,aB1)=4UA(aA1,aB2)=3 和 UB(aA1,aB2)=5UA(aA2,aB1)=4 和 UB(aA2,aB1)=3UA(aA2,aB2)=5 和 UB(aA2,aB2)=7。最佳反应决策nUA(aA1,aB1)=6 和 UB(aA1,aB1)=4UA(aA1,aB2)=3 和 UB(aA1,aB2)=5UA(aA2,aB1)=4 和 UB(aA2,aB1)=3UA(aA2,aB2)=5和UB(aA2,aB2)=7。n假如A选择策略aA1,那么B的最佳反应决策为什么?
21、最佳反应决策nUA(aA1,aB1)=6 和 UB(aA1,aB1)=4UA(aA1,aB2)=3 和 UB(aA1,aB2)=5UA(aA2,aB1)=4 和 UB(aA2,aB1)=3UA(aA2,aB2)=5 和 UB(aA2,aB2)=7。n假如A选择策略aA1,那么B的最佳反应决策为aB2(因为 5 4)。最佳反应决策nUA(aA1,aB1)=6 和 UB(aA1,aB1)=4UA(aA1,aB2)=3 和 UB(aA1,aB2)=5UA(aA2,aB1)=4 和 UB(aA2,aB1)=3UA(aA2,aB2)=5 和 UB(aA2,aB2)=7。n假如A选择策略aA1,那么B的最
22、佳反应决策为aB2(因为 5 4)。n假如A选择策略aA2,那么B的最佳反应决策为什么?最佳反应决策nUA(aA1,aB1)=6 和 UB(aA1,aB1)=4UA(aA1,aB2)=3 和 UB(aA1,aB2)=5UA(aA2,aB1)=4 和 UB(aA2,aB1)=3UA(aA2,aB2)=5 和 UB(aA2,aB2)=7。n假如A选择策略aA1,那么B的最佳反应决策为aB2(因为 5 4)。n假如A选择策略aA2,那么B的最佳反应决策为aB2(因为 7 3)。最佳反应决策n假如A选择策略 aA1 那么 B 选择策略 aB2。n假如A选择策略 aA2 那么 B选择策略 aB2。nB的
23、最佳反应曲线最佳反应曲线为:A的最佳反应决策aA1aA2aB2aB1B的最佳反应决策最佳反应决策n假如A选择策略 aA1 那么 B 选择策略 aB2。n假如A选择策略 aA2 那么 B选择策略 aB2。nB的最佳反应曲线最佳反应曲线为:A的决策aA1aA2aB2aB1B的最佳反应决策注意到aB2 对于B来说是一个严格的占优策略。最佳反应决策和纳什均衡A的反应决策aA1aA2aB2aB1aA1aA2aB2aB1+A的策略B的反应决策B的反应决策如何利用参与者的最佳反应曲线来确定该博弈的纳什均衡?BA最佳反应决策和纳什均衡A的反应决策aA1aA2aB2aB1aA1aA2aB2aB1+A的决策B的决
24、策B的反应决策如何利用参与者的最佳反应曲线来确定该博弈的纳什均衡?将一个反应曲线置于另一个 反应曲线的顶部。BA如何利用参与者的最佳反应曲线来确定该博弈的纳什均衡?将一个反应曲线置于另一个 反应曲线的顶部。最佳反应决策和纳什均衡A的反应决策aA1aA2aB2aB1aA1aA2aB2aB1+A的决策B的决策B的反应决策BA如何利用参与者的最佳反应曲线来确定该博弈的纳什均衡?将一个反应曲线置于另一个 反应曲线的顶部。最佳反应决策和纳什均衡A的反应决策aA1aA2aB2aB1+B的反应决策是否存在一个纳什均衡?如何利用参与者的最佳反应曲线来确定该博弈的纳什均衡?将一个反应曲线置于另一个 反应曲线的顶
25、部。最佳反应决策和纳什均衡A的反应决策aA1aA2aB2aB1+是否存在一个纳什均衡?存在,(aA2,aB2)。为什么?B的反应决策如何利用参与者的最佳反应曲线来确定该博弈的纳什均衡?将一个反应曲线置于另一个 反应曲线的顶部。最佳反应决策和纳什均衡A的反应决策aA1aA2aB2aB1+是否存在一个纳什均衡?存在,(aA2,aB2)。为什么?aA2 为对决策aB2的最佳反应决策。aB2 为对决策aA2的最佳反应决策。B的反应决策最佳反应决策和纳什均衡6,43,55,74,3aA1aA2aB1aB2参与者参与者 B参与者参与者 AaA2 为对决策aB2的唯一最佳反应决策。aB2 为对决策aA2的唯
26、一最佳反应决策。博弈的策略表最佳反应决策和纳什均衡6,43,55,74,3aA1aA2aB1aB2参与者参与者 B参与者参与者 A博弈的策略表aA2 为对决策aB2的唯一最佳反应决策。aB2 为对决策aA2的唯一最佳反应决策。是否存在第二个纳什均衡?最佳反应决策和纳什均衡6,43,55,74,3aA1aA2aB1aB2参与者参与者 B参与者参与者 A是否存在第二个纳什均衡?不存在,因为 aB2 对于B来说为一个严格占优策略。aA2 为对决策aB2的唯一最佳反应决策。aB2 为对决策aA2的唯一最佳反应决策。博弈的策略表最佳反应决策和纳什均衡现在允许两个参与者混合他们的决策。6,43,55,74
27、,3aA1aA2aB1aB2参与者参与者 B参与者参与者 A最佳反应决策和纳什均衡现在允许两个参与者混合他们的决策。6,43,55,74,3aA1aA2aB1aB2参与者参与者 B参与者参与者 AA选择决策aA1的概率为pA1,B选择决策aB1的概率为pB1。最佳反应决策和纳什均衡6,43,55,74,3aA1aA2aB1aB2参与者参与者 B参与者参与者 AA选择决策aA1的概率为pA1,B选择决策aB1的概率为pB1。给定 pB1,pA1为多少对A最好?最佳反应决策和纳什均衡6,43,55,74,3aA1aA2aB1aB2参与者参与者 B参与者参与者 AEVA(aA1)=6pB1+3(1-
28、pB1)=3+3pB1.A选择决策aA1的概率为pA1,B选择决策aB1的概率为pB1。给定 pB1,pA1为多少对A最好?最佳反应决策和纳什均衡6,43,55,74,3aA1aA2aB1aB2参与者参与者 B参与者参与者 AA选择决策aA1的概率为pA1,B选择决策aB1的概率为pB1。给定 pB1,pA1为多少对A最好?EVA(aA1)=6pB1+3(1-pB1)=3+3pB1.EVA(aA2)=4pB1+5(1-pB1)=5-pB1.最佳反应决策和纳什均衡A选择决策aA1的概率为pA1,B选择决策aB1的概率为pB1。给定 pB1,pA1为多少对A最好?EVA(aA1)=3+3pB1.E
29、VA(aA2)=5-pB1.3+3pB1 5-pB1 当 pB1?=aA2 假如 pB1=aA2(例如 pA1=0)假如 pB1=aA2(例如 pA1=0)假如 pB1 aA2(例如 pA1=0)假如 pB1 aA2(例如 pA1=0)假如 pB1 aA2(例如 pA1=0)假如 pB1=最佳反应决策和纳什均衡A选择策略aA1的概率为pA1,B选择策略aB1的概率为pB1。给定pA1,pB1为多少时对B最好?EVB(aB1)=3+pA1.EVB(aB2)=7-2pA1.3+pA1 7-2pA1 对于所有0 pA1 1.最佳反应决策和纳什均衡A选择决策aA1的概率为pA1,B选择决策aB1的概率为pB1。给定 pB1,pA1为多少对A最好?EVB(aB1)=3+pA1.EVB(aB2)=7-2pA1.3+pA1=pSBpJB110013/西斯合作博弈;性别战pSBpJB110013/西斯pSBpJB110013/杰克合作博弈;性别战pSBpJB110013/西斯pSBpJB110013/杰克博弈的纳什均衡为什么?合作博弈;性别战pSBpJB110013/西斯pSBpJB110013/杰克博弈的纳什均衡为什么?