1、1第十章第十章 博弈论博弈论 通过前面分析可知,寡头想达到垄断通过前面分析可知,寡头想达到垄断的结果,需要进行合作,而合作往往的结果,需要进行合作,而合作往往难以维持。其均衡是博弈的结果。难以维持。其均衡是博弈的结果。博弈论:研究人们在各种战略情况下博弈论:研究人们在各种战略情况下如何行事如何行事。2囚犯的两难处境囚犯的两难处境 张三张三坦白坦白抵赖抵赖 李四李四坦白坦白 抵赖抵赖-8,-8 0,-20-20,0 -1,-13红与黑的游戏MAX:profit红,红 -3,-3黑,黑 +3,+3红,黑 +5,-5 共6轮决策,第3轮分数x2,第6轮分数x4总分最高者获胜4一、博弈论的基本概念一、
2、博弈论的基本概念博弈博弈是指具有不同利益和目标的多个行为主体共同参加是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。并相互影响的事态发展过程中的策略决策。博弈论博弈论(Game Theory)也称对策论,它是一种分析博)也称对策论,它是一种分析博弈过程和结果的数学方法,研究具有理性的多个行为弈过程和结果的数学方法,研究具有理性的多个行为主体的决策和行动直接相互作用和影响时,事态发展主体的决策和行动直接相互作用和影响时,事态发展过程的决策和均衡问题。广泛应用于政治、军事、经过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。济、外交和日常
3、生活的许多领域。5二、特二、特 点点参与者具有各自的目标:参与者具有各自的目标:参与者都是理性行为者;参与者都是理性行为者;参与者之间具有相关性;参与者之间具有相关性;事态发展的结果取决于全部参与者的共事态发展的结果取决于全部参与者的共同行为;同行为;参与者要根据对其他参与者的判断决定参与者要根据对其他参与者的判断决定自己的行动,因而是对策。自己的行动,因而是对策。6博弈论与优化论的不同博弈论与优化论的不同优化论是一种优化论是一种单方决策理论单方决策理论博弈论所揭示的是一种博弈论所揭示的是一种多方决策理论多方决策理论7三、博弈的基本要素三、博弈的基本要素参与者参与者Players(玩家):(玩
4、家):即参加博弈过程的行为和决策即参加博弈过程的行为和决策主体,也是利益主体。在一个博弈中,最少要有两个参主体,也是利益主体。在一个博弈中,最少要有两个参与者。与者。策略策略Strategies(战略或策略行为):即参与者在某个博(战略或策略行为):即参与者在某个博弈时点,根据其掌握的有关博弈信息而选择的决策变量弈时点,根据其掌握的有关博弈信息而选择的决策变量和行动计划,一个参与者的全部可行策略称为他的策略和行动计划,一个参与者的全部可行策略称为他的策略空间。空间。收益收益Payoff(支付、得益)和收益函数:(支付、得益)和收益函数:收益是指在既定收益是指在既定策略组合条件下参与者的得失情况
5、。每个参与者的收益策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略,称为收益函数。取决于全部参与者所采取的策略,称为收益函数。8结局结局 outcome(结果):指博弈的结果,指既定(结果):指博弈的结果,指既定策略组合条件下全部参与者所得收益的集合。策略组合条件下全部参与者所得收益的集合。均衡均衡 Equilibrium(均势):指达到稳定的策略(均势):指达到稳定的策略组合或结局。组合或结局。博弈规则博弈规则:指参与者、策略、结局之间的联系。指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决它是由博弈的环境和参与者之间的相互影响决定的。定的
6、。9博弈的例子博弈的例子可口可乐与百事可乐(可口可乐与百事可乐(参与者参与者)的价格决策:)的价格决策:双方都可以保持价格不变或提高价格(双方都可以保持价格不变或提高价格(策略策略)博弈目标和得失情况体现为利润多少(博弈目标和得失情况体现为利润多少(收益收益)利润的大小取决于双方策略组合(利润的大小取决于双方策略组合(收益函数收益函数)博弈有四种策略组合,其(博弈有四种策略组合,其(结局结局)表示为以下)表示为以下收益矩阵收益矩阵10博弈的例子博弈的例子 博弈的标准模型博弈的标准模型 包括三个要素:参与者、每个参与者可以选择包括三个要素:参与者、每个参与者可以选择的策略以及收益函数。的策略以及
7、收益函数。在两个参与者的有限博弈中,标准模型可以用收益矩阵表示。在两个参与者的有限博弈中,标准模型可以用收益矩阵表示。参与者参与者2 百事可乐百事可乐 参与者参与者1 可口可乐可口可乐 不涨价不涨价 涨价涨价 不涨价不涨价 涨价涨价10,10 100,-30-20,30 140,3511四、博弈的分类四、博弈的分类(一)合作博弈与非合作博弈(一)合作博弈与非合作博弈(根据参与者之间能否通(根据参与者之间能否通过谈判达成具有约束力的协议或合同来划分)过谈判达成具有约束力的协议或合同来划分)可以达成协议的为合作博弈可以达成协议的为合作博弈cooperative game,合作博弈强调合作博弈强调集
8、体理性和整体最优集体理性和整体最优。如买卖双方讨价还价后成交。如买卖双方讨价还价后成交。不能达成协议的为非合作博弈不能达成协议的为非合作博弈non-cooperative game,非合作非合作博弈强调个体理性和局部最优。博弈强调个体理性和局部最优。如寡头之间的竞争博弈,如寡头之间的竞争博弈,双方的利益和目标有冲突,难以达成可以实施的协议,双双方的利益和目标有冲突,难以达成可以实施的协议,双方都有欺骗和违约的冲动。方都有欺骗和违约的冲动。12博弈的分类博弈的分类(二)静态博弈与动态博弈(二)静态博弈与动态博弈 (根据参与者选择策略的关系划分)根据参与者选择策略的关系划分)参与者同时或独立选择策
9、略的博弈是参与者同时或独立选择策略的博弈是静态博弈静态博弈。参与者按照一定的次序选择策略,后选择者了解参与者按照一定的次序选择策略,后选择者了解先选择者的行动,这种博弈是先选择者的行动,这种博弈是动态博弈动态博弈。13博弈的分类博弈的分类(三)完全信息博弈与不完全信息博(三)完全信息博弈与不完全信息博(根据参与者对其他参与者的特征、策略空间、(根据参与者对其他参与者的特征、策略空间、收益函数等信息的了解程度划分)收益函数等信息的了解程度划分)n全部相互了解即为完全信息博弈;全部相互了解即为完全信息博弈;n否则是不完全信息博弈否则是不完全信息博弈14五、博弈的均衡概念五、博弈的均衡概念 n博弈方
10、的博弈方的不同策略将导致各种不同的均衡不同策略将导致各种不同的均衡,而均,而均衡的特征又与博弈方的行为假设有密切关系。衡的特征又与博弈方的行为假设有密切关系。n首先分析静态的非合作的博弈,并且对博弈双方首先分析静态的非合作的博弈,并且对博弈双方的行为作出以下假设:的行为作出以下假设:假定博弈双方是理性的假定博弈双方是理性的 假定博弈双方具有完全的信息假定博弈双方具有完全的信息 假定博弈双方独立地进行决策假定博弈双方独立地进行决策 15 海滩定位问题海滩定位问题 400米米A海海滩滩161 1、支配性策略均衡、支配性策略均衡 支配性策略支配性策略也称也称上策上策或或优势策略优势策略 在博弈中,对
11、有些参与者来说,不管对手采在博弈中,对有些参与者来说,不管对手采取什么策略,他的策略都保持不变。这种不取什么策略,他的策略都保持不变。这种不取决于对手选择的最优策略称为支配性策略取决于对手选择的最优策略称为支配性策略(上策或优势策略)。(上策或优势策略)。17支配性策略均衡支配性策略均衡 囚徒困境囚徒困境囚徒困境说明,个人理性(最优)与集体理性(最优)囚徒困境说明,个人理性(最优)与集体理性(最优)可能不一致。可能不一致。如寡头之间的广告投入、产量控制等。如寡头之间的广告投入、产量控制等。囚徒囚徒1坦白坦白抵赖抵赖 囚徒囚徒2坦白坦白 抵赖抵赖-8,-8 0,-20-20,0 -1,-118
12、广告博弈的优势策略均衡?广告博弈的优势策略均衡?广告博弈的得益矩阵广告博弈的得益矩阵 厂商厂商2厂商厂商1做做 广广 告告不做广告不做广告做做 广广 告告10,515,0不做广告不做广告6,810,219博弈一方无优势策略博弈一方无优势策略 厂 商厂 商 2厂商厂商1做做 广广 告告不做广告不做广告做做 广广 告告10,515,0不做广告不做广告6,820,220 不存在优势策略的夫妻之争不存在优势策略的夫妻之争 王先生王先生W张女士张女士Z看球赛看球赛(T)看电影看电影(F)看球赛(看球赛(T)1,20,0看电影(看电影(F)0,03,1212、纳什均衡、纳什均衡 纳什均衡纳什均衡是在博弈一
13、方既定的策略下,博弈的另一方是在博弈一方既定的策略下,博弈的另一方所能选择的最佳策略,并且没有改变策略的冲动。所能选择的最佳策略,并且没有改变策略的冲动。优势策略优势策略(上策上策)均衡均衡是不管博弈一方选择什么策略,是不管博弈一方选择什么策略,博弈的另一方所选择的策略都是最好的。博弈的另一方所选择的策略都是最好的。优势策略均衡是纳什均衡优势策略均衡是纳什均衡的特例,但是反过来的特例,但是反过来纳什均纳什均衡未必是优势策略均衡。衡未必是优势策略均衡。22 产品选择问题的纳什均衡产品选择问题的纳什均衡 厂商厂商 2厂商厂商1咸咸甜甜咸咸-4,-49,9甜甜10,10-4,-4233、最大最小策略
14、、最大最小策略纳什均衡是建立在参与者理性行为基础上的,这纳什均衡是建立在参与者理性行为基础上的,这就使参与者在决策时面临可能出现某些非理性就使参与者在决策时面临可能出现某些非理性行为的风险。为了降低风险,决策者可以采取行为的风险。为了降低风险,决策者可以采取最大最小策略最大最小策略以便降低风险,即以便降低风险,即在各种策略的在各种策略的最小收益中,选择具有最大收益的策略。最小收益中,选择具有最大收益的策略。其代其代价是放弃最优策略。价是放弃最优策略。243、最大最小策略、最大最小策略 博弈方博弈方2博弈方博弈方1进进退退守守1,01,2攻攻-600,04,2253、最大最小策略、最大最小策略下
15、图是一个产品开发博弈的收益矩阵。其中,按照理性下图是一个产品开发博弈的收益矩阵。其中,按照理性行为会有两种纳什均衡,(行为会有两种纳什均衡,(无新产品,有新产品无新产品,有新产品)以)以及(及(有新产品,无新产品有新产品,无新产品)。但如果采取最大最小策)。但如果采取最大最小策略,两个企业略,两个企业都不推出新产品都不推出新产品。厂商厂商1无新品无新品有新品有新品 厂商厂商2无新品无新品 有新品有新品4,4 3,66,3 2,2厂商厂商2的最小收益的最小收益 3 2厂商厂商1的最小收的最小收益益 3 226威胁信号?威胁信号?公司之间经常相互发出信号以表明他们的意图、动机公司之间经常相互发出信
16、号以表明他们的意图、动机和目标。有些信号是威胁性的。和目标。有些信号是威胁性的。例如,例如,A公司宣布,如果谁挑起价格战,它将坚决奉公司宣布,如果谁挑起价格战,它将坚决奉陪到底,并宣称其规模在本行业中名列前茅,最有降陪到底,并宣称其规模在本行业中名列前茅,最有降价的实力。价的实力。是否所有的威胁都是可信的?是否所有的威胁都是可信的?B公司公司 降价降价 不降价不降价 降价降价 100,200 200,-100 不降价不降价 600,1000 1000,700A公司公司A公司降价的威胁公司降价的威胁可信吗?不可信。可信吗?不可信。如果如果A公司要让公司要让B公司相信其威胁是公司相信其威胁是可信的
17、,只有一个可信的,只有一个途径:建立一种不途径:建立一种不按牌理出牌的形象按牌理出牌的形象27限制进入限制进入在许多行业中在位者可以采取一定的策略性行动形成对在许多行业中在位者可以采取一定的策略性行动形成对进入的威慑。进入的威慑。下图列出了一个进入博弈的收益矩阵。显然,默许是在下图列出了一个进入博弈的收益矩阵。显然,默许是在位者的支配性策略(上策),商战是一个空头威胁,位者的支配性策略(上策),商战是一个空头威胁,潜在的进入者将会选择进入。潜在的进入者将会选择进入。28限制进入限制进入为了使商战的威胁具有可信性和效果,在位者可以用策为了使商战的威胁具有可信性和效果,在位者可以用策略性行动作出承
18、诺,一旦进入发生,它将以低价回击。略性行动作出承诺,一旦进入发生,它将以低价回击。比如,它可以建造并维持一定的剩余生产能力,这将比如,它可以建造并维持一定的剩余生产能力,这将使它的垄断利润减少使它的垄断利润减少30,博弈的收益矩阵变为:,博弈的收益矩阵变为:高价不再是一个上策,均衡可能是(高价,不进入)。高价不再是一个上策,均衡可能是(高价,不进入)。29贸易政策与国际竞争贸易政策与国际竞争一个国家的政府对本国战略性产业进行扶持,可一个国家的政府对本国战略性产业进行扶持,可以影响国际竞争格局。以影响国际竞争格局。政府不干预政府不干预 欧洲有关国家政府补贴后欧洲有关国家政府补贴后 空中客车空中客
19、车 空中客车空中客车 生产生产 不生产不生产 生产生产 不生产不生产 生产生产 -10,-10 100,0 生产生产 -10,10 100,0 不生产不生产 0,100 0,0 不生产不生产 0,120 0,0波音波音波音波音30合作的诱惑合作的诱惑在类似囚徒的困境这样的博弈中,在类似囚徒的困境这样的博弈中,个体理性往往导个体理性往往导致集体的非理性致集体的非理性。在有多个纳什均衡的博弈中,。在有多个纳什均衡的博弈中,参与者判断失误,或者某个参与者非理性行为,参与者判断失误,或者某个参与者非理性行为,都会导致双方的严重损失。因此,存在着通过合都会导致双方的严重损失。因此,存在着通过合作改善博弈
20、结果的诱惑,这样可以使大家的收益作改善博弈结果的诱惑,这样可以使大家的收益都得到改善。都得到改善。例如,在上述广告博弈中,如果双方都不做广告,例如,在上述广告博弈中,如果双方都不做广告,比都做广告收益高。但这种合作难以自动实现。比都做广告收益高。但这种合作难以自动实现。31合作的诱惑合作的诱惑对社会无害的合作,往往通过某些规则实现对社会无害的合作,往往通过某些规则实现。交通规则。交通规则下图列出了斗鸡博弈的收益矩阵。设两辆汽车同时到达下图列出了斗鸡博弈的收益矩阵。设两辆汽车同时到达一个十字路口,每个驾驶员都有开和等两种选择,博一个十字路口,每个驾驶员都有开和等两种选择,博弈结果如下,弈结果如下
21、,需要通过交通规则引导博弈。需要通过交通规则引导博弈。驾驶员驾驶员1开开等等 驾驶员驾驶员2 开开 等等 -8,-8 4,0 0,4 0,032合作的诱惑合作的诱惑对社会有害的合作,设法制止对社会有害的合作,设法制止。在囚徒困境博弈中,如在囚徒困境博弈中,如果两个囚徒可以形成攻守同盟,则罪犯得到好处,对果两个囚徒可以形成攻守同盟,则罪犯得到好处,对社会不利。例如在寡头厂商的定价博弈中,勾结定高社会不利。例如在寡头厂商的定价博弈中,勾结定高价对双方都有好处,但对社会不利,因此受到反垄断价对双方都有好处,但对社会不利,因此受到反垄断法的严密监控。寡头厂商的价格博弈收益矩阵如下:法的严密监控。寡头厂
22、商的价格博弈收益矩阵如下:厂商厂商1高价高价低价低价 厂商厂商2 高价高价 低价低价 50,50 10,70 70,10 30,3033重复博弈和序列博弈重复博弈和序列博弈 在现实经济社会,完全信息静态博弈的条件并在现实经济社会,完全信息静态博弈的条件并不经常可以得到满足。特别是在市场竞争中,不经常可以得到满足。特别是在市场竞争中,厂商之间的竞争不是一次性的,而是长期和反厂商之间的竞争不是一次性的,而是长期和反复的。同时,厂商之间的行为往往是有先后次复的。同时,厂商之间的行为往往是有先后次序的,决策者可以先了解对手的行动,在充分序的,决策者可以先了解对手的行动,在充分掌握信息的基础上,然后再决
23、定自己的对策。掌握信息的基础上,然后再决定自己的对策。这种情况称为这种情况称为完全信息动态博弈完全信息动态博弈。34重复博弈重复博弈在下图的价格博弈中,如果是静态博弈,厂商很容易陷在下图的价格博弈中,如果是静态博弈,厂商很容易陷入囚徒的困境(低价,低价)。但如果博弈可以无限入囚徒的困境(低价,低价)。但如果博弈可以无限重复下去,则厂商的最佳策略是重复下去,则厂商的最佳策略是“以牙还牙以牙还牙”。这样,。这样,考虑到对手会以牙还牙,从长远和整体来看,降低价考虑到对手会以牙还牙,从长远和整体来看,降低价格不会有什么好处,博弈可能达到合作的结果。格不会有什么好处,博弈可能达到合作的结果。厂商厂商1低
24、价低价高价高价 厂商厂商2 低价低价 高价高价 10,10 100,-50-50,100 50,5035重复博弈重复博弈 在现实经济运行中,寡头之间的价格默契并在现实经济运行中,寡头之间的价格默契并不容易,主要原因有:不容易,主要原因有:如果博弈重复是有限的,则最后一次博弈会采取低价策如果博弈重复是有限的,则最后一次博弈会采取低价策略,理性的结果是抢先低价,一直到第一次博弈;但是,略,理性的结果是抢先低价,一直到第一次博弈;但是,只要以牙还牙的理性行为有一定折扣或(怀疑),合作只要以牙还牙的理性行为有一定折扣或(怀疑),合作以避免价格战的结果仍然会出现。以避免价格战的结果仍然会出现。厂商较多,
25、使以牙还牙(对欺骗者进行报复和惩罚)难厂商较多,使以牙还牙(对欺骗者进行报复和惩罚)难以实现,合作就十分困难。以实现,合作就十分困难。厂商之间的成本差别较大,需求和成本变化很快,难以厂商之间的成本差别较大,需求和成本变化很快,难以达成默契。达成默契。36序列博弈序列博弈在现实中,较常见的是在现实中,较常见的是序列博弈序列博弈,即一方先行动,另一,即一方先行动,另一方后行动。方后行动。先行者优势先行者优势 在序列博弈中,先行者处于有利地位。如果在序列博弈中,先行者处于有利地位。如果是静态博弈,两厂商必须同时宣布决策。根据最大最是静态博弈,两厂商必须同时宣布决策。根据最大最小原则,可能大家都无新产
26、品。但如果其中某一厂商小原则,可能大家都无新产品。但如果其中某一厂商率先推出新产品,则另一厂商只好放弃进入该市场。率先推出新产品,则另一厂商只好放弃进入该市场。37序列博弈序列博弈在重复博弈的情况下,厂商可能不仅考虑在重复博弈的情况下,厂商可能不仅考虑短期收短期收益益,而且更重视,而且更重视长期利益长期利益。因此,为了维持长。因此,为了维持长期的垄断利润,厂商可能以牺牲短期利益为代期的垄断利润,厂商可能以牺牲短期利益为代价把进入者驱逐出去。这种价把进入者驱逐出去。这种在博弈中采取一定在博弈中采取一定非理性行为非理性行为的方法,形成进入威慑的另一种途的方法,形成进入威慑的另一种途径,即建立不惜一切代价粗暴对待进入者的名径,即建立不惜一切代价粗暴对待进入者的名声,而不需要有具体的承诺。(实际上是把牺声,而不需要有具体的承诺。(实际上是把牺牲短期利益作为承诺)牲短期利益作为承诺)