1、2023-2-16第七讲博弈论与竞争策略第七讲博弈论与竞争策第七讲博弈论与竞争策略略第七讲博弈论与竞争策略在现实经济社会,完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力,又面临很大的竞争压力。厂商之间具有相关性和依存性。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi),他们都对博弈论在经济学中的应用作出了贡献。请大家浏览“诺贝尔经济学奖得主北京论坛”第七讲博弈论与竞争策略 70年代以来,博弈论已经发展成为现代经济学的基础重要基础之一,改变了传统经济学的结构
2、,这主要有两个方面的原因:1现实经济运行中市场是不完全竞争不完全竞争的,行为主体之间的决策具有相互影响 2在信息不对称信息不对称条件下 博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外,关键是正确估计各参与者的策略空间和收益函数。第七讲博弈论与竞争策略第一节第一节 博弈论的基本概念博弈论的基本概念 一博弈论及其特点博弈论及其特点 1博弈和博弈论 博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。博弈论(Game Theory)也称对策论,它是一种分析博弈过程和结果的数学方法,研究具有理性的理性的多个行为主体的决策和行动直接相互作用和影响时,事态发展过
3、程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。第七讲博弈论与竞争策略2特点:(1)参与者具有各自的目标:(2)参与者都是理性行为者;(3)参与者之间具有相关性;(4)事态发展的结果取决于全部参与者的共同行为;(5)参与者要根据对其他参与者的判断决定自己的行动,因而是对策。可见,博弈论是与优化论不同的决策理论。优化论是一种单人决策理论单人决策理论;博弈论所揭示的规律是一种多人决策理论多人决策理论。第七讲博弈论与竞争策略二博弈论的基本概念二博弈论的基本概念 在博弈论中,博弈的基本要素被概括为以下概念:1)参与者Players(玩家):即参加博弈过程的行为和决策主体,也是
4、利益主体。在一个博弈中,最少要有两个参与者。2)策略Strategies(战略或策略行为):即参与者在某个博弈时点,根据其掌握的有关博弈信息而选择的决策变量和行动计划,一个参与者的全部可行策略称为他的策略空间策略空间。3)收益Payoff(支付、得益)和收益函数:收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略,称为收益函数。4)结局 outcome(结果):指博弈的结果,指既定策略组合条件下全部参与者所得收益的集合。5)均衡 Equilibrium(均势):指达到稳定的策略组合或结局。6)博弈规则:(游戏规则)第七讲博弈论与竞争策略例:可口可乐与百事
5、可乐(参与者参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略策略)博弈的目标和得失情况体现为利润的多少(收益收益)利润的大小取决于双方的策略组合(收益函数收益函数)博弈有四种策略组合,其结局结局是:(1)如果双方都不涨价,各得利润10单位;(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;博弈的稳定状态有两个:都不涨价或者都涨价(均衡均衡),均衡称为博弈的解,它是由博弈规则博弈规则(即参与者采取什么策略会取得什么结局
6、,市场的需求弹性、交叉价格弹性等)决定的。第七讲博弈论与竞争策略三博弈的表述方法三博弈的表述方法 博弈一般用数学模型表达,分为标准和扩展模型两种。1.博弈的标准模型 包括三个要素:参与者、每个参与者可以选择的策略以及收益函数。在两个参与者的有限博弈中,标准模型可以用收益矩阵收益矩阵表示。如上例的可乐价格博弈可以表示如下:在收益矩阵中,包含了标准博弈模型的基本信息,表格中各组数字表示不同策略组合条件下的结局。在每个结局中,第一个数字代表参与者1 的收益,第二个数字代表参与者2的收益。参与者2 百事可乐 参与者2 可口可乐 不涨价 涨价 不涨价 涨价10,10 100,-30-20,30 140,
7、35第七讲博弈论与竞争策略2.博弈的扩展模型 包括五个要素:参与者、决策时点、策略空间、信息和收益函数。在简单的博弈中,扩展模型可以用博弈树博弈树表示。如上例的可乐价格博弈可表示如图下:不涨价涨价参与者1可口可乐10,10100,-30-20,30140,35不涨价涨价参与者2百事可乐不涨价涨价参与者2百事可乐 博弈树一般用来分析动态博弈。在博弈过程中,从某一个决策点开始,参与者在已有行动的基础上开始选择,到博弈结束,称为“子博弈”。第七讲博弈论与竞争策略四博弈的分类四博弈的分类(1)合作博弈与非合作博弈 根据参与者之间能否通过谈判达成具有约束力的协议或合同来划分。可以达成协议的为合作博弈co
8、operative game,合作博弈强调集体理性和整体最优。如买卖双方讨价还价后成交。不能达成协议的为非合作博弈non-cooperative game,非合作博弈强调个体理性和局部最优。如寡头之间的竞争博弈,双方的利益和目标有冲突,难以达成可以实施的协议,双方都有欺骗和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领域。(2)静态博弈与动态博弈 根据参与者选择策略的关系划分。参与者同时或独立选择策略的博弈是静态博弈。参与者按照一定的次序选择策略,后选择者了解先选择者的行动,这种博弈是动态博弈。(3)完全信息博弈与不完全信息博弈 根据参与者对其他参与者的特征、策略空间、收益函数等信息的了
9、解程度划分。全部相互了解即为完全信息博弈,否则是不完全信息博弈。第七讲博弈论与竞争策略第二节第二节 完全信息静态博弈静态博弈 一囚徒的困境与纳什均衡一囚徒的困境与纳什均衡 1囚徒的困境:假设有两个嫌疑犯作案后被抓获,并在不同的房间审讯。警察告诉他们,如果两人都坦白,各判刑8年;如果两人都抵赖,各判刑1年;如果其中一人坦白而另一人抵赖,坦白者释放,抵赖者判刑10年;这样,每个犯人就有两种策略,即坦白和抵赖。这个博弈的收益矩阵如下 囚徒1坦白抵赖 囚徒2坦白 抵赖-8,-8 0,-10-10,0 -1,-1 在这个博弈中,(坦白,坦白)是博弈的解,即均衡结局。因为不管对方怎样行动,两个囚徒都会选择
10、坦白。囚徒的困境说明,个人理性(最优)与集体理性(最优)可能不一致。如寡头之间的广告投入、产量控制等。第七讲博弈论与竞争策略囚徒困境的寓意v两个寡头选择产量的博弈v公共产品的供给v冷战期间的军备竞赛v经济改革既得利益集团与改革者v土地征用制度改革第七讲博弈论与竞争策略2纳什均衡 在这个博弈中,出现了两个纳什均衡,参与者不能判断对方会采取什么策略,因而可能出现非均衡的结局(涨价,不涨价)和(不涨价,涨价);或者对双方不利的均衡(不涨价,不涨价)。因此,纳什均衡只说明均衡存在的可能,不能解释均衡的结果。纳什均衡是指由所有参与者的最优策略组成的策略组合。在这种情况下,没有人可以从改变策略中得到好处,
11、因而形成了一种均衡(僵局)。帕雷托最优一种制度或者协议要能够自动实行(即得到自觉遵守),必须满足纳什均衡的条件。可以通过画圈的方法求解纳什均衡。例如,前述可乐定价博弈收益矩阵可以确定有(涨价,涨价)和(不涨价,不涨价)两个纳什均衡。第七讲博弈论与竞争策略常见的博弈 智猪博弈 斗鸡博弈 性别博弈第七讲博弈论与竞争策略1.智猪博弈q H:v 按铃控制食物供给10单位/按v谁按就有2单位的成本付出v若大猪先到,吃9单位;小猪吃1单位v若同时到,大猪吃7单位,小猪吃3单位v若小猪先到,大猪吃6单位,小猪吃4单位q纳什均衡(大猪按,小猪等)智猪博弈矩阵图 大猪按等 小猪 按 等5,1 4,49,-1 0
12、,0第七讲博弈论与竞争策略现实中的智猪博弈 大股东和小股东监督经理的责任 大企业和小企业广告宣传 富人与穷人造桥,修路“多劳不能多得”链接第七讲博弈论与竞争策略智猪博弈与激励对策 方案一:减量方案,投食为原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。方案二:增量方案,投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,但竞争意识却不会很强。方案三:减量加移位方案,
13、投食为原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。第七讲博弈论与竞争策略2.斗鸡博弈q现实中的斗鸡博弈v十字路口v市场容量有限的,谁先进入,谁占优v游行队伍与警察o 理性/理智的假设,if not,镇压/动乱 斗鸡博弈矩阵 甲进退 乙进 退-3,-3 10,00,10 0,0这里涉及到一个承诺的问题,即,如何作出有效的承诺,让后动者相信“承诺”而放弃竞争第七讲博弈论与竞争策略3.性别博弈“性别战”传统的“天仙配”“当家的”“妻管严”谁说了算,取决于什么?经济实力?文化?修养?2,10,00,01,2丈夫歌
14、剧球赛歌剧球赛妻子实际意义:“制式博弈”标准的形成家电行业的竞争过程计算机的操作系统的统一我国奶片的行业标准的制定第七讲博弈论与竞争策略二支配性策略二支配性策略dominant strategy均衡均衡 支配性策略均衡也称上策均衡或优势策略均衡。在博弈中,对有些参与者来说,不管对手采取什么策略,他的策略都保持不变。这种不取决于对手选择的最优策略称为支配性策略(上策或优势策略)。当存在支配性策略时,可以首先确定支配性策略,然后确定对手的选择,从而得出博弈的均衡解。例如,两个寡头厂商的广告博弈收益矩阵如下:参 与 者1可 口 可乐有广告无广告 参与者2 百事可乐有广告 无广告10,5 15,06,
15、8 20,6 在这个博弈中,百事可乐有一个支配性策略,即不管可口可乐是否有广告,他都会有广告。在此基础上,可口可乐必然也会有广告。博弈的结果就是(有广告,有广告)。这种均衡称为支配性策略均衡。它也是纳什均衡,但纳什均衡不一定是支配性策略。第七讲博弈论与竞争策略三合作的诱惑三合作的诱惑 在类似囚徒的困境这样的博弈中,个体理性往往导致集体的非理性。在有多个纳什均衡的博弈中,参与者判断失误,或者某个参与者非理性行为,都会导致双方的严重损失。因此,存在着通过合作(共谋、勾结和串通)改善博弈结果的诱惑,这样可以是大家的收益都得到改善。例如,在上述广告博弈中,如果双方都不做广告,比都做广告收益高。但这种合
16、作难以自动实现。曼瑟尔奥尔森,集体行动的逻辑第七讲博弈论与竞争策略1对社会无害的合作,往往通过某些规则实现 如香烟广告,交通规则,重复建设。下图列出了斗鸡博弈的收益矩阵。设两辆汽车同时到达一个十字路口,每个驾驶员都有开开和等等两种选择,博弈结果如下:驾驶员1开等 驾驶员2 开 等 -8,-8 4,0 0,4 0,0 在这个博弈中,(开,等)和(等,开)是两个纳什均衡,但在完全信息静态博弈中,可能由于判断失误导致交通事故,或无谓地延误时间。因此通过交通规则引导博弈。第七讲博弈论与竞争策略 厂商1脆甜 厂商2 脆 甜 -5,-5 10,20 20,10 -8,-8避免重复建设 例如两个厂商进行产品
17、开发博弈的收益矩阵。两个厂商同时开发一个市场(麦片),市场需要甜和脆两种产品,每个厂商只能生产其中一种产品。从收益矩阵可以看出,在理性行为条件下博弈的两个纳什均衡是(脆,甜)和(甜,脆)。但由于推出甜的厂商有较多利润,可能导致(甜,甜)的重复建设结果。因此,应该通过发布信息和政策引导。第七讲博弈论与竞争策略2对社会有害的合作,设法制止 在囚徒的困境博弈中,如果两个囚徒可以互相协商,并形成攻守同盟,则罪犯得到好处,对社会不利。例如在寡头厂商的定价博弈中,勾结定高价对双方都有好处,但对社会不利,因此受到反垄断法的严密监控。寡头厂商的价格博弈收益矩阵如下:厂商1高价低价 厂商2 高价 低价 50,5
18、0 10,70 70,10 30,30第七讲博弈论与竞争策略四最大最小策略四最大最小策略 纳什均衡是建立在参与者理性行为基础上的,这就使参与者的决策时面临可能出现某些非理性行为的风险。为了降低风险,决策者可以采取最大最小策略最大最小策略以便降低风险,即在各种策略的最小收益中,选择具有最大收益的策略。其代价是放弃最优策略。下图是一个产品开发博弈的收益矩阵。其中,按照理性行为会有两种纳什均衡,(无新产品,有新产品)以及(有新产品,无新产品)。但如果采取最大最小策略,两个企业都不推出新产品。厂商1无新品有新品 厂商2无新品 有新品4,4 3,66,3 2,2厂商2的最小收益 3 2厂商1的最小收益
19、3 2第七讲博弈论与竞争策略支配性策略 在有些情况下,为了避免陷入被动,采取最大最小策略十分必要。在下图的博弈中,乙方采取“右”是一个支配性策略。因为不管甲方选什么,乙方采取右的策略都比左的策略好,可以得到1的收益。在期望乙方采取右的情况下,甲方应该采取“下”,并得到2的收益。这样,支配性策略均衡为(下,右)。如果甲方比较慎重,考虑到乙方可能不一定理性,或者可能故意捉弄甲方,则应该采取最大最小策略,形成(上,右)的博弈结果。甲方上下 乙方 左 右 1,0 1,1 -8,0 -2,1乙 方 的 最 小 收 益 0 1甲方的最小收益 1 -8第七讲博弈论与竞争策略第三节第三节 重复博弈和序列博弈重
20、复博弈和序列博弈 在现实经济社会,完全信息静态博弈的条件并不经常可以得到满足。特别是在市场竞争中,厂商之间的竞争不是一次性的,而是长期和反复的。同时,厂商之间的行为往往是有先后次序的,决策者可以先了解对手的行动,在充分掌握信息的基础上,然后再决定自己的对策。这种情况称为完全信息动态博弈。第七讲博弈论与竞争策略一重复博弈一重复博弈 Repeated game 重复博弈是指参与者之间的博弈不是一次性的,而是可以重复的。这样,参与者就可以通过分析对手的行动采取相应的策略。1摆脱囚徒的困境的条件 以寡头之间的价格竞争为例,在下图的价格博弈中,如果是静态博弈,厂商很容易陷入囚徒的困境(低价,低价)。但如
21、果博弈可以无限重复下去,则厂商的最佳策略是“以牙还牙以牙还牙”。这样,考虑到对手会以牙还牙,从长远和整体来看,降低价格不会有什么好处,博弈可能达到合作合作的结果。厂商1低价高价 厂商2 低价 高价 10,10 100,-50-50,100 50,50第七讲博弈论与竞争策略2合作的困难(链接:卡特尔不稳定性)在现实经济运行中,寡头之间的价格默契并不容易,主要原因有:1)如果博弈重复是有限的,则最后一次博弈会采取低价策略,理性的结果是抢先低价,一直到第一次博弈;但是,只要以牙还牙的理性行为有一定折扣或(怀疑),合作以避免价格战的结果仍然会出现。2)厂商较多,使以牙还牙以牙还牙(对欺骗者进行报复和惩
22、罚)难以实现,合作就十分困难。如我国的家电市场(3)厂商之间的成本差别较大,需求和成本变化很快,难以达成默契。第七讲博弈论与竞争策略二序列博弈二序列博弈 Sequential game 在现实中,较常见的是序列博弈,即一方先行动,另一方后行动。1先行者优势 在序列博弈中,先行者处于有利地位,可得到竞争优势。在下图中,两家厂商进行产品开发的博弈,如果是静态博弈,两家厂商必须同时宣布决策。根据最大最小原则,可能大家都无新产品。但如果其中某一厂商具有研发优势,可以率先推出新产品,则另一厂商只好放弃进入该市场的打算。第七讲博弈论与竞争策略Case:先行者优势沃尔玛 大型连锁折扣店行业中,沃尔玛最为成功
23、 1962年,山姆沃尔顿在阿肯色州开始“小镇经营模式”一开始,它的竞争对手都忽视,甚至嘲笑之 沃尔玛世界老大后,竞争对手想进入小镇,与之竞争,为什么没有发生?因为,小镇一般在10万人口以下,市场容量并不是很大,不足以满足两家大卖场钢铁大王安德鲁钢铁大王安德鲁卡内基曾经说过:卡内基曾经说过:“第一个来的人得到了第一个来的人得到了牡蛎,而第二个人只得到了贝壳。牡蛎,而第二个人只得到了贝壳。”第七讲博弈论与竞争策略现实的思考“有麦当劳(肯德鸡)的地方,肯定就有肯德鸡(麦当劳)”临海为什么只有肯德鸡?第七讲博弈论与竞争策略2空头威胁、承诺和策略性行动 在序列博弈中,先行者可以用既成事实获得竞争优势。在
24、这种情况下,怎样才能获得先行优势呢?理性的厂商都知道先行者优势,并希望让竞争者确信自己一定会推出新产品,从而放弃新产品。怎样才能做到这一点呢?(1)空头威胁空头威胁 如果厂商的努力不足以使对手相信自己肯定会推出新产品,如制造舆论、研究与开发投入、广告宣传等,这种努力称为空空头威胁头威胁。第七讲博弈论与竞争策略Case:空头威胁:空头威胁“中国彩电行中国彩电行业的困境业的困境”1999年初,长虹公司又一次大幅度降低电视机的价格,三年初,长虹公司又一次大幅度降低电视机的价格,三天后康佳公司宣布奉陪到底,其他公司的价格也随之下降。天后康佳公司宣布奉陪到底,其他公司的价格也随之下降。彩电生产企业为了维
25、持自身的利润水平,向上游生产企业彩电生产企业为了维持自身的利润水平,向上游生产企业挤压,彩管的价格在短短的两个月内明显下降。为了维护挤压,彩管的价格在短短的两个月内明显下降。为了维护彩管生产商的利益,国内八大彩管生产企业于彩管生产商的利益,国内八大彩管生产企业于5月份在北月份在北京开会协商,决定停产一个月,以提高彩管的价格。但彩京开会协商,决定停产一个月,以提高彩管的价格。但彩电生产企业对这一价格联盟不屑一顾。果不其然,不到一电生产企业对这一价格联盟不屑一顾。果不其然,不到一个月,这八家企业中就有人悄悄地开工生产。个月,这八家企业中就有人悄悄地开工生产。不听话,警察叔叔把你带走你再哭,等会狼来
26、了第七讲博弈论与竞争策略(2)承诺和策略性行动)承诺和策略性行动 如果厂商想要吓退竞争者,必须作出一定推出新产品的承诺承诺commitment,它是一种无法反悔的行动。承诺与空头威胁的界限在哪里呢?“破釜沉舟”,“背水一战”就是这个道理。例子:红军和白军抢占一岛屿桥陆地陆地小岛海桥第七讲博弈论与竞争策略3对进入的威慑 在许多行业中都存在现有厂商(在位者)与潜在进入者(进入者)之间关于进入与反进入之间的博弈。这也是一种序列博弈,在位者可以采取一定的策略性行动形成对进入的威慑。下图列出了一个进入博弈的收益矩阵。显然,默许是在位者的支配性策略(上策),商战是一个空头威胁,潜在的进入者将会选择进入。第
27、七讲博弈论与竞争策略 为了使商战的威胁具有可信性和效果,在位者可以用策略性行动作出承诺,一旦进入发生,它将以低价回击。比如,它可以建造并维持一定的剩余生产能力,这将使它的垄断利润减少30,博弈的收益矩阵变为:这样,高价不再是一个上策,均衡可能是(高价,不进入)。在重复博弈的情况下,厂商可能不仅考虑短期收益,而且更重视长期利益。因此,为了维持长期的垄断利润,厂商可能以牺牲短期利益为代价把进入者驱逐出去。这种在博弈中采取一定非理性行为的方法,形成进入威慑的另一种途径,即建立不惜一切代价粗暴对待进入者的名声,而不需要有具体的承诺。(实际上是把牺牲短期利益作为承诺)第七讲博弈论与竞争策略q企业的策略性
28、行为v含义:指企业通过影响竞争对手在该企业行动的预期,使竞争对手在预期的基础上,作出对该企业有利的决策行为v主要讨论非合作策略性行为零和博弈 合作策略性行为 正和博弈第七讲博弈论与竞争策略v非合作策略性行为掠夺性定价指一家企业为将对手挤出市场和吓退企图进入该市场的潜在对手而降低价格,待对手退出市场后再行提价的策略性行为。试图以短期损失来换取长期收益以低于成本的价格来击退竞争对手两种形式对称企业:AC一样;因为掠夺行为的实施需要受更大的亏损,一般不会成功。非对称企业:AC不同,掠夺者的AC相对低;成功率更高些第七讲博弈论与竞争策略非合作策略性行为(续)限制进入定价 干中学 提高对手的成本 直接的方式 非兼容生产 相机和照片 提高转换成本 惠普墨盒上的芯片 借助政府管制干预对手 尤其借助环保问题,保护主义 提高工资 限制进入定价模型行业需求曲线AC进入者的D2023-2-16第七讲博弈论与竞争策略