经济博弈论完整教学课件1.ppt

上传人(卖家):金钥匙文档 文档编号:1212098 上传时间:2021-03-25 格式:PPT 页数:540 大小:1.53MB
下载 相关 举报
经济博弈论完整教学课件1.ppt_第1页
第1页 / 共540页
经济博弈论完整教学课件1.ppt_第2页
第2页 / 共540页
经济博弈论完整教学课件1.ppt_第3页
第3页 / 共540页
经济博弈论完整教学课件1.ppt_第4页
第4页 / 共540页
经济博弈论完整教学课件1.ppt_第5页
第5页 / 共540页
点击查看更多>>
资源描述

1、经济博弈论完整教学课件1 博弈与社会 导论:个人理性与社会效率 本章目录 社会问题; 理性人行为; 效率标准; 外部性与科斯定理。 社会的两个基本问题 社会是什么? 协调(coordination) 合作(cooperation) 协调问题:以交通为例 靠 左 行 靠 右 行 靠左行 靠右行 A B 1, 1 1, 1 -1, -1 -1, -1 协调与预测 协调问题的核心是预测(prediction): 预测其他人如何行为; 个人行为的基本规则是什么? 信息:too little knowledge; too much knowledge; fail to use the knowledge

2、; no knowledge can help. 合作问题 合 作 不 合 作 合作 不合作 A B 3, 3 0, 0 -1, 4 4, -1 合作与激励 合作问题的核心是激励(incentive) 个人行为与社会利益的冲突 什么是个人的最优选择? 什么是社会的最优选择? 如何把个人行为与社会利益统一起来? 协调与合作相互作用 如交通问题; 如密云元宵节惨剧; 如SARS问题,禽流感问题; 如恐怖主义问题; 如股票市场; 如宏观经济波动; 等等。 社会问题及其解决办法 社会规模:小社会,大社会,全球化; 技术问题: 社会分工: 社会制度:个人的行为规则 正式制度;明规则,法律 非正式制度;潜

3、规则,社会规范,文化 价格制度; 非价格制度。 理解人的行为 所有社会科学都是有关人的行为的科学, 但不同学科的方法、假设、着眼点不同; 经济学:从个人到社会(from micro to macro) 社会学:从社会到个人(from macro to micro) 心理学:用观察、实验的方法看人们实 际上是怎么行为的。(行为科学) Homo economicus vs. Homo sociologicus Adam Smith vs. Emile Durkheim Rational, outcome-oriented; social norm- oriented, not outcome-or

4、iented: “the former is supposed to be guided by instrumental rationality, while the behavior of the latter is dictated by social norms. The former is pulled by the prospect of future rewards, whereas the latter is pushed from behind by quasi-inertial forces. Cont The former adapts to changing circum

5、stances, always on the lookout for improvement. The latter is insensitive to circumstances, sticking to the prescribed behavior even if new and apparently better options become available. The former is easily caricatured as self-contained, asocial atom, and the latter as the mindless playing of soci

6、al forces.” (Jon Elster, 1989, JEP) 为什么学习博弈论? 博弈论是有关“互动行为”(interactive behavior)的科学 “A sort of umbrella, or unified field theory for the rational side of social science. It develops methodologies that apply in principle to all interactive situations.”(Aumann and Hart, 1992) “It provides solid micro-

7、foundations for the study of social structure and social change.”(Jon Elster, 1982) Contd “Nash Equilibrium has had a fundamental and pervasive impact in economics and the social science which is comparable to that of the discovery of the DNA double helix in the biological sciences. Nash formulated

8、the basic vocabulary for a new language of economic analysis.”(R. Myerson, 1999,JEL) “More and more, the language of game theory has become the language of economics. More and more, pure theory came to mean game theory.” (Faruk Gul, 1997, JEP) 博弈论的基本假设 理性假设(Rationality): agents are instrumentally ra

9、tional; 共同知识(common knowledge of rationality) Know the rules of the game 关于理性人假设 理性人的定义:有一个很好定义的偏好 (well-defined preference);在给定约束下 追求偏好的最大化(maximization) 偏好是如何形成的? 关于偏好的假设: 完备性(completeness):任何两个可选择的 方案之间都是可比较的; 传递性(transitivity):(偏好具有一致性) 偏好函数 如果偏好满足其他一些假设(特别是连 续性假设),可以定义一个偏好函数或 称效用函数(utility func

10、tion); Lexicographic preferences endowment effect. ),(yxfU 无差异曲线 X Y A B 约束条件 技术性约束: 如一天工作不能超过24小时; 制度性约束: 如晚上12点必须熄灯; 信息约束: 如你并知道这门课有什么价值; 对他人行为的预期 确定环境下理性人行为的基本特征 最优选择由偏好和约束条件决定:人们 选择的不同可能是由于偏好不同,也可 能是由于面临的约束条件不同,如买车; 最优选择在个人边际成本等于边际收益 时达到; 最优选择会随外生变量的变化而改变。 不确定环境下的最优选择 预期效用理论(expected utility the

11、ory) 期望效用理论(prospect theory) 对理性人假设的批评 有限理性(bounded rationality):intended to be rational, but only limited to be so. Cognitive ability(limited computational skill and serious flawed memories) 有限毅力(bounded willpower); Present-biased preference 有限自利(bounded self-interest) emotional behavoir 对理性人假设的捍卫

12、Second best: no reliably accurate and analytically tractable theory of inconsistence and foolishness has been developed; Survival: peoples behavior is expected to more closely approximate the ideal rationality; Normative: functional goal of social science is not just to predict human behavior, but a

13、lso to analyze social institutions and evaluate proposals for institutional reform. 效率标准 问题:社会是由人组成的,每个人的行为都会 影响到他人的利益。那么,我们用什么样的标 准判断个人的行为是否正当? 考虑两种情形: 情形A:某店主雇人将竞争对手的店门堵上,使后 者不能营业; 情形B:某店主以更低的价格和更优良的服务将竞 争对手打垮。 这两种情形有什么不同?为什么法律允许第二 种情形而不允许第一种情形? 帕累托效率 定义:一种状态(资源配置、社会制度等)被称为帕 累托最优状态,如果不存在另一种状态能使得没有

14、任 何人的处境变坏同时至少有一个人的处境变得更好。 简单的说法是:对每个人来说,除非“损人”就不可 能“利己”,社会就达到了帕累托最优状态。 不同帕累托状态之间不可以比较 所以,帕累托最优可能意味着收入分配的不公平;极 端地,一个人得到所有收入,另一个人一无所有,也 是一个帕累托最优 以两人社会为例 A的收入 B 的 收 入 X Y Z 。 。 。 X和Y都是帕累托最优状态, 但Z不是帕累托最优状态 帕累托改进与帕累托标准 定义:一种变革没有使任何人的处境变坏,至 少有一个人的处境变好。 如果一种状态不是帕累托最优,意味着存在帕 累托改进的可能。 如果社会已经处在帕累托最优状态,就不可能 有帕

15、累托改进的余地。 状态X帕累托优于状态Y,如果在状态X下,至 少有一个人的处境比状态Y下更好,而没有任 何人的处境比在状态Y下坏。 两人社会为例 A的收入 B 的 收 入 。 Z 。 F 。 X 。 G 。 H 从Z到F、X是帕累托改进; 从Z到H、G不是帕累托改进; 从H、G到X、F、Z都不是帕累托改进 卡尔多卡尔多-希克斯希克斯(Kaldor-Hicks)标准 设想:状态X下,A的收入是100,B的收入也 是100;在状态Y下,A的收入是1000,B的收 入是99。依帕累托标准,这两个状态是不可比 较的:A在状态Y下更好,B在状态X下更好。 卡尔多-希克斯标准:如果一种变革使得受益者 的所

16、得足以弥补受损者的所失,这种变革就是 一个卡尔多-希克斯改进。如果补偿实际发生, 就是帕累托改进。因此,“卡尔多-希克斯标准” 就是“财富最大化”。 举一个法律的例子:过失责任 杨颉等诉北京大华无线电仪器厂:杨颉、王磊、徐方略都是十三 四岁的儿童,三人的爷爷和奶奶是邻居,居住在大华厂家属楼内。 2000年10月2 日,三小孩相约各自携带火柴、爆竹、手电等一起 玩耍。大华的厂区与宿舍区有围墙相隔,但是,该围墙有一缺口, 人们可以轻易翻越。为了上班方便,人们经常从缺口处翻越行走。 三小孩来到大华厂围墙外,从缺口处翻墙进入厂区内,并找到一 个装有液体(三氯乙烷,危险品)的白色塑料桶,三人将桶盖拧 开

17、倒出液体,王磊用火柴将液体点燃,后王磊又将桶内液体全部 倒在火上,使火势突然增大,并发出巨响,随即大火朴到杨颉身 上,将其烧伤。(王成,第122页) 法院判决:大华厂承担责任 HAND 规则。 应用:交易效率 人们为什么交易: 偏好不同; 生产成本不同; 信息不同; 风险态度不同。 自愿的交易一定是一个帕累托改进(假定没有欺诈) 设想:A拥有10个苹果,0个桃;B拥有0个桃,10个苹 果。如果边际效用是递减的,A用5个苹果换B的5个桃, 对双方是一个帕累托改进;交易的结果:各有5个苹果 和5个桃。 市场:供给与需求 数量 价 格 需求曲线(消费者的评价) 供给曲线 (生产者的成本) 均衡价格

18、均衡产量 为什么垄断是没有效率的 数量 价 格 需求曲线(消费者的评价) 供给曲线 (生产者的成本) 均衡价格 均衡价格 垄断价格 垄断产量 应用:竞争规则 设想有一个商店。如果一个人使用暴力捣毁这个商店, 然后在旁边办起自己的商店销售同样的东西,这种行 为就构成犯罪。但如果这个人用较低的价格和更好的 服务挤这个商店,他就无须为此承担责任。从该商店 的所有者来看,结果是一样,但为什么法律的规则不 一样呢?原因在于后一种情况下,社会的所得(包括 消费者和新店的所有者)大于所失,是一个卡尔多-希 克斯改进,而在前 一种情况下,不如此。 一般地,什么是所谓的社会允许甚至鼓励的“正当竞 争”?答案是“

19、卡尔多-希克斯标准”。 应用:生产效率 生产可行性边界 小麦 玉 米 。 X 非效率点 应用:分工效率 如果两个人同时生产两样产品(面包和牛奶), 每人的产量为(50,50),总产量是(100, 100); 如果A专业化于生产面包,产量可以达到150; B专业化于生产牛奶,产量可以达到140;那么, 分工与不分工比较,就是一个帕累托改进,因 为总产量可以达到(150,140)。 绝对优势与比较优势。 经济增长很大程度上来自分工效率。 应用:合作与组织 如果两个人在一起工作创造的价值大于独立工 作创造的价值之和,合作就是一个帕累托改进; 当只当组织的价值必须大于个人独立的价值之 和时,组织是可能

20、一个帕累托改进;当个人才 组织中获得的价值大于独立获得的价值时,加 入组织是一个帕累托改进;1+12 企业战略联盟:只有当联盟是一个帕累托改进 时,联盟才会出现。 应用:企业重组 以郑百文为例:到2000年6月30日止,郑百文的债务总 额达23.46亿,其中对信达资产管理公司负债20.99亿; 在郑百文的资产中,固定资产2.5亿,流动资产61686万 (其中大部分是高风险的应收帐款);郑百文的每股 净资产为-6.81元,股东权益为-13.458亿。 郑百文应该破产清算,还是进行资产重组? 清算意味着着除债权人外,其他参与人的价值均为零; 因此,只要债务人从重组得到的价值不低于预期可收 回的债权

21、,重组对所有参与人是一个帕累托改进。 解雇员工能成为一个帕累托改进吗? 应用:社会改革 如果改革中没有人受损,至少有一些人 受益,改革就是一个帕累托改进; 如果改革使一部分人受益,另一部分人 受损,但受益者所得大于受损者所失, 改革是一个卡儿多-希克斯改进,或者说, 潜在的帕累托改进;如果受损者得到足 够的补偿,就是一个帕累托改进; 革命通常不是一个帕累托改进。 应用:婚姻家庭 自由结婚对夫妻双方是一个帕累托改进;买卖 婚姻对买卖双方是一个帕累托改进; 离婚不一定是一个帕累托改进;但如果提出离 婚的一方愿意补偿另一方,使得对方同意离婚, 离婚就是一个帕累托改进;所以,协议离婚是 一个帕累托改进

22、。 但离婚对其他利益相关者(如父母和儿女)可 能不是一个帕累托改进。 以什么为比较基:第三者问题 李敖之女哭了 北京青年报2004年2月13日:为了邻居的狗叫鸡鸣、养花晒衣 等,台湾著名作家李敖之女李文多次投诉邻居,以致她和几家邻 居的关系日渐紧张。2月10日,嘉浩园区的物业突然向李文发出 “逐客令”,以李文给整个园区的生活造成极坏的影响为由,要 求李文搬离小区,否则将遭到断水断电的处理。对此,李文流出 委屈的泪水,并委托律师状告物业公司。 李文说,这幢别墅是她以每月1300美元的租金租来的,租期是三 年,从去年8月份开始她一直住在这儿。在别墅的二楼,李文指着 某歌星的大院说,前段时间,三条大

23、狼狗经常冲着大铁门狂叫, 只要有人过来,大狼狗便不停地狂叫。接着她又指向右侧的一幢 别墅说,他们家养了两只公鸡,每天5点左右就开始打鸣,吵得人 无法正常休息。李文还说,有的邻居竟在院子内种植庄稼,因此 招来了不少蚊虫;有的还将内衣挂在外面晾晒,这种做法很让她 受不了。 李敖之女哭了 李文说,为了维护自己的权益,她多次向小区的物业投诉,而小区的 物业只是非常被动地接待她的投诉。无奈,她又多次找到几家邻居交涉, 然而交涉的过程却非常艰难,为此还与邻居发生争吵。2月10日,小区的 物业竟送来通知,要求她在一个星期内搬走,否则就将她所住的别墅断 水断电。 李文说,她只是想维护自己的权益,没想到物业竟然

24、赶她走,而且 她已经交纳了房屋的租金。说着李文已经泪流满面。 当记者问及这些投诉是否挑剔时,李文说:“我感觉我不是那么挑 剔,只是我的要求高一点,我的生活观念比人家高一点,只要有人侵犯 到我的小范围,影响到我的生活了,我一定要投诉!” 北京盟科置业有限公司的总经理陈渊宇接受了记者的采访。陈总说, 之所以发出这样的通知,完全是因为李文与邻居的关系太紧张,再就是 李文根本听不进别人的意见。李文非常注重自己的权益,以至于到了苛 刻的地步。邻居在家中养花、晾衣物她也认为侵犯了她的权益,并为此 数次找到物业公司投诉、找到邻居理论。由于李文容易激动,所以从去 年8月份她入住该小区以来,就一直与物业和周围邻

25、居关系紧张。 外部性与科斯定理 个人收益与社会收益:一项活动的社会 收益等于决策者个人得到的收益加社会 其他成员得到的收益,如养花; 个人成本与社会成本:社会成本等于决 策者的个人承担的成本加社会其他成员 承担的成本,如环境污染,交通堵塞; 如果个人收益(/成本)不等于社会收益, 我们说存在外部性。 个人最优决策与社会最优 理性人的最优决策:边际个人成本等于 边际个人收益;当然,目标函数很重要; 社会最优决策(帕累托最优):边际社 会成本等于边际社会收益; 因此,除非没有外部性,个人最优决策 不等于社会最优决策。 图示说明:社会成本大于个人成本 产量 边际成本 与 边际收益 边际个人收益 (等

26、于边际社会收益) 边际个人成本 边际社会成本 个人最优产量 社会最优产量 边际外部成本 图示说明:社会收益大于个人收益 产量 边际成本 与 边际收益 边际个人收益 边际个人成本(等于边际社会成本) 个人最优产量 社会最优产量 边际社会收益 举例 环境污染; 夜间施工; 交通事故; 垄断定价; 国有企业的恶性竞争; 教育; 政府管制、皮古税与科斯定理 个人最优与社会最优的不一致意味着有帕累托 改进的余地; 核心是:如何将外部性内部化:如果有办法使 得个人在边际上承担全部的社会成本和获得全 部的社会收益,问题就解决了; 传统的理论:政府管制或对个人征收皮古税 (或补贴); 在负外部性的情况,征税和

27、补贴代表不同的产 权安排。 皮古税或补贴如何解决问题? 产量 边际成本 与 边际收益 边际个人收益 (等于边际社会收益) 边际个人成本(无税情况) 边际社会成本 (加税后的边际个人成本) 个人最优产量 社会最优产量 边际税率=边际外部成本 科斯定理 Coase(1960):只要产权界定是清楚的, 如果没有交易成本,外部性可以通过当 事人之间谈判解决,帕累托效率可以实 现;并且,最终的资源配置与初始的产 权安排无关。 比如说:夜间唱歌 科斯定理图示 牧养人放牧的数量 牧羊的边际利润 农场主的边际净损失 社会最优量 P S O 说明 如果产权归农场主,农场主可以禁止放牧(点0),小于社会最优 量S

28、;但此时,增加放牧给牧羊人带来的边际利润大于给农场主 造成的损失,牧羊人将有积极性贿赂农场主,直到放牧量达到S 为止; 如果产权归牧羊人,牧羊人的利润最大点是P,大于社会最优量S; 但此时,减少放牧量对牧羊人的边际利润损失小于给农场主节约 的边际成本,所以,农场主将有积极性贿赂牧羊人,直到S; 因此,无论初始产权如何安排,双方谈判可以实现帕累托最优。 科斯定理意味着:如果没有交易成本,公司治理结构(包括股权 结构)是无关紧要的 交易成本与次优选择 定义:交易成本包括所有与交易有关的成本, 包括发现交易对象的成本、谈判成本、签约成 本、执行成本,以及所有可能的效率损失(与 帕累托最优比); 交易

29、成本存在的原因: 交易者的数量(人越多,达成本协议越难) 信息不对称(信息越不对称,谈判越难,合同的执 行也越难) 交易成本意味着:只有次优,没有最优; 作为激励机制的法律 法律通过责任的分配和赔偿/惩罚规则是实施, 将个人行为的外部成本内部化,诱导个人选择 社会最优的行动; 如果个人之间签约的交易成本太高,法律可以 节约交易成本; 以交通事故为例:司机开车可能伤害他人,但 要每个司机与所有可能的受害人签定合同是不 可能的,侵权赔偿替代了合同; 但法律面临信息约束。 民法与刑法的不同 诉讼:民法是“民不告,官不纠”;刑 法是“民不告,官也纠”(政府是公诉 人); 责任程度:民法的赔偿基本上是补

30、偿性 的;刑法的处罚是惩罚性的; 形式:民法的赔偿以货币形式为主;刑 法的处罚以非货币形式为主(自由和说 明) 民法与刑法的界线 侵权的外部性程度:受害人越多,越适 合于刑法; 惩罚的可性度:如果民事制裁不可信, 就需要刑事制裁; 复仇的可能性:如果私人复仇会导致伤 害的不断升级,就需要用刑法替代民法。 纳什均衡与一致预期 张维迎 教授 北京大学光华管理学院 博弈的基本概念(1) 参与人(players):博弈中决策主体的集合:什 么人参与博弈?每个人是什么角色? 行动(actions): 每个人有些什么样行动可以选 择?在什么时候行动? 信息(information):在博弈中的知识;每个人

31、 知道些什么(包括特征、行动等)? 战略(strategies):行动计划;每个人有什么战 略可供选择?战略的完备性; 博弈的基本概念(2) 支付(payoffs):每个人在不同战略组合下得到 些什么?依赖于所有参与人的选择; 均衡(equilibrium):所有参与人最优战略的组 合; 结果(outcomes):我们所感兴趣的东西。 静态博弈 最简单的博弈:所有参与人同时选择行 动,并且只选择一次; “同时”是一个信息概念,而不一定与 日历上的时间一致; 囚徒困境(prisoners dilemma) 囚徒困境 坦白 不坦白 坦白 不坦白 8,8 0,10 10,0 1,1 无论对方如何选择

32、,每个人的最优选择:坦白。 所以,我们可以预测,结果将是(坦白,坦白) 占优均衡 (dominant-strategy equilibrium) 一般来说,由于每个参与人的效用依赖于所有人的选 择,因此每个人的最优选择(战略)也依赖于所有其 他人的选择(战略)。但在上述例子中,一个人的最 优选择并不依赖于他人的选择。这样的最优战略,被 称为“占优战略”(dominant strategy)。由所有参与人 的占优战略构成的战略组合被称为“占优均衡”。 占优战略均衡的出现只要求所有人都是理性的,但不 要求每个参与人知道其他参与人是否理性。 囚徒困境博弈有占优均衡,所以其结果很容易预测。 个人理性与

33、集体理性的冲突 “囚徒困境”表明个人理性与集体理性的冲突。 这样的例子很多:寡头竞争,军备竞赛,团队 生产中的劳动供给,公共产品的供给,等等; 许多的制度就是为解决“囚徒困境”而存在的; 公共产品(public goods) 提供 不提供 提供 不提供 4,4 -1,5 5,-1 0,0 无论对方如何选择,每个人的最优选择:不提供。 所以,我们可以预测,结果将是(不提供,不提供) 公共产品与税收制度 比较私人产品与公共产品的不同:使用 上排他性; 私人产品是志愿购买的,但公共产品可 能需要强制购买; 税收制度就是保证公共产品的生产,解 决公共产品生产上的“囚徒困境” “囚徒困境”的一般表示 合

34、作 不合作 合作 不合作 T,T S,R R,S P,P 满足:RTPS; (S+R)R-T “智猪博弈”(boxed pigs) 有些博弈没有占优均衡,但通过剔除“坏”战 略,我们可以预测博弈的结果。如“智猪博弈” 按 等待 按 等待 3,1 2,4 7,1 0,0 这个博弈中,大猪的最优选择依赖 于小猪的选择,但小猪的最优选择 与大猪的选择无关。如果大猪知道 小猪的理性的,大猪将选择“按”。 均衡是“大猪按,小猪等待”。 “劣”战略:无论对方选择什么,如果 自己选择A得到的总是收益小于选择 B得到的收益,A就是相对于B的劣 战略。 重复剔除占优均衡 “重复剔除严格劣战略”(iterated

35、 elimination of strictly dominated strategy)的思路:首先找出博弈参与人的劣 战略(dominated strategy)(假定存在的话),把这个劣 战略剔除后,剩下的是一个不包含已剔除劣战略的新 的博弈;然后在剔除这个新的博弈中的劣战略;继续 这个过程,直到没有劣战略存在。如果剩下的战略组 合是唯一的,这个唯一的战略组合就是“重复剔除占 优均衡”(iterated dominance equilibrium)。 如果这样的解存在,我们说该博弈是“重复剔除占优 可解的”(iterated dominance solvable). 理性共识 (commo

36、n knowledge of rationality) (1)Zero-order CKR: 每个人都是理性的,但不知 道其他人是否是理性的; (2)first-order CKR: 每个人是理性的,并且知道 其他每个人也都是理性的,但并不知道其他人 是否知道自己是理性的; (3)second-order CKR: (1)+(2)+每个人知道(2) nth-order CKR: R(b)C(b)R(b)C(b)R is rational, 重复剔除与理性共识 重复剔除不仅要求每个人是理性的,而且要求每个人 知道其他人是理性的,每个人知道每个人知道每个人 是理性的,如此等等,即理性是“共同知识”

37、(共识) C1 C2 C3 R1 R2 R3 10,4 1, 5 98,4 9, 9 0, 3 99,8 1,98 0,100 100,98 这个博弈只要求 一阶理性共识就 可以预测均衡结 果。 如果把(下左) 的第一个数字改为 11呢? 最优选择 这个博弈只要求一阶理性共识就可以预测均衡 结果: 如果R相信C是理性的,R就知道C不会选择C3, 所以R的最优选择是R1; 如果C相信R是理性的,C就知道R不会选择R2, 所以C的最优选择是C2。 但要C预期R不会选择R3,需要二阶理性共识; 要R不预期C会选择C1,需要三阶理性共识。 R排除C选择C1 R believes C believes

38、R believes C is rational (C1,C2) R1 C2 好事变坏事? 在单人决策中,个人给定选择在所有情况下的收益都 增加,一个人的状况不会变得更坏,但博弈中则不同。 上 下 左 右 上 下 左 右 -1, 3 2, 1 0, 2 3, 4 1, 3 4, 1 0, 2 3, 4 选择越多,对理性共识的要求越高 R1 R2 R3 R4 C1 C2 C3 C4 5,10 0,11 1,20 10,10 4,0 1,1 2,0 20,0 3,2 0,4 4,3 50,1 2,93 0,92 0,91 100,90 (1)Zero-order CKR: C not choose

39、 C4 for C is rational (2)1st-order CKR: R not choose R4 for R (b) C (3)2nd-order CKR: C not choose C1 for C(b)R(b)C (4)3rd-order CKR: R not choose R1 for R(b)C(b)R(b)C (5)4th-order CKR: C not choose C3 for C(b) R(b)C(b)R(b)C (6)5th-order CKR: R not choose R3 for R(b) C(b) R(b)C(b)R(b)C so, (R2,C2) i

40、s an equilibrium 不能用重复剔除解的博弈 许多博弈没有占优均衡,也没有重复剔除的占 优均衡。考虑如下博弈: C1 C2 C3 R1 R2 R3 0,4 4,0 5,3 4,0 0,4 5,3 3,5 3,5 6,6 可理性化的选择 Rationalizable strategy: 不能被重复剔除的 战略;或者说,可以被合理的信念(belief) 所支持的行为; 例如:R理性化选择R1: 如果R(b)C 选择C2, 如果R(b)C(b)R会选择R2; 如果R(b)C(b)R(b)C会选择C1; 如果R(b)C(b)R(b)C(b)R会选择R1 Consistently align

41、ed beliefs (CAB) 考虑(R3,C3):对方不会犯预期错误:R选 择R3,如果他认为C会选择C3;C会选择C3, 如果他认为R会选择R3。 CAB:每个人对别人行为的预期(信念)是正 确的; Harsanyi doctrine: 如果两个理性的人具有相同 的信息,他们一定会得出相同的推断和相同的 结论; Robert Aumann: rational agents cannot agree to disagree. 纳什均衡与一致预期 纳什均衡:所有参与人的最优战略的组合:给 定该战略中别人的选择,没有人有积极性改变 自己的选择。 一致预期:基于信念的选择是合理的;支持选 择的信

42、念是正确的; 预期的自我实现:如何所有人认为这个结果会 出现,这个结果就会出现。预期是自我实现的, 预期不会错误。如果你认为我预期你将选择X, 你就真的会选择X。 哲学思考 如果参与人事前达成一个协议,在不存在外部 强制的情况下,每个人都有积极性遵守这个协 议,这个协议就是纳什均衡。 寻找纳什均衡 C1 C2 C3 R1 R2 R3 100,100 0,0 50,101 50,0 1,1 60,0 0,300 0,0 200,200 纳什均衡:举例 广告博弈 纳什均衡:(做广告,做广告) 战略做广告 不做广告 做广告4,415,1 不做广告 1,1510,10 企业1 企业2 利用纳什均衡寻租

43、 考虑股票市场融资的例子:设想企业价值是 100,现在发行的流通股为100股,每股价值1 元。现在假定经理想筹集100元,投资价值只 有50元。有人买新股吗? 假定每一股配4股,价格为0.25元。如果股东不 接受配股:原来一股1元的价值就变成0.3元 (=150/500);如果接受配股,他持有的股票 的价值是1.5元;因为配股的成本是1元,所以 他的最优选择是接受配股。 所有权配置与等级结构 考虑团队生产:让其中的一个人变成所 有者 工作 偷懒 工作 偷懒 6,6 2,2 0,8 8,0 纳什均衡与学习过程 R2 R1 NE q1 q2 双寡头竞争:Cournot博弈 两个企业同时选择产量,价

44、格由市场决 定; 假定需求函数为 其中 为企业1的产量, 为企业2的产量 假定成本函数为: 那么,利润函数为: )()( 21 qqaQP 1 q 2 q iii qcqC)( )()( )()( 212222 211111 cqqaqcqQPq cqqaqcqQPq 双寡头竞争(续) 企业最大化利润的一阶条件为: 纳什均衡产量: 纳什均衡利润为 22 )( 22 )( 1 222 2 211 qca qRq qca qRq 3 21 ca qq NENE 9 )( 2 21 ca NENE 垄断产量和垄断利润 垄断企业的目标函数: 垄断产量: 垄断利润: )()(cQaQQcQQP M 2

45、ca QM 4 )( 2 ca M 划拳博弈 老虎 鸡 虫 杠子 老虎 鸡 虫 杠子 0,0 1,-1 0,0 -1,1 -1,1 0,0 1,-1 0,0 0,0 -1,1 0,0 1,-1 1,-1 0,0 -1,1 0,0 混合战略纳什均衡 有些博弈没有“纯战略”纳什均衡,但 有混合战略纳什均衡,如监督博弈。 监督 不监督 偷懒 不偷懒 1,1 1,2 2,3 2,2 给定工人偷懒,老板的最优 选择是监督;给定老板监督, 工人的最优选择是不偷懒; 给定工人不偷懒,老板的最 优选择是不监督;给定老板 不监督,工人的最优选择是 偷懒;如此循环。 纳什均衡的存在性问题 每一个有限博弈至少存在一

46、个纳什均衡 (纯战略或混合战略); 如果一个博弈存在两个纯战略纳什均衡, 那么,一定存在第三个混合战略纳什均 衡。 风险与均衡 由于纳什均衡要求理性共识和一致预期,当人 们可能犯小小的错误时,纳什均衡不一定被选 择。如下面这个博弈中,多数人将选择“下” 而不是“上”。 上 下 左 右 8, 10 -1000,9 7, 6 6, 5 只要B有千分之一的 概念错误地选择右, A将选择下;如果B怀疑 A怀疑自己可能犯错误, B将选择右。所以,出现 的不是纳什均衡 有问题的纳什均衡? C1 C2 C3 R1 R2 R3 2,2 3,1 0,2 1,3 2,2 3,2 2,0 2,3 2,2 第三章 多

47、重均衡与制度和文化 张维迎 北京大学光华管理学院 实验:选数博弈 规则:有两个人,110十个数字,每个 人可以选择其中的任意五个;如果两个 人的选择没有重复,每人得到50元;否 则,各为0。 多重纳什均衡:产品标准 许多博弈可能有多个纳什均衡 3.5“ 5.5“ 3.5“ 5.5“ 8, 8 3, 2 2, 3 6, 6 这个博弈被称为 “协调博弈”:有 两个纯战略纳什均衡, 一个混合战略均衡。 哪一个将出现呢? 交通博弈 靠左行 靠右行 靠左行 靠右行 1,1 1,1 -1,-1 -1,-1 约会博弈 芭蕾舞 足球场 芭蕾舞 足球场 1,2 0,0 0,0 2,1 进门博弈 先进 后进 先进

48、 后进 -1,-1 -1,-1 2,1 1,2 分蛋糕博弈 x1 x2 1 1 任何满足x1+x2=1的点都是 纳什均衡。 资源争夺博弈(chicken) Hawk Dove Hawk Dove -1,-1 5,5 10,0 0,10 如何协调? 仅仅“理性”是不够的; FOCAL POINT(PROMINENCE): Schelling(1960); 帕累托最优均衡:可以通过协商选择一 个纳什均衡;cheap talking; 文化与制度 行业组织; 帕累托最优均衡 3.5“ 5.5“ 3.5“ 5.5“ 8, 8 3, 2 2, 3 6, 6 (3.5“,3.5”) 帕累托优于(5.5“,

49、5.5”) Cheap talk 可以 帮助协调到一个 帕累托最优均衡 为什么要相信? C1 C2 R1 R2 9,9 0,8 8,0 7,7 不论C选择什么,他都有积极性告诉R他将选择C1; 所以没有理由认为R应该相信C的话。 R C 锁定效应与路径依赖 如果博弈参与人很多,达成协议的成本很高,最初的 非帕累托均衡可以被锁定(lock-in), 导致路径依赖 (path dependence):每个人多偏好于新产品(或标 准),如果其他人都选择新产品的话;但由于每个人 都预期其他人不会选择新产品,所以每个人的最优选 择是不转向新产品,结果是整个社会被锁定在现有的 产品(标准)(非帕累托最优)

50、; 这常被用来作为市场失灵的理论证据; 经验证据:QWERT vs Dvorak键盘;Beta vs VHS录象 机;MAC与IBM计算机软件; 但最新的研究似乎正在推翻这些广泛流行的结论。 键盘的寓言 1868年Christopher L. Stoles发明QWERT键盘;由Remington公司生 产; 1936年Dvorak发明简化键盘(DSK,Dvorak Simplified Keyboard): 认为这一键盘通过平衡双手和更有力的手指之间的工作量,极大 地减少了打字产生的手指运动,其优势在于提高速度、减少疲劳, 以及更容易的学习。 为什么没有被采用?最初的打字员不选择学习Dvora

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(经济博弈论完整教学课件1.ppt)为本站会员(金钥匙文档)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|