经济博弈论概述课件.pptx_163文库

资源描述

1、经济博弈论经济博弈论参考书参考书n博弈与信息博弈与信息艾里克艾里克拉斯缪森著，拉斯缪森著，北京大学出版社n博弈论Drew.Fudenberg&Jean Tirol,美朱弗登博格，法让梯若尔,经济科学出版社n博弈论矛盾冲突分析Roger B.Myerson,中国经济出版社n博弈论基础Gibbons,R1992 Priceton Univ.Pressn博弈论与信息经济学张维迎，北京大学出版社n博弈论施锡铨上海财经大学出版社n经济博弈论谢识予，复旦大学出版社n著名经济学家泰勒尔著名经济学家泰勒尔(Jean Tirole)说说:“n如果情况确实如此，对今天的经济学家来说，不懂得博弈论显然是不行了。博

2、弈论为何如此热门博弈论为何如此热门?n诺贝尔经济学奖偏爱博弈论研究诺贝尔经济学奖偏爱博弈论研究q1994年诺贝尔经济学授予诺贝尔经济学授予n约翰约翰纳什纳什 n约翰约翰海萨尼海萨尼 n莱因哈德莱因哈德泽尔腾泽尔腾 q1996年诺贝尔经济学授予诺贝尔经济学授予n威廉维克瑞n詹姆斯莫里斯q2001年诺贝尔经济学授予诺贝尔经济学授予n乔治.A.阿克洛尔夫nA.斯潘塞n约瑟夫.斯蒂格尼兹q2005诺贝尔经济学授予诺贝尔经济学授予n罗伯特奥曼n托马斯谢林n20072007年年:诺贝尔经济学奖授予诺贝尔经济学奖授予n赫维茨(Hurwicz）n马斯金（Maskin）n梅耶森（Myerson）n2012201

3、2年年:诺贝尔经济学奖授予诺贝尔经济学奖授予n埃尔文罗斯（Alvin Roth）n罗伊德夏普利（Lloyd Shapley）。埃尔文埃尔文罗斯（罗斯（Alvin E.RothAlvin E.Roth）罗伊德罗伊德夏普利（夏普利（Lloyd S.ShapleyLloyd S.Shapley）他们的贡献：他们的贡献：稳定的匹配理论与市场设计的实践稳定的匹配理论与市场设计的实践n经济学是研究资源最优配置问题的，而真实世界里配置资源的方式多种多样，市场、价格机制是经济学研究最多的。n但是有一些市场里头，价格的作用受到多种限制，可能是来自法律等正式规则的限制，也可能是来自习俗或伦理道德等非正式制度的限制

4、。n例如：找对象，不是价高者得，而是情投意合才能结成夫妻。n问题是情投意合这种分配方式讲究“配对”，而且这种配对最好还需要“稳定”，麻烦的是还不能依靠传统的价格机制，在这种情况下经济学应该怎么办呢？n2012年的诺贝尔经济学奖就授给了夏普利（L.S.Shapley）和罗斯（A.E.Roth），表彰他们在“for the theory of stable allocations and the practice of market design”夏普利夏普利与与夏普利夏普利值值n我们熟悉的夏普利，是他在合作博弈上所做的贡献，即夏普利夏普利值值。n在前六次的诺奖获得者中，他们都可以说是在非合作博弈

5、领域的大家（我们这门课实际上也是讨论在非合作博弈理论基础上的经济层面的应用问题），而夏普利则是合作博弈领域的巨头。n所谓非合作和合作博弈的区分，简单来说就是非合作主要是个体之间的博弈，而合作博弈则处理群体与群体之间的博弈，例如医生与医院、学生与学校这类群体间的博弈。n夏普利值也是这个合作博弈领域最为突出的贡献，不过有意思的是，这一次的诺贝尔经济学奖的贡献却没有颁给“夏普利值”，而是稳定配对理论。合作博弈合作博弈在博弈论中，合作的概念是重要的。我们现在能够阅读到的各种版本的博弈论教科书，以及本课程将要介绍的主要是经典博弈理论，都是建立在参与人理性的、非合作基础之上的。事实上，在非合作博弈理论还

6、没有完全建立起来之前，合作博弈理论一直是博弈论专家们研究关注的领域。n合作博弈的概念是冯诺依曼（John von Neumann）和摩根斯顿（Oskar Morgenstern）在他们的博弈论与经济行为（1944）一书中首次提出。到50年代，合作博弈理论的发展到达鼎盛时期,其中包括纳什（Nash,1950）和夏普利（Shapley,1953）的“讨价还价模型”，Gillies和Shapley(1953)关于合作博弈中的“核”的概念，以及其他一些人的贡献。n一般观点认为合作博弈理论要比非合作博弈理论更为重要，因为，如果人们的合作是有利可图的，参与博弈的理性人怎么会放弃合作而采取非合作态度呢？n我

7、们知道，在任何真实的博弈局势中，无论合作博弈还是非合作博弈，如果我们仔细地考察人们为达成一个协议而能做什么的话，那么原则上我们就应该有可能把它模型化，然后通过分析这个博弈的均衡（解）来预测其结果。n不幸得很，在合作博弈理论中，各种合作博弈解的概念是针对不同情况、不同理由给出了不同的解释，如q核心（core）、沙普利值（Shapely value）、核仁（nucleolus）、核（kernel）、谈判集以及稳定集（stable set）等等，q但没有一种解能够具有纳什均衡在非合作博弈中具有的没有一种解能够具有纳什均衡在非合作博弈中具有的核心地位核心地位，也许正是这一点使合作博弈理论的应用研究受到

8、了极大地挑战。n不仅如此，在现实社会中，竞争是一切社会、经济关系的根本基础，不合作是基本的，而合作常常又是令人难以捉摸的、是有条件的和暂时的。n即便如此，人们并没有放弃对合作博弈理论研究的兴趣。n因为，在现实社会中，确实存在有很多类似于“为共同目的而一起行动”的合作问题，如各种形式的联盟。n联盟通常是那些有着共同利益的一群（两个或两个以上）人，为了试图增进他们的共同利益一起行动所组成的集团q如个体厂商为了获得更高利润，期待通过集团形成卖方垄断；q消费者为了寻求更低的价格，期待通过集团形成买方垄断；q工人们为了得到更高的工资待遇，期待通过工会形成讨价还价的势力等等。以夏普利值为例来看合作问题n例

9、题1q假定某议会共有100个席位，议员分属4个党派：红党43席，蓝党33席，绿党16席，白党8席；q假定对于一般议题的任何提案，议会实行一人一票并且多数通过的投票规则。q假设由于党纪的约束，议员对于任何议题，都只能按照党的意志投票。n议会共有4个“议会党团”，每1个议会党团，都有可能面对其他3个议会党团组成的各种可能的联盟。n其他3个议会党团的各种联盟组合，一共有7种：q一种是3个议会党团各自成“团”有3个联盟q一种是3个议会党团两两抱团有3个联盟q一种是3个议会党团抱成一团有1个联盟每个党团面对其他3个党可能组成的联盟三个联盟两两联盟两两联盟两两联盟单独联盟单独联盟单独联盟红党43席蓝绿白5

10、7蓝绿49蓝白41绿白24蓝33绿16白8蓝党33席红绿白67红绿59红白51绿白24红43绿16白8绿党16席红蓝白84红蓝76红白51蓝白41红43蓝33白8白党8席红蓝绿92红蓝76红绿59蓝绿49红43蓝33绿16n面对其他3个议会党团所有7种情形的联盟，我们要看看有几种情形他成为决定性的议会党团，即q加入联盟就能够让联盟的议案通过q不加入联盟就可以阻止联盟的议案通过，并且把成为决定性议会党团的数目叫做这个议会党团的“权力指数”。计算4个党派在议会的“权力指数”n权力指数：即在不同情况他加入或者退出一个投票联盟足以改变投票结果的情况是多少。n先看红党：红党：有43席，可能面对的是7种情

11、况：q蓝绿白联盟57票q蓝绿联盟49票、蓝白联盟41票、绿白联盟24q蓝党33票、绿党16票、白党8票。n在这7种情况下，有6种情况他加入联盟,联盟就会获胜、不加入联盟，联盟就会失败，于是我们说红党的权力指数是6。n再看蓝党蓝党：有33席，也面对7种情况：q红绿白联盟67票q红绿联盟59票、红白联盟51票、绿白联盟24票q单独的红党43票、绿党16票和白党8票。n在这7种情况下，他只有面对绿白联盟24票或者单独的红党43票这2种情况，才是决定议案是否通过的议会党团，从而蓝党的权力指数是2。n运用同样的方法，可以知道绿党绿党的权力指数是2，白党白党的权力指数也是2.。结果是足以让人口呆目瞪的：n

12、在这个议会里面，议员数目33的蓝党，与议员数目差不多只有他三分之一的白党，权力指数竟然一样，都是2。n事实上，上面的例子告诉我们，操纵一项提案是否能够通过的“能力”，与议员党团成员数目，并不成正比。n四个党的议员数目之比是四个党的议员数目之比是43：33：16：8，而，而“权力指数权力指数”之比却是之比却是6：2：2：2。n夏普利值就是在分析这类问题时建立的概念和有力的工具，其中理论上最容易说明的，就是上述议会党团的权力指数，其他情况的夏普利值，会复杂很多。夏普利值的应用非常广泛n比较浅白的应用，包括加装电梯的成本如何在不同楼层的公寓之间分摊，以及同一路线上远近不同的同事长期固定合伙乘出租车上

13、下班如何分摊车费等等。n上面例子当中的权力指数是6：2：2：2。如果你喜欢“圆整”的权力指数，也可以都除以622212，把它们定义为总和为一的6/12：2/12：2/12：2/12，即1/2：1/6：1/6：1/6。n美国的总统选举，在各州是赢者通吃的，一个州的多数选民选A君，那么这个州的选举团里面的每一个人，都必须选A君。n上述关于权力指数的讨论，也有助于读者理解在各州赢者通吃的这种间接选举中，选民比较多的候选人何以未必胜出。n代议制民主里面有一些这样的情况。n这是关于合作、投票、分配、合作剩余、夏普利值等的讨论。稳定的匹配理论稳定的匹配理论n严格来说，并不是经济学家首先提出并在理论上解决这

14、一问题的n1962年，数学家盖尔（D.Gale）和博弈论学者夏普利在美国数学月刊（American Mathematical Monthly）发表了一篇名为大学录取和婚姻稳定的文章，首先提出了后来被称为盖尔-夏普利算法的稳定配对（stable matching）问题。n稳定配对稳定配对是说不存在两个人，他们都更中意于彼此、胜过他们当前的配对者。n通俗来说，就是你的配偶是你所获得的最爱。n因为就整个市场而言，如果婚姻市场上有数量大致相当的适婚男女，男的知晓所有女的信息，女的也一样。然后男的对女的有一个排序，女的也对男的排序。n接下来一方发起求婚，另一方对照自己的偏好排序表，如果是最爱的就接受，不

15、是的就拒绝。n在交易费用为零和配对时间不限的情况下，最终萝卜青菜各有所爱，每个人总能找到自己的伴侣，并且这种配对是稳定的，即没有人想分手，不会出现出轨的现象。n为什么呢？n让我们假设有X男和Y女出轨了，X与原来的M女分手，这说明X更偏好Y，这违反了预设的偏好稳定。当然这可能意味着X之前没有向Y求过婚，同样对Y来说选择X也意味着更偏好X，但每个人都是按照自己的偏好排序来求婚的，就违反了偏好排序。n所以如果是稳定配对，就不存在出轨现象。在这里，我们应该注意到：在这里，我们应该注意到：n这其实和经济学对理性人的偏好稳定及偏好可排序假设没有任何区别，无非是这里并不是用价格，而是用配对来配置婚姻资源。n

16、GS算法（盖尔-夏普利）对多人参与的合作博弈如何分配资源的问题有重要的贡献和启示。罗斯的贡献罗斯的贡献n对经济学来说，不仅仅存在个体与个体之间的交换，而且还存在大量群体参与的交换，这个时候如何让供需双方稳定配对，并不是简单的事情。n从抽象的理论到市场制度的实际设计的发展，考虑如何匹配不同的市场主体。n例如学生如何与学校匹配，人体器官的捐献者如何与需要器官移植的患者匹配。n经济学家要在这篇数学论文发表差不多20年后，才开始将其中的原理逐步应用到真实世界的市场里。n而这个工作最主要的代表者就是罗斯。1984年罗斯的论文n发表了一篇关于实习医生的文章实习医生的文章，将夏普利的理论应用到解释实际经济问

17、题中。n在医学领域，学生通常在后几年学习生涯中需要去医院实习。n40年代，美国的医院系统开始大规模发展，但医学院学生的数量很少，医院之间的竞争导致对医学院学生需求的急剧增加，于是很多医院就让学生提前实习，甚至在这些学生还没有选定专业领域的情况下就参加实习。n但如果学生拒绝一个医院，往往导致医院再去找第二个学生就太迟了，因为第二个人可能已经被另一个医院抢走了。n市场在这种情况下是极为不稳定的，因为医院往往会设定一个最后申请期限，迫使学生在不晓得是否还有其他机会之前就做出选择。n由于医院未能及时给所有学生提供机会，而学生也未能向所有医院提出及时申请，双方都未能极大化自己的利益。NRMPNRMP全国

18、住院医师配对项目n到了1950年代，为了解决这个问题，美国设立了一个集中的清算所（Clearinghouse），也就是全国住院医师配对项目（NRMP：National Resident Matching Program）的项目。n在1984年的论文中，罗斯发现这个清算所采用的就是盖尔盖尔-夏普利算法夏普利算法，从而达到有效而稳定的配对。市场设计市场设计n跟着这个发现，罗斯随后考察了英国的医院和医生配对情况，发现有些地区是稳定的，而有一些则不然。n那么随之而来的问题就是为什么会有这些差异呢？n原来英国不同的地方采用的配对算法不同，而如何有一个算法使得配对稳定下来，就成为成功的关键。n如何改进算法

19、，不仅要利用每一个市场的信息，也要借助计算机技术的进步，将理论和实际联系起来，这促成和发展了经济学的一个分支：市场设计。市场设计市场设计n在拍卖领域得到了最广泛的应用，2007年克拉克奖得主阿西（S.C.Athey）就是自然资源领域拍卖设计的领军人物。n而Google公司的在线广告拍卖也得到了首席经济学家范里安的帮助。医生夫妇的问题n美国的NRMP项目一开始很成功，但随后又遇上了一个意想不到的问题。n那就是医生夫妇的问题，因为1950年代中期之后，医学院的女生数量开始增长，这导致了医学院学生中夫妻学生数量也开始增长，他们在找实习机会的时候，总是倾向于在一起，而采用NRMP系统找实习的话，两个人

20、很可能分开，因为同一个医院对两个人的排序是有差异的。罗斯新的设计罗斯新的设计n这种情况下夫妻学生档开始绕过NRMP找工作，这就重新导致了市场的不稳定。n由于NRMP系统青睐医院胜过学生，招致了大量的批评。n罗斯在1995年应NRMP的要求，重新设计了配对系统，加入对学生配偶考虑，这项调整使得清算所稳定配对的功能得以继续发挥。nNRMP于1997年采用了罗斯新的设计，现在每年能为约2万个学生有效匹配医院实习职位。但这里还有一个问题：n如果学生夫妻可以抗拒最初的NRMP项目来达到改变项目的目的，那么是不是也有人可以通过系统地操纵算法来获得更好的收益，例如通过先隐藏自己的真实偏好并使他人境况变差来获

21、得更好的收益。n对市场设计而言，最重要的除了稳定（stability）之外，还要激励兼容（incentive compatibility），也就是说没有人有激励说谎话，这样除了能真实揭示出每个参与者的偏好排序外，也避免了有人系统性地操纵市场。n罗斯后来的工作表明要系统实现操纵NRMP项目是不可能的，不仅因为新的算法避免了学生这种“错误表达偏好”的可能，也避免了医院系统操纵NRMP项目的可能，因为成本太高。n关于激励兼容的研究，是2007年诺贝尔经济学奖得主赫维茨、马斯金和梅耶森的贡献了。n而罗斯后来的主要工作是将博弈论、经验证据和实验室研究结合起来，这个领域之前的获奖者是2002年的弗农史密斯

22、。n我们已经知道找对象和找工作都是双向配对的，但是有一些真实世界的问题却不是双向的，而是单向的。q例如对器官移植而言，就是完全单向的，病人是等待者，而捐赠者捐出之后，最好能又快又好地进行移植手术，才能最大化捐赠人和受赠人的利益。n在这个市场上，等待器官移植的人由于受到法律和道德的限制，不能实施价高者得，而且可能实施起来的成本也不低，所以所以必须要有另外的配置资源的方式必须要有另外的配置资源的方式。n那么在器官移植这种问题上，如何提高效率呢？市场设计在这里也有可为之处n夏普利和盖尔提出了另一种算法，叫做“首位交易循环”（TTC:top trading cycle）。nTTC机制除了在器官移植领域

23、广泛应用外，在学生择校领域也有广泛应用。nTTC是说先进行之前提到的稳定配对，已经配对完成的参与者就从市场中移除。说真话机制n这个简单的限定在偏好稳定且可以排序的情况下，就导致没有人愿意说假话掩盖自己的偏好并试图操纵市场了，因为说真话揭示自己的真实偏好是唯一优胜的策略。n在生死攸关的器官移植问题上，这一算法简单却又实用的保证了配对稳定和资源分配的效率。n这里的挑战有两个：一是捐赠的器官是不是与受助者兼容；二是移除配对完成的参与者也需要时间。n尽管如此，美国有大量的州已经实行这一TTC机制多年，为大量患者带去了福音。这类市场设计可以被推广到大量价格的作用受限的市场里n其中最主要的一类应用是学生择

24、校。n学生要选到自己的理想学校，而学校也想挑选最佳学生，这显然属于两个群体之间如何最优配对且能稳定配对的问题。n中国有不少研究高考择校问题的学者，已经在这方面做了一些探索，比较不同的择校机制之间的优劣。n事实上，夏普利和后来的研究者已经将盖尔-夏普利算法做了改进，也可以被应用到价格起作用的市场中，例如拍卖，尤其是网络拍卖，有竞价，有大量的信息，以及便捷的技术，这个领域正在产出大量有意思的新问题和文章。机制设计理论机制设计理论n20072007年年:诺贝尔经济学奖授予诺贝尔经济学奖授予n赫维茨(Hurwicz）n马斯金（Maskin）n梅耶森（Myerson）q是因为他们是因为他们“为机制设计理

25、论奠定了基础为机制设计理论奠定了基础”。机制设计理论n是研究在自由选择、自愿交换、信息不完全及决策分散化的条件下，能否设计一套规则或制度来达到既定目标的理论，深远地影响了现代经济学发展。n从一个单位的激励机制的设计，到整个社会和国家的制度设计，都可以用一个统一的模型来考虑。莱昂尼德赫维奇（被誉为被誉为“机制设计理论机制设计理论之父之父”）n赫维茨早在上世纪40年代就以研究博弈论出名。n他论文资源配置中的最优化与信息效率，拉开“机制设计理论”的序幕；n1973年赫维奇在最著名的美国经济评论杂志上发表论文资源分配的机制设计理论，奠定了机制设计理论这门学问的框架。埃里克马斯金n马斯金最大的一个贡献就

26、是对有一个委托人兼有许多代理人的情况下，达到一个给定的目标，需要的充分必要条件是什么，这是一个很了不起的成果。n因为他这个理论的前提是任何一个给定的目标。n在机制设计理论方面，马斯金最出名的工作则是“纳什均衡可实施机制”，为人们寻找可行的规则提出一种标准，被称为马斯金定理。n之前，莫里斯在1971年发表了最优所得税理论的探索的论文都堪称这方面的经典之作，赢得了1996年的诺贝尔经济学奖。罗杰迈尔森n迈尔森最大的贡献就是奠定了最优合同理论的机制。n最优合同理论是机制设计的一个分支。n前几年拿诺贝尔经济学奖的这些人，实际上是在赫维茨的框架下做。n现年56岁的芝加哥大学经济系教授迈尔森开发出了分析选

27、举的数学模型并发表了70多篇有关博弈论和其他课题的论文。n他在获奖当天于芝加哥举行的新闻发布会上表示，“我们认识到不仅资源的制约很重要，激励的制约也很重要。现在这些已经被理解为经济学问题的基本组成部分。”机制设计思想机制设计思想n“机制设计理论”解答的问题，是不同的制度或配置机制如何发挥作用？以实现社会福利或个人营利之类特定目标的最佳效益。n机制设计理论可以看作是博弈论和社会选择理论的综合运用。所罗门王的故事所罗门王的故事n圣经上所罗门王的故事：两个女人为争夺一个孩子吵到所罗门王那里，都说孩子是自己的。所罗门王见她们争执不下，便喝令侍卫拿一把剑来，要把孩子劈成两半，一个人一半。这时其中一个女人

28、赶紧说：“大王，不要杀死孩子。把孩子给她吧，我不和她争了”。所罗门王听了却说：“这个女人才是真的母亲，把孩子给她。”n假如故事中的假母亲和真母亲说同样的话，那所罗门王该怎么办呢？n所罗门王可以向其中任一母亲（称为A）提问孩子是不是她的。n如果A说不是她的，那么孩子给另一个女人（称为B），GAME OVER。n如果A说孩子是她的，那么所罗门王可以接着问B是否反对。如果B不反对，则孩子归A，GAME OVER。n如果B反对，则所罗门就要她提出一个赌注，然后向A收取罚金。q比较罚金和赌注，如果罚金高于赌注，则孩子给A，她只须交给所罗门王赌注那么多钱，而B要交给他罚金的钱；q如果罚金比赌注低，则孩子给

29、B，她给所罗门王赌注的钱，A的罚金也归他。n不难推出，在A是真母亲的情形下，她的策略是说孩子是她的，然后B不反对。n因为她反对的结果只会导致她要多交钱，因为A为了得到孩子并避免白白给出罚金，必然会真实地根据孩子对她的价值拿出罚金；n在A是假母亲的情形下，她的策略是承认孩子不是她的，因为如果她说孩子是她的，B必然会反对，并且B为了得到孩子并少付钱，一定会真实出价，而A只有出高出孩子对她的真正价值的钱才会得到孩子，可这就不合乎她的偏好了。“没有规矩，不成方圆”n方不方、圆不圆很大程度上取决于“规矩”的好坏，而如何去评价“规矩”，如何去创造个好“规矩”就是机制设计理论研究的课题。n某种程度上看，机制

30、设计理论似乎比我们熟知的传统经济理论更加抽象和高深，大部分经济学家都是习惯于在一个“既定框架”下研究各种最优化问题，而赫维茨等人研究的恰恰就是这个“既定框架”本身。机制设计是不完全信息不完全信息下下委托代理委托代理问题问题n 经济社会活动中，存在着大量一方委托另一方完成特定工作的情况。n其特征是委托方利益与被委托方的行为有密切关系，而且委托方不能直接控制被委托方的行为。只能通过报酬等间接影响被委托方的行为。n除了有书面合同、协议，或至少有口头委托的明显委托关系以外，还有大量经济社会关系虽然没有明显的委托关系，但一方利益与另一方的行为有关，也可以用委托代理理论来加以研究。n当对代理人付出的努力不

31、能进行完全的检验，代理人有可能试图只付出少于他能够付出的努力时（偷懒）；n当一个只根据行动而不兼顾结果支付报偿的契约建立时，潜在的道德风险立即产生。n n 委托代理的核心是两人动态博弈，基本问题是代理人问题。n是指由于代理人目标函数与委托人目标函数不一致，加上存在不确定性和信息不对称，代理人可能偏离委托人的目标函数，而出现损害委托人收益和非效率现象。n就委托人而言，如何设计最优契约激励代理人是问题的关键。n因此这种问题也称为“激励机制设计”或“机制设计”。在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和经济学产生了重大影响。约翰纳什,1928年生于美国 1994年Nobel 经济学

32、奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和经济学产生了重大影响。约翰海萨尼，1920年生于美国 1994年Nobel 经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和经济学产生了重大影响。莱因哈德泽尔腾，1930年生于德国 1994年Nobel 经济学奖得主背景n冯诺依曼（Von Neumann），摩根斯坦恩（Morgenstern）（1944），博弈论和经济行为（The Theory of Games and Economic Behavior）。标志着博弈理论的初步形成nNash（1950，1951）两篇关于非合作博弈的重要文章，在非常一般的

33、意义下，定义了非合作博弈及其均衡解，并证明了均衡解的存在。基本上奠定了现代非合作博弈论的基石。n1994年：在非合作博弈的均衡分析理论方面做出了开创性德贡献对博弈论和经济学产生了重大影响 n1996年：在信息经济学理论领域做出了重大贡献，尤其是不对称信息条件下的经济激励理论（莫里斯）；在信息经济学、激励理论、博弈论等方面都做出了重大贡献（维克瑞）n2001年：为不对称信息市场的一般理论奠定了基石。他们的理论迅速得到了应用，从传统的农业市场到现代的金融市场。他们的贡献来自于现代信息经济学的核心部分。n20052005年年:诺贝尔经济学奖授予拥有以色列和美国双重国籍的罗伯特罗伯特奥曼奥曼和美国人托

34、马斯托马斯谢林谢林，以表彰他们运用博弈论推进了人们对冲突与合作的理解。n20072007年年:诺贝尔经济学奖授予以美国经济学家赫维茨、马斯金、罗杰-B-迈尔森，以表彰他们激励机制设计理论所作出的贡献与奠定基础。获得获得2001诺贝尔经济学奖诺贝尔经济学奖对对不对称信息理论不对称信息理论的贡献的贡献n获得获得2001诺贝尔经济学奖诺贝尔经济学奖q加利福尼亚大学加利福尼亚大学George Akerlof q斯坦福大学斯坦福大学Michael Spenceq美国哥伦比亚大学美国哥伦比亚大学Joseph Stiglitzn他们三人的贡献是他们三人的贡献是q提出了当买方和卖方具有不对称信息时市场运作的理

35、论，提出了当买方和卖方具有不对称信息时市场运作的理论，这一理论的应用非常广泛，从传统的农业市场到现代的这一理论的应用非常广泛，从传统的农业市场到现代的金融市场均有涵盖。金融市场均有涵盖。q虽然过去经济学家对不完全信息早有研究，但他们研究虽然过去经济学家对不完全信息早有研究，但他们研究的是更为复杂的不对称信息的是更为复杂的不对称信息奥曼和谢林利用博弈论解决了一个世纪难题奥曼和谢林利用博弈论解决了一个世纪难题n即为何有的人、组织或国家在推进合作方面表现出色，而另一些人则深受冲突之苦。n在核竞赛盛行的20世纪50年代后期，谢林出版了冲突战略一书，奠定了博弈论作为社会科学的方法论的地位。n他指出，冲

36、突中的一方可以通过自陷绝境从而加强自己的地位；拥有报复手段比抵抗手段更重要；难以预料的报复手段比已知的报复手段更有效。这些论断在一些地区冲突的解决和避免战争的斡旋中被证明是正确的。n谢林的理论推进了博弈论在社会科学领域的发展，并被应用于从企业竞争到政治谈判的广泛领域。奥曼的贡献奥曼的贡献-在于创造了重复博弈理论n他的理论着重解释这样一些问题：为何参与者太多合作就变得困难；参与者何时会偶尔互动一下；何时这种互动会瓦解等。n重复博弈论解释了经济冲突如价格战、贸易战的原因，也说明了为何一些政府比另一些政府能更好地管理公共资源。n重复博弈理论已被用于从行业协会到有组织犯罪、从劳资谈判到国际贸易条约等领

37、域。20072007年年诺贝尔经济学奖n按照亚当斯密的设想，市场这只看不见的手在理想情境中能有效分配资源。但现实中总有各种各样的制度约束，导致市场不能发挥作用。nn1991年诺贝尔经济学奖得主科斯指出市场存在交易费用，不能有效发挥作用，于是有企业这样的机制作为替代。因此n不同类型的制度如何最大化个人或社会的福利就成为经济学的一个重要问题。n这就是激励机制设计理论产生的背景。激励理论的两个方面n通常而言，激励理论涉及两个方面:n一个是最优机制，即机制的目标是最大化个人的预期收益。n另一个可以称为效率机制，即设计者的目标不是个人收益最大化，而是社会整体的福利最大化。激励机制设计理论n激励机制设计理

38、论不仅在理论上将博弈论引入到新制度经济学中，推动了理论的发展；n在现实中，也有助于人们找出有效的交易机制、管制手段和投票程序，丰富了现实中可以选择的经济制度。n各种预测虽然都没有猜中获奖名单，但赫维茨、马斯金和梅耶森的获奖是“意料之外，情理之中”。1.1.博弈论概述博弈论概述1.1如何描述一个博弈问题如何描述一个博弈问题1.2优势策略优势策略1.3纳什均衡纳什均衡1.4纳什均衡应用举例纳什均衡应用举例1.5计算纳什均衡计算纳什均衡1.1如何描述一个博弈问题如何描述一个博弈问题Case1.guess coin 正面正面反面反面猜硬币方猜硬币方盖硬币方盖硬币方正面正面反面反面 n博弈方博弈方：

39、盖硬币方和猜硬币方；：正面和反面；:猜对者得1元，盖者输1元；猜错者输1元，盖方得1元。Case2.prisonersdilemma不坦白不坦白坦白坦白不坦白不坦白坦白坦白囚犯囚犯2 2囚犯囚犯1 1：囚犯1、2：坦白与不坦白：若两人同时坦白各判5年；n若一个坦白一个不坦白，坦白放人，不坦白被判8年；n若两人同时不坦白各被判1年。Case3.boxed pigs按按等待等待按按等待等待小小猪猪大猪大猪猪和小猪；猪和小猪；：按和等待；按和等待；按一下按纽会有10个猪食进槽，但谁按谁要支付成本2个单位。若大猪先到，大猪吃9个，小猪吃1个；若同时到，大猪吃7个，小猪吃3个；若小猪先到，大猪

40、吃6个，小猪吃4个。Case4.夫妻之争夫妻之争看足球看足球看芭蕾看芭蕾看足球看足球看芭蕾看芭蕾夫夫妻妻；：看足球和看芭看足球和看芭蕾；蕾；Case4.Chicken game-3，-3 2，0 0，2 0，0进退A B进退n博弈方：两个人A，B；n可选策略：进或退。n决策次序：几乎同时决策n所得利益：若两继续前进则两败俱伤；n若一方前进另一方退下来，前进者取得胜利，退下来者丢面子；n若两人都退下来，两Case5.石头剪子布的博弈石头剪子布的博弈1.1.博弈方博弈方1 1，2 2；2.2.可选策略：石头、可选策略：石头、剪子和布；剪子和布；3.3.几乎同时决策；几乎同时决策；4.4

41、.所得利益：所得利益：0 0表示没有输赢；表示没有输赢；1 1表示赢；表示赢；-1-1表示输。表示输。0，01，-1-1，1-1，10，01，-11，-1-1，10，0博弈方2石头剪子布博弈方1石头剪子布Case6 无限策略博弈无限策略博弈n古诺寡头模型中古诺寡头模型中(需求函数：需求函数：p=a-Q，其中其中Q=q1+q2)1.两厂商博弈方两厂商博弈方2.可选择策略可选择策略：产量产量q1、q23.支付函数为支付函数为：u=pq-cq=(p-c)q ui=a-(q1+q2)-cqi=(a-c)qi-q1qi-q2qi i=1,2 如果假设如果假设a=8,c=2,则有则有n u1=6q

42、1-q1q2-q12 u2=6q2-q1q2-q22Case7.市场进入与阻挠市场进入与阻挠 Player1：在位者：在位者Player2：进入者：进入者:初始结初始结Player2有两个可选策略：有两个可选策略：进入与不进进入与不进决策结决策结 Player1面临两个可选策面临两个可选策略略:斗争与合作斗争与合作(a,b)为支付向量为支付向量21 不进进入斗争合作（0,300)(-10,0)(40,50)Basic factors of GamenPlayersnStrategies&strategies set nOrder of gamenInformationnPayoff&pay

43、off functionnOutcome&EquilibriumnCasesPlayers 单人博弈单人博弈、两人博弈和多人博弈、两人博弈和多人博弈q可以是自然人或团体，如企业、国家、可以是自然人或团体，如企业、国家、OPECOPEC、EUEU、NATONATO等等q目的是通过选择行动或策略以最大化自己的目的是通过选择行动或策略以最大化自己的支付或效用水平支付或效用水平n重要的是每个决策主体必须有可供选择的行动或策略和一个很好定义的偏好函数n而不做决策的被动主体只当作环境参数单人博弈单人博弈只有一个博弈方的博弈只有一个博弈方的博弈例：单人迷宫入口AB出口(奖金M)A,1B,1右左右左M00扩展

44、形Strategies n是博弈中各博弈方可以选择的行动方案，即对行为或者经济活动水平等等的可能的选择，或决策内容。n不同的博弈问题中各博弈方可选策略的多少不同，一般分为：有限策略博弈和无限策略博弈博弈的表述式博弈的表述式参与人参与人1 1参与人参与人2 2参与人参与人2 2（参与人（参与人1 1，参与人，参与人2 2）Information 是是Player有关博弈的知识，它是重要的决策有关博弈的知识，它是重要的决策依据和决定博弈结果的重要因素依据和决定博弈结果的重要因素完美信息与不完美信息完美信息与不完美信息完美博弈 N 大小 A A 开发不开开发不开 B B B B （4，4）（

45、8，0）（0，8）（0，0）（-3，-3）（1，0）（0，1）（0，0）不完美博弈 N 大小 A A 开发不开开发不开 B B B B （4，4）（8，0）（0，8）（0，0）（-3，-3）（1，0）（0，1）（0，0）开发不开开发不开开发不开开发不开不完美博弈 N 大小 A A 开发不开开发不开 B B B B （4，4）（8，0）（0，8）（0，0）（-3，-3）（1，0）（0，1）（0，0）开发不开开发不开开发不开开发不开不完美博弈 N 大小 B B 开发不开开发不开 A （4，4）（8，0）（0，8）（0，0）（-3，-3）（1，

46、0）（0，1）（0，0）开发不开开发不开开发不开开发不开确定性信息与不确定性信息确定性信息与不确定性信息参与人参与人1参与人参与人2参与人参与人2（参与人（参与人1，参与人，参与人2）对称信息与不对称信息对称信息与不对称信息完全信息与不完全信息完全信息与不完全信息The order of Play每个博弈参与人几乎同时行每个博弈参与人几乎同时行动（不是时间概念）动（不是时间概念）：每个博弈参与人选择行动每个博弈参与人选择行动或策略有先后之分或策略有先后之分q重要的是后行动方通过观察先行动方的行动来获重要的是后行动方通过观察先行动方的行动来获取信息，从而使得博弈分析成为预测人的行

47、为的取信息，从而使得博弈分析成为预测人的行为的一个强有力的工具一个强有力的工具：是指同一个博弈反复进行所构成是指同一个博弈反复进行所构成的博弈过程的博弈过程q构成重复博弈的一次性博弈称为构成重复博弈的一次性博弈称为“原博弈原博弈”或或“阶段博阶段博弈弈”Payoffq这是player真正关心的东西，是player博弈后所得利益q他的目标就是在自己可以选择的策略集合里，选择某个战略以最大化自己的期望效用函数。Utility Functionn如果有n人博弈，令ui为Player i 的支付，u=(u1,uiun)为支付组合payoff profile,n博弈的一个基本特征是一个参与人的支付不仅取

48、决于自己的策略选择，而且取决于所有其他参与人的策略选择，即ui是所有参与人的策略选择的函数：ui=ui(s1,si,sn)其中si是Player i 的策略选择。Outcome&Equilibriumn博弈的结果是所有博弈方所关心的，如均衡策博弈的结果是所有博弈方所关心的，如均衡策略组合，均衡行动组合，均衡支付组合。略组合，均衡行动组合，均衡支付组合。n均衡是所有参与人的最优策略的组合，一般记均衡是所有参与人的最优策略的组合，一般记为为 S*=（S1*，,Si*,Sn*)其中，其中，是是Player i 在均衡情况下的最优策在均衡情况下的最优策略。略。要做的事要做的事后面要讨论后面要讨论1.2

49、优势策略优势策略从数学上讲从数学上讲,就是就是:囚犯囚犯1和囚犯和囚犯251囚囚犯犯1囚犯囚犯25-588(-5,-5)8501.3纳什均衡纳什均衡n个案个案n多重纳什均衡多重纳什均衡n纯策略纳什均衡纯策略纳什均衡n随机策略的纳什均衡随机策略的纳什均衡n强、弱纳什均衡强、弱纳什均衡个案：智猪博弈、建模者困境和性别战个案：智猪博弈、建模者困境和性别战Case.boxed pigs按按等待等待按按等待等待小小猪猪大猪大猪求解这个博弈问题：求解这个博弈问题：1.1.下划线法下划线法2.2.重复剔除严格劣策略重复剔除严格劣策略纳什均衡：纳什均衡：（按，等待）（按，等待）这个博弈有占优策略？Ca

50、se.建模者困境建模者困境Case.性别战性别战三三帕累托有效帕累托有效n博弈的一个结果是帕累托有效（Pareto efficient）,当且仅当不存在另一个能使所有参与人的状况更好的结果。n囚徒困境可以说是一个存在帕累托改善（或者说无效均衡）的例子。n纳什均衡是博弈的结局，它指博弈中每个局中人均不能因单方面改变自己的策略选择而获益。n纳什均衡是一个僵局：给定别人不动的情况下，没有人有兴趣动。n纳什均衡可以理解为一种具有自我强制力的协议，即这种协议没有外加力量保证实施却使每个参与者都自愿遵守，原因就在背叛协议无利可图。NE的哲学思想的哲学思想n“当事人会自觉遵守这个协议”，等于说这个协议构成一

展开阅读全文