1、博弈论理论及应用博弈论理论及应用参考书目参考书目n经济博弈论 谢识予 复旦大学出版社n博弈论与信息经济学 张维迎 上海三联出版社n纳什均衡论 谢识予 上海财大出版社n博弈学习理论 陈学彬 上海财大出版社n微观信息经济学 谢康 中山大学出版社n詹姆斯莫里斯论文精选 商务印书馆 博弈论(game theory)是由美国数学家冯诺依曼和经济学家摩根斯坦于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、社会学、心理学、智能计算、生物学、火箭工程技术、军事及政治科学等。1994年,三位博弈论专家即数学家纳什(美丽美丽心灵心灵)、经济学家海萨尼和泽尔滕因在博弈论及其在经济学中的应用研究上所作出
2、巨大贡献而获得诺贝尔经济学奖。1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。博弈论的发展过程博弈论的发展过程 1.博弈思想源于对策问题,可谓历史悠久,至少可追溯到2000多年前我国古代的“田忌赛马”;1500年前巴比伦犹太教法典中的“婚姻合同问题”等;2.博弈论早期研究的起点1883年的“古诺模型”。这一模型同1883年伯特兰德的寡头竞争模型都是
3、对博弈问题的早期研究;3.博弈论的系统研究是从本世纪初期开始的。系统研究博弈理论的发端是齐默罗和波雷尔对象棋博弈等的系统研究;4.博弈论的真正起点为冯诺伊曼、摩根斯坦1944年博弈论和经济行为(Theory of Games and Economic Behavior),在这本著作中引进了扩展形表示和策略形表示,定义了极小化极大解提出了稳定集解概念等,正式提出了博弈论的一般理论,这时期也是博弈论研究的第一个高潮时期;博弈论的发展过程博弈论的发展过程 5.博弈论研究的第二个高潮时期为20世纪50年代后期到70年代,其中的重要代表人物是海萨尼和泽尔滕,产生了微分博弈、重复博弈的重要理论以及子博弈完
4、美纳什均衡和贝叶斯纳什均衡的概念;博弈论的发展过程博弈论的发展过程 6.博弈论研究的第三个高潮时期为20世纪80至90年代,其中提出了顺推归纳法、序列均衡以及进化博弈的重要理论。年度年度照片照片简介简介获奖缘由获奖缘由约 翰 纳 什1928年生于美国 在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响约 翰 海 萨尼1920年生于美国 莱因哈德泽尔腾1930年生于德国 1994诺贝尔经济学奖与博弈论诺贝尔经济学奖与博弈论 年度年度照片照片简介简介获奖缘由获奖缘由詹姆斯莫里斯年生于英国1936在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的激励理论威 廉
5、 维 克瑞1914生于美国1996在信息经济学、激励理论、博弈论等方面都做出了重大贡献诺贝尔经济学奖与博弈论诺贝尔经济学奖与博弈论 年度年度照片照片简介简介获奖缘由获奖缘由阿 克 洛 夫1940年生于美国为不对称信息市场的一般理论奠定了基石。他们的理论迅速得到了应用,从传统的农业市场到现代的金融市场。斯彭斯1943年生于美国斯蒂格利兹1942年生于美国2001诺贝尔经济学奖与博弈论诺贝尔经济学奖与博弈论 年度年度照片照片简介简介获奖缘由获奖缘由罗伯特奥曼1930年生于德国通过博弈论分析,促进了人们对冲突和合作的理解托 马 斯 谢林1921年生于美国2005诺贝尔经济学奖与博弈论诺贝尔经济学奖与
6、博弈论 年度年度照片照片简介简介获奖缘由获奖缘由赫维奇 1917年出生于俄罗斯创立和发展了“机制设计理论”。这一理论有助于经济学家、各国政府和企业识别在哪些情况下市场机制有效,哪些情况下市场机制无效。此外,借助“机制设计理论”,人们还可以确定最佳和最有效的资源分配方式。马斯金1950年出生于美国迈尔森1951年出生在美国2007诺贝尔经济学奖与博弈论诺贝尔经济学奖与博弈论 为什么博弈论在经济学领域会产生如此大的影响呢?这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。博弈论在经济学中的应用博弈论在经济学中的应用 v产业组织理论 v信息经济学 v讨
7、价还价理论 v拍卖理论 v公共经济学 v产权与制度分析 v国际贸易政策 v宏观经济政策分析此外,博弈论在保险市场、金融市场、企业管理、跨国公司经营、会计学等领域也有广泛的应用博弈论的发展前景博弈论的发展前景 新的博弈分析工具和应用领域的不断发现成为博弈论继续向前发展的根本基础和保证随着博弈理论的发展和博弈研究的不断深入,博弈论本身还存在着许多问题,特别是理论基础方面还存在一些没有很好解决的根本性问题金融、贸易、法律、政治等众多领域,不断提出新的博弈论应用课题,也不断有新的应用博弈模型产生,这些是今后博弈论进一步发展的巨大动力在合作博弈和非合作博弈中,非合作博已成为当今博弈论的主流。然而,合作博
8、弈理论的发展及合作与非合作博弈的重新融合,将为博弈论发展提出新的方向和课题 博弈博弈论论(Game theory)是针对多个利益主体间的利益冲突和相互决策研究方面而产生和发展起来的一门学科,用来分析人类的社会行为和管理活动以及自然界生物的相互行为。什么是博弈论?什么是博弈论?n 博弈人n 策略集n 支付函数博弈论的三要素博弈论的三要素Player 2 s21s22s11u1(s11,s21),u2(s11,s21)u1(s11,s22),u2(s11,s22)s12u1(s12,s21),u2(s12,s21)u1(s12,s22),u2(s12,s22)s13u1(s13,s21),u2(s
9、13,s21)u1(s13,s22),u2(s13,s22)博弈模型博弈模型博弈人 策略 支付Player 1博弈类型分类方法博弈类型分类方法 得益得益 过程过程 完全完全 完美完美完全且完美信息动态博弈完全但不完美动态博弈完全信息静态博弈重复博弈不完全信息静态博弈不完全信息动态博弈博弈类型博弈类型静态动态 完全 信息完全信息静态博弈纳什均衡Nash(1950)完全信息动态博弈 子博弈精炼纳什均衡 泽尔腾(1965)不完 全信 息不完全信息静态博贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈,精炼贝叶斯纳什均衡;泽尔腾(1975)Kreps,Wilson(1982),Fudenb
10、erg,Tirole(1991)博弈分类博弈分类博弈中的博弈方博弈中的博弈方 单人博弈 两人博弈 多人博弈 博弈中的策略博弈中的策略 有限策略博弈 无限策略博弈 博弈中的得益博弈中的得益 零和博弈 常和博弈 变和博弈 博弈的过程博弈的过程 静态博弈 动态博弈 重复博弈博弈的解与博弈的解与Nash均衡均衡给定其他博弈人的策略,博弈人 i 偏离策略 si*不能得到任何好处Prisoner 2MumConfessPrisoner 1Mum-1,-1-9,0Confess 0,-9-6,-6Nash均衡分析均衡分析划线法:划线法:反应函数法:反应函数法:Nash均衡分析均衡分析常见经典博弈模型常见经典
11、博弈模型1.囚徒困境2.赌胜博弈3.产量决策的古诺模型坦 白不坦白坦 白不坦白囚徒囚徒 2囚徒1囚徒1:坦白囚徒2:坦白囚徒困境囚徒困境囚徒困境囚徒困境-5,-50,-8-8,0-1,-1两个罪犯的得益矩阵双寡头削价竞争双寡头削价竞争100,10020,105150,2070,70高 价低 价高 价低 价寡头寡头2寡寡头头1双寡头的得益矩阵政府组织协调的必要性和重要性寡头1:低价(70)寡头2:低价(70)囚徒困境囚徒困境田忌赛马田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-
12、1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田田 忌忌齐齐威威王王得益矩阵得益矩阵取胜关键:不让对方猜到自己策略,尽可能猜出对方策略取胜关键:不让对方猜到自己策略,尽可能猜出对方策略赌胜博弈赌胜博弈硬币博弈硬币博弈-1,11,-11,-1-1,1正 面反 面猜硬币方盖硬币方正 面反 面赌胜博弈赌胜博弈石头石头-剪子剪子-布布0,01,-1-1,1-1,11,-10,01,-1-1,10,0石 头剪 子布博弈方博弈方2 2石 头剪 子布博
13、博弈弈方方1 1赌胜博弈赌胜博弈 产量决策的古诺模型产量决策的古诺模型n古诺模型是寡头产量竞争,是市场经济中最常见的问题之一n古诺1838年提出,直到现在还是经常使用n古诺模型有很多扩展n古诺模型与囚徒困境相似,对理解市场经济和博弈分析本身都有重要价值古诺的寡头模型古诺的寡头模型 博弈方1 1利润:博弈方2 2利润:在本博弈中,的纳什均衡的充分必要条件是 和 的最大值问题:社会收益最大化:假设总产量为Q Q,总收益为UQP(Q)CQ Q(8-Q)2Q6QQ2 其最大值为Q*=3,;该结果与纳什均衡有较大的差异,这就是纳什均衡是源于各厂商追求自身利益最大化的结果。2111 1112111 21(
14、)8()26uqP QCqqqqqqqqq22222212221 22()8()26uq P QC qqqqqqqqq*12(,)qq*1q*2q12*21121*22122max(6)max(6)qqqq qqqq qq*12122,u=u=4qq12=4.5uu 产量决策的古诺模型产量决策的古诺模型伯特兰德的寡头模型伯特兰德的寡头模型 n在该模型中厂商选择价格而不是产量n厂商1的价格与需求函数:P1,厂商2的价格与需求函数:P2,其中,d1,d20为两厂商产品的替代系数。假设两厂商无固定成本,边际成本分别为c1和c2。收益:纳什均衡:221222221(,)qq P Pab Pd P111
15、21 11 11111 11222122222222222 1(,)()()(,)()()uu P PPqc qPcabPd Puu P PPqc qPcab Pd P*12122 211 11 2121 212*21211 122 21 2121 2122()()442()()44dbPab cabcbbd dbbd ddbPabcab cbbd dbbd d111211 112(,)qq P Pab Pd P 产量决策的古诺模型产量决策的古诺模型 两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招供者立即被释放,未招
16、供者判入狱10年;若二人都招供则两人各判刑8年;若两人都不招供则未获证据但因私入民宅各拘留1年。案例分析案例分析(1)招 供不招供招 供不招供囚徒2 囚徒1-8,-80,-10-10,0-1,-1两个罪犯的得益矩阵问题:罪犯如何做出选择?设想有两户相居为邻的农家,十分需要有一条好路从居住地通往公路。修一条路的成本为4,每个农家从修好的好路上获得的好处为3。如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民获得净的好处(支付)为3-4/2=1;当只有一户人家单独出资修路时,修路的居民获得的支付为3-4=-1(亏损),“搭便车”不出资但仍然可以使用修好的路的另一户人家获得支付3-0=3。
17、案例分析案例分析(2)修 路不 修修 路不 修乙 甲1,1-1,33,-10,0修路博弈的得益矩阵问题:为什么政府要负责修建公共设施?我们看到,对甲和乙两家居民来说,“修路”都是劣战略,因而他们都不会出资修路。这里,为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位,然后投入4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善。这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理,国防、教育、社会保障,环境卫生等都由政府承担资金投入,私人一般没有积极性承担这方面服务的积极性和能力 猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,
18、每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。案例分析案例分析(3)按等 待按等 待小猪 大猪5,14,49,-10,0智猪博弈的得益矩阵问题:大猪小猪会如何选择?智猪博弈没有“剔除劣战略均衡”,因为大猪没有劣战略。但是,小猪有一个劣战略“按”,因为无论大猪作何选择,小猪选择“等待”是比选择“按”更好一些的战略。所以,小猪会剔除“按”,而选择“等待”;大猪知道小猪会选择“等待”
19、,从而自己选择“按”,所以,可以预料博弈的结果是(按,等待)。这称为“重复剔除劣战略的占优战略均衡”,其中小猪的战略“等待”占优于战略“按”,而给定小猪剔除了劣战略“按”后,大猪的战略“按”又占优于战略“等待”。为何股份公司中的大股东才有投票权为何股份公司中的大股东才有投票权?在股份公司中,大股东是大猪,他们要收集信息监督经理,因而拥有决定经理任免的投票权,而小股东是小猪,不会直接花精力去监督经理,因而没有投票权。为什么中小企业不会花钱去开发新产品?为什么中小企业不会花钱去开发新产品?在技术创新市场上,大企业是大猪,它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术
20、创新,而是等待大企业的新产品形成新的市场后生产模仿大企业的新产品的产品去销售。为什么只有大企业才会花巨资打广告为什么只有大企业才会花巨资打广告?大企业是大猪,中小企业是小猪。大资金为产品打广告,中小企业等大企业的广告为产品打开销路形成市场后才生产类似产品进行销售。博弈论作为经济学研究的有力工具,真正大行其道是在70年代不对称信息下经济行为分析的兴起。不对称信息指一些局中人拥有别的局中人不拥有的“私人信息”,也就是说一些局中人知道别的局中人不知道的某些情况。下面用一些例子说明这种情形下的博弈行为。不对称信息博弈不对称信息博弈二手车市场为什么难以建立?二手车市场为什么难以建立?在发达国家,二手车(
21、旧车)的价格往往比新车差一大截,即使旧车本身没有什么质量问题,一旦旧车进入二手车市场,其价格就会与新车相比差得老远。在我国许多城市,二手车市场甚至难以建立起来,原因是进入市场的买车人太少。这是为什么呢?二手车市场的博弈理论为我们解答了这个谜语。案例分析案例分析(4)在二手车市场上,卖车人比买车人更多地知道车的质量情况,但卖车人不会将旧车的质量问题老老实实地告诉买车人。买车人也知道这种情形,因此,买车人在开出价格时会考虑到车的质量问题。假定没有问题的好车价值20万元,有问题的坏车只值10万元,并且设买车人认为市场上出现好车和坏车的可能性各占一半。这时,买车人开出的价格不会高于15万元。这样,如果
22、卖车人的车果真是好车,他就不会出售,好车退出市场,但当卖车人的车是坏车时,他会十分积极地将只值10万元的车按15万元卖给他。但买车人知道愿意按15万元卖的车一定是坏车,从而认定市场上全是坏车。所以,除非他愿意买一辆坏车,否则他会退出市场。当他愿买坏车时,他只开出10万元的价。于是,旧车市场或者建立不起来,没有买主,或者充斥着坏车,真正的好车退出市场,而坏车在不断成交,但价格很低。类似现象广泛存在如人才市场、信贷市场等。如一个公司往往流走的是能力强的人,因为公司不能正确评价一个能力强的员工的能力,给予的薪水低于其市场价值。如果有一件古董需要拍卖,有许多人参加竞争性拍卖。这件古董在每个买主心中有一
23、个价值评价。但是,卖主不知道买主的评价,买主也不会老实将其对古董的评价告诉卖主。不同买主之间也不知道其他人的价值评价。案例分析案例分析(5)如果采用“英式拍卖法”,买主们轮流出价,直到开出最高价的买主拿走古董并支付所开出的最高价格。按这种拍卖方法,古董并不能按买主心中的最高评价价值卖出。壁如,当买主中的最高评价为100万元,第二高评价为90万元时,当评价最高的买主开出91万元时,就可买走其评价为100万元的古董但只支付了91万元。由于这是公开竞价,会出现围标问题,即买主们合谋压价。另一种方法是:“一级密封价格拍卖法”。买主每人将其开出的价格写入一个信封,密封后交给卖主。卖主拆开所有信封,将古董
24、卖给信封中出价最高的买主,并要求支付最高的价格。这种方法可避免围标,但不能将古董按买主中最高的评价价值卖出。因为买主不会按心中的评价老老实实地将价格写为其价值评价。如果该买主认为古董值100万元,他不会写出价格为100万元,因为当他开出比100万更低一些的价格时,有可能赢得古董但净赚一个价值与价格的差额。如当他开出90万元时,有可能成交并净赚10万元。相反,当他开出100万元时,即使成交也无赚头。所以,大家都不会老老实实报出心中的价值。经济学家维克里发明的“二级密封价格拍卖法”(维克里拍卖法),既可避免围标,又可诱使买主们老老实实地开出心中的真实评价。维克里拍卖法要求每个买主写入信封一个出价,
25、密封后交给卖主,卖主拆开信封后宣布将古董卖给出价最高的人,但只需支付开出的第二高的价格。譬如,出价最高的为100万元,第二高的为90万元,古董就卖给开出100万元的人,但他只需支付给卖主90万元。对每个买主来说,他不知道其他买主的评价,但给定其他买主的评价(尽管他不知道),他一旦获胜,支付的第二高的价格是固定的,不会随他开出的价格而变;但他开出的价格愈高,获胜的可能就愈大;但是,他不能开出比他的价值评价更高的价格。因为一旦存在别的人开出的价格比他的价值评价还要高,当他获胜时,就必须以高出他的价值评价的价格购买古董,对他来说是得不偿失的。所以,每个人都会老老实实在按心中的评价开出价格。如果所有人
26、的评价是一样的,古董就以真实的最高价值卖出。维克里拍卖法可以诱使买主说出真话。70年代美国联邦政府运用维克里招标法进行公共工程招标,为联邦政府节省了大笔开支。在18世纪以前,英国苏格兰地区有大量的草地,其产权没有界定,属公共资源,大家都可以自由地在那里放牧。草地属于“可再生资源”,如果限制放牧的数量,没有被牛羊吃掉的剩余草皮还会重新长出大面积草场,但如果不限制放牧规模,过多的牛羊将草吃得一光二净,则今后不会再有新草生长出来,草场就会消失。案例分析案例分析(6)由于草地的产权没有界定,政府也没有对放牧作出规模限制,每家牧民都会如此盘算:如果其他牧民不约束自己的放牧规模,让自己的牛羊过多地到草地上
27、吃草,那么,我自己一家约束自己的放牧规模规模对保护草场的贡献是微乎其微的,不会使草场免于破坏;相反,我也加入过度放牧的行列,至少在草场消失之前还会获得一部分短期的收益。如果其他牧民约束放牧规模,我单独一家人过度放牧不会破坏广褒的牧场,但自己却获得了高额的收益。因此,任何一位牧民的结论都会是:无论其他牧民是否过度放牧,我选择“约束自己的放牧规模”都是劣战略,从而被剔除。大家最终都会选择过度放牧,结果导致草地消失,生态破坏。假设有 n 个工厂,而且有一条可供这些工厂自由排放废水的公共河道。由于河道是有限的,所以可供排放的废水也是有限的,如果超过了最大废水排放量,则不但会影响生态环境,而且使得这些工
28、厂都无法排放废水进而影响产量降低利润。假定这些工厂在给定的日期统一排放废水,而且在排放前就要确定其排放的数量,但每个工厂只知道他自己的废水排放量,而不知道其他工厂的废水排放量,但所有工厂都知道这条河道的最大废水排放量。p每个工厂如何确定排放量?每个工厂如何确定排放量?p公共管理部门如何设定排放量使得社会福利最大化?公共管理部门如何设定排放量使得社会福利最大化?公地悲剧模型化公地悲剧模型化n 个个 工工 厂厂 模型构建模型构建 博弈人博弈人 废水排放量废水排放量 策略集策略集 利利 润润 支付(得益)支付(得益)假定:第 个工厂的废水排放量为 ,则废水总排放量为 ,又可知每个工厂的单位产出 是废
29、水总排放量的减函数 ,假定每个工厂的单位排污成本都是相同的(设为c)。iiq1,in()nqqqQ21V)(QVV 模型构建模型构建cqQVquiii)(由于工厂的排污量与产量是正相关的,因此工厂 排污 的得益函数为 。iqi设定 ,此时,三个发电厂的得益分别为:13211120)(1000qqqqqu3n20c)(1000321qqqV23212220)(1000qqqqqu33213320)(1000qqqqqu数据分析数据分析 可得均衡解为 ,即为三个工厂的废水排放量,此时总排放量为735。000332211quququ245*3*2*1qqqNash均衡解均衡解由此时三个发电厂的利润为:总利润为18007560025*3*2*1uuuPareto最优解最优解若讨论总体效用最大化,则总社会效益为由最优条件可得总最优排放量此时,总效益为 240019 QQQu20)1000(0Qu499*Q 240019 180075 499 735?n理性经济人考虑最大化个人利益nNash均衡解下的排放量过大n要使得社会福利最大化,需要政府或 公共管理部门的管制结结 论论