1、教材:经济博弈论(第三版)经济博弈论(第三版)复旦大学出版社,2007年版出勤:30(点名概率随上课人数的变化相机决策博弈)考试:开卷有益(论文或出题形式取决于学生与学院的博弈结果,70)参考书目:阅读书目阅读书目http:/ 导论1.1 什么是博弈论1.1.1 从游戏到博弈博弈就是策略对抗,或策略有关键作用的游戏博弈就是策略对抗,或策略有关键作用的游戏 博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用 游戏下棋、猜大小 经济寡头产量决策、市场阻入、投标拍卖 政治、军事美国和伊拉克、以
2、色列和巴勒斯坦1.1.2 一个非技术性定义四个核心方面四个核心方面 博弈的参加者(Player)博弈方 各博弈方的策略(Strategies)或行为(Actions)博弈的次序(Order)博弈方的得益(Payoffs)1.2 几个经典博弈模型1.2.1 囚徒的困境 囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷一、基本模型-5,-50,-8-8,0-1,-1坦 白不坦白坦 白不坦白两个罪犯的得益矩阵囚徒囚徒 2囚囚徒徒1囚徒1:坦白囚徒2
3、:坦白二、双寡头削价竞争100,10020,105150,2070,70高 价低 价高 价低 价寡头寡头2寡寡头头1双寡头的得益矩阵政府组织协调的必要性和重要性寡头1:低价(70)寡头2:低价(70)1.3 博弈论历史和发展简述 2000年前我国古代的“齐威王田忌赛马”1500年前巴比伦犹太教法典“婚姻合同问题”等。1838年古诺寡头模型。1883年伯特兰德寡头竞争模型。1913年齐默罗象棋博弈定理、“逆推归纳法”1921-1927年波雷尔混合策略的第一个现代表述,有数种策略两人博弈的极小化极大解 1928年诺伊曼和摩根斯坦扩展形博弈定义,证明有限策略两人零和博弈有确定结果 1.3.1博弈论的
4、形成冯冯.诺伊曼和摩根斯坦诺伊曼和摩根斯坦博弈论和经济行为博弈论和经济行为Theory of Games and Economic Behavior 1944 引进扩展形(extensive form)表示和正规形(normal form)或称策略形(strategy form)、矩阵形(matrix form)表示 提出稳定集(stable sets)解概念 正式提出创造博弈论一般理论的主意 给出博弈论研究的一般框架、概念术语和表述方法1.3.2 博弈论的成长和发展一、第一个研究高潮,本世纪40年代末和50年代初 1950年纳什提出“纳什均衡”(Nash equilibrium)概念和证明纳
5、什定理,发展非合作博弈的基础理论。1950年Melvin Dresher和Merrill Flood在兰德公司(美国空军)“囚徒的困境”(Prisons dilemma)博弈实验,(Howard Raiffa)独立进行这个博弈实验;1952-1953年期间(L.S.Shapley)和(D.B.Gillies)提出“核”(Core)作为合作博弈的一般解概念 Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。奥曼(R.J.Aumann)“40年代末50年代初是博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。”二、50年代中后期
6、一直到70年代博弈论发展的青年期 1954-1955年提出了“微分博弈”(Differential games)的概念。奥曼则在1959年提出了“强均衡”(Strong equilibrium)的概念。“重复博弈”(Repeated games)也是在50年代末开始研究的,这自然引出了关于重复博弈的“民间定理”(Folk theorem)。1960年(Thomas C.Schelling)引进了“焦点”(Focal point)的概念。博弈论在进化生物学(Evolutionary Biology)中的公开应用也是在60年代初出现的。塞尔腾(Selten)1965提出“子博弈完美纳什均衡”(su
7、bgame perfect Nash equilibrium)1975年提出的“颤抖手均衡”(Trembling hand perfect equilibrium)海萨尼(Harsanyi)1967-1968三篇构造不完全信息博弈理论的系列论文,“贝叶斯纳什均衡”(Bayesian Nash equilibrium)。海萨尼1973年提出关于“混合策略”的不完全信息解释,以及“严格纳什均衡”(Strict Nash equilibrium)。70年代“进化博弈论”(Evolutionary game theory)的重要发展,(John Maynard Smith)1972年引进“进化稳定策略
8、”(Evolutionarily stable strategy,ESS)等。“共同知识”(Common knowledge)的重要性,因为奥曼1976年的文章引起广泛的重视。三、40年代末到70年代末是博弈论发展的重要阶段 这个时期博弈理论仍然没有成熟,理论体系还比较乱,概念和分析方法很不统一,在经济学中的作用和影响还比较有限,但这个时期博弈论研究的繁荣和进展却是非常显著的。对这一阶段博弈论研究的迅速发展,除了理论发展自身规律的作用以外,全球政治、军事、经济特定环境条件的影响(战争和冷战时期的军事对抗和威慑策略研究的需要,经济竞争、国际经济竞争的加剧),以及经济学理论发展本身的需要等,都起了
9、重要的作用。正是因为有了这一阶段博弈论研究的繁荣发展,才有80、90年代博弈论的成熟和对经济学的博弈论革命。1.3.3博弈论的成熟及与主流经济学的融合一、80、90年代是博弈论走向成熟的时期 1981(Elon Kohlberg)“顺推归纳法”(Forward induction)克瑞泼斯(David M.kreps)和威尔孙(Robert Wilson)1982年提出“序列均衡”(Sequential equilibria)1982年斯密(John Maynard Smith)出版了进化和博弈论()1984年由伯恩海姆(B.D.Bernheim)和皮尔斯(D.G.Pearce)提出“可理性化
10、性”(Rationalizability)海萨尼和塞尔腾1988年提出了在非合作和合作博弈中均衡选择的一般理论和标准,1991年弗得伯格(D.Fudenberg)和泰勒尔(J.Tirole)首先提出了“完美贝叶斯均衡”(Perfext Bayesian equilibrium)的概念二、博弈论和经济学诺贝尔奖 1994:非合作博弈:纳什(Nash)、海萨尼(Harsanyi)、泽尔腾(Selten)1996:不对称信息激励理论:莫里斯(Mirrlees)和维克瑞(Vickrey)2001:不完全信息市场博弈:阿克罗夫(Akerlof)、斯宾斯(Spence)、斯蒂格里兹(Stiglitze)2
11、005:合作博弈论:Aumann,Shcelling 2007:机制设计:Hurwicz,Maskin,Myerson 生于1928年6月13日。任普林斯顿大学数学系教授。1950,约翰纳什获得美国普林斯顿高等研究院的应用博士学位,他那篇仅仅27页的博士论文中有一个重要发现,这就是后来被称为“纳什均衡”的博弈理论。1920年5月29日出生于匈牙利布达佩斯,2000年在美国柏克莱逝世。海萨尼的父母曾希望他将来成为一个药商,但海萨尼自己爱好研究哲学和数学。但选择了布达佩斯大学的药学专业。1944年初,他获得了药学硕士学位。但是,1944年3月,德国军队占领了匈牙利。海萨尼从5月到11月被强迫到一个
12、苦力营中劳动。同年11月,纳粹当局决定将海萨尼所在的苦力营从布达佩斯放逐到奥地利的一个集中营去。但是,海萨尼很幸运地就在列车开往奥地利之前,从布达佩斯火车站逃脱。一位他认识的耶钱教神父让他躲在修道院的地窖里避难。海萨尼确实是够幸运的,因为后来他那些苦力营的同伴绝大多数都死于集中营里。战后的1946年,海萨尼重新到布达佩斯大学注册入学,攻读博士学位,专业是哲学,兼修社会学和心理学。海萨尼于1947年6月获得布达佩斯大学哲学博士学位。1948年6月,由于海萨尼与当局政见不同,他被迫从研究所辞职。1950年4月,海萨尼逃到了奥地利。1950年12月30日,他到达澳大利亚的悉尼,在悉尼的工厂当劳工的同
13、时,在悉尼大学修读经济学夜间课程,并于1953年取得文学硕士。在悉尼读书时,他开始在经济期刊(包括JournalofPoliticalEconomy和theReviewofEconomicStudies)发表研究论文。由于拥有学位,他得以于1956年在布里斯班昆士兰大学取得教席。在1958年,他获得了洛克菲勒奖学金,在美国斯坦福大学肯尼斯约瑟夫阿罗的指导下写了一篇关于博弈论的论文,并于1959年取得了第二个经济学博士学位。1958年,在堪培拉澳大利亚国立大学以研究员身份工作一段很短的时间后,因为博弈论在澳大利亚仍是默默无闻而感到被孤立。在肯尼斯阿罗和詹姆斯托宾的帮助下,他得以能够迁移到美国,同
14、时于1961年至1963年之间在底特律韦恩州立大学担任经济学教授。1964年,他转到美国柏克莱加州大学,并一直留在那里直至他于1990年退休。1930年10月10日出生于德国的不莱斯劳(Breslau)。泽尔腾考入了法兰克福大学数学系,1957年毕业,获数学硕士学位。而后从事着博弈论及其应用、实验经济学等博弈论的学术研究。1961年,泽尔腾获得法兰克福大学数学博士学位;60年代早期,泽尔腾做了寡头博弈的实验,19671968年度,泽尔腾到加州伯克利分校作访问教授,1972年转到比勒菲尔德大学(University of Bielefeld)工作,1984年至今一直在波恩大学工作。1936.07
15、.05亚当斯密的同乡。莫里斯从小就显露出了对数学的浓厚兴趣和超乎寻常的天分。1957年,莫里斯以第一名的骄人成绩从爱丁堡大学数学系毕业,顺利进入剑桥大学,拿下了博士学位。后来近30年的时间里,莫里斯一直执教于牛津,现在是剑桥大学和香港中文大学的经济学教授。除了担任过国际计量经济学会会长、英国皇家经济学会会长、中国政府经济顾问等职,1997年,莫里斯教授还被英国女王授予了“爵士”爵位。1914年,维克瑞生于加拿大 1935年获耶鲁大学理学学士学位 1937年获哥伦比亚大学硕士学位 1945年起,维克瑞任职于哥伦比亚大学。1947年又获哥伦比亚大学哲学博士学位 19641967年,他担任哥伦比亚大
16、学经济系主任,在此期间曾任纽约市城市经济协会会长 1967年成为加利福尼亚斯坦福行为科学高级研究中心研究员与经济计量学会会员 1971年出任澳大利亚纳施大学客座讲师 1973年出任美国经济研究局局长 1974年,他出任联合国发展规划预测和政策中心财政顾问,并成为美国文理研究院研究员。1979年获芝加哥大学人文学博士 在得奖三天之后,在前去开会的途中去世。他在诺贝尔的光环照耀中倒下了,其一生为学术研究鞠躬尽瘁,最后为其人生画上了一个美丽的句号。1940.6.17 1966年获美国麻省理工学院博士头衔,现为美国加利福尼亚州大学伯克利(UCBerkeley)经济学教授。1943.11.7生于美国新泽
17、西州,1962-1966年就读于普林斯顿大学并获哲学学士学位;1968年在牛津大学获数学硕士学位,并获得该校罗氏奖学金;1972年在哈佛大学获经济学博士学位。约瑟夫约瑟夫斯蒂格利茨(斯蒂格利茨(Joseph E.Stiglitz),2001年诺贝尔经济学奖获得者 Joseph Eugene Stiglitz,ForMemRS,FBA,(born February 9,1943)is an American economist and a professor at Columbia University.He is a recipient of the Nobel Memorial Prize
18、in Economic Sciences(2001)and the John Bates Clark Medal(1979).He is also the former Senior Vice President and Chief Economist of the World Bank.Aumann(born June 8,1930)is an Israeli-American mathematician and a member of the United States National Academy of Sciences.He is a professor at the Center
19、 for the Study of Rationality in the Hebrew University of Jerusalem in Israel.He also holds a visiting position at Stony Brook University and is one of the founding members of the Center for Game Theory in Economics at Stony Brook Thomas Crombie Schelling(born 14 April 1921)is an American economist
20、and professor of foreign affairs,national security,nuclear strategy,and arms control at the School of Public Policy at University of Maryland,College Park.He is also co-faculty at the New England Complex Systems Institute.He was awarded the 2005 Nobel Memorial Prize in Economic Sciences(shared with
21、Robert Aumann)for having enhanced our understanding of conflict and cooperation through game-theory analysis.Hurwicz(August 21,1917 June 24,2008)was a Russian-born American economist and mathematician.His nationality of origin was Polish.He was Jewish.He originated incentive compatibility and mechan
22、ism design,which show how desired outcomes are achieved in economics,social science and political science.Interactions of individuals and institutions,markets and trade are analyzed and understood today using the models Hurwicz developed Maskin(born December 12,1950)is an American economist and Nobe
23、l laureate recognized with Leonid Hurwicz and Roger Myerson for having laid the foundations of mechanism design theory.He is the Albert O.Hirschman Professor of Social Science at the Institute for Advanced Study,and a visiting lecturer with the rank of Professor at Princeton University.Myerson(born
24、March 29,1951)is an American economist and Nobel laureate recognized with Leonid Hurwicz and Eric Maskin for having laid the foundations of mechanism design theory.A professor at the University of Chicago,he has made contributions as an economist,as an applied mathematician,and as a political scient
25、ist.第二章 完全信息静态博弈2.1 上策均衡上策上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低价”。上策均衡上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果 上策均衡不是普遍存在的 2.1.1 严格下策反复消去法严格下策严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略严格下策反复消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中2.1.2 划
26、线法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚囚徒徒困困境境-1,11,-11,-1-1,1猜猜硬硬币币2,10,00,01,3夫夫妻妻之之争争2.1.3 箭头法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚囚徒徒困困境境-1,11,-11,-1-1,1猜猜硬硬币币2,10,00,01,3夫夫妻妻之之争争 2.2 纳什均衡 2.2.1 纳什均衡的定义策略空间:博弈方 的第 个策略:博弈方 的得益:博弈:纳什均衡纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最
27、佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡NoImagenSS,1ijiSsiu,;,11nnuuSSG,;,11nnuuSSG),(*niss i),.,(*1*1*niiissss),.,(),.,(*1*1*1*1*niijiiiniiiiisssssusssssuijiSs),(*nissGiij2.2.2 纳什均衡与严格下策反复消去法 上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡命题命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡命题命题2.2:在n个博弈方的博弈中 中,如果 是 的一个纳什均
28、衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的),(*niss,;,11nnuuSSG),(*niss),(*niss,;,11nnuuSSGG2.3 无限策略分析和反应函数2.3.1 古诺的寡头模型寡头产量竞争以两厂商产量竞争为例QQPPqqQ8)(21121111112)(8)(qqqqqcQPqu212116qqqq221 cc221222222)(8)(qqqqqcQPqu222126qqqq4.5,4.55,3.753.75,54,4不突破突破厂商厂商2不突破 突破厂厂商商1以自身最大利益为目标:各生产2单位
29、产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5两寡头间的囚徒困境博弈2.3.2 反应函数古诺模型的反应函数)6()()6()()6max(max1211222212112121111qqRqqqRqqqqquq1q(3,0)(6,0)(0,3)(0,6)2q)(21qR)(12qR古诺模型的反应函数图示理性局限和古诺调整2.3.3 伯特兰德寡头模型价格竞争寡头的博弈模型价格竞争寡头的博弈模型产品无差别,消费者对价格不十分敏感产品无差别,消费者对价格不十分敏感122222122211112111),(),(PdPbaPPqqPdPbaPPqq11111112111
30、)(),(qcPqcqPPPuu22222222122)(),(qcPqcqPPPuu)(2111111PdPbacP)(1222222PdPbacP)(21)(21*122222*2*211111*1PdcbabPPdcbabP2.3.4 公共资源问题公共草地养羊问题)(1QVVqqQn以三农户为例 n=3,c=4cqQVquiii)(323211212148),(qqqqRq313122212148),(qqqqRq212133212148),(qqqqRq17287257624*3*2*1*3*2*1uQuuuqqqQQQQu964)100(1728576323047224348uQ合作
31、:总体利益最大化合作:总体利益最大化竞争:个体利益最大化竞争:个体利益最大化2.4 混合策略和混合策略纳什均衡2.4.1 严格竞争博弈和混合策略的引进一、猜硬币博弈-1,11,-11,-1-1,1正 面反 面猜硬币方猜硬币方盖盖硬硬币币方方正 面反 面(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念这类博弈很多,引出混合策略纳什均衡概念二、混合策略、混合策略博弈 和混合策略纳什均衡 混合策略混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立
32、,且 混合策略扩展博弈混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。混合策略纳什均衡混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。,;,11nnuuSSGi,1ikiissSki),(1ikiippp10ijpkj,111ikipp三、一个例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析5213BABApppp1352DCDCpppp博弈方1的混合策略博弈方2的混合策略2,35,23,11,5CDAB博弈方博弈方2博博弈弈方方1 策略 得益博弈方1 (0.8,0.2)2.6博弈方2 (0.8,0.2)2.62.4
33、.2 多重均衡博弈和混合策略一、夫妻之争的混合策略纳什均衡2,10,00,01,3时 装足 球时装足球丈丈 夫夫妻妻子子夫妻之争夫妻之争3)(0)(0)(1)(FpCpFpCpwwww1)(0)(0)(2)(FpCpFpCphhhh妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡 策略 得益博弈方1 (0.75,0.25)0.67博弈方2 (1/3,2/3)0.752.4.3 混合策略和严格下策反复消去法3,10,20,23,31,31,1LRUMD博弈方博弈方2博博弈弈方方123212111003eu23212111030eu博弈方2采用纯策略L时,博弈方1采用混合策略(1/2,1
34、/2,0)的得益博弈方2采用纯策略R时,博弈方1采用混合策略(1/2,1/2,0)的得益2.4.4 混合策略反应函数猜硬币博弈-1,11,-11,-1-1,1正 面反 面猜硬币方猜硬币方正面反面猜硬币博弈猜硬币博弈盖盖硬硬币币方方rq111/21/2(r,1-r):盖硬币方选择正反面的混合策略概率分布(q,1-q):猜硬币方选择正反面的混合策略概率分布)(2rRq)(1qRr 第三章 完全且完美信息动态博弈3.1 动态博弈的表示法和特点3.1.1 阶段和扩展性表示 阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿
35、冒(0,10)仿冒不制止制止仿冒不仿冒3.1.2 动态博弈的基本特点 策略是在整个博弈中所有选择、行为的计划 结果是上述“计划型”策略的策略组合,构成一条路径 得益对应每条路径,而不是对应每步选择、行为 动态博弈的非对称性先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利,有“先行优势”。3.2 可信性和纳什均衡的问题3.2.1 相机选择和策略中的可信性问题不同版本的开金矿博弈分钱和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈分钱打官司都可信乙甲乙打(2,2)不分分不
36、借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈分钱打官司都不可信3.2.2 纳什均衡的问题 第三种开金矿博弈中,(不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。结论结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能可能是不稳定的,不能作为预测的基础。根源根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题3.3 子博弈和子博弈完美纳什均衡3.3.1 子博弈 定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行
37、博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)3.3.2 子博弈完美纳什均衡定义定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。3.4 两个经典动态博弈模型3.4.1 寡占的斯塔克博格模型 先后选择产量的产量竞争博弈 把古诺模型改
38、为厂商1先选择,厂商2后选择,而非同时选择即可。QQPPqqQ8)(,21221 cc121111112)(8)(qqqqqcQPqu212116qqqq221222222)(8)(qqqqqcQPqu222126qqqq 产量 得益厂商1 3单位 4.5厂商2 1.5单位 2.25先行优势3.4.3 讨价还价博弈三回合讨价还价112不接受,出S接受不接受,出S2接受出S1)10000(,22SS)10000,(11SS)10000(,22SSSS2SSS211000010000三回合讨价还价博弈结果的讨论益越大甲的得益越小,乙的得越大,时,当益越小甲的得益越大,乙的得越大,时,当5.0015
39、.0无限回合讨价还价SS211000010000SSS211000010000110000*S11000010000*S3.4.4 委托人代理人理论一、委托人代理人关系 经济活动和社会活动中有很多委托人代理人关系,有明显的,也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。委托人代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性 委托人代理人涉及问题:激励机制设计、机制设计理论,委托合同设计问题等二、无不确定性的委托人代理人模型R(S)-w(S),w(S)-SR(E)-w(E),w(E)-ER(0),0R(0),0122偷懒努力拒绝
40、接受不委托委托代理人的选择激励相容约束:w(E)-E w(S)-S w(E)w(S)+E-S参与约束:22R(E)-w(E),w(E)-E拒绝接受拒绝接受R(0),0R(S)-w(S),w(S)-SR(0),0接受:w(E)-E0接受:w(S)-S0参与约束 委托人的选择11不委托委托委托R(S)-w(S),w(S)-SR(0),0R(E)-w(E),w(E)-E不委托R(0),0委托:R(E)-w(E)R(0)不委托:R(E)-w(E)R(0)不委托:R(S)-w(S)0不委托:0.1*20-w(S)+0.9*10-w(S)0不委托:0.9*20-w(E)+0.1*10-w(E)0.1*w(
41、20)-S+0.9*w(10-S)接受:0.9*w(20)-E+0.1*w(10)-E0委托:0.9*20-w(20)+0.1*10-w(10)0激励相容约束促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件参与约束对于委托人来说,就是要根据上述两个条件,以及 E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20)-w(10)五、选择报酬和连续努力水平的 委托人代理人博弈R,CC(e)+R(e)委托人希望的代理人努力水平(满足参与约束)UU*eeNoImage)()()()()()(*eCeRweCeRwUeCeRw激励相容约束:参与约束:店主和店员的问题
42、商店的利润 ,是均值为0的随机变量店员的负效用 ,是店员的努力机会成本为1店主采用的报酬计算公式店员的得益店员期望得益为店主的得益为 eR42eC)4(eBABRASABeBeBAe)1()1(4)4(4NoImageNoImage24eBeAe2)4(eeBA3.5 有同时选择的动态博弈模型3.5.1 国际竞争和最优关税ijiiijiijietehceheaheha)()()(厂商的得益函数为:第二阶段厂商选择:32,3),(max*jiiijijijiitcaetcaheehhtt),(jijijiiieehhtt第一阶段政府选择:先把第二阶段根据厂商选择得到结果代入政府得益,再求最优化:
43、2,1,9,9)(4,33)(9)2(9)(18)(2),(),(max*2*22*icaecahcattcattcatcatcattwttwiiiiijiijiijii政府的得益函数;),(jijijiiieehhttww jiijieteh2)(21第四章 重复博弈4.1 重复博弈引论4.1.1 为何研究重复博弈 经济中的长期关系 人们的预见性 未来利益对当前行为的制约 长期合同、回头客、长客和一次性买卖的区别 有无确定的结束时间4.1.2 基本概念 有限次重复博弈有限次重复博弈:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到
44、以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。无限次重复博弈无限次重复博弈:一个基本博弈G一直重复博弈下去的博弈,记为G()策略策略:博弈方在每个阶段针对每种情况如何行为的计划 子博弈子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分 均衡路径均衡路径:由每个阶段博弈方的行为组合串联而成NoImage重复博弈的得益的平均得益为相同的现在值,则称得益序列阶段的得益,能产生与无限次重复博弈)各个重复博弈或作为重复博弈(有限次:如果一常数,,2121平均得益NoImage11)1
45、(ttt虑贴现问题无限次重复博弈必须考考虑贴现因素有限次重复博弈不一定4.2 有限次重复博弈4.2.1 两人零和博弈的有限次重复博弈 零和博弈是严格竞争的,重复博弈并不改变这一点。以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样,博弈方的正确策略是重复一次性博弈中的纳什均衡策略。4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈 定理定理:设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益的与原博弈G中的得益。-5,-50,-8-8
46、,0-1,-1坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-5,-5)-10,-10-13,-5-5,-13-6,-6坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-10,-10)有限次重复削价竞争博弈100,10020,150150,2070,70高 价低 价高价低价寡头寡头2寡寡头头1削价竞争博弈有唯一纯策略纳什均衡(70,70)有限次重复的结果仍然是(低价,低价)4.2.3 有限次重复博弈的民间定理个体理性得益个体理性得益:不管其它博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益可实现得益可实现得益:博弈中所有纯策略组合得益的加权平均数组定理定理:
47、设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们厂商2得益厂商1得益(1,4)(3,3)(1,1)(4,1)w=(1.1)4.3 无限次重复博弈4.3.1 两人零和博弈的无限次重复博弈 两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡4.3.2唯一纯策略纳什均衡博弈 的无限次重复博弈两寡头削价竞争博弈 该博弈一次性博弈均衡是都采用低价,是囚徒困境型博弈4,40,55,01,1HLHL无限次重复两寡头削价博弈 触发策略触发策略:第一阶段采用H,如
48、果前t-1阶段的结果都是(H,H),则继续采用H,否则采用L。如果博弈方2采用L,总得益现值为 如果博弈方2采用H,总得益现值为 因此当 时,此触发策略纳什均衡策略151152VV 44/1两寡头削价竞争无限次重复博弈的民间定理厂商2得益厂商1得益(1,4)(3,3)(1,1)(4,1)(5,0)(5,0),(),(1),(),(11niininxxGiexGxxGeeG均得益为什均衡,各博弈方的平完美纳中一定存在一个子博弈次重复博弈,那么无限足够接近都成立,而对任意博弈方果的任意可实现得益。如表示用的纳什均衡的得益,记的静态博弈。用是一个完全信息理:设无限次重复博弈民间定4.3.3 无限次重
49、复古诺模型 假定假定:,边际成本都为2。在无限次重复古诺模型中,当贴现率 满足一定条件时,两厂商采用下列触发策略构成一个子博弈完美纳什均衡:在第一阶段生产垄断产量的一半1.5;在第 t 阶段,如果前 t-1 阶段结果都是(1.5,1.5),则继续生产1.5,否则生产古诺产量2。21,8qqQQP其中 设厂商1已采用该触发策略,若厂商2也采用该触发策略,则每期得益4.5,无限次重复博弈总得益的现值为:如果厂商2偏离上述触发策略,则他在第一阶段所选产量应为给定厂商1产量为1.5时,自己的最大利润产量,即满足:解得 ,此时利润为5.0625,高于触发策略第一阶段得益4.5。15.415.422222
50、5.4max25.18max222qqqqqqq25.22q 但从第二阶段开始,厂商1将报复性地永远采用古诺产量2,这样厂商2也被迫永远采用古诺产量,从此得利润4。因此,无限次重复博弈第一阶段偏离的情况下总得益的现值为:当 上述策略是厂商2对厂商1的同样触发策略的最佳反应,否则偏离是最佳反应。140625.540625.52179140625.515.4即第六章 完全但不完美信息动态博弈 6.1 不完美信息动态博弈6.1.2 不完美信息动态博弈的表示多节点信息集扩展形表示01(-7000)(-10000)(-16000)(-10000)运输路线扩展形1112好差卖不卖不卖买不买买不买卖(0,0
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。