博弈论经典PPT课件(PPT 343页).pptx

上传人(卖家):三亚风情 文档编号:3193369 上传时间:2022-07-31 格式:PPTX 页数:343 大小:20.80MB
下载 相关 举报
博弈论经典PPT课件(PPT 343页).pptx_第1页
第1页 / 共343页
博弈论经典PPT课件(PPT 343页).pptx_第2页
第2页 / 共343页
博弈论经典PPT课件(PPT 343页).pptx_第3页
第3页 / 共343页
博弈论经典PPT课件(PPT 343页).pptx_第4页
第4页 / 共343页
博弈论经典PPT课件(PPT 343页).pptx_第5页
第5页 / 共343页
点击查看更多>>
资源描述

1、博弈论博弈论1第1页,共343页。参考书目:参考书目:博弈论基础博弈论基础,罗伯特,罗伯特吉本斯,高峰译吉本斯,高峰译 中国社会科学出版社,中国社会科学出版社,19991999年年3 3月月策略策略-博弈论导论博弈论导论,乔尔,乔尔沃森,费方域,赖丹馨译,沃森,费方域,赖丹馨译,上海人民出版社,上海人民出版社,20102010年年1111月月经济博弈论(第二版)经济博弈论(第二版),谢枳予,谢枳予 复旦大学出版社,复旦大学出版社,20022002年年1 1月月2第2页,共343页。主要内容主要内容第一章第一章 完全信息静态博弈完全信息静态博弈第二章第二章 完全信息的动态博弈完全信息的动态博弈第

2、三章第三章 非完全信息静态博弈非完全信息静态博弈第四章第四章 非完全信息动态博弈非完全信息动态博弈3第3页,共343页。在所有社会,人们经常互动。在所有社会,人们经常互动。互动有时是合作,有时是竞争。互动有时是合作,有时是竞争。在这两种情况下,都可以用一个术语,即在这两种情况下,都可以用一个术语,即相互依赖相互依赖性性来表示一个人的行为对另外一个人的福利造成的影响来表示一个人的行为对另外一个人的福利造成的影响。相互依赖的情形可称为相互依赖的情形可称为策略环境策略环境。因为人们为了确。因为人们为了确定所采取的最优行动,必须考虑他周围的其他人会怎定所采取的最优行动,必须考虑他周围的其他人会怎样选择

3、行动。样选择行动。博弈就是策略对抗博弈就是策略对抗博弈的定义博弈的定义4第4页,共343页。定义:定义:博弈就是一些个人、队组或其他组织,面对一定的博弈就是一些个人、队组或其他组织,面对一定的环境条件,环境条件,在一定的规则下,同时或先后,一次或多次,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。各自取得相应结果的过程。四个核心方面四个核心方面 博弈的参加人博弈的参加人(Player)博弈方博弈方 各博弈方的策略各博弈方的策略(Strategies)或行为或行为(Actions)博

4、弈的次序博弈的次序(Order)博弈方的得益博弈方的得益(Payoffs)5第5页,共343页。目前,博弈论被许多来自不同领域的专业人士使用,这些领域目前,博弈论被许多来自不同领域的专业人士使用,这些领域包括经济学、政治学、法律、生物、国际关系哲学以及数学。包括经济学、政治学、法律、生物、国际关系哲学以及数学。事实上,事实上,大多数情形即包含了冲突元素,也包含了合作的元素大多数情形即包含了冲突元素,也包含了合作的元素。我。我们对博弈的组成要有一个广义的理解。们对博弈的组成要有一个广义的理解。简而言之,博弈是策略环境的正式描述。因此,博弈论是研究相简而言之,博弈是策略环境的正式描述。因此,博弈论

5、是研究相互依赖情形的正式的方法论。这里,互依赖情形的正式的方法论。这里,“正式正式”是指一种以数学化是指一种以数学化的精确,以及逻辑上的一致见长的结构。的精确,以及逻辑上的一致见长的结构。利用正确的理论工具,我们可以研究各种情况下的行为,从而更利用正确的理论工具,我们可以研究各种情况下的行为,从而更好地理解经济中的相互作用。好地理解经济中的相互作用。6第6页,共343页。静态博弈:静态博弈:所有博弈方同时或可看作同时选择策略的博弈所有博弈方同时或可看作同时选择策略的博弈 石头剪刀布、猜硬币、古诺模型石头剪刀布、猜硬币、古诺模型动态博弈:动态博弈:各博弈方的选择和行动有先后次序且后选择、各博弈方

6、的选择和行动有先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动博弈方的选择和行动 弈棋、市场进入、斯坦博格型市场结构弈棋、市场进入、斯坦博格型市场结构7第7页,共343页。完全信息博弈:完全信息博弈:各博弈方都完全了解所有博弈方各种情各博弈方都完全了解所有博弈方各种情况下的得益况下的得益 不完全信息博弈:不完全信息博弈:至少部分博弈方不完全了解其他博弈至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为方得益的情况的博弈,也称为“不对称信息博弈不对称信息博弈”完美信息博弈:完美信息博弈:每个轮到行动的博弈方对

7、博弈的进程每个轮到行动的博弈方对博弈的进程完全了解的博弈完全了解的博弈 不完美信息博弈:不完美信息博弈:至少某些博弈方在轮到行动时不完全至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈了解此前全部博弈的进程的博弈8第8页,共343页。约翰约翰福布斯福布斯纳什纳什(John Forbes Nash Jr.,1950,1951)(John Forbes Nash Jr.,1950,1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。了坚实的基础。19941994年年约翰约翰福布斯福布斯纳什纳什、约翰约翰C

8、C海萨尼海萨尼以及以及莱因哈德莱因哈德泽尔腾泽尔腾,三人同时因为他们对博弈论的研究,三人同时因为他们对博弈论的研究,所作出的突出贡献,而获得诺贝尔经济学奖。所作出的突出贡献,而获得诺贝尔经济学奖。John HarsanyJohn NashLeihaden Selten9第9页,共343页。三位大师主要的贡献三位大师主要的贡献 19501950年和年和19511951年纳什的两篇关于非合作博弈论的重要论文,年纳什的两篇关于非合作博弈论的重要论文,证明了非合作博弈及其均衡解,并证明了证明了非合作博弈及其均衡解,并证明了均衡解的存在性均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内

9、在即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。联系。泽尔腾(泽尔腾(19651965)将纳什均衡概念引入了动态分析,提出了)将纳什均衡概念引入了动态分析,提出了“精精炼纳什均衡炼纳什均衡”概念。概念。海萨尼发展了刻画不完全信息静态博弈的海萨尼发展了刻画不完全信息静态博弈的“贝叶斯纳什均贝叶斯纳什均衡衡”(1967196719681968)。)。泽尔腾和海萨尼进一步将纳什均衡动态化,加入了接近实际的泽尔腾和海萨尼进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论,提供了不完全信息条件。他们的工作为后人继续发展博弈论,提供了基本思路和模型基本思路和

10、模型 。10第10页,共343页。第一章第一章 完全信息静态博弈完全信息静态博弈 1.1 基本理论基本理论:博弈的标准式和纳什均衡博弈的标准式和纳什均衡 1.2 应用举例应用举例 1.3 混合策略和均衡的存在混合策略和均衡的存在11第11页,共343页。1.1 基本理论基本理论:博弈的标准式和纳什均衡博弈的标准式和纳什均衡 例例1 儿童游戏:儿童游戏:“石头、剪刀、布石头、剪刀、布”。参与人参与人:1,2。策略空间策略空间:S1=S2=石头、剪刀、布石头、剪刀、布 收益收益:两人出手的函数:两人出手的函数 u1(石头,石头石头,石头)=0,u1(石头,剪刀石头,剪刀)=1,u1(石石头,布头,

11、布)=-1 u2(石头,石头石头,石头)=0,u2(石头,剪刀石头,剪刀)=-1,u2(石石头,布头,布)=112第12页,共343页。博弈的标准式表示博弈的标准式表示(normal-form representation)(1)参与人参与人(player).n 个参与人:个参与人:1,2,i,n(2)策略策略(strategy).一个参与人的策略是他采取的一个行动。一个参与人的策略是他采取的一个行动。参与人参与人 i 的策略:的策略:si 参与人参与人 i 的策略空间的策略空间:Si 策略的一个组合策略的一个组合:s=s1,s2,sn 简化表示:简化表示:s-i=s1,,s i-1,s i+

12、1,sn(3)收益收益(payoff).参与人参与人 i 的收益:的收益:ui=ui(s1,s2,sn)n 个参与人博弈的标准形式表示个参与人博弈的标准形式表示:G=S1,S2,Sn;u1,u2,un13第13页,共343页。博弈标准式特例:博弈标准式特例:u1(s11,s21),u2(s11,s21)u1(s11,s22),u2(s11,s22)u1(s12,s21),u2(s12,s21)u1(s12,s22),u2(s12,s22)u1(s13,s21),u2(s13,s21)u1(s13,s22),u2(s13,s22)s11 s12 s13参与人参与人1参与人参与人2s21 s22S

13、1=s11,s12,s13 S2=s21,s22 收益表收益表(Payoff):两个参与人,有限个战略的博弈的表两个参与人,有限个战略的博弈的表示方法示方法 14第14页,共343页。0,0 1,-1 -1,1-1,1 0,0 1,-1 1,-1-1,1 0,0石头石头剪刀剪刀布布 石头石头 剪刀剪刀 布布P1P215第15页,共343页。囚徒囚徒1的考虑:无论对方选沉默还是招认,自己选的考虑:无论对方选沉默还是招认,自己选“招认招认”好于好于“沉沉默默”。囚徒囚徒2的考虑:的考虑:无论对方选什么,无论对方选什么,“招认招认”好于好于“沉默沉默”。两人的选择两人的选择:(招认招认,招认招认)。

14、-1,-1-9,00,-9-6,-6 囚徒囚徒 2沉默沉默 招认招认沉默沉默 招认招认例例 囚徒困境囚徒困境(The Prisoners Dilemma)囚徒囚徒1占优占优16第16页,共343页。17 每一个博弈都是一个你中有我,我中有你的情形,不同每一个博弈都是一个你中有我,我中有你的情形,不同的博弈参与者可以选择不同的行动,但由于相互作用,的博弈参与者可以选择不同的行动,但由于相互作用,一个博弈参与者的得益不仅取决于自己采取的行动,也一个博弈参与者的得益不仅取决于自己采取的行动,也取决于其他博弈参与者所采取的行动。取决于其他博弈参与者所采取的行动。博弈论的精髓在于基于系统思维基础上的理性

15、换位博弈论的精髓在于基于系统思维基础上的理性换位思考,思考,即在选择你的行动时,你应当用他人的得益去推即在选择你的行动时,你应当用他人的得益去推测他人的行动,从而选择最有利于自己的行动。测他人的行动,从而选择最有利于自己的行动。17第17页,共343页。鹰鸽博弈(斗鸡博弈)鹰鸽博弈(斗鸡博弈)参与人:鹰和鸽参与人:鹰和鸽策略:保持原方向和转向策略:保持原方向和转向偏好:如果他们都保持原方向,就会撞车。如果都转偏好:如果他们都保持原方向,就会撞车。如果都转向,就都保住了面子。如果只有对方转向,就会被称向,就都保住了面子。如果只有对方转向,就会被称为硬汉。为硬汉。保持保持 转向转向 保持保持 0,

16、0 3,1转向转向 1,32,2鸽鸽鹰鹰18第18页,共343页。公共财产的悲剧公共财产的悲剧12少吃少吃 多吃多吃 少吃少吃 2,20,3多吃多吃 3,01,119第19页,共343页。智猪博弈智猪博弈12按下按下 不按不按 按下按下 4,2 2,3不按不按 6,-10,0小猪小猪大大猪猪20第20页,共343页。定义定义:si 是是si 的的严格劣势战略严格劣势战略(strictly dominated),),如果如果:ui(si,s-i)ui(si,s-i)“沉默沉默”是是“招认招认”的严格劣战略的严格劣战略-1,-1-9,00,-9-6,-6 囚徒囚徒 2沉默沉默 招认招认沉默沉默 招

17、认招认囚徒囚徒1理性的参与人不会理性的参与人不会选择严格劣策略选择严格劣策略21第21页,共343页。公共财产的悲剧公共财产的悲剧12少吃少吃 多吃多吃 少吃少吃 2,20,3多吃多吃 3,01,122第22页,共343页。重复剔除严格劣策略重复剔除严格劣策略1,01,20,10,30,12,0上下参与人2左 中 右参与人11,01,20,30,1上下参与人2左 中参与人1博弈结果(上,中)博弈结果(上,中)23第23页,共343页。两人都没有严格劣策略两人都没有严格劣策略保持保持 转向转向 保持保持 0,0 3,1转向转向 1,32,2鸽鸽鹰鹰12按下按下 不按不按 按下按下 4,2 2,3

18、不按不按 6,-10,0小猪小猪大大猪猪24第24页,共343页。定义定义:s*=(s1*,sn*)是一个是一个纳什均衡纳什均衡(Nash equilibrium),如如果对果对 i,ui(si*,s i*)ui(si,s i*)纳什均衡为如下最大化问题的解纳什均衡为如下最大化问题的解 ui=ui(s1*,si,sn*)iiSs max给定你的策略,我的策略是最好的策略给定你的策略,我的策略是最好的策略给定我的策略,你的策略也是最好的策略给定我的策略,你的策略也是最好的策略因此没有一个参与人会轻率地偏离这个策略组合而使因此没有一个参与人会轻率地偏离这个策略组合而使 自己蒙受损失自己蒙受损失25

19、第25页,共343页。纳什均衡特例:纳什均衡特例:u1(s11,s21),u2(s11,s21)u1(s11,s22),u2(s11,s22)u1(s12,s21),u2(s12,s21)u1(s12,s22),u2(s12,s22)u1(s13,s21),u2(s13,s21)u1(s13,s22),u2(s13,s22)s11 s12 s13参与人参与人1 1参与人参与人2 2s21 s22(s11*,s21*)是纳什均衡,如果是纳什均衡,如果 u1(s11*,s21*)u1(s12,s21*)u1(s11*,s21*)u1(s13,s21*)u2(s11*,s21*)u2(s11*,s2

20、2).26第26页,共343页。寻找纳什均衡的方法之一:划线法寻找纳什均衡的方法之一:划线法-1,-1-9,00,-9-6,-6 囚徒囚徒 2 沉默沉默 招认招认沉默沉默 招认招认囚徒囚徒1-6,-6没有哪个博弈方有偏离这个预测结果的愿望没有哪个博弈方有偏离这个预测结果的愿望第一类决策矛盾:强第一类决策矛盾:强烈的个人动机将导致烈的个人动机将导致集体的损失集体的损失27第27页,共343页。对于策略组合对于策略组合S和和S,如果所有的参与人相对于,如果所有的参与人相对于S都更偏好于采取都更偏好于采取S,而且至少对一个参与人来说是严格偏好的,我们就说而且至少对一个参与人来说是严格偏好的,我们就说

21、S比比S更有效率更有效率。用数学来表示,如果用数学来表示,如果ui(S)ui(S)对每个参与人对每个参与人i都成立,并且不等都成立,并且不等式至少对一个参与人是严格成立的,那么式至少对一个参与人是严格成立的,那么S比比S更有效率更有效率。-1,-1-9,00,-9-6,-6 囚徒囚徒 2 沉默沉默 招认招认沉默沉默 招认招认囚徒囚徒1(沉默,沉默)比(招认,招认)更有效率(沉默,沉默)比(招认,招认)更有效率28第28页,共343页。如果不存在其他更有效率的策略组合,我们就称这个策略组合如果不存在其他更有效率的策略组合,我们就称这个策略组合S是有是有效的效的。用数学来表示,不存在其他策略组合。

22、用数学来表示,不存在其他策略组合S对每个参与人对每个参与人i来说来说都满足都满足ui(S)ui(S),同时对某个参与人,同时对某个参与人j来说满足来说满足ui(S)ui(S)。-1,-1-9,00,-9-6,-6 囚徒囚徒 2 沉默沉默 招认招认沉默沉默 招认招认囚徒囚徒1(沉默,沉默)(沉默,沉默),(招认,沉默),(招认,沉默),(沉默,招认)都是有效(沉默,招认)都是有效的策略组合的策略组合29第29页,共343页。寻找纳什均衡的方法之一:划线法寻找纳什均衡的方法之一:划线法1,01,20,10,30,12,0上上下下参与人参与人2左左 中中 右右参与人参与人11,230第30页,共34

23、3页。寻找纳什均衡的方法之一:划线法寻找纳什均衡的方法之一:划线法0,44,05,34,00,45,33,53,56,6上上中中下下参与人参与人2左左 中中 右右参与人参与人16,631第31页,共343页。寻找纳什均衡的方法之一:划线法寻找纳什均衡的方法之一:划线法2,10,00,01,2 帕特帕特歌剧歌剧 拳击拳击歌剧歌剧 拳击拳击克里斯克里斯性别战性别战(the battle of the Sexes)1,22,1第二类决策矛盾:达成第二类决策矛盾:达成均衡的方式不止一种,均衡的方式不止一种,策略不确定性有时会阻策略不确定性有时会阻碍有效结果的获得碍有效结果的获得沟通沟通32第32页,共

24、343页。寻找纳什均衡的方法之一:划线法寻找纳什均衡的方法之一:划线法鹰鸽博弈鹰鸽博弈保持保持 转向转向 保持保持 0,0 3,1转向转向 1,32,2鸽鸽鹰鹰制度、规则、制度、规则、行为及文化行为及文化第二类决策矛盾:达成均衡第二类决策矛盾:达成均衡的方式不止一种,策略不确的方式不止一种,策略不确定性有时会阻碍有效结果的定性有时会阻碍有效结果的获得获得33第33页,共343页。现实生活中无效率均衡的例子现实生活中无效率均衡的例子-QWERTY的键位设计的键位设计第三类决策矛盾:习惯已经根深蒂固了第三类决策矛盾:习惯已经根深蒂固了标准的键位设计(第三行以标准的键位设计(第三行以QWERTY开始

25、)是由打字机的发明者为开始)是由打字机的发明者为了防止按键卡死而修正的。对于机械打字机来说,当两个位置接近的按了防止按键卡死而修正的。对于机械打字机来说,当两个位置接近的按键同时按下的时候,会导致用来敲打色带的铅字杠杆之间发生纠结,因键同时按下的时候,会导致用来敲打色带的铅字杠杆之间发生纠结,因此发明者设计键位的原则是将那些经常连在一起使用的字母分开排列。此发明者设计键位的原则是将那些经常连在一起使用的字母分开排列。但按键卡死在现代来说并不是一个问题。但按键卡死在现代来说并不是一个问题。20实际实际30年代,年代,August Dvorak和和William Dealey通过对英语中单词运通过

26、对英语中单词运用的仔细研究,设计了一种新的键盘用的仔细研究,设计了一种新的键盘-Dvorak键盘,人们确信这种键盘,人们确信这种键盘比使用键盘比使用QWERTY键盘打字效率显著提高。键盘打字效率显著提高。为什么为什么QWERTY键盘现在仍然是标准?键盘现在仍然是标准?34第34页,共343页。寻找纳什均衡的方法之一:划线法寻找纳什均衡的方法之一:划线法公共财产的悲剧公共财产的悲剧12少吃少吃 多吃多吃 少吃少吃 2,20,3多吃多吃 3,01,135第35页,共343页。寻找纳什均衡的方法之一:划线法寻找纳什均衡的方法之一:划线法智猪博弈智猪博弈按下按下 不按不按 按下按下 4,2 2,3不按

27、不按 6,-10,0小猪小猪大大猪猪为什么中小企业不会花钱去开发新产品?为什么中小企业不会花钱去开发新产品?36第36页,共343页。协调博弈协调博弈12A B A1,10,0B 0,01,1帕累托协调博弈帕累托协调博弈12A B A2,20,0B 0,01,1帕累托上策均衡帕累托上策均衡37第37页,共343页。5 5,5 53 3,0 00 0,3 33 3,3 3鹿鹿兔子兔子猎人猎人2 2鹿鹿兔子兔子猎猎人人1 1猎鹿博弈猎鹿博弈风险上策均衡(兔子,兔子)风险上策均衡(兔子,兔子)设猎人设猎人2选抓兔子的概率为选抓兔子的概率为p,则猎人,则猎人1选抓鹿的期望得益选抓鹿的期望得益:5(1-

28、p)选抓兔子的期望得益选抓兔子的期望得益:3(1-p)+3p由由 5(1-p)2/5考虑其他博弈方可能发生错误考虑其他博弈方可能发生错误等时,帕累托上策均衡并不一等时,帕累托上策均衡并不一定是最优选择,需要考虑:风定是最优选择,需要考虑:风险上策均衡。险上策均衡。38第38页,共343页。三个主要的广播电视台:三个主要的广播电视台:A、B、C。所有这三个电视台都可以选择讲。所有这三个电视台都可以选择讲晚间新闻现场直播时间定在晚上晚间新闻现场直播时间定在晚上6点或是推迟到点或是推迟到7点,每个电视台点,每个电视台的目标都是使他的收视率最大化。的目标都是使他的收视率最大化。A B6点7点6点14,

29、24,328,30,277点30,16,2413,12,50A B6点7点6点16,24,3030,16,247点30,23,1414,24,326点7点C39第39页,共343页。缔约(缔约(contract)缔约不仅仅用于防止策略的不确定,还可以缓解共同缔约不仅仅用于防止策略的不确定,还可以缓解共同利益和个体利益之间的冲突。利益和个体利益之间的冲突。即缔约为各参与者提供即缔约为各参与者提供了一种防止无效率协调的方法了一种防止无效率协调的方法。12I N I 8,8-4,4N 10,-2 0,012I N I 8,8-4,4N 7,1 0,040第40页,共343页。让我们集中考虑让我们集中

30、考虑z1+z2x1+y2,z1+z2x2+y1,且,且z1+z20的的情况。这意味着各参与人的收益总和在采取情况。这意味着各参与人的收益总和在采取(I,I)时达时达到最大化。到最大化。(I,I)组合是这个基本博弈唯一的一个有效组合是这个基本博弈唯一的一个有效率的结果。率的结果。问题:假设问题:假设(I,I)是最好的结果,各参与人是否可以缔约,是最好的结果,各参与人是否可以缔约,执行规定的执行规定的(I,I)组合?组合?12I N I z1,z2 y1,x2 N x1,y2 0,0基本博弈基本博弈41第41页,共343页。只要只要(I,I)是一个纳什均衡,采取是一个纳什均衡,采取(I,I)的协定

31、就是自我实施合同。的协定就是自我实施合同。而这只有当而这只有当z1x1和和z2x2的情况下才成立。的情况下才成立。但是,如果其中有一个不成立,那么各个参与人就无法依靠合同的但是,如果其中有一个不成立,那么各个参与人就无法依靠合同的自我实施去维持自我实施去维持(I,I)的结果,他们需要第三方的加入,法庭就是的结果,他们需要第三方的加入,法庭就是作为这样一种第三方存在的。作为这样一种第三方存在的。如果一方选择了如果一方选择了N,法庭的涉入可以在他们之间,强制进行货,法庭的涉入可以在他们之间,强制进行货币收益的币收益的转移支付转移支付。12I N I z1,z2 y1,x2 N x1,y2 0,04

32、2第42页,共343页。假设参与人知道转移的情况,那么法庭的干预就改变了参假设参与人知道转移的情况,那么法庭的干预就改变了参与人之间的博弈。这个新的博弈把转移的数字加到基本博与人之间的博弈。这个新的博弈把转移的数字加到基本博弈中,显示各参与人的实际收益。弈中,显示各参与人的实际收益。这个博弈称为这个博弈称为引发博弈引发博弈(induced game)。12I N Iz1,z2 y1+,x2-N x1+,y2-,-12I N I z1,z2 y1,x2 N x1,y2 0,043第43页,共343页。设计适当的合同,可以很容易引发有效率的设计适当的合同,可以很容易引发有效率的(I,I)结果结果。

33、只要符合只要符合z1x1+和和z2 x2-的的和和都满足这个条件。都满足这个条件。-具体具体和和的值自由决定。的值自由决定。12I N I z1,z2 y1+,x2-N x1+,y2-,-12I N I z1,z2 y1,x2 N x1,y2 0,012I N I 8,8-4,4N 10,-2 0,012I N I 8,8-4,4N 7,1 0,0=-3=044第44页,共343页。但是,上例的最基本的条件是,法庭必须能够区分基本博弈中所有但是,上例的最基本的条件是,法庭必须能够区分基本博弈中所有不同的结果。例如,法庭必须能够核实每个参与人在博弈中,是选不同的结果。例如,法庭必须能够核实每个参

34、与人在博弈中,是选择了择了I还是选择了还是选择了N。我们称这个信息条件为。我们称这个信息条件为完全可证实性完全可证实性(full verifiability)。结论:在完全可证实的条件下,存在一个合同,随着它的结论:在完全可证实的条件下,存在一个合同,随着它的执行可以获得有效率的结果。执行可以获得有效率的结果。不幸的是,完全可证实往往是特例,而不是通例。通常证据都不足不幸的是,完全可证实往往是特例,而不是通例。通常证据都不足以解释基本博弈的结果。法庭也许只能确定最终结果的好坏。好的以解释基本博弈的结果。法庭也许只能确定最终结果的好坏。好的结果意味着双方都进行了投入,坏的结果表示至少有一人没有投

35、入结果意味着双方都进行了投入,坏的结果表示至少有一人没有投入。有限可证实性(有限可证实性(limited verifiability):法庭无法完美地对参:法庭无法完美地对参与人的生产行为进行证实的情况。与人的生产行为进行证实的情况。45第45页,共343页。在有限可证实的情况下,对博弈矩阵中的每一个单元格,规定在有限可证实的情况下,对博弈矩阵中的每一个单元格,规定不同的外部实施收益转移,是不可能的。即法庭无法区分不同的外部实施收益转移,是不可能的。即法庭无法区分(I,N),(N,I)和和(N,N)。合同必须对所有这些结果规定相同的收益转移。合同必须对所有这些结果规定相同的收益转移。从博弈论的

36、角度看,这个合同中的外部实施部分。从博弈论的角度看,这个合同中的外部实施部分只包含一个只包含一个 。(见下图见下图)12I N I z1,z2 y1+,x2-N x1+,y2-,-46第46页,共343页。在有限可证实的情况下,要维持在有限可证实的情况下,要维持(I,I)的结果很难,甚至是不可能的结果很难,甚至是不可能的。例如虽然提高的。例如虽然提高可以降低参与人可以降低参与人2选择选择N的动机,但是又提的动机,但是又提高了参与人高了参与人1选择选择N的动机。因此的动机。因此的选择必须平衡双方的动机。的选择必须平衡双方的动机。需要满足:需要满足:z1x1+和和 z2x2-整理简化以后可得:整理

37、简化以后可得:x2-z2x1+x2时,存在一个时,存在一个同时满足这两个不等同时满足这两个不等式。式。12I N I z1,z2 y1+,x2-N x1+,y2-,-47第47页,共343页。下图所示的基本博弈为例设下图所示的基本博弈为例设=-3,得出的右下的引发博,得出的右下的引发博弈,其中弈,其中(I,I)是纳什均衡。是纳什均衡。1212I I N N I I 8 8,8 8-4-4,4 4N N 1010,-2 2 0 0,0 012I N I 8,8-7,7N 7,1-3,3下图所示的基本博弈在有限可证实的情况下,下图所示的基本博弈在有限可证实的情况下,(I,I)(I,I)不可能不可能

38、被执行。被执行。12I N I 10,10-4,12N 12,-4 0,048第48页,共343页。(2)(2)法庭实施违约赔偿情况下的缔约。法庭实施违约赔偿情况下的缔约。法庭并不总是根据参与人起草的合同进行执行法庭并不总是根据参与人起草的合同进行执行。事实上,美国法庭更可能根据某些法律原则。事实上,美国法庭更可能根据某些法律原则,而不是根据合同的规定实施转移。,而不是根据合同的规定实施转移。在此,我们将对美国的商业环境下,对于赔偿在此,我们将对美国的商业环境下,对于赔偿的三个法律原则进行概括。的三个法律原则进行概括。49第49页,共343页。在在预期利益赔偿的法律原则预期利益赔偿的法律原则下

39、,法庭要求被告转移给原告,下,法庭要求被告转移给原告,使得原告获使得原告获得在合同实现的情况下的收益。得在合同实现的情况下的收益。根据基本博弈,参与人根据基本博弈,参与人1的期望收益是的期望收益是z1,参与人,参与人2的期望收益是的期望收益是z2。因此,如果。因此,如果参与人参与人1违约,他被强制付给参与人违约,他被强制付给参与人2的钱数,必须使得参与人获得的钱数,必须使得参与人获得z2的收益。这意的收益。这意味着味着=y2-z2。类似地,如果参与人。类似地,如果参与人2违约,他付给参与人违约,他付给参与人1的转移是的转移是=z1-y1。在引发博弈中,如果当且仅当在引发博弈中,如果当且仅当z1

40、x1+y2z2和和z2x2+y1z1时,时,(I,I)是纳什均衡。不等是纳什均衡。不等式可以整理得:式可以整理得:z1+z2x1+y2 和和 z1+z2x2+y1它们正好是当它们正好是当(I,I)有效率时所满足的条件。有效率时所满足的条件。结论:在预期利益赔偿原则下,当且仅当结论:在预期利益赔偿原则下,当且仅当(I,I)是有效率的时候,是有效率的时候,(I,I)是可执行的。是可执行的。12I N I z1,z2 z1,x2+y1-z1N x1+y2 z2,z2 0,012I N I z1,z2 y1+,x2-N x1+,y2-,-50第50页,共343页。第二种违约补偿非常适用于第二种违约补偿

41、非常适用于zi无法观察的情况。无法观察的情况。在在信赖利益损害赔偿原则信赖利益损害赔偿原则下,法庭实施的转移,使得原告能下,法庭实施的转移,使得原告能够获得他在没有签署合同情况下的收益。够获得他在没有签署合同情况下的收益。根据左下图,信赖利益损害赔偿意味着根据左下图,信赖利益损害赔偿意味着=y2和和=-y1。引发博弈。引发博弈如右下图所示。如右下图所示。注意,当且仅当注意,当且仅当z1x1+y2 和和z2x2+y1时,时,(I,I)是引发博弈的纳什是引发博弈的纳什均衡。均衡。12I N I z1,z2 0,x2+y1N x1+y2,0 0,012I N I z1,z2 y1+,x2-N x1+

42、,y2-,-51第51页,共343页。违约情况下普遍采用的第三种法律原则指的是违约情况下普遍采用的第三种法律原则指的是回复原状赔偿回复原状赔偿,这种原则是通过取消被告因违约而牟取的,相对于无合同情况这种原则是通过取消被告因违约而牟取的,相对于无合同情况下所增加的不当得利而得名。下所增加的不当得利而得名。回复原状赔偿意味着回复原状赔偿意味着=-x1,=x2。所得到的引发博弈形式如右下。所得到的引发博弈形式如右下图所示。图所示。注意,当且仅当注意,当且仅当z10,z20时,时,(I,I)是引发博弈的纳什均衡。是引发博弈的纳什均衡。12I N I z1,z2 x2+y1,0N 0,x1+y2 0,0

43、12I N I z1,z2 y1+,x2-N x1+,y2-,-52第52页,共343页。1212I I N N I I 4 4,4 4-4-4,9 9N N 2 2,-4-4 0 0,0 0在预期利益赔偿的法律原则下,在预期利益赔偿的法律原则下,(I,I)(I,I)能够被执行。能够被执行。12I N I 4,4 4,1N -6,4 0,0基本博弈基本博弈引发引发博弈博弈53第53页,共343页。1212I I N N I I 4 4,4 4-4-4,9 9N N 2 2,-4-4 0 0,0 0在恢复原状赔偿的法律原则下,在恢复原状赔偿的法律原则下,(I,I)(I,I)能够被执行。能够被执行

44、。12I N I 4,4 5,0N 0,-2 0,0基本博弈基本博弈引发引发博弈博弈54第54页,共343页。1212I I N N I I 4 4,4 4-4-4,9 9N N 2 2,-4-4 0 0,0 0在信赖利益损害赔偿原则的法律原则下,在信赖利益损害赔偿原则的法律原则下,(I,I)(I,I)不能够被执行不能够被执行。12I N I 4,4 0,5N -2,0 0,0基本博弈基本博弈引发引发博弈博弈55第55页,共343页。两方严格竞争博弈(两方严格竞争博弈(two-player,strictly competitive game)是指具有如下性质的两方博弈,对于任意两是指具有如下性

45、质的两方博弈,对于任意两个策略组合个策略组合s,s S,当且仅当,当且仅当u2(s)u1(s)。零和博弈零和博弈是其中的一种是其中的一种 3,20,46,11,3A B参与人参与人1 参与人参与人2 A B-1-1,1 11 1,-1-11 1,-1-1-1-1,1 1正正 面面反反 面面猜硬币方猜硬币方盖盖硬硬币币方方正正 面面反反 面面56第56页,共343页。对于策略对于策略 来说,如果来说,如果 是是 的解,那么的解,那么它就是一个它就是一个安全策略安全策略,其中,其中 参与人参与人i采取策略采取策略si最差最差的得益,参与人的得益,参与人i的安全得益水平为的安全得益水平为 结论结论:

46、如果一个两方博弈是严格竞争的,并且有一个纳什均衡:如果一个两方博弈是严格竞争的,并且有一个纳什均衡s*=(s1*,s2*)S,那么,那么s1*是参与人是参与人1的一个安全策略,的一个安全策略,s2*是参与是参与人人2的一个安全策略。的一个安全策略。3,20,46,11,3A B参与人参与人1 参与人参与人2 A B ismax min(,)jjiiiijsSsSu s smin(,)jjiijsSu s s isSmax min(,)jjiiiijsSsSu s s57第57页,共343页。纳什均衡与重复剔除严格劣策略的关系纳什均衡与重复剔除严格劣策略的关系 命题命题2.12.1:没有被剔除的

47、唯一的策略组合是纳什均:没有被剔除的唯一的策略组合是纳什均衡衡.命题命题2.22.2:如果策略是一个纳什均衡,它们在重复如果策略是一个纳什均衡,它们在重复剔除严格劣策略后留下剔除严格劣策略后留下.上述两个命题保证在进行纳什均衡分析之前上述两个命题保证在进行纳什均衡分析之前先通过剔除严格劣策略简化博弈是可行的。先通过剔除严格劣策略简化博弈是可行的。58第58页,共343页。1.1 节习题与练习节习题与练习1.2 2,01,14,23,41,22,31,30,23,0TMBL C R59第59页,共343页。1.3 设此博弈的纯策略纳什均衡是对于参与人1来说同理,对于参与人2因此,此博弈的纯策略纳

48、什均衡是 且满足12(*,*)ss122111101*1*122*max(max,max)max(1*,0)1*sssssssss 21*1*ss 12(*,*)ss1212*1,0*,*1ssss60第60页,共343页。例例1 定位博弈定位博弈 例例2 合伙人博弈合伙人博弈-策略互补策略互补 例例3 犯罪与治安模型犯罪与治安模型 例例4 古诺双头垄断模型(古诺双头垄断模型(Cournot Model of Duopoly)例例5 贝特兰德双头垄断模型(贝特兰德双头垄断模型(Bertrand Model of Duopoly)例例6 最后要价仲裁最后要价仲裁(Final-offer Arbi

49、tration)例例7 公共财产问题公共财产问题1.2 应用举例应用举例61第61页,共343页。例例1 1 定位博弈定位博弈 帕特和克里斯为一家很大的软饮料公司工作,他们的帕特和克里斯为一家很大的软饮料公司工作,他们的工作是在人们喜欢的一个海滩上销售这家公司的灌装工作是在人们喜欢的一个海滩上销售这家公司的灌装苏打饮料,他们在同一个海滩上工作,而且公司规定,苏打饮料,他们在同一个海滩上工作,而且公司规定,必须卖一样的价格,并且承诺每卖一听饮料给他们必须卖一样的价格,并且承诺每卖一听饮料给他们2525美分美分的佣金。帕特和克里斯需要作出的决定是:的佣金。帕特和克里斯需要作出的决定是:每天早每天早

50、晨要把售货棚设在哪里?晨要把售货棚设在哪里?13245678962第62页,共343页。每个区域中都会有每个区域中都会有50个人个人想要买苏打水。想要买苏打水。如果一个售货员可以为其中区域中的所有顾客服务,他将如果一个售货员可以为其中区域中的所有顾客服务,他将赚的赚的12.5美元。美元。顾客们都会到最近的售货摊去买顾客们都会到最近的售货摊去买。132456789利润利润=43.75利润利润=68.7563第63页,共343页。12345156.25,56.2512.5,10018.75,93.7525,87.531.25,81.252100,12.556.25,56.2525,87.531.2

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(博弈论经典PPT课件(PPT 343页).pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|