1、博弈论研究什么?博弈论研究什么?绪论绪论 学习选择学习选择 学会放弃学会放弃博弈博弈一词最早一词最早见于见于论语孟子论语孟子阳货第十七阳货第十七篇篇,子曰:,子曰:“饱食终日,无所用心,难矣饱食终日,无所用心,难矣哉!不有博弈者乎?为之,犹贤乎已。哉!不有博弈者乎?为之,犹贤乎已。”朱熹朱熹论语集注论语集注:“博,局戏也。弈,博,局戏也。弈,围棋也。围棋也。”新华字典、现代汉语新华字典、现代汉语词典、辞源等对博弈的词典、辞源等对博弈的解释,除了指六博和围解释,除了指六博和围棋外,也泛指赌博。棋外,也泛指赌博。甘肃出土:六博木俑甘肃出土:六博木俑20:05 绪论绪论 学习选择学习选择 学会放弃学
2、会放弃博弈论博弈论译译自自英文英文Game Theory。Game在在英文中的含义有英文中的含义有“游戏、运动及竞技比赛、游戏、运动及竞技比赛、运动会运动会”等,等,比如比如Olympic Games;还有还有“计谋、花招计谋、花招”的意思。的意思。在这类游戏活动中,一旦身体条件、技术水在这类游戏活动中,一旦身体条件、技术水平等因素既定以后,策略选择的好坏就是左右平等因素既定以后,策略选择的好坏就是左右游戏结果的关键因素。特别引起人们兴趣的是游戏结果的关键因素。特别引起人们兴趣的是参赛者之间在策略选择上具有参赛者之间在策略选择上具有相互依存性相互依存性,游,游戏的结果不仅取决于自身的策略选择,
3、还取决戏的结果不仅取决于自身的策略选择,还取决于其他参赛者的策略选择。每位参赛者在做出于其他参赛者的策略选择。每位参赛者在做出自己的选择时必须充分考虑其他参赛者的选择。自己的选择时必须充分考虑其他参赛者的选择。Game Theory正是正是研究这类具有相研究这类具有相互依存性的策略选择问题的理论。互依存性的策略选择问题的理论。20:05 绪论绪论 学习选择学习选择 学会放弃学会放弃为何要为何要研究具有相互依存性的策略选择问题?研究具有相互依存性的策略选择问题?首先,策略选择问题在我们每个人的首先,策略选择问题在我们每个人的日常生活、学习和工作会常常遇到。日常生活、学习和工作会常常遇到。其次,这
4、类策略选择问题都有一个共其次,这类策略选择问题都有一个共性,就是性,就是相互相互依存性。依存性。在你做出选择的在你做出选择的同时别人也在进行选择,他们的选择与同时别人也在进行选择,他们的选择与你的选择相互影响、相互作用。你的选择相互影响、相互作用。具有相互依存性的策略选择问题不仅存在具有相互依存性的策略选择问题不仅存在于下棋、打牌及体育比赛等活动中,还广泛于下棋、打牌及体育比赛等活动中,还广泛地存在于人们的各种社会活动和日常生活地存在于人们的各种社会活动和日常生活中中。只要只要存在人的互动情况,就存在博弈问题。存在人的互动情况,就存在博弈问题。20:05 绪论绪论 学习选择学习选择 学会放弃学
5、会放弃博弈论的应用范围:博弈论的应用范围:博弈博弈论论政治政治经济法律法律军事军事外交外交经济经济19941994年诺贝尔经济学奖年诺贝尔经济学奖 德国柏林大学莱因哈德德国柏林大学莱因哈德赛尔腾因在非赛尔腾因在非合作博弈的均衡分析理论方面做出了开合作博弈的均衡分析理论方面做出了开创性贡献、对博弈论和经济学产生了重创性贡献、对博弈论和经济学产生了重大影响获奖。大影响获奖。美国普林斯顿大学数学系教授约翰美国普林斯顿大学数学系教授约翰纳纳什,因提出在非合作博弈理论中起着核什,因提出在非合作博弈理论中起着核心作用的纳什均衡概念获奖。心作用的纳什均衡概念获奖。20052005年诺贝尔经济学奖年诺贝尔经济
6、学奖 以美双重国籍经济学家罗伯特以美双重国籍经济学家罗伯特奥奥曼和美国经济学家托马斯曼和美国经济学家托马斯谢林因在谢林因在博弈论分析方面的研究获奖。博弈论分析方面的研究获奖。20072007年诺贝尔经济学奖年诺贝尔经济学奖 三位美国经济学家里奥尼德三位美国经济学家里奥尼德赫维赫维茨、埃里克茨、埃里克马斯金、罗杰马斯金、罗杰迈尔森以迈尔森以创立创立和和发展机制发展机制设计设计理论方面理论方面的贡献的贡献获得诺贝尔经济学奖。获得诺贝尔经济学奖。20:05 绪论绪论 学习选择学习选择 学会放弃学会放弃博弈论可以作为社会科学的一种一博弈论可以作为社会科学的一种一般分析方法,同时也是分析和说明我般分析方
7、法,同时也是分析和说明我们日常生活中遇到的问题的学问。们日常生活中遇到的问题的学问。人类社会中的博弈现象,与自然人类社会中的博弈现象,与自然界中的很多自然现象相类似。界中的很多自然现象相类似。美国史密斯学院经济学助理教授詹美国史密斯学院经济学助理教授詹姆斯姆斯米勒在其著作中写到:米勒在其著作中写到:“不理解不理解博弈论的人,在与掌握博弈论的人相博弈论的人,在与掌握博弈论的人相处时,很容易就在战术上失去优势。处时,很容易就在战术上失去优势。”当代经济学全才保罗当代经济学全才保罗萨缪尔森也说过:萨缪尔森也说过:“要想在现代社会做一个有文化的人,要想在现代社会做一个有文化的人,你必须对博弈论有一个大
8、致的了解。你必须对博弈论有一个大致的了解。”博弈论不仅影响着社会科学的博弈论不仅影响着社会科学的研究和发展,更重要的是它正改研究和发展,更重要的是它正改变着人们的思维习惯。变着人们的思维习惯。20:05 绪论绪论 学习选择学习选择 学会放弃学会放弃博弈论的学习目的:博弈论的学习目的:初步认识博弈论的基本思想和初步认识博弈论的基本思想和典型问题,建立策略思维的意识,典型问题,建立策略思维的意识,了解策略思维的方法。了解策略思维的方法。更重要的是不但要知道博弈论说了些更重要的是不但要知道博弈论说了些什么,而且要学习运用博弈论的思想和什么,而且要学习运用博弈论的思想和方法分析现实生活中遇到的各种问题
9、,方法分析现实生活中遇到的各种问题,把它当成分析和描述自己身边事情的有把它当成分析和描述自己身边事情的有效方法,提高观察问题、分析问题、解效方法,提高观察问题、分析问题、解决问题的能力。决问题的能力。无论无论你学到了多少博弈论的概念和方法,你学到了多少博弈论的概念和方法,当你真正面临一个具体问题时,都不能生当你真正面临一个具体问题时,都不能生搬硬套。解决问题的关键是开动自己的大搬硬套。解决问题的关键是开动自己的大脑,冷静地将各种理论、方法和具体情况脑,冷静地将各种理论、方法和具体情况综合起来思考,找出尽可能好的解决办法。综合起来思考,找出尽可能好的解决办法。20:05 绪论绪论 学习选择学习选
10、择 学会放弃学会放弃 博弈论博弈论研究研究什么什么从从我们身边说起我们身边说起研究具有相互依存研究具有相互依存性的策略选择问题性的策略选择问题 为何学习博弈论为何学习博弈论遵从社会活动规律遵从社会活动规律建立策略思维的意识建立策略思维的意识了解策略了解策略思维思维的方法的方法如何学习如何学习博弈论博弈论问题导向归纳提炼联系实际问题导向归纳提炼联系实际通过典型问题通过典型问题理解基本方法理解基本方法20:05 囚徒困境囚徒困境囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认 6 9 6 1抵抵赖赖 1 3 9 3囚徒甲和囚徒乙囚徒甲和囚徒乙是参与博弈的两方,是参与博弈的两方,称为称为局中人局中人
11、。甲和乙都各有两个选择,甲和乙都各有两个选择,称为称为行动行动或者或者策略策略。如果甲。如果甲选择了选择了抵赖抵赖、乙选择了、乙选择了供认供认,称为一个称为一个对局对局或者或者策略组合策略组合,记为记为(抵赖,供认抵赖,供认)。一个对局下局中人一个对局下局中人的所得,即博弈的结果,的所得,即博弈的结果,称为收益或者支付,放称为收益或者支付,放在一起称为收益矩阵。在一起称为收益矩阵。左下方为甲的收益,右左下方为甲的收益,右上方为乙的收益。对局上方为乙的收益。对局(抵赖,供认抵赖,供认)的结果记的结果记为为(9,1 1)。20:05 囚徒困境囚徒困境囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认
12、 6 9 6 1抵抵赖赖 1 3 9 3 供认供认是是甲的甲的上策上策,供认,供认也也是乙的上策是乙的上策,(,(供认供认,供认供认)是一个上策均衡,)是一个上策均衡,双方的得益双方的得益为为(6,6)。博弈论中假设局中博弈论中假设局中人都是理性人,就是人都是理性人,就是局中人在博弈中总是局中人在博弈中总是以以自身利益最大化自身利益最大化为为决策的原则。决策的原则。相对相对来说来说,抵赖称为,抵赖称为甲甲的的下策,抵赖也下策,抵赖也是乙是乙的的下下策。下策不策。下策不应该使应该使用,删除后只剩下用,删除后只剩下(供供认认,供认供认)一个策略组合,)一个策略组合,即为均衡策略组合。即为均衡策略组
13、合。20:05 囚徒困境囚徒困境囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认 6 9 6 1抵抵赖赖 1 3 9 3可以将供认看成可以将供认看成背叛背叛同伙的策略同伙的策略;抵赖是;抵赖是与与同伙合作的策略。同伙合作的策略。由于双方无法串供,也无法相信对方由于双方无法串供,也无法相信对方一定会与自己合作,所以只能从自身利一定会与自己合作,所以只能从自身利益最大化来选择,即选择背叛的策略。益最大化来选择,即选择背叛的策略。20:05 价格竞争价格竞争 经济学中将市场分为四类:完全竞争、垄断竞经济学中将市场分为四类:完全竞争、垄断竞争、寡头垄断和完全垄断。争、寡头垄断和完全垄断。完全垄断指市场
14、中只有一个卖家;完全竞争指完全垄断指市场中只有一个卖家;完全竞争指市场中有充分多个卖家和买家,任何人都不能单市场中有充分多个卖家和买家,任何人都不能单独影响市场价格,是理想的市场状态。在这两种独影响市场价格,是理想的市场状态。在这两种市场中人们都不必担心策略的相互作用。因为完市场中人们都不必担心策略的相互作用。因为完全垄断情况下只有一个卖方,没有竞争者;而在全垄断情况下只有一个卖方,没有竞争者;而在完全竞争情况下,一家公司不可能跟踪极其多的完全竞争情况下,一家公司不可能跟踪极其多的竞争者的所有行动。竞争者的所有行动。在现实中最多见的市场情况是寡头垄断和垄断在现实中最多见的市场情况是寡头垄断和垄
15、断竞争。竞争。其中寡头垄断往往出现在生产其中寡头垄断往往出现在生产高度集中的行业。如钢铁、石油、高度集中的行业。如钢铁、石油、汽车、飞机、家电等。寡头厂商汽车、飞机、家电等。寡头厂商为保持自身地位会采取种种排他为保持自身地位会采取种种排他措施,产生博弈问题。措施,产生博弈问题。当市场上只有几家公司时,局中当市场上只有几家公司时,局中人必须考虑自己的行动对竞争对手人必须考虑自己的行动对竞争对手可能产生的影响。同时也要分析竞可能产生的影响。同时也要分析竞争者可能做的事情。否则,危险便争者可能做的事情。否则,危险便会接踵而至。而博弈论正是擅长分会接踵而至。而博弈论正是擅长分析这一类问题的方法。析这一
16、类问题的方法。20:05 价格竞争价格竞争苏宁苏宁高价高价低价低价国国美美高高价价1200亿亿1500亿亿1200亿亿500亿亿低低价价500亿亿900亿亿1500亿亿900亿亿(低价,低价)也是(低价,低价)也是上策均衡,所以价格竞上策均衡,所以价格竞争是囚徒困境式的争是囚徒困境式的博弈。博弈。如果如果双方通过某种协议双方通过某种协议进行合作,共同采用高价进行合作,共同采用高价格,则称为合作博弈。否格,则称为合作博弈。否则称为非合作博弈。则称为非合作博弈。现代现代博弈论主要研究非合作博弈论主要研究非合作博弈。因为主导人们行为方式博弈。因为主导人们行为方式的主要还是个体理性而不是集的主要还是个
17、体理性而不是集体理性,竞争是一切社会经济体理性,竞争是一切社会经济关系的根本基础,不合作是基关系的根本基础,不合作是基本的,合作是有条件和暂时的。本的,合作是有条件和暂时的。另外,合作博弈比非合作博弈另外,合作博弈比非合作博弈难度大,非合作博弈理论可以难度大,非合作博弈理论可以作为合作博弈理论的基础。作为合作博弈理论的基础。20:05 囚徒困境的理解囚徒困境的理解显然,不论是从两个囚徒整体来看,还是从他显然,不论是从两个囚徒整体来看,还是从他们各自来看,两人都供认的结局都不如两人都抵们各自来看,两人都供认的结局都不如两人都抵赖的结局。由于这种结局具有必然性,虽然不理赖的结局。由于这种结局具有必
18、然性,虽然不理想但又很难摆脱,所以称为囚徒困境。想但又很难摆脱,所以称为囚徒困境。囚徒困境模型同时揭示了两个矛盾:一个是个囚徒困境模型同时揭示了两个矛盾:一个是个体理性与团体理性之间的矛盾,从个体利益最大体理性与团体理性之间的矛盾,从个体利益最大化出发的行为往往不能实现团体的最大利益;另化出发的行为往往不能实现团体的最大利益;另一个是个体理性本身的内在矛盾,即使从个体利一个是个体理性本身的内在矛盾,即使从个体利益最大化出发的行为最终也不一定能真正实现个益最大化出发的行为最终也不一定能真正实现个体的最大利益,甚至会得到相当差的结果。体的最大利益,甚至会得到相当差的结果。20:05 囚徒困境的理解
19、囚徒困境的理解囚徒困境是很多社会现象的简单抽象,可以说囚徒困境是很多社会现象的简单抽象,可以说是理性的人类社会活动最形象的比喻。它准确地是理性的人类社会活动最形象的比喻。它准确地描述了人类社会中所存在的互相之间不信任和相描述了人类社会中所存在的互相之间不信任和相互防范的一面。在无法改变他人选择的情况下,互防范的一面。在无法改变他人选择的情况下,背叛常常是使自己避免风险的最好选择。背叛常常是使自己避免风险的最好选择。上述结论是在理性人假设之下得到的。理性人上述结论是在理性人假设之下得到的。理性人可以理解为广义上的利己之人。人是生而利己的,可以理解为广义上的利己之人。人是生而利己的,利他是后天习得
20、的,其实也是一种利己的扩大化。利他是后天习得的,其实也是一种利己的扩大化。利己而不损人,利人而不损己。损人利己,长不利己而不损人,利人而不损己。损人利己,长不了,好不了;损己利人,多不了,也长不了。利了,好不了;损己利人,多不了,也长不了。利己心是推动社会发展的原动力。己心是推动社会发展的原动力。20:05 军备竞赛军备竞赛前苏联前苏联扩军扩军裁军裁军美美国国扩扩军军2000亿亿 2000亿亿 8000亿亿裁裁军军8000亿亿0 0上策均衡:上策均衡:(扩军,扩军扩军,扩军)是囚徒困境式的博弈是囚徒困境式的博弈 扩军是两国的理性行为,扩军是两国的理性行为,但是结果却显得不理性。但是结果却显得不
21、理性。20:05 军备竞赛军备竞赛B国国扩军扩军小军备小军备零军备零军备A国国扩军扩军2000 1500 2000 1600 8000 小军小军备备1600 500 1500 500 9500 零军零军备备8000 9500 0 0删除下策,可得到上策均衡:删除下策,可得到上策均衡:(小军备,小军备小军备,小军备)上述博弈问题,都可以通过比较收益上述博弈问题,都可以通过比较收益的大小找出局中人的的大小找出局中人的上策上策,即局中人的,即局中人的最佳策略,从而推测出博弈的结果。这最佳策略,从而推测出博弈的结果。这种分析方法可称为种分析方法可称为上策分析法上策分析法。20:05 公地悲剧公地悲剧公
22、共公共资源利用、公共设施提供和公共环境保护资源利用、公共设施提供和公共环境保护等方面的问题也包含了众多的博弈问题。等方面的问题也包含了众多的博弈问题。这里所说的公共资源大家这里所说的公共资源大家都可以自由免费都可以自由免费利用,利用,但是随着人们的使用公共资源会逐渐减少。但是随着人们的使用公共资源会逐渐减少。这就是说,公共资源是那些具有这就是说,公共资源是那些具有非非排他性却不排他性却不具有非竞争性的物品。具有非竞争性的物品。政治经济学家政治经济学家们早就认识到,在人们完全从自们早就认识到,在人们完全从自利动机出发自由利用公共资源时,公共资源倾向利动机出发自由利用公共资源时,公共资源倾向于被过
23、度利用、低效率使用和甚至浪费。于被过度利用、低效率使用和甚至浪费。牧民们在自由放牧的草地上放牧牛羊,并牧民们在自由放牧的草地上放牧牛羊,并自己决定放牧数量。草原很大,但如果牛羊自己决定放牧数量。草原很大,但如果牛羊过多,草地也会退化、沙化。从每一个牧民过多,草地也会退化、沙化。从每一个牧民来看,多放牧牛羊是他们的上策。如果每一来看,多放牧牛羊是他们的上策。如果每一个牧民都这样做,草地上的牛羊必然会过量,个牧民都这样做,草地上的牛羊必然会过量,最终草地会变得寸草不生。最终草地会变得寸草不生。如果只有一两个人减少放牧量,情况也不如果只有一两个人减少放牧量,情况也不会改变多少。所以,不论是从长期考虑
24、还是会改变多少。所以,不论是从长期考虑还是短期来看,牧民们都应该尽量增加放牧量,短期来看,牧民们都应该尽量增加放牧量,所以草原沙化是不可避免的。只有牧民们都所以草原沙化是不可避免的。只有牧民们都适量放牧才不会这样。但仅靠牧民自己无法适量放牧才不会这样。但仅靠牧民自己无法改变囚徒困境式的局面。改变囚徒困境式的局面。公地悲剧问题说明在公共资源的利用、公公地悲剧问题说明在公共资源的利用、公共设施的提供方面,政府的组织、协调和制共设施的提供方面,政府的组织、协调和制约是非常必要的,也是政府存在的主要理由约是非常必要的,也是政府存在的主要理由之一。之一。20:05 注水简历注水简历写简历应该如实介绍还是
25、夸大其词,也写简历应该如实介绍还是夸大其词,也是囚徒是囚徒困境式的博弈。困境式的博弈。不错不错优秀优秀出类出类拔萃拔萃旷世旷世奇才奇才20:05 关税之战关税之战两个国家,在进口关税上都有两种选择:两个国家,在进口关税上都有两种选择:提高关税,以保护本国同类商品。(背叛)提高关税,以保护本国同类商品。(背叛)降低关税,以利各自商品的流通。(合作)降低关税,以利各自商品的流通。(合作)当一国独自提高关税时,另一国也会做出同样当一国独自提高关税时,另一国也会做出同样反应,会引发关税战,两国商品均会失去对方的反应,会引发关税战,两国商品均会失去对方的市场,同时对本国经济也造成损害。市场,同时对本国经
26、济也造成损害。除了关税战,还有多种多样的非关税战。如以除了关税战,还有多种多样的非关税战。如以保护环境、食品安全等名义,制定更高的环保标保护环境、食品安全等名义,制定更高的环保标准、技术标准和劳工标准,等。贸易保护的形式准、技术标准和劳工标准,等。贸易保护的形式和手段更加灵活多样,也更具隐蔽性。和手段更加灵活多样,也更具隐蔽性。20:05 员工困境员工困境一名苛刻的经理和手下数名员工。一名苛刻的经理和手下数名员工。如果所有员工都听从经理吩咐,则奖金等待如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都要超负荷工作;如果某人遇一样,不过所有人都要超负荷工作;如果某人不听从吩咐,其他人听从
27、吩咐,则此人下岗,其不听从吩咐,其他人听从吩咐,则此人下岗,其他人继续工作;如果所有人都不听从经理吩咐,他人继续工作;如果所有人都不听从经理吩咐,则经理下岗。则经理下岗。由于员工之间信息不公开,都担心别人听话由于员工之间信息不公开,都担心别人听话自己不听话而下岗,所以大家只能继续繁重的工自己不听话而下岗,所以大家只能继续繁重的工作。作。20:05 兴奋剂问题兴奋剂问题运动员运动员2使用兴奋剂使用兴奋剂不使用兴奋剂不使用兴奋剂运运动动员员1使用兴使用兴奋剂奋剂双方都有双方都有1/2机会机会获胜但获胜但健康受损健康受损落败落败获胜但健康获胜但健康受损受损 不使用不使用兴奋剂兴奋剂获胜但健康获胜但健
28、康受损受损 双方都有双方都有1/2机会机会获胜获胜落败落败 大多数雇员都不会靠服用兴大多数雇员都不会靠服用兴奋剂来提升工作业绩,但他们奋剂来提升工作业绩,但他们却会牺牲家庭生活和休息来保却会牺牲家庭生活和休息来保住工作。住工作。20:05 博弈模型构成小结博弈模型构成小结囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认696 1抵抵赖赖 1393博弈模型的构成:局中人、策略、收益博弈模型的构成:局中人、策略、收益局中人都局中人都是理性人,是理性人,在博弈中总在博弈中总是以自身利是以自身利益最大化为益最大化为选择策略的选择策略的原则。原则。20:05一个博弈模一个博弈模型中至少有两型中至少有两个
29、局中人。个局中人。每个局中人每个局中人都有多于一个都有多于一个的策略。的策略。每个局中人每个局中人的收益依赖于的收益依赖于所有局中人选所有局中人选定的策略,策定的策略,策略和收益具有略和收益具有相互依存性。相互依存性。将所有对局将所有对局下的收益排列下的收益排列成的矩阵称为成的矩阵称为收益矩阵。收益矩阵。囚徒困境博弈小结囚徒困境博弈小结囚徒困境博弈的启示:囚徒困境博弈的启示:两个囚徒都是从自身利益最大化出发进行决两个囚徒都是从自身利益最大化出发进行决策,而最终得到的却是不理想、但又难以摆脱策,而最终得到的却是不理想、但又难以摆脱的结局。的结局。说明从个体利益最大化出发的行为往往不能说明从个体利
30、益最大化出发的行为往往不能实现团体的最大利益,同时也不一定能真正实实现团体的最大利益,同时也不一定能真正实现个体的最大利益。现个体的最大利益。囚徒困境式博弈就是你处于这样一种两难中,囚徒困境式博弈就是你处于这样一种两难中,你觉得这样做不好,可是又不得不这样做。你你觉得这样做不好,可是又不得不这样做。你做了的结果又是两败俱伤。做了的结果又是两败俱伤。20:05 上策均衡小结上策均衡小结上策与上策均衡上策与上策均衡囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认696 1抵抵赖赖 1393如果一个策略下的如果一个策略下的所有收益都不小于其所有收益都不小于其它策略的收益,则称它策略的收益,则称该策略
31、为局中人的一该策略为局中人的一个个上策上策或优势策略;或优势策略;如果是严格大于,则如果是严格大于,则称为严格上策或严格称为严格上策或严格优势策略。优势策略。如果一个博弈中所有如果一个博弈中所有局中人都有上策,则该局中人都有上策,则该博弈存在上策均衡。博弈存在上策均衡。相对来说,如果策略相对来说,如果策略A下下的收益均不大于策略的收益均不大于策略B下的下的收益,则称策略收益,则称策略A是相对于是相对于策略策略B的下策;如果是严格的下策;如果是严格小于,则称为严格下策。小于,则称为严格下策。下策不应该使用,删下策不应该使用,删除后可以简化博弈问题。除后可以简化博弈问题。20:05 上策均衡小结上
32、策均衡小结上策均衡反映了所有局中人的绝对偏好,因而上策均衡反映了所有局中人的绝对偏好,因而非常稳定。进行博弈分析时,可首先判断各局中非常稳定。进行博弈分析时,可首先判断各局中人是否都有上策,博弈中是否存在上策均衡。人是否都有上策,博弈中是否存在上策均衡。下策对于局中人来说是必然不选的,所以应该下策对于局中人来说是必然不选的,所以应该排除。通过不断删除下策,可以简化博弈问题。排除。通过不断删除下策,可以简化博弈问题。但是,在大部分博弈中,往往不存在局中人绝但是,在大部分博弈中,往往不存在局中人绝对偏好的上策,也不存在可以完全排除的下策。对偏好的上策,也不存在可以完全排除的下策。局中人的不同策略之
33、间往往不存在局中人的不同策略之间往往不存在绝对的优劣关绝对的优劣关系系,只存在相对的、有条件的优劣关系。所以需,只存在相对的、有条件的优劣关系。所以需要引入其他的均衡概念。要引入其他的均衡概念。20:05 情侣博弈与纳什均衡情侣博弈与纳什均衡例如:例如:女女拳击拳击时装时装男男拳拳击击1020时时装装1211(拳击拳击,拳击拳击)、(时装时装,时装时装)都是由都是由具有相对优势的策略构成的均衡,具有相对优势的策略构成的均衡,称为称为纳什均衡纳什均衡。20:05在纳什均衡中,在纳什均衡中,每个每个局中人的策局中人的策略都是针对其他局中人略都是针对其他局中人策略的策略的最佳最佳策略策略。纳什。纳什
34、均衡是非合作博弈理论均衡是非合作博弈理论中最重要的一个均衡概念。中最重要的一个均衡概念。在纳什均衡策略组合下,任何一在纳什均衡策略组合下,任何一个局中人都不会单独改变自己的策个局中人都不会单独改变自己的策略,或者说都不愿意略,或者说都不愿意单独偏离单独偏离这个这个均衡。均衡。这意味着当出现的策略组合不是这意味着当出现的策略组合不是纳什均衡时,至少有一个局中人会纳什均衡时,至少有一个局中人会感到后悔。感到后悔。寻找纳什均衡划线法寻找纳什均衡划线法例如:情侣博弈例如:情侣博弈女女拳击拳击时装时装男男拳拳击击1020时时装装1211囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认696 1抵抵赖赖
35、1393例如:囚徒困境例如:囚徒困境 当某一个格里的两个数当某一个格里的两个数字都有下划线时,说明其字都有下划线时,说明其对应的策略分别是两个人对应的策略分别是两个人都愿意选的,都是应对对都愿意选的,都是应对对手的最佳策略,所以构成手的最佳策略,所以构成纳什均衡。纳什均衡。情侣博弈有两情侣博弈有两个纳什均衡,囚个纳什均衡,囚徒困境博弈只有徒困境博弈只有一个纳什均衡。一个纳什均衡。上策均衡一定上策均衡一定是纳什均衡,但是纳什均衡,但纳什均衡不一定纳什均衡不一定是上策均衡。是上策均衡。20:05 寻找纳什均衡划线法寻找纳什均衡划线法例如:例如:20:05局中人乙局中人乙XY局局中中人人甲甲A000
36、0B0101策略组合策略组合(A,X)、(A,Y)、(B,X)结果都是结果都是(0,0),但是,但是(A,Y)和和(B,X)都不是纳什均衡,只有都不是纳什均衡,只有(A,X)是纳是纳什均衡。什均衡。(B,Y)也是纳什均衡。也是纳什均衡。纳什均衡的特性纳什均衡的特性纳什均衡的力量来源于其纳什均衡的力量来源于其一致预测性一致预测性和和稳定性稳定性。若所有局中人都预测一个特定的博弈结果会出若所有局中人都预测一个特定的博弈结果会出现,而且都不会利用这种预测能力选择与预测结现,而且都不会利用这种预测能力选择与预测结果不一致的策略,即没有哪个局中人有偏离这个果不一致的策略,即没有哪个局中人有偏离这个预测结
37、果的愿望,因此这个预测结果最终会成为预测结果的愿望,因此这个预测结果最终会成为博弈的结果,这种特性称为博弈的结果,这种特性称为一致预测性一致预测性。注意,这里所说的注意,这里所说的一致性一致性是指各局中人的实际是指各局中人的实际行为选择与他们的预测一致,而不是指各局中人行为选择与他们的预测一致,而不是指各局中人的预测或选择一致、无差异。的预测或选择一致、无差异。在具有一致预测性的均衡之下,局中人的决策在具有一致预测性的均衡之下,局中人的决策具有具有稳定性稳定性和和自我强制性自我强制性。20:05因此,在假设各局中人都有完全理性时,因此,在假设各局中人都有完全理性时,即不会犯错误的情况下,不可能
38、预测任何即不会犯错误的情况下,不可能预测任何非纳什均衡是博弈的结果。虽然不能保证非纳什均衡是博弈的结果。虽然不能保证人们不犯错误,但是不能因为无法保证人人们不犯错误,但是不能因为无法保证人们不犯错误而舍弃纳什均衡概念。们不犯错误而舍弃纳什均衡概念。纳什均衡的特性纳什均衡的特性最后的归宿博弈说明,纳什均衡最后的归宿博弈说明,纳什均衡具有很好的具有很好的稳稳定性定性。乙乙abc甲甲A212230B322123C032222 纳什均衡也可以理解为是这样纳什均衡也可以理解为是这样一种策略组合,这种组合由所有一种策略组合,这种组合由所有局中人的最优策略组成。即给定局中人的最优策略组成。即给定其他人策略的
39、情况下,没有任何其他人策略的情况下,没有任何一个局中人有积极性选择其他策一个局中人有积极性选择其他策略,从而没有任何人有积极性打略,从而没有任何人有积极性打破这种均衡,或者说纳什均衡是破这种均衡,或者说纳什均衡是一种一种僵局僵局,给定别人不动的情况,给定别人不动的情况下,没有人有兴趣动。下,没有人有兴趣动。如果谁想偏离纳什均如果谁想偏离纳什均衡另搞一套,利益角逐衡另搞一套,利益角逐的最终结果,还是会回的最终结果,还是会回到纳什均衡的位置。到纳什均衡的位置。20:05小王小王德语德语法语法语小小李李德德语语4353法法语语2524 情侣博弈的应用情侣博弈的应用例如:例如:如:同一行业内的如:同一
40、行业内的两家公司选择行业两家公司选择行业标准的问题。标准的问题。如:你走在马路上如:你走在马路上应该靠左走还是靠应该靠左走还是靠右走。右走。20:05 情侣博弈的应用情侣博弈的应用例如:鞋店与大脚女顾客例如:鞋店与大脚女顾客大脚女顾客大脚女顾客去普通鞋店去普通鞋店不去不去鞋鞋店店有大有大号鞋号鞋满意满意0盈利盈利积压积压没有大没有大号鞋号鞋丢脸丢脸000鞋店可以通过广告打鞋店可以通过广告打破不好的均衡。在纳什破不好的均衡。在纳什均衡里,我们假定对手均衡里,我们假定对手的策略不变,但实际情的策略不变,但实际情况不完全如此。如果两况不完全如此。如果两个局中人都可以调正自个局中人都可以调正自己的策略
41、,并改变对手己的策略,并改变对手的行动,就可以达到更的行动,就可以达到更好的均衡。好的均衡。20:05 协调博弈协调博弈不难看出,类似情侣博弈这一类博弈中,合作不难看出,类似情侣博弈这一类博弈中,合作对局中人有利。而且,对局中人来说,隐瞒自己对局中人有利。而且,对局中人来说,隐瞒自己的行动或是对自己将如何打算说谎话都是不明智的行动或是对自己将如何打算说谎话都是不明智的。在这类博弈中,局中人需要彼此协调行动。的。在这类博弈中,局中人需要彼此协调行动。所以这一类博弈又称为所以这一类博弈又称为协调博弈协调博弈。在所有协调博弈中,局中人都希望你知道他会在所有协调博弈中,局中人都希望你知道他会做什么,以
42、及履行自己所承诺的行为给自己带来做什么,以及履行自己所承诺的行为给自己带来的好处。的好处。在协调博弈中,成功的关键就在于公开、诚实在协调博弈中,成功的关键就在于公开、诚实和信任。和信任。20:05 麦琪的礼物麦琪的礼物麦琪的礼物麦琪的礼物是美国著名文学家欧是美国著名文学家欧亨利的亨利的短篇小说。讲的是贫穷但恩爱的小两口,在圣诞短篇小说。讲的是贫穷但恩爱的小两口,在圣诞节前一天,妻子卖掉自己引以为傲的长发,为丈节前一天,妻子卖掉自己引以为傲的长发,为丈夫买了一条白金表链;而丈夫则卖掉祖传的珍贵夫买了一条白金表链;而丈夫则卖掉祖传的珍贵怀表,为妻子买下了她渴望已久的发梳。他们付怀表,为妻子买下了她
43、渴望已久的发梳。他们付出自己最宝贵的东西,却送出了无用的礼物。出自己最宝贵的东西,却送出了无用的礼物。当然他们得到是不能用金钱衡量的比任何礼物当然他们得到是不能用金钱衡量的比任何礼物都宝贵的东西。但是如果他们事先能协调一下,都宝贵的东西。但是如果他们事先能协调一下,就会有更好地结局。就会有更好地结局。麦琪的礼物麦琪的礼物告诉我们,告诉我们,“惊喜惊喜”是奢是奢侈品,如果你还不富裕,你很可能享受不起。侈品,如果你还不富裕,你很可能享受不起。可供对比的是,在一些发达国家,人们在发可供对比的是,在一些发达国家,人们在发送邀请函的时候,往往会注明希望收到什么送邀请函的时候,往往会注明希望收到什么礼物,
44、这样,就避免了送礼物的人为了带给礼物,这样,就避免了送礼物的人为了带给接受礼物的人接受礼物的人“惊喜惊喜”而导致礼物无用的情而导致礼物无用的情况。而这正是自利的行为带给双方效益最大况。而这正是自利的行为带给双方效益最大化的启示。化的启示。20:05 大规模协调博弈大规模协调博弈情侣博弈是两个人的博弈问题,而靠左走还是情侣博弈是两个人的博弈问题,而靠左走还是靠右走是很多人之间的博弈问题。网络效应就是靠右走是很多人之间的博弈问题。网络效应就是在很多人参与的博弈中出现的一种相互作用的结在很多人参与的博弈中出现的一种相互作用的结果。果。网络效应网络效应又称为又称为网络外部性网络外部性。以色列经济学家。
45、以色列经济学家奥兹奥兹夏伊提出的定义是,夏伊提出的定义是,“当一种产品对用户当一种产品对用户的价值随着采用相同的产品、或可兼容产品的用的价值随着采用相同的产品、或可兼容产品的用户增加而增大时,就出现了网络外部性。户增加而增大时,就出现了网络外部性。”网络效应就是指产品价值随着购买这种产品及网络效应就是指产品价值随着购买这种产品及其兼容产品的消费者的数量增加而不断增加。其兼容产品的消费者的数量增加而不断增加。传媒业、通讯业等行业普遍存在网络效应。传媒业、通讯业等行业普遍存在网络效应。20:05 网络效应网络效应信息产品存在着互联的内在需要,因为人们生信息产品存在着互联的内在需要,因为人们生产和使
46、用它们的目的就是更好地收集和交流信息。产和使用它们的目的就是更好地收集和交流信息。这种需求的满足程度与这种需求的满足程度与网络的规模网络的规模密切相关。如密切相关。如果网络中只有少数用户,他们不仅要承担高昂的果网络中只有少数用户,他们不仅要承担高昂的运营成本,而且只能与数量有限的人交流信息和运营成本,而且只能与数量有限的人交流信息和使用经验。使用经验。随着用户数量的增加,每名用户承担的成本将随着用户数量的增加,每名用户承担的成本将持续下降,同时信息和经验交流的范围得到扩大,持续下降,同时信息和经验交流的范围得到扩大,所有用户都可能从网络规模的扩大中获得更大的所有用户都可能从网络规模的扩大中获得
47、更大的价值。此时,价值。此时,网络的价值网络的价值呈几何级数式的增长。呈几何级数式的增长。这种效应即被称为这种效应即被称为网络效应网络效应。20:05 网络效应网络效应例如:例如:电话的电话的使用使用软件软件的的兼容性兼容性英语英语的的优越性优越性钞票的钞票的价值价值网络效应可以分为直接的网络效应网络效应可以分为直接的网络效应和间接的网络效应。比如传真设备之和间接的网络效应。比如传真设备之间就是直接的网络效应,而间就是直接的网络效应,而DVD播放播放器之间则是间接的网络效应。因为我器之间则是间接的网络效应。因为我买买DVD时不必考虑别人是否已经拥有。时不必考虑别人是否已经拥有。但拥有但拥有DV
48、D的人越多,更多的的人越多,更多的DVD可播放内容将被提供,我能播放的内可播放内容将被提供,我能播放的内容也会更多。因此,你购买容也会更多。因此,你购买DVD会间会间接提高我的播放器的价值。接提高我的播放器的价值。在具有网络效应在具有网络效应的产业中,的产业中,“先下手为强先下手为强”和和“赢家通赢家通吃吃”是市场竞争的重要特征。是市场竞争的重要特征。20:05 纳什均衡小结纳什均衡小结纳什均衡是局中人的策略组合。在这个组合纳什均衡是局中人的策略组合。在这个组合中,给定所有其他人的选择,没有人对自己的策中,给定所有其他人的选择,没有人对自己的策略感到后悔,所以没有人想改变自己的策略。略感到后悔,所以没有人想改变自己的策略。在纳什均衡中,你不一定满意其他人的策略,在纳什均衡中,你不一定满意其他人的策略,但是,你的策略是应对对手策略的最佳策略。但是,你的策略是应对对手策略的最佳策略。寻找纳什均衡的划线法,依据的是策略之间寻找纳什均衡的划线法,依据的是策略之间的相对优劣关系的相对优劣关系。囚徒困境博弈只存在一个纳什均衡,情侣博囚徒困境博弈只存在一个纳什均衡,情侣博弈存在两个纳什均衡。弈存在两个纳什均衡。20:05