囚徒困境及其启示-1课件.pptx

上传人(卖家):三亚风情 文档编号:2514947 上传时间:2022-04-28 格式:PPTX 页数:19 大小:5.72MB
下载 相关 举报
囚徒困境及其启示-1课件.pptx_第1页
第1页 / 共19页
囚徒困境及其启示-1课件.pptx_第2页
第2页 / 共19页
囚徒困境及其启示-1课件.pptx_第3页
第3页 / 共19页
囚徒困境及其启示-1课件.pptx_第4页
第4页 / 共19页
囚徒困境及其启示-1课件.pptx_第5页
第5页 / 共19页
点击查看更多>>
资源描述

1、囚徒困境囚徒困境小组成员:王嘉瑶小组成员:王嘉瑶 王洁霞王洁霞 王孟佳王孟佳 王晓斌王晓斌什么是博弈论?什么是博弈论?博弈论又被称为博弈论又被称为对策论对策论(Game TheoryGame Theory)既是现代数学的一个新分)既是现代数学的一个新分支,也是运筹学的一个重要学科。支,也是运筹学的一个重要学科。博弈论主要研究博弈论主要研究公式化的激励结构间的相互作用公式化的激励结构间的相互作用。是研究具有斗。是研究具有斗争或竞争性质现象的数学理论和方法。争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体博弈论考虑游戏中的个体的的预测行为和实际行为预测行为和实际行为,并研究它们的,并研究

2、它们的优化策略优化策略。生物学家使用。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈理论来理解和预测进化论的某些结果。基本概念中包括局中人、行动、信息、策略、收益、均衡和结果基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。果被统称为博弈规则。类型类型(1)1)合作博弈合作博弈研究人们达成合作时如何分配合作得到的收益,即收研究人们达成合作时如何分配合作得到的收益,即收益分配问题。益分配问题。 (2)(2)非合作博弈非合作博弈研究人们在利益相互影响的局

3、势中如何选决策使自研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。己的收益最大,即策略选择问题。 (3)(3)完全信息完全信息/ /不完全信息博弈:参与者对所有参与者的策略空间及策不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。 (4)(4)静态博弈和动态博弈静态博弈和动态博弈静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。者不知道先行动者的策略。动态

4、博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。者的策略。要素要素1)局中人局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为一个局中人。只有两个局中人的博弈现象称为“两人博弈两人博弈”,而多而多于两个局中人的博弈称为于两个局中人的博弈称为 “多人博弈多人博弈”。 2)策略策略:一局博弈中,每个局中人都有选择实际可行的完整的行:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动

5、的一动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。方案,称为这个局中人的一个策略。3)得失得失:一局博弈结局时的结果称为得失。每个局中人在一局博:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的局中人的“得失得失”

6、是全体局中人所取定的一组策略的函数,通常是全体局中人所取定的一组策略的函数,通常称为支付(称为支付(payoff)函数。)函数。 4)对于博弈参与者来说,存在着一对于博弈参与者来说,存在着一博弈结果博弈结果 。 5)博弈涉及到均衡博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均

7、衡,它是此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。一稳定的博弈结果。“囚徒困境囚徒困境”是是1950年美国兰德公司提出的博弈论模型。年美国兰德公司提出的博弈论模型。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,

8、二者都判刑八年。由于囚徒无法揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。信任对方,因此倾向于互相揭发,而不是同守沉默。警方怀疑他们作案,但并没有掌握他们作案的确凿证据,于是明确地分别告诉2名嫌疑人:对他们犯罪事实的认定及相应的量刑,完全取决于他们自己供认与否。有2个涉嫌共同作案偷窃的嫌疑人A和B被带进警察局。假定警方对2名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到对方的选择。v如果一方与警方合作,坦白所做违法之事,而另一方抵赖,招认方将无罪释放,另一方则会被判重刑8年;v如果双方都与警方合作共同招认,各被判刑5年;v如果双方均

9、不认罪,因为警察找不到其他证明他们违法的证据,则判刑1年。 A B 不坦白不坦白 坦白坦白不坦白不坦白A:判刑:判刑1年年B:判刑:判刑1年年A:无罪释放:无罪释放B:判刑:判刑8年年坦白坦白A:判刑:判刑8年年B:无罪释放:无罪释放A:判刑:判刑5年年B:判刑:判刑5年年现实中,基于人是理性的这一前提,无论同伙是否坦白,自现实中,基于人是理性的这一前提,无论同伙是否坦白,自己坦白总是比不坦白好。两个人这样一算计,己坦白总是比不坦白好。两个人这样一算计,最好的结果都最好的结果都是选择坦白,各判刑是选择坦白,各判刑5年。年。然而实际上,如果然而实际上,如果两人都抵赖,那么都会无罪释放两人都抵赖,

10、那么都会无罪释放,显然这,显然这个结果是最好的。但人在理性算计排除了这一结果。个结果是最好的。但人在理性算计排除了这一结果。这个故事讲得就是这个故事讲得就是囚徒困境囚徒困境,是在,是在1950年,由就职于兰德公年,由就职于兰德公司的梅里尔司的梅里尔弗拉德(弗拉德(Merrill Flood)和梅尔文)和梅尔文德雷希尔德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔)拟定出相关困境的理论,后来由顾问阿尔伯特伯特塔克(塔克(Albert Tucker)以囚徒方式阐述,并命名为)以囚徒方式阐述,并命名为“囚徒囚徒困境困境”。u 囚徒困境的囚徒困境的核心理念核心理念是:博弈

11、全输,合作双赢,怀疑或不信是:博弈全输,合作双赢,怀疑或不信任导致失败。任导致失败。u 要诀要诀:注重合作,力求双赢;注重策略选择,善于换位思考。:注重合作,力求双赢;注重策略选择,善于换位思考。u 囚徒困境是博弈论的囚徒困境是博弈论的非零和博弈非零和博弈中具代表性的例子,反映个中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但在现实中政治、经济、军事、企业经营、社会生活、组织但在现实中政治、经济、军事、企业经营、社会生活、组织管理等方面,也会频繁出现类似情况。管理等方面,也会频繁出现类似情况。非零和博弈是一种

12、合作下的博弈,博弈中各方非零和博弈是一种合作下的博弈,博弈中各方的收益或损失的总和不是零值,它区别于零和的收益或损失的总和不是零值,它区别于零和博弈。在经济学研究中比较有用。博弈。在经济学研究中比较有用。 在这种状况在这种状况时,自己的所得并不与他人的损失的大小相等,时,自己的所得并不与他人的损失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能即使伤害他人也可能“损人不利己损人不利己”,所以博,所以博弈双方存在弈双方存在 “双赢双赢”的可能,进而达成合作。的可能,进而达成合作。非零和博弈非零和博弈 之政治博弈之政治博弈现实中的囚徒困

13、现实中的囚徒困境境50年后军事解密,朝鲜战争的起因,因为中国和美国都有考虑,我国是怕韩国如果统一朝鲜后美军会侵略中国,而美军是怕如果朝鲜统一韩国后,中国军队会侵略日本,在占领日本后威胁美国本土。所以双方都是以出兵和不出兵考虑,如果出兵,会有经济损失,如果不出兵会威胁自己的领土,所以双方在”囚徒困境“模式下都选择了出兵,最后两败俱伤。 台湾要买美国的F16,中国希望欧洲对华军售,两个地区的政府都在为武器画着大价钱从而损失了国家的经济发展力,这也是囚徒困境的模式,都会担心如果一旦开战会对自己不利,如果我没有先进武器,你有先进武器,那么开战的话我就会吃亏。如果我有先进武器你没有的话,我就会得利。所以

14、我一定要有先进武器。殊不知如果两岸达成和平条约,双方都不购买先进武器,把资金都放在经济发展人民收入上,那才是真的双赢。政治博弈也是一种政治博弈也是一种非零和博弈非零和博弈。零和效应零和效应:实力相当的双方在谈判时做出大体相等的让步,方可取得结果,亦即每一方所得与所失的代数和大致为零,谈判便可成功。然而,人类社会发展的历程越来越走向“非零和”也就是我们现在所说的双赢。 眼下没有哪个国家能够主导世界,相互对抗只能导致双方人力财力的损失与浪费,合作共赢才是时代之流。需要注意的是,在大国与小国之间,我们则不能单纯地用非零和博弈去解释。毕竟这个世界仍然充斥着强权与武力。 两个公司互相竞争,二公司的广告互

15、相影响,即一公司的广告较两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。又会被对方夺走。此二公司可以有二选择此二公司可以有二选择:互相达成协议,减少广告的开支。(合作)互相达成协议,减少广告的开支。(合作)增加广告开支,设法提升广告的质量,压倒对方。(背叛)广告战广告战现实中的囚徒困现实中的囚徒困境之境之 观简单的数据,我们不难发现,无论是其

16、营业总收入、连锁店的总数量与扩张速度乃至平均到每家单店的营业力与收益率,在中国市场,麦当劳均大大逊色于对手肯德基,两者在中国市场的争锋结果,已形成了悬殊落差。 在比较肯德基与麦当劳的过程中还发现了这样一个事实,虽然这两家彼此都视对方为最重要、最直接的竞争对手,但也都在中国市场都取得了不俗的成绩,他们没有陷入同质化进而互打价格战的恶性竞争中去,却各以各的方式提升自己的竞争力,竞争的结果是实现了双赢。这也许更值得中国本土企业去思考和借鉴!1、肯德基的价格稍高,但量大;麦当劳的价格稍微便宜2、3元,但量少。 2、肯德基是百事可乐 麦当劳是可口可乐。 3、肯德基主要以鸡为主; 麦当劳有牛肉类和鸡类。

17、4、肯德基的背景墙主要是发展历程; 麦当劳的背景墙是以儿童纯真时代为主。5、肯德基的音乐轻快、悠闲;麦当劳的音乐纯真、童趣。肯德基与麦当劳肯德基与麦当劳间谍战间谍战商业战商业战关税战关税战现实生活中还有很多囚徒困境的例子:现实生活中还有很多囚徒困境的例子:大学生的博弈大学生的博弈大学生最关心的问题是以后的就业问题,能否找到好工作大学生最关心的问题是以后的就业问题,能否找到好工作和大学期间的努力使成正比的,这也是一个博弈问题(假和大学期间的努力使成正比的,这也是一个博弈问题(假设是自己和竞争者之间努力与否的博弈,排除其他因素),设是自己和竞争者之间努力与否的博弈,排除其他因素),问题如下表:问题

18、如下表:同学努力同学努力同学不努力同学不努力自己努力都能找到好工作 自己能找到好工作,同学不能自己不努力同学能找到好工作,自己不能 都不能过找到好工作 上面的问题是关乎以后我们命运的博弈。我们都知道上面的问题是关乎以后我们命运的博弈。我们都知道“近近朱者赤,近墨者黑朱者赤,近墨者黑”这句千古名言,环境对于我们的成长这句千古名言,环境对于我们的成长起着至关作用。起着至关作用。大学缺少的是学习氛围,我们要走出这个大学缺少的是学习氛围,我们要走出这个不利的困境,要相互影响(当然是好的方面),找到各自不利的困境,要相互影响(当然是好的方面),找到各自的目标,走出自己精彩的大学路。的目标,走出自己精彩的

19、大学路。大学四年很短,我们要大学四年很短,我们要抓紧这短暂的时间创造无限的财富,同学之间要相互团结、抓紧这短暂的时间创造无限的财富,同学之间要相互团结、沟通、合作、理解、帮助,一起实现各自的理想。沟通、合作、理解、帮助,一起实现各自的理想。囚徒困境的启示囚徒困境的启示反映个人最佳选择并非团体最佳选择。反映个人最佳选择并非团体最佳选择。注重合作,力求双赢,注重策略选择,善于换位思考。注重合作,力求双赢,注重策略选择,善于换位思考。必须正视生活中普遍存在的必须正视生活中普遍存在的“囚徒困境囚徒困境”现象,要想真正走出现象,要想真正走出困境仅靠博弈参与者的个人理性是难以办到的,它需要的是困境仅靠博弈

20、参与者的个人理性是难以办到的,它需要的是博博弈双方用长远目光看待问题,以集体理性为行动基础,从竞争弈双方用长远目光看待问题,以集体理性为行动基础,从竞争走向合作。走向合作。只有在集体理性的作用下,参与博弈的只有在集体理性的作用下,参与博弈的“囚徒囚徒”们们才能限制对方的机会主义行为,增强彼此的互相信任,最终才才能限制对方的机会主义行为,增强彼此的互相信任,最终才能摆脱困境,实现双赢。能摆脱困境,实现双赢。应用到国家中,国与国之间应避免斗争,应用到国家中,国与国之间应避免斗争,合作共赢才是王道。合作共赢才是王道。应用到应用到企业企业中,管理者应当尽量避免囚徒困境,从而引导每个局中,管理者应当尽量

21、避免囚徒困境,从而引导每个局中人都自觉地为整体努力。中人都自觉地为整体努力。应用到应用到个人个人中,中,每个人从自己收益最大化出发来考虑问题,最终每个人从自己收益最大化出发来考虑问题,最终往往落得两败俱伤的结果。人类的个人理性算计有时能导致集体往往落得两败俱伤的结果。人类的个人理性算计有时能导致集体的非理性的非理性聪明的人类会因自己的聪明而作茧自缚。聪明的人类会因自己的聪明而作茧自缚。作为一个作为一个理性的人,在陷入这种进退两难的囚徒困境的时候,必须计算下理性的人,在陷入这种进退两难的囚徒困境的时候,必须计算下厉害得失,采取合适的策略将可能面临的损失降到最低。厉害得失,采取合适的策略将可能面临的损失降到最低。感谢聆听

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(囚徒困境及其启示-1课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|