1、1 生活中的博弈论生活中的博弈论2 假如你正跟恋人用手机通电话,突然信号断了。这时,你会立即拨电话过去,还是等你的恋人拨电话过来?很显然,你是否应拨电话过去,取决于你的恋人是否会拨过来。如果你们其中一方要拨,那么另一方最好是等待;如果一方等待,那么另一方就最好是拨过去。因为如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中流逝。想一想想一想精品资料4 你怎么称呼老师?如果老师最后没有总结一节课的重点的难点,你是否会认为老师的教学方法需要改进?你所经历的课堂,是讲座式还是讨论式?教师的教鞭“不怕太阳晒,也不怕那风雨狂,只怕先生骂我笨,没有学问无颜见爹娘”“太阳当空照,花儿对我
2、笑,小鸟说早早早”5 这,就是博弈这,就是博弈!这,就是博弈这,就是博弈!*在一场博弈中,你必须考虑对方的选择以确定你自己在一场博弈中,你必须考虑对方的选择以确定你自己的最优选择,而对方也必须考虑你的选择来确定他的的最优选择,而对方也必须考虑你的选择来确定他的最优选择。最优选择。*你从博弈中得到的,不仅取决于你自己的行动,也取你从博弈中得到的,不仅取决于你自己的行动,也取决于对方的行动。决于对方的行动。如果你知道恋人不会打过来(如以前断线就是她在如果你知道恋人不会打过来(如以前断线就是她在等电话,如果你的手机包月额度很难用完而她的接听免等电话,如果你的手机包月额度很难用完而她的接听免费),那么
3、你的最优行动就是拨过去。费),那么你的最优行动就是拨过去。*博弈最本质的特征是:双方的行动相互影响又相互依赖博弈最本质的特征是:双方的行动相互影响又相互依赖6博弈无处不在7金庸小说中的珍珑棋局,多少高手未曾破解;而棋艺浅陋的虚竹“退一步”,闭了眼睛乱下一子,杀死自己白棋一片,反而天地一宽,破解迷局。8田忌赛马田忌赛马 比赛规则:马按奔跑的速度分为上中下三等,等次不同装饰不同,各家的马依等次比赛,三赛二胜。比赛前田忌按照孙膑的主意,第一场,用上等马鞍将下等马装饰起来,冒充上等马,与齐威王的上等马比赛;第二场,用上等马与齐威王的中等马比赛;第三场,田忌的中等马和齐威王的下等马比赛。结果二比一,田忌
4、赢了齐威王。在双方条件相当时,对策得当可以战胜对方;在双方条件相差很远时,对策得当也可将损失减低到最低程度。9猜硬币博弈-1,11,-11,-1-1,1正 面反 面猜硬币方猜硬币方盖盖硬硬币币方方正 面反 面取胜关键:不能让另一方猜到自己的策略 尽可能猜出对方策略10石头、剪子、布0,01,-1-1,1-1,11,-10,01,-1-1,10,0石 头剪 子布博弈方博弈方2石 头剪 子布博博弈弈方方111划拳博弈老虎鸡虫杠子老虎鸡虫杠子0,01,-10,0-1,1-1,10,01,-10,00,0-1,10,01,-11,-10,0-1,10,012关于博弈论的某些光环 博弈论很时髦,也有点神
5、秘,谁懂博弈论,博弈论很时髦,也有点神秘,谁懂博弈论,或在文章中使用博弈方法,似乎很有面子或在文章中使用博弈方法,似乎很有面子 Why?因为它以数学为基础,似乎不容易学因为它以数学为基础,似乎不容易学懂懂 它有广泛的用途,但很直接有效的运用似它有广泛的用途,但很直接有效的运用似乎也不多见乎也不多见 发展很快发展很快13博弈论之“数学”的特征 只是数学思维、数学符号只是数学思维、数学符号,有些符号怪模怪有些符号怪模怪样样,甚至不会读甚至不会读,但很少有什么艰深的数学但很少有什么艰深的数学 这里的符号比较麻烦,因为它和代数中的这里的符号比较麻烦,因为它和代数中的纯粹抽象而无意义的符号不同,在脑子里
6、纯粹抽象而无意义的符号不同,在脑子里要时刻记得它们的实际意义要时刻记得它们的实际意义 但要熟悉这种简捷、抽象的思维方式,记但要熟悉这种简捷、抽象的思维方式,记住这些符号的代表意义住这些符号的代表意义 所以,一个比较有效的学习方法是重复所以,一个比较有效的学习方法是重复14博弈论的学习特点 很多人对博弈论有所期待,似乎它有很很多人对博弈论有所期待,似乎它有很强的功效。的确,犹如数学,力量很强,强的功效。的确,犹如数学,力量很强,无处不在,作用非常广泛而深刻,但学无处不在,作用非常广泛而深刻,但学习的时候很枯燥习的时候很枯燥 因其与数学密切相关,关于博弈论素养因其与数学密切相关,关于博弈论素养的提
7、高要靠自己的学习、揣摩和领悟的提高要靠自己的学习、揣摩和领悟习薫悟化习薫悟化 注重数学的严谨,注意基本功注重数学的严谨,注意基本功 得鱼忘筌,得意忘形得鱼忘筌,得意忘形15本课程的阅读文献 张维迎张维迎博弈论与信息经济学博弈论与信息经济学为主要教材为主要教材 通俗读物:王则柯通俗读物:王则柯博弈论平话博弈论平话、白波、白波博博弈游戏弈游戏、潘天群、潘天群博弈生存博弈生存 参考书籍:谢识予参考书籍:谢识予经济博弈论经济博弈论、姚国庆、姚国庆博弈论博弈论(南开南开),拉斯缪森,拉斯缪森博弈与信息博弈与信息(北大与三联北大与三联)、弗登博格、弗登博格博弈论博弈论(人民大人民大学学),信息经济学信息经
8、济学(湖北湖北)期刊文章:非常多,关于博弈论基本问题的文期刊文章:非常多,关于博弈论基本问题的文章自章自1995陆续发表。但我国直接研究博弈论理陆续发表。但我国直接研究博弈论理论的文章不多,应用博弈论方法的文章非常多,论的文章不多,应用博弈论方法的文章非常多,但水平低但水平低16 博弈论(Game Theory)又名对策论,游戏论博弈论,英文为Game theory,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。博弈论试图研究既存在冲突又存在合作的情况下(如寡头垄断)人们的决策行为。博弈是一种势态,在该势态中,两个或更多的参与人都在追求他们各自的利益,没有人能够
9、支配结果。博弈的过程就是一个策略上的相互作用过程。这使得任何一方的行为都必须考虑到对方可能作出的反映。17博弈论研究对象博弈论研究对象 博弈论是研究理性的决策主体在其行博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策为发生直接的相互作用时的策略选择及策略均衡的理论。略均衡的理论。博弈分析的关键步骤是找出在别人选博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略(给择既定的情况下自己的最优反应策略(给自己带来最大收益的策略)。自己带来最大收益的策略)。18博弈论的产生和发展博弈论的产生和发展 学 弈 (孟 子 告子):弈秋,通国之善弈也。使弈秋侮二人弈,其一人专
10、心致志,惟弈秋之为听;一人虽听之,一心以为有鸿鹄将至,思援弓缴而射之。虽与之俱学,弗若之矣。为是其智弗若与?吾曰:非然也。1.博弈在中国博弈在中国19博弈又称博戏,是一门古老的游戏。博弈又称博戏,是一门古老的游戏。世本世本说,说,“乌曹作博乌曹作博”,乌曹乃是,乌曹乃是夏代著名之能工巧匠。千百年来,博弈夏代著名之能工巧匠。千百年来,博弈更是与人们的生活紧紧相连,从博棋到更是与人们的生活紧紧相连,从博棋到牌戏,从斗戏到彩票,中华民族的历史牌戏,从斗戏到彩票,中华民族的历史长河中就这样形成了别具风情的博弈文长河中就这样形成了别具风情的博弈文化化20从孙子兵法到三十六计从孙子兵法到三十六计从田忌赛马
11、到孙庞斗智从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从运筹帷幄到韬光养晦从曹刿论战到论持久战从曹刿论战到论持久战212.博弈论的开山之作博弈论的开山之作1943年,冯年,冯诺依曼和摩诺依曼和摩根斯顿发表根斯顿发表博弈论和经博弈论和经济行为济行为的一书,的一书,标志着博弈论作为一门独立科学的开始,标志着博弈论作为一门独立科学的开始,也标志着新古典经济学进入了一个新的发也标志着新古典经济学进入了一个新的发展阶段。展阶段。22 3.1994年三位获诺奖的博弈论学者年三位获诺奖的博弈论学者John NashJohn HarsanyLeihaden Selten234.1996年诺贝尔经年诺贝尔经济学奖得
12、主:詹姆济学奖得主:詹姆斯斯莫里莫里 斯:主要斯:主要贡献:不对称信息贡献:不对称信息条件下的激励理论条件下的激励理论245.2001年诺贝尔经济年诺贝尔经济学奖得主:迈克尔学奖得主:迈克尔斯斯宾塞:在不对称信息市宾塞:在不对称信息市场分析方面所做出开创场分析方面所做出开创性研究。性研究。256.2005年二位获诺奖的博弈论学者年二位获诺奖的博弈论学者Robert AumannThomas Shelling26二、基本概念二、基本概念局中人或参与者(局中人或参与者(Players)规则(规则(rules):规定博弈各方的行动):规定博弈各方的行动顺序、方式、以及最终的结果等。顺序、方式、以及最
13、终的结果等。策略(策略(Strategy):一整套的行动方案,一整套的行动方案,规定了各种情况下的行动。比如:敌进规定了各种情况下的行动。比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。我退,敌退我追,敌驻我扰,敌疲我打。27相机策略(相机策略(contingent strategy):仅在不):仅在不确定事件发生时才会采取的策略。如:人不确定事件发生时才会采取的策略。如:人不犯我,我不犯人;人若犯我,我必犯人。犯我,我不犯人;人若犯我,我必犯人。行动:局中人在特定条件下的行为行动:局中人在特定条件下的行为支付支付(Pay-off):博弈结束时,各方得到的:博弈结束时,各方得到的收益。收益。策略
14、均衡:参与者之间稳定的、可预测的互策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。动行为模式,就是策略均衡。28l上策均衡:l我所做的是不管你做什么我所能做的最好的l你所做的是不管我做什么你所能做的最好的lNASH均衡:l我所做的是给定你所做的我所能做的最好的l你所做的是给定我所做的你所能做的最好的29上策与上策均衡上策与上策均衡所谓上策,是指这样一种策略,即不管对手采取什么策略,这种策略都是最优的。而当对局者选择的都是上策的时候,这种均衡叫做上策均衡 所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有的对局者都不想再改变他们所选择的策略。上策均衡与前面的均衡的区别:上策均
15、衡与前面的均衡的区别:第一,完全竞争、垄断竞争等市场结构中最终实现的均衡状态都是在假定厂商是追求最大利润的,而且厂商在均衡状态也实现了最大利润 第二,在上述几种竞争模式中,可供厂商选择的竞争策略也相对较少。上策均衡是博弈均衡的一种特殊状态。30纳什均衡纳什均衡 纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。1上策均衡与纳什均衡的区别:上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。选择什么策略,你所选择的是最好的。纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策
16、纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。略,你所选择的是最好的。上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。均衡。31纳什均衡的意义所以“纳什均衡”是对冯诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。纳什
17、均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。32美丽心灵33金发女郎金发女郎约翰约翰追求追求金发女郎金发女郎追求追求其他女士其他女士雷哈德雷哈德追求追求金发女郎金发女郎0,02,1追求追求其他女士其他女士1,21,134A、B、C三人决斗,每人有2颗子弹,每次发一枪。A、B、C的命中概率分别为0.3、0.8、1.0。三人依次发射,两轮后对决结束。每次可以选择向对手发射,也可以放空枪。射中即死。问在这场博弈中A的最优策略。故事模型故事模型B(80%)A:30%C(100%)35分析过程的行动选择集合的行动选择集合()对空发射,()射,()射()对空发射,()射,()射如对空
18、发射,如对空发射,有有80%的可能杀死(必然射,因为一定选择射击,的可能杀死(必然射,因为一定选择射击,则必死);然后有则必死);然后有30%可能杀死(仅,;必射);可能杀死(仅,;必射);如未能杀死,则向射击(存活概率如未能杀死,则向射击(存活概率0.2)。对局结束。存活。对局结束。存活概率为概率为0.8*(0.3+0.7*0.2)0.352。如未射死,则射杀,然后要么成功射杀,要么被如未射死,则射杀,然后要么成功射杀,要么被射杀;存活概率为射杀;存活概率为0.2*0.3=0.06。总体存活概率。总体存活概率41.2%。概率树工具概率树工具射空射空射死射死0.8未射死未射死0.2射死射死0.
19、3未射死未射死0.7射射A不中不中0.2射死射死0.3未射死未射死0.7射不中射不中036对空发射:对空发射:存活概率为0.8(0.3+0.70.2)+0.20.3=41.2%A可以采取的行动可以采取的行动向向C发射:发射:存活概率为0.30.2(0.7+0.30.2)+0.741.2%=33.4%向向B发射:发射:存活概率为0.741.2%=28.84%37再说再说三个三个枪手枪手 A A和和B B似乎达成了某种默契:在似乎达成了某种默契:在C C被干掉之前,他被干掉之前,他们相互不是敌人。们相互不是敌人。这不难理解,毕竟人总要优先考虑对付最大的威这不难理解,毕竟人总要优先考虑对付最大的威胁
20、,同时这个威胁还为他们找到了共同利益,联手打胁,同时这个威胁还为他们找到了共同利益,联手打倒这个人,他们的生存机会都上升。而且,从悲观的倒这个人,他们的生存机会都上升。而且,从悲观的角度看,他们恐怕也活不到需要相互拼个你死我活的角度看,他们恐怕也活不到需要相互拼个你死我活的时候。时候。但这个但这个“同盟同盟”也是很不牢固的,两个人都在时也是很不牢固的,两个人都在时时权衡利弊,一旦背叛的好处大于默契的好处,他们时权衡利弊,一旦背叛的好处大于默契的好处,他们马上就会翻脸。马上就会翻脸。在这个在这个“同盟同盟”里,最忠诚的是里,最忠诚的是B B 只要只要C C不不死,他就不会背叛;死,他就不会背叛;
21、A A就要滑头多了,在前面轮流开就要滑头多了,在前面轮流开枪的例子中,他不朝枪的例子中,他不朝C C开枪,从同盟者的角度说,就开枪,从同盟者的角度说,就是没有履行义务,而把盟友送上危险的境地,这不是是没有履行义务,而把盟友送上危险的境地,这不是因为道德水平不同,而是处境不同。因为道德水平不同,而是处境不同。是是C C的头号目标,这个敌人一定要向他开枪的,的头号目标,这个敌人一定要向他开枪的,完全没有回旋的余地;而完全没有回旋的余地;而A A不同,他随时愿意牺牲不同,他随时愿意牺牲换取下次自己的先手之利。换取下次自己的先手之利。除了压力较小之外,而且还有一个动力驱使除了压力较小之外,而且还有一个
22、动力驱使A A背背叛,那就是一旦干掉叛,那就是一旦干掉C C后,的机会比他要大,他至后,的机会比他要大,他至少要保持先下手,才可能一争高下。少要保持先下手,才可能一争高下。38诸葛亮在隆中对中提出“跨有荆益、东有孙权、北图中原”,他舌战群儒,力劝东吴孙权与刘备联盟。三国中的博弈三国中的博弈联吴抗魏联吴抗魏所以,弱者总是有动力去维持一个稳定的三角形结构:与次强者联盟,但是却不愿真正消灭强者。39火烧赤壁一战,孙刘联军大败曹操,曹操北逃。诸葛亮明知关羽重义气,必然放走曹操,为何还将捉曹重任交给关羽?三国中的博弈三国中的博弈华容道华容道结论:诸葛亮并不想杀掉曹操曹操一死,刘备亦亡矣!有人会问:既然放
23、操,为何又设三重拦截?有人会问:既然放操,为何又设三重拦截?如果孙权知道诸葛放操,则孙刘联盟瓦解,因此,既如果孙权知道诸葛放操,则孙刘联盟瓦解,因此,既要放,又不能让孙权看出是有意放。要放,又不能让孙权看出是有意放。冷战期间,中、苏、美。尼克松访华冷战期间,中、苏、美。尼克松访华40揭示思想:揭示思想:一个人,在社会上的生存不仅取决于其能力大小,还要看其威胁到的人。现实例子:现实例子:总统竞选,实力最弱的开始时总是表现低调,实力强劲与实力中等者互相攻击,狼狈不堪,这时最弱的竞选者粉墨登场。“功高震主”“木秀于林,风必摧之”一个对他人利益不构成威胁的人,自然不会是他人意欲除掉一个对他人利益不构成
24、威胁的人,自然不会是他人意欲除掉的对象,反而能在各种政治风云中幸存下来。的对象,反而能在各种政治风云中幸存下来。能力最强,本事最大的人,反而最有可能走向悲剧结果。能力最强,本事最大的人,反而最有可能走向悲剧结果。的存活概率只有的存活概率只有14%。能力处于中间状态的,是最可能存活的。:能力处于中间状态的,是最可能存活的。:56%能力最弱的,也可以比最强者有更大的生存机会。:能力最弱的,也可以比最强者有更大的生存机会。:41.2%。41三国中的博弈孙刘联盟的瓦解 孙权不但孙权不但“火烧赤壁火烧赤壁”打败曹操,更在此后打败曹操,更在此后还长期承担了对抗曹操的主要任务。而刘备虽在还长期承担了对抗曹操
25、的主要任务。而刘备虽在赤壁之战中也出了力,但此后几年未与曹操打过赤壁之战中也出了力,但此后几年未与曹操打过大仗大仗(也就是没有尽联盟义务也就是没有尽联盟义务)。倒是趁此机会扫。倒是趁此机会扫荡地方势力,扩充地盘,直至占据两川,将曹操荡地方势力,扩充地盘,直至占据两川,将曹操赶出汉中,又派关羽北伐,水淹七军,不但取代赶出汉中,又派关羽北伐,水淹七军,不但取代了孙权原来的老二地位,甚至有可能击败曹操,了孙权原来的老二地位,甚至有可能击败曹操,成为新的老大。孙权地位跌落到老三,他的策略成为新的老大。孙权地位跌落到老三,他的策略也随之改变。也随之改变。于是孙权趁关羽北伐后方空虚之机,与曹操于是孙权趁关
26、羽北伐后方空虚之机,与曹操合谋,夺取了荆州,杀死关羽。结果是同盟破裂,合谋,夺取了荆州,杀死关羽。结果是同盟破裂,刘备兴兵报仇,又被孙权打败。蜀汉从此衰落,刘备兴兵报仇,又被孙权打败。蜀汉从此衰落,东吴也面临了两面作战的不利局面。东吴也面临了两面作战的不利局面。42三国中的博弈孙刘联盟的瓦解三国中的博弈孙刘联盟的瓦解 如果分析一下孙权的心理,我们可能对他的背信弃如果分析一下孙权的心理,我们可能对他的背信弃义有更多同情。赤壁之战尽管符合他的利益,但到底是义有更多同情。赤壁之战尽管符合他的利益,但到底是他出力挽救了刘备,此后他不但把荆州长期借给刘备,他出力挽救了刘备,此后他不但把荆州长期借给刘备,
27、还把妹妹嫁给了这个老头子。他尽了同盟的义务,曾与还把妹妹嫁给了这个老头子。他尽了同盟的义务,曾与曹操大战数次,不仅损兵折将曹操大战数次,不仅损兵折将(他的大将太史慈、董袭、他的大将太史慈、董袭、陈武等都在战斗中阵亡陈武等都在战斗中阵亡),他自己也险些在逍遥津送命。,他自己也险些在逍遥津送命。可从收益上说,他与刘备是可从收益上说,他与刘备是“牛打江山马坐殿牛打江山马坐殿”,感到,感到不平衡是正常的。不平衡是正常的。可是从对策论来看,孙权却犯了一个大错误,由于可是从对策论来看,孙权却犯了一个大错误,由于嫉妒,他过早和刘备翻脸,致使两败俱伤。这就好比枪嫉妒,他过早和刘备翻脸,致使两败俱伤。这就好比枪
28、手手A A突然翻脸向开火。坐收渔利的当然是突然翻脸向开火。坐收渔利的当然是C C。虽然曹操。虽然曹操的继任者曹丕没能抓住机会夹攻孙权,一举消灭这两个的继任者曹丕没能抓住机会夹攻孙权,一举消灭这两个敌手,但蜀和吴此后已经没有可能打败魏国了。敌手,但蜀和吴此后已经没有可能打败魏国了。那么,孙权的最优策略是什么?回想上面的枪手决那么,孙权的最优策略是什么?回想上面的枪手决斗就明白了。既然已经落到斗就明白了。既然已经落到A A的地位,就该以的地位,就该以A A的策略行的策略行事。让刘备去和曹操恶斗,自己扩充势力,养精蓄锐,事。让刘备去和曹操恶斗,自己扩充势力,养精蓄锐,随机应变。无论两者胜负,自己都能
29、从中渔利。随机应变。无论两者胜负,自己都能从中渔利。43面对诸葛亮的空城,司马懿真的是不敢攻城吗?三国中的博弈三国中的博弈空城计空城计非也!正是因为诸葛亮的存在,才使曹魏对其有所依赖。一旦诸葛亮倒下,也就是他被逐出朝廷甚至迫害的日子。“兔死狗烹”即使这个道理。既然既然“兔死狗烹兔死狗烹”,那么猎狗最好不要让兔子全部死掉。,那么猎狗最好不要让兔子全部死掉。44公路塞车,大家都遵守交规,一个人违规进入自行车道,得便宜,但如果每人都这样,则人人都吃亏。如每个人都守规矩,则一个不守规矩的就会获得好处,每个人都不守规矩,则人人都失利。45囚徒困境模型囚徒困境模型 两人因盗窃被捕,警方怀疑其有抢劫行为但未
30、获得确凿证据可以判他们犯了抢劫罪,除非有一人供认或两人都供认。即使两人都不供认,也可以判他们犯盗窃物品的轻罪。囚徒被分离审查,不允许他们之间或通信息,并交代政策如下:如果两人都供认,每个人都将因抢劫罪加盗窃罪被判3年监禁;如果两人都拒供,则两人都将因盗窃罪被判半年监禁;如果一人供认而另一个拒供,则供认这被认为有功而免受处罚,拒供者将因抢劫罪、盗窃罪以及拒供重判5年。46囚徒困境赢利表(囚徒困境赢利表(Payoff Table)Payoff Table)拒供供认拒供0.5年,0.5年5年,0年供认0年,5年3年,3年乙乙甲甲47囚徒困境囚徒困境每个囚徒都会发现每个囚徒都会发现如果对方拒供,则自己
31、供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择。如果对方供认,则自己供认将被判3年,而自己拒供则会被判5年,因此供认是较好的选择。由于每个囚徒都发现供认是自己更好的选择,因此,博弈的稳由于每个囚徒都发现供认是自己更好的选择,因此,博弈的稳定结果是两个囚徒都会选择供认。这就是博弈的纳什均衡。定结果是两个囚徒都会选择供认。这就是博弈的纳什均衡。攻守同盟?攻守同盟?很难达成:隔离审查,每个人都担心对方背弃盟约。很难达成:隔离审查,每个人都担心对方背弃盟约。48囚徒困境的启示囚徒困境的启示“囚徒的两难选择囚徒的两难选择”有着广泛而深刻的意有着广泛而深刻的意义。个人理性与集体理性
32、的冲突,各人追义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个求利己行为而导致的最终结局是一个“纳纳什均衡什均衡”,也是对所有人都不利的结局。,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互有当他们都首先替对方着想时,或者相互合谋合谋(串供串供)时,才可以得到最短时间的监时,才可以得到最短时间的监禁的结果。禁的结果。49经济学中的理性人成立吗?传统经济学的鼻祖亚当斯密在其传世经典国民财富的性质和原因的研究中这样描述市
33、场机制:“当个人在追求他自己的私利时,市场的看不见的手会导致最佳经济后果。”这就是说,每个人的自利行为在“看不见的手”的指引下,追求自身利益最大化的同时也促进了社会公共利益的增长。即自利会带来互利。传统经济学秉承了亚当斯密的思想。传统经济学认为:人的经济行为的根本动机是自利,自私是个好东西,每个人都有权追求自己的利益,没有私社会就不会进步,现代社会的财富是建立在对每个人自利权利的保护上的。因此经济学不必担心人们参与竞争的动力,只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公正,自然会增进社会福利。50个人理性与集体理性的冲突 但是囚徒困境的结果,恰恰表明个人理性
34、不能通但是囚徒困境的结果,恰恰表明个人理性不能通过市场导致社会福利的最优。每一个参与者可以过市场导致社会福利的最优。每一个参与者可以相信市场所提供的一切条件,但无法确信其他参相信市场所提供的一切条件,但无法确信其他参与者是否能与自己一样遵守市场规则。与者是否能与自己一样遵守市场规则。佛家讲因果律,儒家讲究佛家讲因果律,儒家讲究“财自道生,利缘义财自道生,利缘义取取”。从囚徒困境看来,如果一味地想算计别人,。从囚徒困境看来,如果一味地想算计别人,算来算去,最后算计到自己头上来了。如果我们算来算去,最后算计到自己头上来了。如果我们将囚徒困境中的有期徒刑改为死刑,那么将囚徒困境中的有期徒刑改为死刑,
35、那么“机关机关算尽太聪明算尽太聪明,反误了卿卿性命反误了卿卿性命”用在这里是再恰当用在这里是再恰当不过的了。不过的了。51现实中的囚徒困境现实中的囚徒困境、公共物品的提供(反倾销的应对,公共过道的路灯)、招商引资中的“政策竞赛”、文革中的“竞相揭发”、贸易战52“人质”方案长期关系和重复博弈报复与惩罚(株连制)如何走出囚徒困境如何走出囚徒困境53开车博弈开车博弈奔驰奔驰等待等待前行前行别克别克等待等待0,01,5前行前行5,1100,10054设想汤姆和吉米是两个顽皮的小孩,他们在小设想汤姆和吉米是两个顽皮的小孩,他们在小伙伴的鼓动下要进行一场关于勇气的比赛:两伙伴的鼓动下要进行一场关于勇气的
36、比赛:两人分别从一条独木桥的两端冲向对方,谁退却人分别从一条独木桥的两端冲向对方,谁退却谁就是谁就是“小鸡小鸡”。显然,如果两个人都向前冲,。显然,如果两个人都向前冲,则两败俱伤,设支付水平为则两败俱伤,设支付水平为-2;如果一个勇进;如果一个勇进而另一个退却,则勇进者受到小伙伴的欢呼,而另一个退却,则勇进者受到小伙伴的欢呼,退却者受到嘲讽,设支付分别为退却者受到嘲讽,设支付分别为4和和-1;若两人;若两人同时退却,则一起受到小伙伴的嘲笑,设支付同时退却,则一起受到小伙伴的嘲笑,设支付为为0,因为两人一起受到嘲笑比起一人单独受到,因为两人一起受到嘲笑比起一人单独受到嘲笑要好受些。嘲笑要好受些。
37、斗鸡博弈斗鸡博弈(chicken game)(胆小鬼博弈胆小鬼博弈)55 吉米吉米 退却退却 勇进勇进 退却退却 汤姆汤姆 勇进勇进0,0-1,44,-1-2,-2有两个均衡。实际会怎样?有两个均衡。实际会怎样?56 这个博弈也有两个纳什均衡:(进,退),(退,进)该例也有许多应用。有些公共产品的供给就属于此类问题。若村子里住的是两户富人,有一条路要修,一种可能的情况是,一家修路,另一家就不修;一家不修,另一家就得修。(总结一下,公共产品的供给可能是囚徒博弈,也可能是智猪博弈,还有可能是斗鸡博弈,依具体产品而论)57 冷战期间,苏美两个军事集团在世界各地抢占地盘,也是一种斗鸡博弈。一般来说,如
38、果一方已经抢占了一块地盘,另一方就设法占领另一块地盘,而不是与对手竞争同一块地盘。还有警察与游行队伍的例子。游行队伍与警察越来越近,这时候,定要有一方退下来。如果警察不让步,游行队伍便会后退;反过来,如果游行队伍来势很猛,警察就得撤退。58 夫妻间矛盾也是个斗鸡问题。一般来说,吵得厉害了,不是妻子回娘家躲一躲,就是丈夫到院子里抽支烟。当然,斗鸡博弈的一个重要问题是,究竟哪一方退下来,因为退下来虽比两败俱伤好,总归是一件丢面子的事情。若每一方都寄希望于对方退下阵来,两败俱伤的结局也可能出现。59政府与流浪汉博弈流浪汉寻找工作流浪政府救济3,2-1,3不救济-1,10,060什么是智猪博弈 智猪博
39、弈说的是,有两头非常聪明的猪(要不怎么叫智猪呢),一大一小共同生活在一个猪圈里。猪圈的一端有一个踏板,踏板连着开放饲料的机关。只要踏一下,在猪圈的另一端就会出现10个单位食物。经过精确的衡量,任何一头猪去踏这个踏板都会付出相当于两个单位食物的成本;每只猪都可以选择“踏”或者“不踏”踏板。那么,大猪小猪分别会做那么,大猪小猪分别会做什么选择呢?什么选择呢?61选择若小猪去踏,大猪若小猪去踏,大猪先候在槽边,则当先候在槽边,则当小猪赶到槽边时大小猪赶到槽边时大猪已经吃光了猪已经吃光了10个单位食物,小猪个单位食物,小猪不仅什么都没吃到不仅什么都没吃到,反而付出了,反而付出了2个个单位成本单位成本智
40、猪们的选择智猪们的选择若大猪去踏,小猪若大猪去踏,小猪先等候在是食槽边先等候在是食槽边,则大猪因时间耽,则大猪因时间耽搁只食得搁只食得6个单位个单位食物,小猪食得食物,小猪食得4个单位食物,大猪个单位食物,大猪扣除成本后赢利扣除成本后赢利4单位食物,小猪没单位食物,小猪没有成本因而赢利也有成本因而赢利也为为4单位食物;单位食物;两只猪一起去踏,然两只猪一起去踏,然后一起回槽边进食,后一起回槽边进食,则大猪由于食的更快则大猪由于食的更快可吃下可吃下8个单位食物个单位食物,小猪只能吃到个,小猪只能吃到个单位食物,扣除各自单位食物,扣除各自的成本,大猪实际赢的成本,大猪实际赢利利6个单位食物,小个单
41、位食物,小猪则赢利猪则赢利0个单位食个单位食物;物;两只猪都不去踏两只猪都不去踏,则大家都只能,则大家都只能赢利赢利0该博弈的赢利表见图4-162智智 猪猪 博博 弈弈 的的 收收 益益 矩矩 阵()阵()小猪小猪 踏踏 不踏不踏 踏踏大猪大猪 不踏不踏6,0 4,410,-2 0,0观察此博弈发现:小猪有优势策略观察此博弈发现:小猪有优势策略无论大猪踏或不踏,无论大猪踏或不踏,小猪选择不踏总是最合适的,但是大猪没有优势策略小猪选择不踏总是最合适的,但是大猪没有优势策略63改变方案一:减量方案改变方案一:减量方案投食仅原来的一半分量。结果是小猪大猪都投食仅原来的一半分量。结果是小猪大猪都不去踩
42、踏板了。小猪去踩,大猪将会把食物不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板,这个游戏如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。规则的设计显然是失败的。64改变方案二:增量方案改变方案二:增量方案投食为原来的一倍分量。结果是小猪、大猪都会去踩投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次踏板。谁想吃,谁
43、就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富把食物吃完。小猪和大猪相当于生活在物质相对丰富的的“共产主义共产主义”社会,所以竞争意识却不会很强。社会,所以竞争意识却不会很强。对于游戏规则的设计者来说,这个规则的成本相当高对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。让猪们去多踩踏板的效果并不好。65改变方案三:减量加移位方案改变方案三:减量加移位方案投食仅原来的一半分量,但同时将投食口移投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢
44、,小猪和大猪都在拼命到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。得。每次的收获刚好消费完。对于游戏设计者,这是一个最好的方案。成对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。本不高,但收获最大。66智猪博弈的启示智猪博弈的启示原版的原版的“智猪博弈智猪博弈”故事给了竞争中的弱者故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态
45、。为使车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝而能否完全杜绝“搭便车搭便车”现象,就要看游戏现象,就要看游戏规则的核心指标设置是否合适了。规则的核心指标设置是否合适了。67搭便车者 智猪博弈深刻的反映了经济和社会生活中的免费搭便车智猪博弈深刻的反映了经济和社会生活中的免费搭便车问题。无论大猪踏或不踏,小猪都选择不踏;给定小猪问题。无论大猪踏或不踏,小猪都选择不踏;给定小猪不踏,大猪最好去踏。不踏,大猪最好去踏。有意思的
46、是大猪选择踏在主观上是为了自己的利益,但有意思的是大猪选择踏在主观上是为了自己的利益,但在客观上小猪也享受到了好处。在经济学里,这头小猪在客观上小猪也享受到了好处。在经济学里,这头小猪被称为被称为“搭便车者搭便车者”。若全部的博弈主体都试图免费搭车,那么就可能陷入囚若全部的博弈主体都试图免费搭车,那么就可能陷入囚徒困境徒困境68请列举请列举“搭便车搭便车”的现象的现象冲开水、搞卫生;股市上庄家与散户冲开水、搞卫生;股市上庄家与散户20世纪世纪70年代末年代末80年代初,美国市场上私人标签年代初,美国市场上私人标签(private label)的软饮料价格便宜、质量较差,因此)的软饮料价格便宜、
47、质量较差,因此占有较低的市场份额。可口可乐公司和百事可乐公司占有较低的市场份额。可口可乐公司和百事可乐公司最初能容忍这些私人标签饮料的存在,因为它们是小最初能容忍这些私人标签饮料的存在,因为它们是小猪,威胁有限。可是没过多久,一家主要的私人标签猪,威胁有限。可是没过多久,一家主要的私人标签饮料供应商饮料供应商Cott公司通过挑衅性的定价和较高的质量,公司通过挑衅性的定价和较高的质量,从拥有较低市场份额的地区品牌,成长为一个拥有三从拥有较低市场份额的地区品牌,成长为一个拥有三分之一市场份额的、旗鼓相当的竞争者。此时,可口分之一市场份额的、旗鼓相当的竞争者。此时,可口可乐公司和百事可乐公司通过降低
48、价格这种进攻性的可乐公司和百事可乐公司通过降低价格这种进攻性的行动,使私人标签软饮料的市场份额立即瓦解了。行动,使私人标签软饮料的市场份额立即瓦解了。69改革与制度锁定 如果一个制度不是一个好制度,那么就会有人试图推翻这项制度并建立新的制度。但是,改革是有成本的,需要流汗,甚至流血。总有一些人充当“大猪”的角色,为改革东奔西走,承担为改革而付出的代价,而另一些人就象小猪一样,没有为改革付出努力,却坐享了改革的成果,是“免费搭车者”。如果这个社会人人都想搭免费车,都不站出来向旧制度发难,那么并不美好的旧制度就会被长期锁定。这也许可以解释为什么有些制度明明不合理却又长期存在的现象。70技术创新便车
49、 小企业通常模仿大企业的产品,等大企业通过广告打开市场后出售廉价模仿品。大企业作为“大猪”常会花钱进行研究开发、技术创新,而小企业作为小猪,常常等待大企业开发出新技术、新产品后模仿起技术和产品并生产和出售类似产品。71混合策略混合策略 小偷与守卫的博弈小偷与守卫的博弈混合策略博弈的几个原则混合策略博弈的几个原则 72小偷与守卫的博弈小偷与守卫的博弈 守卫守卫睡睡不睡不睡小偷小偷偷偷6,23,0不偷不偷0,20,0给定工人偷懒,老板的最优选择是监督;给定老板给定工人偷懒,老板的最优选择是监督;给定老板监督,工人的最优选择是不偷懒;给定工人不偷懒,监督,工人的最优选择是不偷懒;给定工人不偷懒,老板
50、的最优选择是不监督;给定老板不监督,工人老板的最优选择是不监督;给定老板不监督,工人的最优选择是偷懒;如此循环。的最优选择是偷懒;如此循环。73混合策略博弈的几个原则混合策略博弈的几个原则 策略组合不可能是单一的策略或者纯策略,而必须把不同的策略混合一起使用,这种博弈也称之为“混合策略”博弈,所达到的均衡也称之为混合策略均衡。第一,不能让对方事先知道自己可能采取的策略。第二,必须采取随机选择的原则。第三,选择策略的概率一定要使对方无机可乘。74重复博弈重复博弈 如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的