1、可编辑1 2022-5-21可编辑2主要内容主要内容一、博弈现象及基本概念一、博弈现象及基本概念二、完全信息静态博弈二、完全信息静态博弈 三、完全信息动态博弈三、完全信息动态博弈 四、不完全信息静态博弈四、不完全信息静态博弈 五、不完全信息动态博弈五、不完全信息动态博弈 六、不完全信息专题六、不完全信息专题2022-5-21可编辑3主要参考书主要参考书(1)(1)姚国庆:姚国庆:博弈论博弈论,高等教育出版社,高等教育出版社,2007.2007.(2)(2)罗云峰:罗云峰:博弈论教程博弈论教程,清华大学出版社、北,清华大学出版社、北京交通大学出版社。京交通大学出版社。(3)(3)张维迎:张维迎:
2、博弈论与信息经济学博弈论与信息经济学,上海三联书,上海三联书店,上海人民出版社,店,上海人民出版社,20042004。(4)(4)施锡铨,施锡铨,博弈论博弈论,上海财经大学出版社,上海财经大学出版社,20022002。2022-5-21可编辑4(5)(5)张守一,张守一,现代经济对策论现代经济对策论,高等教育出版社,高等教育出版社,19981998。(6)(6)钱颂迪,钱颂迪,运筹学运筹学,清华大学出版社,清华大学出版社,19961996。(7)(7) 美美 艾里克艾里克. .拉斯缪森:拉斯缪森:博弈与信息博弈与信息,北京,北京大学出版社,大学出版社,20032003。(8)(8) 美美 弗登
3、博格:弗登博格:博弈论博弈论,中国人民大学出版,中国人民大学出版社,社,20022002。2022-5-21可编辑5第一讲第一讲 博弈现象与基本概念博弈现象与基本概念1 1博弈现象博弈现象2. 2. 博弈概念博弈概念3. 3. 博弈描述博弈描述4. 4. 博弈练习博弈练习5. 5. 关于博弈论关于博弈论2022-5-21可编辑61 1博弈现象博弈现象 田忌赛马:田忌赛马:正确的策略可以反败为胜。正确的策略可以反败为胜。囚徒困境:囚徒困境:认罪认罪不认罪不认罪认罪认罪(-5,-5-5,-5)(0,0,-10-10)不认罪不认罪(-10,0-10,0)(-1,-1-1,-1)甲甲乙乙理性的人是自私
4、自利的;理性的人是自私自利的;理性选择不是全局最优。理性选择不是全局最优。2022-5-21可编辑7经济合作:经济合作: 合作合作欺骗欺骗合作合作(2,22,2)(-2,4-2,4)欺骗欺骗(4,4,-2-2)(0,00,0)甲甲乙乙诚信的价值;诚信的价值;一报还一报策略;一报还一报策略;人类生存环境启示。人类生存环境启示。2022-5-21可编辑8长街上的超市长街上的超市 (海滩占位模型)(海滩占位模型) 01/23/411/4AO资源浪费还是理性的必然?资源浪费还是理性的必然?其它相似情形:其它相似情形:旅行社的热门路线;黄金时间旅行社的热门路线;黄金时间的电视节目;总统竞选。的电视节目;
5、总统竞选。2022-5-21可编辑9狩猎与投资狩猎与投资狩猎:狩猎: 两个猎人围住一头鹿,各卡住两个关口中的两个猎人围住一头鹿,各卡住两个关口中的一个,齐心协力即可成功获得并平分猎物。此时一个,齐心协力即可成功获得并平分猎物。此时有一群兔子跑过,任何一人去抓兔子必可成功,有一群兔子跑过,任何一人去抓兔子必可成功,但鹿会跑掉。但鹿会跑掉。 他们会坚持猎鹿还是去抓兔子?他们会坚持猎鹿还是去抓兔子?2022-5-21可编辑10共同投资:共同投资: 双方共同投资一个大项目,可期望有较大双方共同投资一个大项目,可期望有较大收益。此时如某方抽出资金去进行小项目投资,收益。此时如某方抽出资金去进行小项目投资
6、,必可成功获小利,但会使共同项目陷入困境,必可成功获小利,但会使共同项目陷入困境,使对方蒙受损失。使对方蒙受损失。 投资者会如何选择?投资者会如何选择?2022-5-21可编辑11旅行者困境旅行者困境 两个旅行者花瓶被摔坏,向航空公司索赔。两个旅行者花瓶被摔坏,向航空公司索赔。航空公司知道价格约为八九十元,但不知道确切航空公司知道价格约为八九十元,但不知道确切价格。于是请两位旅客在价格。于是请两位旅客在100100元以内自己写下花元以内自己写下花瓶的价格。瓶的价格。 如两人写的一样,就认为他们讲真话,并按如两人写的一样,就认为他们讲真话,并按所写数额赔偿;如果两人写的不一样,就认定低所写数额赔
7、偿;如果两人写的不一样,就认定低者讲真话,并照此价格赔偿。同时,对讲真话的者讲真话,并照此价格赔偿。同时,对讲真话的旅客奖励旅客奖励2 2元钱,对讲假话的旅客罚款元钱,对讲假话的旅客罚款2 2元。元。 理性原则下,他们会写多少价格呢?理性原则下,他们会写多少价格呢?2022-5-21可编辑12什么是博弈:什么是博弈: 个人或团体间在依存和对抗、合作和冲突个人或团体间在依存和对抗、合作和冲突中的决策问题。中的决策问题。 博弈论研究博弈过程中的理性行为。博弈论研究博弈过程中的理性行为。2. 2. 博弈概念博弈概念2022-5-21可编辑13如何理解理性行为:如何理解理性行为: 自身利益最大;自身利
8、益最大; 持续地有意图的行动;持续地有意图的行动; 不对动机妄加猜测;不对动机妄加猜测; 不考虑道德问题;不考虑道德问题; 只研究合法问题;只研究合法问题; 盈利函数有多重标准。盈利函数有多重标准。2022-5-21可编辑14博弈三要素博弈三要素 局中人局中人(参与人)参与人)players:决策主体决策主体;自然人、团体或自然人、团体或“虚拟局中人虚拟局中人”;有可供选择的策略和明确定义的利益函数;有可供选择的策略和明确定义的利益函数;分为两人和多人分为两人和多人2022-5-21可编辑15策略(战略)策略(战略)strategies:采取行动的规则;采取行动的规则;可以是一次行动也可以是一
9、个行动序列;可以是一次行动也可以是一个行动序列;可以是纯策略也可以是混合策略;可以是纯策略也可以是混合策略;分为有限和无限。分为有限和无限。支付(盈利函数)支付(盈利函数)payoff:对应于某策略组合的局中人利益或损失;对应于某策略组合的局中人利益或损失;确定的或是期望的;确定的或是期望的;分为零和和非零和。分为零和和非零和。2022-5-21可编辑16扩展术语:扩展术语:信息:信息:信息集;信息集;完全信息(完全信息(completecomplete);完美信息(完美信息(perfectperfect)。共同知识:共同知识:双方可能获取的相同信息;双方可能获取的相同信息; 彼此都能算清楚。
10、彼此都能算清楚。博弈结果:博弈结果:均衡策略组合;均衡行动组合。均衡策略组合;均衡行动组合。均衡:均衡:所有局中人最优策略的组合。所有局中人最优策略的组合。2022-5-21可编辑17博弈的策略型(标准型、正则型)表述:博弈的策略型(标准型、正则型)表述:指定指定n n个局中人,以及他们各自的纯策略空间个局中人,以及他们各自的纯策略空间和这些局中人各自的支付(盈利)函数和这些局中人各自的支付(盈利)函数我们将该博弈表示为:我们将该博弈表示为:niSi,2,1,niSSSuni,2,1),(21,;,2121nnuuuSSSG3. 3. 博弈描述博弈描述2022-5-21可编辑18例:寡头竞争问
11、题例:寡头竞争问题),(),(; 0, 021221121qqqqqqG策略型表述多适用于静态博弈。策略型表述多适用于静态博弈。另一种表述方式是扩展式表述,两种表述形式几另一种表述方式是扩展式表述,两种表述形式几乎是完全等价的,但是扩展式表述更适合于讨论乎是完全等价的,但是扩展式表述更适合于讨论动态博弈。动态博弈。2022-5-21可编辑19房地产开发实例房地产开发实例 双方:双方:A A,B B 策略:策略:开发投资开发投资1 1亿元;不开发,投资亿元;不开发,投资0 0 售价:售价:高需:高需:1.41.4亿元亿元( (两栋两栋) ),1.81.8亿元亿元( (一栋一栋) ); 低需:低需
12、:0.70.7亿元亿元( (两栋两栋) ),1.11.1亿元亿元( (一栋一栋) )。2022-5-21可编辑20结果:结果:高需,高需,( (开,不开开,不开) ), (0.8(0.8,0)0) 高需,高需,( (不开,开不开,开) ), (0(0,0.8)0.8) 高需,高需,( (开,开开,开) ), (0.4(0.4,0.4)0.4) 高需,高需,( (不开,不开不开,不开) ),(0(0,0)0) 低需,低需,( (开,不开开,不开) ), (0.1(0.1,0)0) 低需,低需,( (不开,开不开,开) ), (0(0,0.1)0.1) 低需,低需,( (开,开开,开) ), (-
13、0.3(-0.3,-0.3)-0.3) 低需,低需,( (不开,不开不开,不开) ),(0(0,0)0)2022-5-21可编辑21策略型表述:策略型表述: (两人有限博弈;矩阵形式)两人有限博弈;矩阵形式)开发开发不开发不开发开发开发(0.4,0.40.4,0.4)(0.8,00.8,0)不开发不开发(0,0,0.80.8)(0,00,0)A B高需求情况高需求情况低需求情况?低需求情况?2022-5-21可编辑22房地产博弈分析房地产博弈分析 假设:假设:同时决策;市场需求双方已知同时决策;市场需求双方已知若市场需求大,双方开发,各得若市场需求大,双方开发,各得0.40.4万元。万元。若市
14、场需求小,依赖于对方行动。若市场需求小,依赖于对方行动。若市场不确定,依赖对市场的判断及对方行动。若市场不确定,依赖对市场的判断及对方行动。例:例:P P0.5,0.5,最坏情况期望盈利最坏情况期望盈利500500万元,开发。万元,开发。P P0.3,0.3,对方开发概率对方开发概率31/4031/40时,开发;否时,开发;否则,不开发。(?)则,不开发。(?)2022-5-21可编辑23关键问题:关键问题: 对自然状态的概率估计;对自然状态的概率估计; 不同时间决策(决策顺序);不同时间决策(决策顺序); 对对方先验信息的估计(即估计对方对信对对方先验信息的估计(即估计对方对信息的掌握程度)
15、。息的掌握程度)。现实困难:现实困难: 对市场了解程度不同;对市场了解程度不同;对对方了解程度不同;对对方了解程度不同;如何向对方暗示自己的行动。如何向对方暗示自己的行动。2022-5-21可编辑244.4.博弈练习博弈练习游戏一:游戏一:心灵感应心灵感应 两个人一组,独立写出两个人一组,独立写出1 1至至1010之间的任之间的任意意5 5个数。如果不重复则得奖;否则受罚。个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?获胜的秘诀是什么?2022-5-21可编辑25游戏二:游戏二:海盗逃生海盗逃生 有有5 5个海盗,即将被处死刑。法官愿意个海盗,即将被处死刑。法官愿意给他们一个机会。从给
16、他们一个机会。从100100个黄豆中随意抓取,个黄豆中随意抓取,最多可以全抓,最少可以不抓,可以和别最多可以全抓,最少可以不抓,可以和别人抓的一样多。抓得最多的和最少的要被人抓的一样多。抓得最多的和最少的要被处死。处死。 如果你第一个抓,你抓几个?如果你第一个抓,你抓几个?2022-5-21可编辑26游戏三:游戏三:100元怎么分?元怎么分? 你看见两个小孩在玩耍,出于好奇,你你看见两个小孩在玩耍,出于好奇,你给他们给他们100100元,让他们猜拳。猜赢者决定怎元,让他们猜拳。猜赢者决定怎么分这么分这100100元,而输者如果同意赢者的分配元,而输者如果同意赢者的分配比例,那么他们将各有所得,
17、如果不同意,比例,那么他们将各有所得,如果不同意,那么这那么这100100元,你将收回。元,你将收回。 请你替赢者考虑一下,怎样分配,赢者请你替赢者考虑一下,怎样分配,赢者既得到最大利益,又能让输者也同意呢?既得到最大利益,又能让输者也同意呢?2022-5-21可编辑27游戏四:游戏四:一元钱竞拍一元钱竞拍 给一元钱钞票开出你的价钱,使自己获益最大或给一元钱钞票开出你的价钱,使自己获益最大或损失最少;每次叫价以损失最少;每次叫价以5 5分钱为单位;开价最高者得分钱为单位;开价最高者得到这一元钱;出价最高和次高者一并按所开的价钱支到这一元钱;出价最高和次高者一并按所开的价钱支付。付。 斜坡上的均
18、衡;斜坡上的均衡; “骑虎难下骑虎难下”的博弈;的博弈; “协和谬误协和谬误”2022-5-21可编辑28游戏五:游戏五:强盗分赃强盗分赃 有五个强盗抢得有五个强盗抢得100100枚金币,在如何分赃枚金币,在如何分赃问题上争吵不休。于是他们决定:问题上争吵不休。于是他们决定: (1 1)抽签决定自己的号码()抽签决定自己的号码(1 1,2 2,3 3,4 4,5 5);); (2 2)由)由1 1号提出分配方案,然后号提出分配方案,然后5 5人表决,人表决,如果方案超过半数同意就通过,否则他将被如果方案超过半数同意就通过,否则他将被仍进大海喂鲨鱼;仍进大海喂鲨鱼; 2022-5-21可编辑29
19、 (3 3)1 1号死后,由号死后,由2 2号提方案,号提方案,4 4人表决,人表决,当且仅当超过半数同意方案通过,否则当且仅当超过半数同意方案通过,否则2 2号同号同样被仍进大;样被仍进大; (4 4)依次类推,直到找到一个每个人都接)依次类推,直到找到一个每个人都接受的方案(当然,如果只剩下受的方案(当然,如果只剩下5 5号,他当然接号,他当然接受一个人独吞的结果)。受一个人独吞的结果)。 如果你是第一个强盗,你该如何提出分配如果你是第一个强盗,你该如何提出分配方案才能使自己的收益最大化呢?方案才能使自己的收益最大化呢? 2022-5-21可编辑305. 5. 关于博弈论关于博弈论博弈分类
20、博弈分类:合作、非合作:合作、非合作:是否存在一个具有约束力的协议(是否存在一个具有约束力的协议(binding binding agreementagreement)前者强调团体理性(效率、公正、公平)前者强调团体理性(效率、公正、公平)后者强调个人理性(最优决策,不保证效率)后者强调个人理性(最优决策,不保证效率)2022-5-21可编辑31完全信息与不完全信息:完全信息与不完全信息:每一个局中人对自己及其它局中人是否有每一个局中人对自己及其它局中人是否有完全的了解;完全的了解;包括局中人特征、策略空间、盈利函数等包括局中人特征、策略空间、盈利函数等知识。知识。动态与静态:动态与静态:行动
21、的先后顺序行动的先后顺序; ;是否同时(或不同时但对方不知)。是否同时(或不同时但对方不知)。2022-5-21可编辑32发展历史:发展历史:19441944Von Neumann & Morgenstern Von Neumann & Morgenstern “The theory The theory of games and economic behaviorof games and economic behavior”19501950 Nash & 1953Nash & 1953Shapley Shapley “讨价还价讨价还价”模型模型19501950、1951 1951 Nash
22、Nash 非合作博弈非合作博弈19501950Tucker PrisonersTucker Prisoners dilemma dilemma19531953 Gillies & Shapley Gillies & Shapley 合作博弈合作博弈1965 1965 Selton Selton 动态分析动态分析;“精炼纳什均衡精炼纳什均衡”19671967、19681968HarsanyiHarsanyi“不完全信息不完全信息”19941994 Nash Nash 、SeltonSelton、 Harsanyi Harsanyi诺贝尔经济诺贝尔经济学奖学奖2022-5-21可编辑33纳什的传奇
23、人生 19281928年出生于一个电子工程师家庭。年出生于一个电子工程师家庭。 17 17岁进入今卡耐基梅隆大学,专攻数学。岁进入今卡耐基梅隆大学,专攻数学。2020岁时进入普林斯顿大学攻读博士学位。岁时进入普林斯顿大学攻读博士学位。 1949 1949年,年,2121岁的纳什写下论文岁的纳什写下论文多人博多人博弈的均衡点弈的均衡点。 1950 1950年以论文年以论文非合作型博弈非合作型博弈获得数获得数学博士学位。学博士学位。2022-5-21可编辑342022-5-21可编辑35 毕业后先后在兰德研究所、普林斯顿大毕业后先后在兰德研究所、普林斯顿大学、学、MITMIT工作。工作。 1957
24、 1957年他与年他与MITMIT学生爱莉西娅结婚。学生爱莉西娅结婚。 在而立之年患上了妄想型精神分裂症,在而立之年患上了妄想型精神分裂症,九十年代逐渐恢复了正常。九十年代逐渐恢复了正常。 1994 1994年纳什博士获诺贝尔经济学奖。年纳什博士获诺贝尔经济学奖。 20022002年来北京参加年来北京参加 “国际数学家大会国际数学家大会” 2022-5-21可编辑362022-5-21可编辑37电影电影 “美丽心灵美丽心灵”2022-5-21可编辑38 静态静态 动态动态 完全完全信息信息 完全信息静态博弈完全信息静态博弈纳什均衡纳什均衡纳什(纳什(1950,1951) 完全信息动态博弈完全信
25、息动态博弈子博弈精炼纳什均衡子博弈精炼纳什均衡泽尔滕(泽尔滕(1965) 不完不完全信全信息息 不完全信息静态博弈不完全信息静态博弈贝叶斯纳什均衡贝叶斯纳什均衡海萨尼(海萨尼(19671968) 不完全信息动态博弈不完全信息动态博弈精炼贝叶斯纳什均衡精炼贝叶斯纳什均衡泽尔滕(泽尔滕(1975)博弈论体系博弈论体系2022-5-21可编辑39第二讲第二讲完全信息静态博弈完全信息静态博弈1.1.矩阵博弈矩阵博弈2.2.累次严优均衡累次严优均衡3.3.纳什均衡纳什均衡4.4.混合策略纳什均衡混合策略纳什均衡5.5.纳什均衡的存在性与多重性纳什均衡的存在性与多重性2022-5-21可编辑401. 1.
26、 矩阵博弈矩阵博弈什么是矩阵博弈:什么是矩阵博弈: 两人零和有限策略博弈;两人零和有限策略博弈; 可用矩阵形式表述。可用矩阵形式表述。 矩阵元素为局中人矩阵元素为局中人A A的赢得,亦即的赢得,亦即B B的损失。的损失。 例:例:用矩阵形式表述田忌赛马博弈(?)用矩阵形式表述田忌赛马博弈(?)2022-5-21可编辑41有鞍点情形有鞍点情形:存在最优纯策略存在最优纯策略例:例:表中数据为表中数据为I I的赢得的赢得 II III I 123min161882324239110104 3063max962博弈哲学博弈哲学:从最坏处考虑,争取最好结从最坏处考虑,争取最好结果果2022-5-21可编
27、辑42无鞍点情形:无鞍点情形:最优混合策略最优混合策略例:例: II III I 12min111552797max11?)1 ,(),();1 ,(),(2121yyxx设最优混合策设最优混合策略:略:2022-5-21可编辑43对局中人对局中人I:2022-5-21可编辑44I I的最优混合策略为的最优混合策略为 同理,同理,IIII的最优混合策略为的最优混合策略为G G8 8同理可求局中人同理可求局中人IIII的最优混合策略(?)的最优混合策略(?))21,21(),(21)43,41(),(212022-5-21可编辑452.2.累次严优均衡累次严优均衡占优策略均衡占优策略均衡(严格严
28、格)劣策略:劣策略:无论对方如何选择都更差无论对方如何选择都更差。占优策略:占优策略:无论对方如何选择存在唯一最优。无论对方如何选择存在唯一最优。占优策略均衡:占优策略均衡:所有局中人占优策略的组合。所有局中人占优策略的组合。特点:特点:只要求每个人理性,并不要求知道其它只要求每个人理性,并不要求知道其它人是不是理性。人是不是理性。2022-5-21可编辑46例:裁军问题例:裁军问题 以巴以巴 武装武装裁军裁军武装武装(3000,3000)( 10000 , )裁军裁军( , 10000)(0,0)例:例:囚徒困境中的(认罪,认罪)囚徒困境中的(认罪,认罪)例:例:房地产投资市场大情况下(开发
29、,开发)房地产投资市场大情况下(开发,开发)2022-5-21可编辑47重复剔除的占优均衡重复剔除的占优均衡 (iterated elimination)也称为累次严优均衡。也称为累次严优均衡。通过重复剔除劣战略剩下唯一的战略组合。通过重复剔除劣战略剩下唯一的战略组合。如果存在则称为重复剔除占优可解的。如果存在则称为重复剔除占优可解的。(dominance solvabledominance solvable) 特点:特点:不仅要求每个人理性,还要求知道其不仅要求每个人理性,还要求知道其它人理性。理性是共同知识。它人理性。理性是共同知识。2022-5-21可编辑48例:智猪博弈例:智猪博弈按钮
30、喂食:一次供应量为按钮喂食:一次供应量为8 8,代价为,代价为2 2。大猪先到大猪先到 7 7: :1 1; ;同时到同时到 5 5: :3 3; ;小猪先到小猪先到 4 4: :4 4 小猪小猪大猪大猪 按按等等按按(3,1)(2,4)等等(7,1)(0,0)2022-5-21可编辑49分析:分析:小猪有占优策略,大猪没有,所以小猪有占优策略,大猪没有,所以不存在占优均衡;不存在占优均衡;在在“理性理性”为共同知识的情况下,存为共同知识的情况下,存在重复剔除的占优均衡,即(大猪按,小在重复剔除的占优均衡,即(大猪按,小猪等)。猪等)。应用:应用: 此为此为“多劳不多得,少劳不少得多劳不多得,
31、少劳不少得”的的奇怪情形,是一种有趣的社会现象。经济奇怪情形,是一种有趣的社会现象。经济学中称为学中称为“搭便车现象搭便车现象”2022-5-21可编辑50 III LMRU(4,3)(5,1)(6,2)M(2,1)(8,4)(3,6)D(3,0)(9,6)(2,8)无论局中人无论局中人I I怎样决策,局中人怎样决策,局中人IIII与其选取策略与其选取策略M M还不还不如选取策略如选取策略R R。对于局中人对于局中人IIII来说,来说,M M是个劣策略。是个劣策略。可以去掉可以去掉IIII的的“M M”列。列。 例:例:2022-5-21可编辑51假定假定IIII不选不选M M,对于对于I I
32、来说来说M M和和D D是劣策略。是劣策略。 III LRU(4,3)(6,2)M(2,1)(3,6)D(3,0)(2,8)2022-5-21可编辑52故故I I选择选择U U。这时,这时,IIII选择选择L L而不选而不选R R。可以预测博弈的合理结局可能是(可以预测博弈的合理结局可能是(U U,L L)即(即(4 4,3 3)。)。 III LRU(4,3) (6,2) III LU(4,3)2022-5-21可编辑53严优均衡的局限严优均衡的局限有时无法开始累次严优的剔除;有时无法开始累次严优的剔除;例:房地产投资中市场小的情况例:房地产投资中市场小的情况反常现象:反常现象:盈利函数取极
33、端值时;盈利函数取极端值时; 如果双方都存在严劣策略,从不同人开如果双方都存在严劣策略,从不同人开始的结果一致;始的结果一致;与混合策略的优劣比较。与混合策略的优劣比较。2022-5-21可编辑54 III LRU(7, 9) (1000, 8.5)D(6, 5) (5, 4.5) 分析:分析: 累次严优过程产生了唯一解(累次严优过程产生了唯一解(U U,L L)。)。 然而,不管局中人然而,不管局中人I I如何行动,局中人如何行动,局中人IIII取取R R仅比取仅比取L L在盈利上差在盈利上差0.50.5。I I选策略选策略U U要冒极大的风险,策略要冒极大的风险,策略D D比比U U更加稳
34、健。更加稳健。 所以,局中人所以,局中人I I不会选不会选U U,而是选择而是选择D D。稳健性。稳健性。例:例:2022-5-21可编辑553. 3. 纳什均衡纳什均衡定义:定义: 有有n n个局中人的策略式表述博弈个局中人的策略式表述博弈 G=S G=S1 1, ,S,Sn n;u;u1 1, ,u,un n , 策略组合策略组合s s* * = (s = (s1 1* *, ,s,si i* *, ,s,sn n* *) )是一个是一个纳什均衡,如果对于每一个纳什均衡,如果对于每一个i i,s si i* *是给定其是给定其它局中人选择它局中人选择 s s-i-i* *=(s=(s1 1
35、* *, ,s,si-1i-1* *,s,si+1i+1* *, ,s,sn n* *) ) 的情况下第的情况下第i i个局中人的最优策略,即个局中人的最优策略,即 u ui i(s(si i* *,s,s-i-i* *) ) u ui i(s(si i,s,s-i-i* *) , ) , s si i S Si i, , i i 2022-5-21可编辑56或者用另一种表述方式:或者用另一种表述方式:s si i* *是下述最大化问题的解:是下述最大化问题的解: s si i* * argmaxargmax u ui i(s(s1 1* *, ,s,si-1i-1* *,s,si i,s,s
36、i+1i+1* *, ,s,sn n* *),), i=1,2, i=1,2,n n。s si i S Si i结论:结论: 最优对任一参与者的任一策略成立;最优对任一参与者的任一策略成立; 是 一 种 可 以 自 动 实 施 的 协 议是 一 种 可 以 自 动 实 施 的 协 议 ( ( s e l f -s e l f -enforcing)enforcing)2022-5-21可编辑57两人有限博弈纳什均衡的确定两人有限博弈纳什均衡的确定 例:用表上作业法寻找例:用表上作业法寻找nashnash均衡均衡 BA LCRU(0,4) (4,0) (5,3)M(4,0) (0,4) (5,3
37、)D(3,5) (3,5) (6,6)2022-5-21可编辑58对纳什均衡的理解对纳什均衡的理解“一致性一致性”特征:特征:局中人预测到均衡;局中人也预测到其它局中人预测到均衡;局中人也预测到其它人预测到均衡;人预测到均衡;没有局中人有兴趣作不同的选择。没有局中人有兴趣作不同的选择。是局中人的一致性预测;但不一定最好。是局中人的一致性预测;但不一定最好。2022-5-21可编辑59与严优均衡的关系:与严优均衡的关系:(1 1)每个占优均衡、重复剔除的占优均衡)每个占优均衡、重复剔除的占优均衡一定是纳什均衡,反之则不然。一定是纳什均衡,反之则不然。(2 2)纳什均衡一定是在重复剔除严劣策略)纳
38、什均衡一定是在重复剔除严劣策略过程中没有剔除的策略组合,反之则不然。过程中没有剔除的策略组合,反之则不然。(3 3)纳什均衡有强弱之分。强纳什均衡;)纳什均衡有强弱之分。强纳什均衡;弱纳什均衡弱纳什均衡。允许弱劣策略存在。允许弱劣策略存在。2022-5-21可编辑60例:市场进入博弈例:市场进入博弈参与人:参与人:在位者;进入者在位者;进入者策略:策略:在位者:默许、斗争;在位者:默许、斗争; 进入者:进入、不进入。进入者:进入、不进入。假定:假定:进入之前的垄断利润为进入之前的垄断利润为300300,进入之后寡头利润为进入之后寡头利润为100100, 进入成本为进入成本为1010。2022-
39、5-21可编辑61 在位者在位者进入者进入者 默许默许斗争斗争进入进入(40,50)(10,0)不进入不进入(0,300)(0,300)纳什均衡分析:纳什均衡分析:(进入,默许)是强纳什均衡,(进入,默许)是强纳什均衡,(不进入,斗争)是弱纳什均衡。(不进入,斗争)是弱纳什均衡。2022-5-21可编辑62重复剔除弱劣策略方法:重复剔除弱劣策略方法:“斗争斗争”是在位者的弱劣战略被剔除,(进是在位者的弱劣战略被剔除,(进入,默许)是唯一重复剔除的占优均衡;入,默许)是唯一重复剔除的占优均衡;纳什均衡(不进入,斗争)将被剔除掉。纳什均衡(不进入,斗争)将被剔除掉。说明(弱)纳什均衡允许弱劣战略存
40、在。说明(弱)纳什均衡允许弱劣战略存在。2022-5-21可编辑634.4.纳什均衡应用举例纳什均衡应用举例(1) 消耗战(鹰鸽博弈)消耗战(鹰鸽博弈) 两只老虎为争夺猎物对峙。都坚持则猎两只老虎为争夺猎物对峙。都坚持则猎物腐烂;一方放弃则归另一方;都放弃则都物腐烂;一方放弃则归另一方;都放弃则都得不到猎物。猎物价值得不到猎物。猎物价值f f,僵持成本为,僵持成本为c c。 (对称博弈与对称均衡)(对称博弈与对称均衡)2022-5-21可编辑64(2)性别战(协调博弈)性别战(协调博弈) 一对情侣周末安排,女方喜欢音乐会,一对情侣周末安排,女方喜欢音乐会,男方喜欢足球赛。情侣陪伴看喜欢的为最男
41、方喜欢足球赛。情侣陪伴看喜欢的为最好,陪情侣看自己不喜欢的为次之,各自好,陪情侣看自己不喜欢的为次之,各自看自己喜欢的又次之,各自看不喜欢的最看自己喜欢的又次之,各自看不喜欢的最糟糕。糟糕。2022-5-21可编辑65(3)协同作业)协同作业1 两人合作,报酬相同为两人合作,报酬相同为v v。两人同时用。两人同时用力,代价为力,代价为c cl l;只有一人用力,代价为;只有一人用力,代价为c ch h。 c cl l V c V 0,a), c0,ai i=0=0(图?)(图?)最优反应函数:最优反应函数:a ai i* *(a(aj j)=(c+a)=(c+aj j)/2)/2联立求联立求N
42、ashNash均衡得:均衡得:a a1 1=a=a2 2=c=c2022-5-21可编辑67(5)Cournot寡头竞争模型寡头竞争模型 CournotCournot,18381838,完全信息静态博弈。完全信息静态博弈。参与人:参与人:企业企业1 1和企业和企业2 2;企业策略:企业策略:选择产量;选择产量;支付:支付:利润,是两个企业产量的函数。利润,是两个企业产量的函数。2022-5-21可编辑68第第i i个企业的产量:个企业的产量: 成本函数:成本函数:价格函数:价格函数:第第i i个企业的利润函数:个企业的利润函数: ),0iq)(iiqC)(21qqPP2 , 1),()(),(
43、2121iqCqqPqqqiiii2022-5-21可编辑69对每个企业的利润函数求导并令其等于零:对每个企业的利润函数求导并令其等于零: 分别定义了两个反应函数:分别定义了两个反应函数:结论:结论:每个企业的最优战略(产量)是另一每个企业的最优战略(产量)是另一个企业产量的函数。个企业产量的函数。0)()(112112111qCqqPqqqPq0)()(222122122qCqqPqqqPq)(),(122211qRqqRq2022-5-21可编辑70两个反应函数的交叉点就是纳什均衡:两个反应函数的交叉点就是纳什均衡: ),(21qqq2022-5-21可编辑71考虑上述模型的简单情况:考虑
44、上述模型的简单情况:设,设,价格函数取线性形式:价格函数取线性形式:最优化的一阶条件分别为:最优化的一阶条件分别为:222111)(,)(qcqCqcqC)(21qqaP0)(12111cqqqaq0)(22122cqqqaq2022-5-21可编辑72反应函数为:反应函数为:解两个反应函数,得纳什均衡为:解两个反应函数,得纳什均衡为:每个企业的纳什均衡利润分别为:每个企业的纳什均衡利润分别为:)(21)(),(21)(11222211cqaqRqcqaqRq)(3121caqq2212211)(91),(),(caqqqq2022-5-21可编辑73与垄断情况作比较:与垄断情况作比较:垄断企
45、业的问题:垄断企业的问题:垄断企业的最优产量:垄断企业的最优产量:垄断利润:垄断利润:)(cQaQMaxQ)(32)(2121caqqcaQ2212)(92)(41cacam2022-5-21可编辑74结论:结论:(1 1)寡头竞争的总产量大于垄断产量的原因,)寡头竞争的总产量大于垄断产量的原因,在于每个企业在选择自己的最优产量时,只考在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业虑对本企业利润的影响,而忽视对另一个企业的外部负效应。的外部负效应。(2 2)易证明,双方串谋成立卡特尔是不稳定)易证明,双方串谋成立卡特尔是不稳定的,双方都有欺骗的动机。(?)的,
46、双方都有欺骗的动机。(?)2022-5-21可编辑75(6)自学)自学伯川德模型伯川德模型多党竞选;事故赔偿法;多党竞选;事故赔偿法;公共地悲剧;争议仲裁;公共地悲剧;争议仲裁;合作性谈判;报案;专家诊断;合作性谈判;报案;专家诊断;2022-5-21可编辑765. 5. 混合策略纳什均衡混合策略纳什均衡例:社会福利博弈(父母与懒惰儿子)例:社会福利博弈(父母与懒惰儿子)参与人:参与人:政府;一个流浪汉政府;一个流浪汉政府策略:政府策略:救济、不救济;救济、不救济; 流浪汉策略:流浪汉策略:找工作、流浪找工作、流浪2022-5-21可编辑77支付矩阵:支付矩阵: 流浪汉流浪汉政府政府找工作找工
47、作游荡游荡救济救济(3,2)(1,3)不救济不救济(1,1)(0,0)2022-5-21可编辑78假定:政府的混合策略假定:政府的混合策略 流浪汉的混合策略流浪汉的混合策略则政府的期望效用函数为:则政府的期望效用函数为: )1 ,(L)1 ,(G 151141011113),(LGGv2022-5-21可编辑79对上述效用函数求微分,得到政府最优化的一对上述效用函数求微分,得到政府最优化的一阶条件为:阶条件为:即,流浪汉以即,流浪汉以0.20.2的概率选择寻找工作,的概率选择寻找工作,0.80.8的的概率选择流浪。概率选择流浪。所以,如果,政府将选择不救济;所以,如果,政府将选择不救济;如果,
48、政府将选择救济;只有当如果,政府将选择救济;只有当时,政府才会选择混合策略(时,政府才会选择混合策略()或任何纯策略。)或任何纯策略。015Gv2 . 02.02.02.01 ,02022-5-21可编辑80同理,求解流浪汉的最优化问题,即可找出政同理,求解流浪汉的最优化问题,即可找出政府的均衡混合战略。府的均衡混合战略。易知易知 (?)(?)纳什均衡要求,每个参与人的混合策略是给定纳什均衡要求,每个参与人的混合策略是给定对方的混合策略下的最优选择。因此,在社会对方的混合策略下的最优选择。因此,在社会福利博弈中,福利博弈中, 是唯一的纳是唯一的纳什均衡。什均衡。5.02 . 0, 5 . 02
49、022-5-21812022-5-21可编辑82例:监督博弈例:监督博弈参与人:参与人:税收机关;纳税人税收机关;纳税人税收机关策略:税收机关策略:检查、不检查;检查、不检查; 纳税人策略:纳税人策略:逃税、不逃税逃税、不逃税2022-5-21可编辑83支付矩阵:支付矩阵:a a是应纳税款,是应纳税款,C C是检查成本,是检查成本, F F是罚款是罚款; ; Ca+F C0c0; ;(2) (2) 如果决定控告,原告要求被告支付如果决定控告,原告要求被告支付s0s0私了私了; ;(3) (3) 被告决定是否接受原告的要求被告决定是否接受原告的要求; ;(4) (4) 如果被告拒绝,原告决定放弃
50、或是向法庭起诉,如果被告拒绝,原告决定放弃或是向法庭起诉,原告的起诉成本为原告的起诉成本为p p,被告的辩护成本为被告的辩护成本为d d; ;(5) (5) 如果案子到了法庭,原告以如果案子到了法庭,原告以 概率赢得概率赢得x x单位的单位的支付支付. .2022-5-21可编辑127提出提出s s2022-5-21可编辑128分析:分析:原告指控条件原告指控条件: x-p0 x-p0,即即 xpxeei i的的v v V(V( i)i),存在一个贴现因子存在一个贴现因子* * 1 1,使得对于所有使得对于所有* *, , v=(vv=(v1 1,v,v2 2,.,v,.,vn n) )是一个