1、博弈论及其应用博弈论及其应用第2章 纳什均衡博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)2 主要内容:主要内容:2.1 2.1 基本概念基本概念 2.2 2.2 纳什均衡纳什均衡 2.3 2.3 混合策略纳什均衡混合策略纳什均衡 2.4 2.4 矩阵博弈矩阵博弈第2章 纳什均衡博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)32.1 基本概念 2.1.1 2.1.1 基本概念基本概念 2.1.2 2.1.2 占优均衡占优均衡 博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)42.1.1 基本概念 例例2.1.1 2.1.1 智猪博弈智猪博弈 例例2.1.2 2.1.2 夫妻爱好问题夫妻爱好
2、问题 例例2.1.3 2.1.3 猜钱币游戏猜钱币游戏 完全信息静态博弈的三个基本要素完全信息静态博弈的三个基本要素 博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)5智猪博弈 猪圈里有两头猪,一头大猪,一头小猪。猪圈猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有一个食槽,另一边安装一个控制按钮的一边有一个食槽,另一边安装一个控制按钮,它能控制食料的供应。按一下按钮有,它能控制食料的供应。按一下按钮有8 8个单个单位的食料进入猪食槽,但需要支付位的食料进入猪食槽,但需要支付2 2个单位的个单位的劳动成本。在吃食的过程中,若大猪先到,大劳动成本。在吃食的过程中,若大猪先到,大猪能吃猪能吃7 7
3、个单位的食料,小猪只能吃个单位的食料,小猪只能吃1 1个单位个单位。若小猪先到,小猪能吃到。若小猪先到,小猪能吃到4 4个单位的食料,个单位的食料,大猪只能吃大猪只能吃4 4个单位。若两只猪同时到,大猪个单位。若两只猪同时到,大猪吃吃5 5个单位,小猪吃个单位,小猪吃3 3个单位的食料。大猪和个单位的食料。大猪和小猪都有两个策略,按或等待。小猪都有两个策略,按或等待。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)6智猪博弈(续)两只猪在不同策略下的支付矩阵:两只猪在不同策略下的支付矩阵:大猪和小猪分别采取什么样的策略,且各自的收益分别为多少大猪和小猪分别采取什么样的策略,且各自的收益分别为多
4、少?博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)7夫妻爱好问题 OROR博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)8猜钱币游戏博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)9完全信息静态博弈三要素 局中人集合局中人集合 局中人集合即博弈参加人的集合。若给定局中人局中人集合即博弈参加人的集合。若给定局中人 ,则记,则记 策略集策略集 每个局中人每个局中人 有一个策略集有一个策略集S Si i ,策略集,策略集S Si i ,可以是有限集,也可以是有限集,也可以是无限集,当策略集是有限集时,我们记:可以是无限集,当策略集是有限集时,我们记:当每个局中人当每个局中人 选定一个策略选定一个
5、策略s si i 后,形成一个策略组合后,形成一个策略组合 ,并称为一,并称为一个局势,记为:个局势,记为:我们也引入如下记号:我们也引入如下记号:显然,显然,也是一个局势,且也是一个局势,且 。支付函数支付函数 每个局中人有一个支付函数。是局势每个局中人有一个支付函数。是局势 s 的函数,是局中人在局势下所的函数,是局中人在局势下所能得到的收益。当然,每个局中人都希望自己的尽可能大。能得到的收益。当然,每个局中人都希望自己的尽可能大。,2,1nNi iNi iS()i iN()()()12,iiiiiimSssss1,2,inis12(,)nss ss,1,2,iisS in111|(,)i
6、iiinstsst ssiiSt|ist|isss完全信息静态博弈三要素 完全信息静态博弈就是在上述三要素的基础上,分完全信息静态博弈就是在上述三要素的基础上,分 析各局中人为实现自身利益最大化的策略行为分析。析各局中人为实现自身利益最大化的策略行为分析。简记为简记为:,iiPSNG 博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)10博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)112.1.2 占优均衡 定义定义2.1.1 2.1.1 严格占优策略严格占优策略 定义定义2.1.2 2.1.2 占优均衡占优均衡 定义定义2.1.3 2.1.3 重复剔除占优均衡重复剔除占优均衡 博弈论及其应用
7、博弈论及其应用(汪贤裕)(汪贤裕)12定义2.1.1 严格占优策略 在博弈在博弈 中,若中,若 和和 是局中人是局中人 的两个的两个策略,对任意策略组合策略,对任意策略组合 都有:都有:(2.1.12.1.1)则称,局中人则称,局中人 的策略的策略 严格占优策略严格占优策略 ,或称策略,或称策略 相相对于对于 是是严格劣策略严格劣策略。囚徒困境囚徒困境中、中、犯罪嫌疑人犯罪嫌疑人A A和和B B策略(承认)就是一个严策略(承认)就是一个严格占优策略。格占优策略。,iiPSNG)(iks)(ihsis)|()|()()(ihiikissPssPi)(iks)(ihs()ihs()iks博弈论及其
8、应用博弈论及其应用(汪贤裕)(汪贤裕)13定义2.1.2 占优均衡 在博弈在博弈 中,若每一个局中人中,若每一个局中人 都存在一个策略都存在一个策略 ,使得,使得 占优于占优于 中任何策略,那么策略组合中任何策略,那么策略组合 称为称为 的占优策略均衡,简称的占优策略均衡,简称占优均衡占优均衡。对应的。对应的 称为称为占优均衡结果占优均衡结果。,iiPSNGi)(,NiSsiiisiisS),(21nssssG|)(NisPi博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)14定义2.1.2 占优均衡(续)囚徒困境囚徒困境中严格占优均衡:中严格占优均衡:(承认,承认)(承认,承认)均衡结果博弈
9、论及其应用博弈论及其应用(汪贤裕)(汪贤裕)15定义2.1.3 重复剔除占优均衡 在博弈在博弈 中,经过重复剔出严格劣策略中,经过重复剔出严格劣策略后,每个局中人后,每个局中人 只剩下一个唯一的策略:只剩下一个唯一的策略:那么,策略组合那么,策略组合 称为博弈称为博弈 的的重复重复剔除占优均衡。剔除占优均衡。对应对应 称为称为 的的重复剔除占优均衡结果重复剔除占优均衡结果。,iiPSNG iiisS),2,1(ni12(,)nss ssG()|1,2,iP sinG博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)16定义2.1.3 重复剔除占优均衡(续)智猪博弈智猪博弈中重复剔除占优均衡中重复
10、剔除占优均衡:(按,不按)(按,不按)均衡结果博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)172.2 纳什均衡 2.2.1 2.2.1 纯策略纳什均衡纯策略纳什均衡 2.2.2 2.2.2 双矩阵博弈的划线法双矩阵博弈的划线法 2.2.3 2.2.3 无限策略的纯策略纳什均衡无限策略的纯策略纳什均衡博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)182.2.1 纯策略纳什均衡 定义定义2.2.1 2.2.1 纯策略纳什均衡点和均衡结果纯策略纳什均衡点和均衡结果 定理定理2.2.1 2.2.1 重复剔除占优均衡与纯策略纳什均衡重复剔除占优均衡与纯策略纳什均衡 纳什均衡点与多目标规划求解比较博
11、弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)19纯策略纳什均衡点和结果 定义定义2.2.12.2.1 在在 人非合作博弈人非合作博弈 中,若有策略组合中,若有策略组合 ,使得每一个,使得每一个 ,对任意,对任意 都有都有 (2.2.12.2.1)则称则称 是是 的一个的一个纯策略纳什均衡点纯策略纳什均衡点,对应的,对应的 称为对应的称为对应的均衡结果。均衡结果。n),(21nssssiiSs 1,2,inNiiiSt)()()|()(sPtsPiiini,2,1),(21nssssG,2,1|)(nisPi,iiGNSP1,2,Nn博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)20纯策略纳
12、什均衡点和结果 夫妻爱好夫妻爱好博弈中纯策略纳什均衡点:博弈中纯策略纳什均衡点:(足球,看足球)(足球,看足球)&(看芭蕾,看芭蕾)(看芭蕾,看芭蕾)均衡结果均衡结果博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)21纯策略纳什均衡点和结果(续)猜钱币游戏猜钱币游戏中不存在纯策略纳什均衡点中不存在纯策略纳什均衡点。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)22定理2.2.1 在在 人非合作博弈人非合作博弈 中:中:若,若,是是重复剔除占优均衡重复剔除占优均衡,则则 一定是一定是纯策略纳什均衡点纯策略纳什均衡点。n,iiPSNG),(21nssss),(21nssss博弈论及其应用博弈论及
13、其应用(汪贤裕)(汪贤裕)23定理2.2.1的证明证明:证明:用用反证法反证法。若若 是重复剔除占优均衡,但不是纯策略纳什均衡点。则有是重复剔除占优均衡,但不是纯策略纳什均衡点。则有 和和 ,使得使得 (2.2.22.2.2)那么在局中人那么在局中人 在对在对 的剔除过程中应有对任意的策略组合的剔除过程中应有对任意的策略组合 满足满足(2.2.12.2.1)式。这里策略组合当然也包括)式。这里策略组合当然也包括 ,即,即 因此(因此(2.2.22.2.2)式是不可能出现的,即()式是不可能出现的,即(2.2.22.2.2)式与剔除严格劣策略过程)式与剔除严格劣策略过程矛盾。矛盾。从而定理从而定
14、理2.2.12.2.1成立。成立。12,nss ssNi()iitsiiSt)()|()|()(iiiitsPssPi)(itss()(|)(|)iiiiP ssP st博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)24纳什均衡点与多目标规划求解比较 在在n n人非合作博弈人非合作博弈 中,对每一个局中人中,对每一个局中人 ,都在寻找自己的策略都在寻找自己的策略 使得自己的收益使得自己的收益 最大最大,但是局中人,但是局中人 单方面不能找到自己的最佳策略,其结果是相互单方面不能找到自己的最佳策略,其结果是相互影响的,是由策略组合影响的,是由策略组合 决定的。这就是一个有决定的。这就是一个有相
15、互影响的多人决策问题。有人可能这样设想:是否有一个局外相互影响的多人决策问题。有人可能这样设想:是否有一个局外人,将人,将 个局中人的收益最大作为个局中人的收益最大作为 个目标的个目标的多目标规划问题多目标规划问题,即求:即求:(2.2.32.2.3)纳什均衡点和上面的(纳什均衡点和上面的(2.2.32.2.3)的多目标规划的求解是两个不同)的多目标规划的求解是两个不同的概念。的概念。12(,)nss ss,iiGNSPiNiisS12(,)inP s ssinn121max(),(),().nniP s P sP sstisS博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)25纳什均衡点与多
16、目标规划求解比较(续)囚犯困境是一个囚犯困境是一个2 2人非合作博弈人非合作博弈 两个局中人策略集两个局中人策略集 和支付和支付 函数函数 都表示在表都表示在表1.2.11.2.1中中 图图2.2.1 2.2.1 囚犯困境中的局中人囚犯困境中的局中人 收益图收益图12,S S12,P P以囚徒困境为例以囚徒困境为例博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)26纳什均衡点与多目标规划求解比较(续)各点代表不同策略组合下双方的收益:各点代表不同策略组合下双方的收益:A A点对应策略组合(承认,承认)点对应策略组合(承认,承认)B B点对应策略组合(承认,不承认)点对应策略组合(承认,不承认)
17、C C点对应策略组合(不承认,不承认)点对应策略组合(不承认,不承认)DD点对应策略组合(不承认,承认)点对应策略组合(不承认,承认)B B点、点、C C点和点和D D点所代表的策略组合点所代表的策略组合 都是单人决策的多目标规划(都是单人决策的多目标规划(2.2.32.2.3)中的非劣解。中的非劣解。但策略组合(承认,承认)是唯一的纳什均衡点。但策略组合(承认,承认)是唯一的纳什均衡点。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)27纳什均衡点与多目标规划求解比较(续)结论:结论:(一)非合作博弈中的纳什均衡点,不可能用(一)非合作博弈中的纳什均衡点,不可能用(2.2.32.2.3)表示
18、的多目标规划作为替代,双方有不)表示的多目标规划作为替代,双方有不同的思想基础。同的思想基础。(二)博弈论与多目标规划这类多人决策问题的(二)博弈论与多目标规划这类多人决策问题的差异,进一步显示出纳什均衡思想在博弈论中的差异,进一步显示出纳什均衡思想在博弈论中的重要地位。重要地位。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)282.2.2 双矩阵博弈的划线法 双矩阵博弈的定义双矩阵博弈的定义 纯策略纳什均衡的简单求解方法纯策略纳什均衡的简单求解方法划线法划线法 定理定理2.2.2 2.2.2 划线法与纯策略纳什均衡划线法与纯策略纳什均衡博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)29双
19、矩阵博弈的定义在博弈中,若三要素的前两个要素满足:在博弈中,若三要素的前两个要素满足:只有只有两个局中人两个局中人,即,即 ;策略集有限策略集有限,即,即 ,此类博弈我们称为此类博弈我们称为双矩阵博弈双矩阵博弈。2,1N,211mS,212nS双矩阵博弈称呼的由来(补充1)在双矩阵博弈中,对任意策略组合在双矩阵博弈中,对任意策略组合 ,记支付,记支付函数函数 ,将两个局中人的支,将两个局中人的支付函数分别记为矩阵付函数分别记为矩阵A A和矩阵和矩阵B B如下:如下:111212122212()nnij m nmmmnaaaaaaAaaaa),(jiijjiaP),(1ijjibP),(2111
20、212122212()nnijm nmmmnbbbbbbBBbbb博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)30博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)31双矩阵博弈称呼的由来(补充2)(2.2.4)回到:划线法 定理2.2.2111112121121212222221122(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)nnnnijij m nmmmmmnmna ba ba ba ba baba bababab划线法 (1)(1)对局中人对局中人1 1,在(,在(2.2.42.2.4)式)式 的每一行的每一行 中,找出对中,找出对方支付矩阵方支付矩阵B B中该行的最
21、大元素中该行的最大元素 ,即即 并在并在 下划线。当下划线。当 不唯一时,均在下面划线。不唯一时,均在下面划线。(2)(2)对局中人对局中人2 2,在(,在(2.2.42.2.4)式每一列)式每一列 中,找出对方支中,找出对方支付矩阵付矩阵A A中该列的最大元素中该列的最大元素 即即 并在并在 下划线。当下划线。当 不唯一时,均在下面划线。不唯一时,均在下面划线。iijb,2,1|maxnjbbijijijbijbi jaji jai jamax|1,2,iji jaaim博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)32划线法(续)(3)(3)若存在一对若存在一对 ,使得其两个元素,使得其
22、两个元素 和和 下面都有划线,则下面都有划线,则 是纯策略纳什均衡是纯策略纳什均衡点,点,和和 是对应的纳什均衡结果。是对应的纳什均衡结果。(4)(4)若不存在满足(若不存在满足(3 3)的数对,则该博弈无纯策略)的数对,则该博弈无纯策略纳什均衡。纳什均衡。),(jijiajibjiajib),(ji博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)33博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)34定理2.2.2 在双矩阵博弈在双矩阵博弈 中划线法的使用:中划线法的使用:(1)(1)若若 和和 同时得到划线,则同时得到划线,则 一定是一定是 的纯策略纳什均衡点。的纯策略纳什均衡点。(2)(
23、2)若不存在能够同时得到划线的数对,则若不存在能够同时得到划线的数对,则 无纯无纯策略纳什均衡点。策略纳什均衡点。Gjiajib),(jiGG博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)35定理2.2.2的证明 设设 和和 都得到划线,则下面两式同时成立:都得到划线,则下面两式同时成立:(2.2.52.2.5)(2.2.62.2.6)是博弈的是博弈的纯策略纳什均衡点纯策略纳什均衡点。若不存在同时得到划线的数对,即不存在若不存在同时得到划线的数对,即不存在 同时满同时满足(足(2.2.52.2.5)和()和(2.2.62.2.6)式,则博弈)式,则博弈 也就不存在纯策也就不存在纯策略纳什均衡
24、点。略纳什均衡点。jiajib),(),(111ikjkkjjijiSPaaP),(),(212jhhihijijiSPbbP),(ji),(jiG博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)362.2.3无限策略的纯策略纳什均衡 定理定理2.2.3 2.2.3 无限纯策略纳什均衡点存在性定理无限纯策略纳什均衡点存在性定理 无限策略纳什均衡点的求解思路无限策略纳什均衡点的求解思路 例例2.2.2 2.2.2 古诺模型古诺模型 例例2.2.3 2.2.3 伯川德双寡头垄断模型伯川德双寡头垄断模型 例例2.2.4 2.2.4 公共地的悲剧公共地的悲剧 例例2.2.5 2.2.5 豪泰林价格竞争
25、模型豪泰林价格竞争模型博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)37定理2.2.3 在博弈在博弈 中,若局中人中,若局中人 的策的策略集略集 是有界闭区域,支付函数是有界闭区域,支付函数 对对任意任意 都是都是 的拟凹连续函数,则博弈的拟凹连续函数,则博弈 一定存在有纯策略纳什均衡点。一定存在有纯策略纳什均衡点。注:严格拟凹函数定义点击注:严格拟凹函数定义点击 ,iiPSNG iiS),(iiissPiisSisG博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)38严格拟凹函数定义 设设 是凸集是凸集 上的函数,对任意上的函数,对任意 及及任意任意 ,若有:,若有:(2.2.82.2.8
26、)则则 为为 上的上的拟凹函数拟凹函数。若(若(2.2.82.2.8)式中不等号为严格不等号,则称)式中不等号为严格不等号,则称 为为 上的上的严格拟凹函数严格拟凹函数。unRXXxx21,1,0)(),(min()1(2121xuxuxxuuXuX无限策略纳什均衡点的求解思路 当局中人当局中人 的收益函数的收益函数 都是都是 上的连续上的连续可微严格拟凹函数时,每个局中人都有一个最优反映函可微严格拟凹函数时,每个局中人都有一个最优反映函数(点击数(点击 )组成含)组成含 个未知数的个未知数的 个方程的方程组:个方程的方程组:(2.2.112.2.11)求解(求解(2.2.112.2.11)式
27、得到博弈)式得到博弈 的一个纯策略纳什均衡点的一个纯策略纳什均衡点 注:),(iiissP)()()(222111nnnsfssfssfs,iiibaS nnGi111,.,.iiinsssss博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)39博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)40反应函数的定义和求解 设设 是定义是定义2.2.22.2.2规定下的拟凹函数,有:规定下的拟凹函数,有:(2.2.9)称称 为局中人为局中人 在在 上最优的上最优的反应函数反应函数 iP()(),()|()max(,)iiiiiiiiiiiitsB ssSP s sP ts()iiB siis反应函数
28、的定义和求解 当当 对任意对任意 是是 上的严格的拟凹函数上的严格的拟凹函数时,时,即只有一个元素。这时,最优反应,即只有一个元素。这时,最优反应函数为函数为:(2.2.10)若若 在闭区间在闭区间 上连续可微且对上连续可微且对任意任意 是严格拟凹函数,则令是严格拟凹函数,则令 可得最优可得最优反应函数:反应函数:)(iisfs)(iisfsiisS)(iiissBiisS(,)iiiP s s,iiibaS 0iisP(,)iiiP s sis博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)41博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)42例2.2.2 古诺模型 设市场有设市场有1 1
29、、2 2两个寡头厂商,生产并销售同一种两个寡头厂商,生产并销售同一种产品。厂商产品。厂商1 1、2 2生产商品的数量分别为生产商品的数量分别为 和和 ,他们有,他们有不同的不变边际成本,分别为不同的不变边际成本,分别为 和和 ,无固定成本。,无固定成本。市场的逆需求函数为市场的逆需求函数为 一个正常数,即该产品的市场最高价格且一个正常数,即该产品的市场最高价格且 。市场需求情况和两厂商的成本和收益。市场需求情况和两厂商的成本和收益确定都是共同知识。两个厂商事前没有任何协议和约定确定都是共同知识。两个厂商事前没有任何协议和约定,同时分别决定生产的产量,以追求市场的最大利润(,同时分别决定生产的产
30、量,以追求市场的最大利润(设厂商的生产产量没有限制,但设厂商的生产产量没有限制,但 )。)。1q2q1c2c12()paqqa,1,2iac i0p 例2.2.2 古诺模型(续)该博弈中局中人为两个厂商,生产数量是他们的策略,该博弈中局中人为两个厂商,生产数量是他们的策略,即即 。厂商各自的利润函数:。厂商各自的利润函数:(2.2.122.2.12)(2.2.132.2.13)由(由(2.2.122.2.12)和()和(2.2.132.2.13)式可知,)式可知,对任何对任何 都是都是 的严格连续凹函数,的严格连续凹函数,对任何对任何 都是都是 的严格连续的严格连续凹函数。凹函数。120,)S
31、S111 11211 1()pqc qaqqqc q222212222()pqc qaqqqc q21q2q12q1q博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)43博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)44例2.2.2 古诺模型(续)两个厂商都来确定产量以追求最大利润可以表示成:两个厂商都来确定产量以追求最大利润可以表示成:求求 和和 ,并且令,并且令 和和 有:有:(2.2.14)(2.2.15)11112111m a x()qSaqqqc q22212222max()qSaqqqc q11q22q110q220q1211()2qaqc2121()2qaqc例2.2.2 古诺
32、模型(续)求解最优反应函数(求解最优反应函数(2.2.14)和和(2.2.15)组成的组成的方程组:方程组:(2.2.16)(2.2.17)组成该博弈的平衡局势,即纯策略纳什均衡点组成该博弈的平衡局势,即纯策略纳什均衡点。均衡结果,分别为:。均衡结果,分别为:。*21123accq*12223accq*12(,)qq*2*221121222(),()33accacc博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)45博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)46例2.2.2 古诺模型(续)该博弈的纯策略纳什均衡的意义该博弈的纯策略纳什均衡的意义 以厂商以厂商1 1为例,由为例,由 ,决定
33、以边际利润等于边,决定以边际利润等于边际成本来确定生产量,才是最优的。但边际利润不仅与自己的际成本来确定生产量,才是最优的。但边际利润不仅与自己的产量产量 有关,也受到厂商有关,也受到厂商2 2的产量的产量 的影响。从反应函数可知,的影响。从反应函数可知,要满足边际成本等于边际利润,其产量要满足边际成本等于边际利润,其产量 与对方生产的产量与对方生产的产量 的关系必须满足(的关系必须满足(2.2.142.2.14)式。厂商)式。厂商2 2也是同样的,要满足边际也是同样的,要满足边际成本等于边际利润,其产量成本等于边际利润,其产量 与对方的生产产量必须满足与对方的生产产量必须满足(2.2.152
34、.2.15)式。求解()式。求解(2.2.142.2.14)和()和(2.2.152.2.15)构成了纳什均衡。)构成了纳什均衡。110q1q2q1q2q2q博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)47例2.2.2 古诺模型(续)纳什均衡点和多目标规划中解概念的差异 1 以例2.2.2古诺模型为例,将有限策略放宽至无限 2 假设厂商1和厂商2有相同的不变边际成本,即 12ccc博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)48例2.2.2 古诺模型(续)将古诺模型中两厂商如何取得自己收益最大作为多目标将古诺模型中两厂商如何取得自己收益最大作为多目标规划问题:规划问题:(2.2.18)
35、其中其中 和和 均由(均由(2.2.122.2.12)和()和(2.2.132.2.13)两式确定)两式确定()。)。112212max(,),(,)q qq q.st110,)qS220,)qS1212ccc博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)49例2.2.2 古诺模型(续)该多目标规划的非劣解由下图所示的直线段该多目标规划的非劣解由下图所示的直线段ABAB确定:确定:图图2.2.3 2.2.3 古诺模型的纳什均衡与多目标规划的关系古诺模型的纳什均衡与多目标规划的关系博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)50例2.2.2 古诺模型(续)上图中上图中D D点表示两厂商均生
36、产点表示两厂商均生产 时双方的时双方的收益。收益。直线直线ABAB的确定的确定 若两厂商由一个垄断集团控制,则最优产量为下若两厂商由一个垄断集团控制,则最优产量为下式的最优解:式的最优解:112212(,)(,)q qq q110,)qS220,)qSmax.st124acqq博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)51例2.2.2 古诺模型(续)取取 ,求解上式,则当,求解上式,则当 时,时,有最值有最值 。也就是说,当厂商。也就是说,当厂商1 1采取策略采取策略 ,厂商,厂商2 2采取采取 ,而,而 时,厂商时,厂商1 1的收益的收益 和厂商和厂商2 2的收益的收益 满足满足 。这
37、样,厂商。这样,厂商1 1和和厂商厂商2 2的收益的帕累托边界为直线段的收益的帕累托边界为直线段ABAB。对应多目标。对应多目标规划(规划(2.2.182.2.18)的非劣解为:)的非劣解为:,12Qqq*2a cQ2*()4ac*1q*2q*122a cqqQ*1*22*12()4ac*110,)qS*220,)qS*122acqq博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)52例2.2.2 古诺模型(续)多目标规划(多目标规划(2.2.182.2.18)的任何满意解都是依一定的)的任何满意解都是依一定的法则在非劣解中寻求满意解。而此时古诺模型的纳什均法则在非劣解中寻求满意解。而此时古诺
38、模型的纳什均衡为:衡为:123cca cqq 对应的收益为图对应的收益为图2.2.32.2.3的的C C点,即两厂商的收益点,即两厂商的收益分别是分别是 。纳什均衡点。纳什均衡点 是多是多目标规划(目标规划(2.2.182.2.18)中的劣解。)中的劣解。212()9ccac12(,)ccq q博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)53例2.2.2 古诺模型(续)结论结论 在策略集为无限时,纳什均衡点仍然不是多目标规在策略集为无限时,纳什均衡点仍然不是多目标规划中的非劣解。划中的非劣解。纳什均衡与多目标规划存在不同,是不可混淆的。纳什均衡与多目标规划存在不同,是不可混淆的。造成这种差
39、别的原因在于,纳什均衡是多人决策,而多造成这种差别的原因在于,纳什均衡是多人决策,而多目标规划是单人决策。目标规划是单人决策。博弈论的一个最显著特征:博弈论的一个最显著特征:竞争环境下的多人决策竞争环境下的多人决策。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)54伯川德双寡头垄断模型 考虑市场上有两个寡头厂商生产同一类型产品。厂考虑市场上有两个寡头厂商生产同一类型产品。厂商商1 1和厂商和厂商2 2分别选择价格分别选择价格 和和 。消费者对企业的产。消费者对企业的产品的需求为:品的需求为:其中其中0b1,即只限于企业,即只限于企业 的产品和企业的产品和企业 产品具有相产品具有相互替代的情况
40、。企业生产没有固定成本,并且边际成本互替代的情况。企业生产没有固定成本,并且边际成本为常数为常数 ,。两个企业同时进行价格选择行动。另外企业两个企业同时进行价格选择行动。另外企业 的策的策略略 是所选价格是所选价格 ,也即每个企业的策略集,也即每个企业的策略集 。1p2p(,)iijijqppapbpijcac iis0ip 0,)iS 伯川德双寡头垄断模型(续)企业企业 选择价格选择价格 ,对手,对手 选择价格选择价格 ,企业的利润,企业的利润为:为:(2.2.20)对于企业对于企业1 1来说,若企业来说,若企业2 2选定的价格为选定的价格为 ,它确定自,它确定自己的价格己的价格 以追求最大
41、利润以追求最大利润 对企业对企业1 1求求 并且令并且令 解得:解得:(2.2.21)iipjjp(,)(,)()()()iijiijiijip pq p ppcapbppc*2p1p11*11212100max(,)max()()ppppapbppc11p110p*121()2pabpc博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)55博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)56 伯川德双寡头垄断模型(续)同理,可得企业同理,可得企业2 2的最优价格的最优价格 (2.2.22)联立联立(2.2.21)(2.2.22)解方程组得:解方程组得:(2.2.23)均衡结果为:均衡结果为:(
42、2.2.24)*211()2pabpc*122acppb212()()2222ccacacacacbcabcbbbb博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)57例2.2.4 公共地的悲剧 考虑有相同情况的考虑有相同情况的 个牧民组成的某个牧民村,他们共同拥有一个牧民组成的某个牧民村,他们共同拥有一片草地。每年所有的牧民都会在共同的草地上放牧养羊。用片草地。每年所有的牧民都会在共同的草地上放牧养羊。用 表示牧表示牧民民 养羊的头数,则牧民村的养羊总头数为养羊的头数,则牧民村的养羊总头数为 。购。购买羊崽和照看一只羊的成本为买羊崽和照看一只羊的成本为c c,c c不随某一牧民拥有羊的树目的
43、多少不随某一牧民拥有羊的树目的多少而变化。当草地上的羊的总头数为而变化。当草地上的羊的总头数为 时,牧民养的一只羊的价值时,牧民养的一只羊的价值为为 ,设,设 。当草地上羊的总头数。当草地上羊的总头数 较少时,每只羊有相对较少时,每只羊有相对较多的空间,每只羊能吃到的草也丰盛些。而羊的总数较多的空间,每只羊能吃到的草也丰盛些。而羊的总数 增加时,则增加时,则正好相反,每只羊相对能吃到的草相对较少。并有当羊群总数正好相反,每只羊相对能吃到的草相对较少。并有当羊群总数 达到达到一个极限一个极限 时,再增加一只羊将对已经牧养的羊带来损害。对一只时,再增加一只羊将对已经牧养的羊带来损害。对一只羊的价值
44、羊的价值 的上述特征用公式表示,则为的上述特征用公式表示,则为:,。niqi12nGqqqG()v G()0v G GGGmaxG()v G()0v G()0vG(2.2.25)博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)58例2.2.4 公共地的悲剧(续)每年春天,每年春天,个牧民同时分别选择牧养羊的数量。假设个牧民同时分别选择牧养羊的数量。假设其是连续的可分割的。牧民其是连续的可分割的。牧民 的策略是选择在公共草地上牧的策略是选择在公共草地上牧养羊的数量养羊的数量 ,并有策略集,并有策略集 。当其他村。当其他村民养羊数为民养羊数为 时,牧民时,牧民 牧养牧养 只羊只羊获得的收益为:获得
45、的收益为:现在要讨论的问题是:牧民现在要讨论的问题是:牧民 如何决定自己的牧养羊如何决定自己的牧养羊数数 ,以获得自己的最大收益,以获得自己的最大收益。niiq0,),1,2,iSin1211(,)iinq qqqqiiq1(),1,2,iiiniqv qqqcq in(2.2.26)iiq1,2,in博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)59例2.2.4 公共地的悲剧(续)这构成了一个这构成了一个 人非合作博弈的问题,需要求平衡局势,人非合作博弈的问题,需要求平衡局势,即纳什均衡。很明显,即纳什均衡。很明显,在任何在任何 时,都是时,都是 的凹函数。计的凹函数。计算算 并且并且令
46、,得到:,得到:当当 是一个已知函数时,求解由上式给出的是一个已知函数时,求解由上式给出的 个方程和个方程和 个未知数,可以求得该体系的纯策略纳什均衡点,即平衡个未知数,可以求得该体系的纯策略纳什均衡点,即平衡局势局势 再代回到(再代回到(2.2.262.2.26)式,则有纳什均衡结果)式,则有纳什均衡结果。niiqiqiiq0iiq11()()0,1,2,iniinv qqqqv qqqcin (2.2.27)vnn*12(,)nq qq博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)60例2.2.4 公共地的悲剧(续)公共地的悲剧的意义公共地的悲剧的意义 将上面的将上面的 人非合作博弈的牧
47、养羊纳什均衡结果与草地在非公共地的情况下,即人非合作博弈的牧养羊纳什均衡结果与草地在非公共地的情况下,即由社会计划管理者进行管理作对比研究。由社会计划管理者进行管理作对比研究。在在 个牧民分散独立决策牧养羊情况下,设个牧民分散独立决策牧养羊情况下,设 是第是第 个牧民的养羊数个牧民的养羊数 最优决策,最优决策,。由于。由于 个牧民是相同情况个牧民是相同情况,则则:令令 ,则由(,则由(2.2.272.2.27)式得:)式得:再将(再将(2.2.282.2.28)的)的 个方程加总,有:个方程加总,有:(2.2.29)(2.2.28)n*iq1,2,inn*ijqq*,ijij,1,2,i jn
48、*12nGqqq*()()0,1,2,iv Gq v Gcinn*1()()0v GG vGcnni博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)61例2.2.4 公共地的悲剧(续)若草地是由社会计划者管理,社会计划者选择草地的最优牧养量是若草地是由社会计划者管理,社会计划者选择草地的最优牧养量是 ,则,则 应该是下式的解:应该是下式的解:若上式的最优解为若上式的最优解为 ,则,则 应满足应满足 (边际收益等于边际成本)(边际收益等于边际成本),即:,即:比较(比较(2.2.292.2.29)式和()式和(2.2.312.2.31)式,下面我们证明)式,下面我们证明 。由式(由式(2.2.2
49、92.2.29)和()和(2.2.312.2.31)式有:)式有:(2.2.30)(2.2.31)*G*G0,)maxG()Gv GGc*G*G0ddG*()()0v GG v Gc*GG*1()()()()v GG v Gv GG v Gn(2.2.32)博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)62例2.2.4 公共地的悲剧(续)令令 由(由(2.2.322.2.32)式和()式和(2.2.252.2.25)式有:)式有:由(由(2.2.332.2.33)式和()式和(2.2.252.2.25)式得:)式得:由(由(2.2.342.2.34)和()和(2.2.352.2.35)有:)
50、有:(2.2.33)(2.2.34)(2.2.35)(2.2.36)由于由于 个牧民是对称的,则他们分散养羊的总收益为:个牧民是对称的,则他们分散养羊的总收益为:,而社会计划管理者的养羊带来的总收益为,而社会计划管理者的养羊带来的总收益为:。()()()f Gv GGv G*1()()()0nf Gf GG v Gn()2()()0fGv GGvG*GGn*()inGv GGC*()G v GG C博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)63例2.2.4 公共地的悲剧(续)由于由于 是(是(2.2.302.2.30)式的最优解,则必有)式的最优解,则必有:(2.2.362.2.36)式