1、专题一:零和博弈专题一:零和博弈2022-4-2912022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华2内容提要内容提要零和博弈零和博弈最小最大方法最小最大方法直线交叉法直线交叉法对抗性排序对抗性排序2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华3零和博弈与非零和博弈零和博弈与非零和博弈(zero-sum game and non-zero-sum game)v如果一个博弈在所有各种对局下全体参与如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零,这个博弈就人之得益总和总是保持为零,这个博弈就叫零和博弈;叫零和博弈;v相反,如果一个博弈
2、在所有各种对局下全相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零,这体参与人之得益总和不总是保持为零,这个博弈就叫非零和博弈。个博弈就叫非零和博弈。v零和博弈是利益对抗程度最高的博弈。零和博弈是利益对抗程度最高的博弈。2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华4零和博弈:掷硬币零和博弈:掷硬币-1,11,-1反面反面1,-1-1,1正面正面反面反面正面正面12支付支付2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华5常和博弈与非常和博弈常和博弈与非常和博弈(constant-sum game and variable-
3、sum game)v如果一个博弈在所有各种对局下全体参与人之得如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数益总和总是保持为一个常数,这个博弈就叫常和这个博弈就叫常和博弈;博弈;v相反,如果一个博弈在所有各种对局下全体参与相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数,这个博弈人之得益总和不总是保持为一个常数,这个博弈就叫非常和博弈。就叫非常和博弈。v常和博弈也是利益对抗程度最高的博弈。常和博弈也是利益对抗程度最高的博弈。2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华6常和博弈与归零博弈常和博弈与归零博弈v设设G G是一
4、个是一个n n人常和博弈,那么在人常和博弈,那么在G G的每种战略组合的每种战略组合下博弈的下博弈的n n个参与人的支付的总和是一个常数。常个参与人的支付的总和是一个常数。常数的数的1/n1/n称为常和博弈支付的称为常和博弈支付的偏零因子偏零因子。v对于每个对于每个n n人常和博弈人常和博弈G G,可以从每个参与人的支付,可以从每个参与人的支付中减去博弈的偏零因子,将中减去博弈的偏零因子,将G G转换为零和博弈转换为零和博弈G G/ /,把,把G G/ /叫做常和博弈叫做常和博弈G G的的归零博弈归零博弈。2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华7常和博弈:掷硬
5、币常和博弈:掷硬币常和为常和为-1-1:偏零因子:偏零因子-1/2-1/2-1.5,0.50.5,-1.5反面反面0.5,-1.5-1.5,0.5正面正面反面反面正面正面12支付支付2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华8归零博弈:支付减去归零博弈:支付减去-0.5-0.5-1,11,-1反面反面1,-1-1,1正面正面反面反面正面正面12支付支付2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华9非零和博弈:囚犯困境(蕴含双赢或多赢)抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A2022-4-29山西财经大学经
6、济学院山西财经大学经济学院 康旭华康旭华10行局中人的支付行局中人的支付-11反面反面1-1正面正面反面反面正面正面12支付支付2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华11内容提要内容提要零和博弈零和博弈最小最大方法最小最大方法直线交叉法直线交叉法对抗性排序对抗性排序2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华12最小最大方法最小最大方法v由冯由冯诺依曼提出诺依曼提出v基本思想:基本思想: 作为局中人,对手将采取对他自己最有利的作为局中人,对手将采取对他自己最有利的策略;相应的,对手会选择使你获得尽可能策略;相应的,对手会选择使你获得
7、尽可能差的支付的策略。差的支付的策略。 由于零和博弈的特点和性质,以上思想即为:由于零和博弈的特点和性质,以上思想即为:任何使对手得到最好结果的策略,都会使你任何使对手得到最好结果的策略,都会使你获得最差的结果。获得最差的结果。 双方都具有这样的理性!双方都具有这样的理性!2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华13最小最大方法的应用最小最大方法的应用610下下4-3上上右右左左甲甲乙乙支付支付max=10 max=6min=-3min=62022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华14最小最大方法:最小最大方法:1 132下下41上
8、上右右左左12支付支付2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华15最小最大方法:最小最大方法:1 13,-32,-2下下4,-41,-1上上右右左左12支付支付2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华16最小最大方法:最小最大方法:2 234下下21上上右右左左12支付支付2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华17最小最大方法:最小最大方法:2 23,-34,-4下下2,-21,-1上上右右左左12支付支付2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华18最小最大方法:最
9、小最大方法:3 3531621100 参与人参与人2L M R参与人1UDM2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华19最小最大方法:最小最大方法:3 35,-53,-31,-16,-62,-21,-11,-10,00,0 参与人参与人2L M R参与人参与人1UDM2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华20最小最大方法:最小最大方法:4 4532643160 参与人参与人2L M R参与人参与人1UDM2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华21最小最大方法:最小最大方法:4 45,-53,-3
10、2,-26,-64,-43,-31,-16,-60,0 参与人参与人2L M R参与人参与人1UDM2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华22内容提要内容提要零和博弈零和博弈最小最大方法最小最大方法直线交叉法直线交叉法对抗性排序对抗性排序2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华23v最小最大方法:最小最大方法: 适用于零和博弈的纯策略纳什均衡适用于零和博弈的纯策略纳什均衡v扩展的最小最大方法扩展的最小最大方法(直线交叉方法):(直线交叉方法): 适用于零和博弈的混合策略纳什均衡适用于零和博弈的混合策略纳什均衡v在非零和博弈中,可
11、能存在共同利益。在非零和博弈中,可能存在共同利益。 2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华24无纯策略纳什均衡的零和博弈无纯策略纳什均衡的零和博弈-11反反1-1正正反反正正12支付支付max=1 max=1min=-1min=-12022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华251 1的选择的选择-11反(反(1-p)1-1正(正(p)反反正正12支付支付p-混合混合 -p+(1-p) p-(1-p)min=-1min=-1min=?2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华261的支付的支付1-101
12、/21-111的的p混合策略混合策略2正正2反反参与人参与人1 1的的p-p-混合策略图解混合策略图解2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华272 2的选择的选择-11反反1-1正正反反(1-q)正正(q)12支付支付max=1 max=1q-混合混合-q+(1-q)q-(1-q)max=?2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华282的支付的支付1-101/21-112的的q混合策略混合策略1反反1正正参与人参与人2 2的的q-q-混合策略图解混合策略图解2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华
13、29内容提要内容提要零和博弈零和博弈最小最大方法最小最大方法直线交叉法直线交叉法对抗性排序对抗性排序2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华30v对抗性排序对抗性排序 根据收益的相关性进行根据收益的相关性进行2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华31“你死我活你死我活”的掷硬币游戏的掷硬币游戏-1,11,-1反面反面1,-1-1,1正面正面反面反面正面正面12支付支付2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华32出现出现“双赢双赢”可能的价格大战可能的价格大战低价低价高价高价低价低价3 3,3 36
14、 6,1 1高价高价1 1,6 65 5,5 5支付支付百事百事可乐可乐可口可乐可口可乐2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华33个体利益与集体利益一致的个体利益与集体利益一致的性别战博弈性别战博弈1,20,0足球足球0,02,1时装时装足球足球时装时装妻子妻子支付支付 丈夫丈夫2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华34协调博弈协调博弈v广义的协调博弈:包括所有能够协调出双广义的协调博弈:包括所有能够协调出双赢对局的博弈,如囚徒困境;赢对局的博弈,如囚徒困境;v狭义的协调博弈:仅指个体利益与集体利狭义的协调博弈:仅指个体利益与
15、集体利益一致的博弈,对于参与人而言,合作总益一致的博弈,对于参与人而言,合作总比不合作要好。比不合作要好。2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华35协调博弈举例:胖子进门协调博弈举例:胖子进门-1,-11,2后走后走2,1-1,-1先走先走后走后走先走先走张三张三支付支付 李四李四2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华36协调博弈举例:交通规则博弈协调博弈举例:交通规则博弈1,1-1,-1靠左靠左-1,-11,1靠右靠右靠左靠左靠右靠右张三张三支付支付 李四李四2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华
16、康旭华37对称博弈对称博弈l对称博弈是指在无角色区分的参与者之间进行的协调博弈,对称博弈是指在无角色区分的参与者之间进行的协调博弈,它表现在支付函数的对称上,二者的策略集是一样的。它表现在支付函数的对称上,二者的策略集是一样的。 抑或:通俗说就是代表参与者身份的下标,在分析中可以抑或:通俗说就是代表参与者身份的下标,在分析中可以省略掉而没有关系。省略掉而没有关系。l对称博弈分成三类:对称博弈分成三类: 支付占优与风险占优不一致;支付占优与风险占优不一致; 支付占优与风险占优一致;支付占优与风险占优一致; 无占优性可比的协调博弈。无占优性可比的协调博弈。 2022-4-29山西财经大学经济学院山
17、西财经大学经济学院 康旭华康旭华38支付占优与风险占优不一致支付占优与风险占优不一致3,32,0猎兔猎兔0,24,4猎鹿猎鹿猎兔猎兔猎鹿猎鹿甲甲支付支付 乙乙 纯策略猎鹿是支付占优纳什均衡、纯策略猎兔是纯策略猎鹿是支付占优纳什均衡、纯策略猎兔是风险占优纳什均衡。风险占优纳什均衡。 猎兔策略是一个保险策略,而猎鹿则是一个帕累猎兔策略是一个保险策略,而猎鹿则是一个帕累托效率策略但由于策略的不确定性而使它具有较大的托效率策略但由于策略的不确定性而使它具有较大的风险。风险。 因此,均衡选择取决于参与人对风险的态度。因此,均衡选择取决于参与人对风险的态度。 2022-4-29山西财经大学经济学院山西财经
18、大学经济学院 康旭华康旭华39支付占优与风险占优一致支付占优与风险占优一致1,10,0右行右行0,01,1左行左行右行右行左行左行甲甲支付支付 乙乙这种情况博弈双方有完全相同的偏好,协调这种情况博弈双方有完全相同的偏好,协调博弈中两个严格纳什均衡是无差异的,而该博弈中两个严格纳什均衡是无差异的,而该博弈的两个严格纳什均衡就是无差异的。博弈的两个严格纳什均衡就是无差异的。 2022-4-29山西财经大学经济学院山西财经大学经济学院 康旭华康旭华40无支付占优与风险占优区分无支付占优与风险占优区分 2,20,0X20,01,1X1X2X1甲甲支付支付 乙乙此类博弈有两个严格纳什均衡(此类博弈有两个严格纳什均衡(X1X1,X1X1););(X2X2,X2X2)。)。