1、2022年8月6日星期六1第十章 博弈论初步第一节 博弈论和策略行为1.博弈论的含义博弈论的含义 博弈论是研究在策略性环境中如何进行策略性决策和采取博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。策略性行动的科学。策略性环境是指,每一个人进行的决策和采取的行动都会对策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。其他人的可能反应来决定自己的决策和行动。2.博弈的三个基本要素博弈的三个基本要素 三个基本要素,即参与人、参与
2、人的策略和参与人的支付。三个基本要素,即参与人、参与人的策略和参与人的支付。所谓参与人(或称局中人),就是在博弈中进行决策的个体;所谓参与人(或称局中人),就是在博弈中进行决策的个体;所谓参与人的策略,指的是一项规则,根据该规则,参与人在博所谓参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动;所谓参与人的支付则是指,在所弈的每一时点上选择如何行动;所谓参与人的支付则是指,在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。的效用(或期望效用)。2022年8月6日星期六23.博弈的
3、简单分类博弈的简单分类根据参与人的数量,可以分为二人博弈和多人博弈;例根据参与人的数量,可以分为二人博弈和多人博弈;例如下棋、打扑克牌;如下棋、打扑克牌;根据参与人的支付情况,可分为零和博弈和非零和博弈;根据参与人的支付情况,可分为零和博弈和非零和博弈;例如赌博;例如赌博;根据参与人拥有的策略的数量多少,可分为有限博弈和根据参与人拥有的策略的数量多少,可分为有限博弈和无限博弈;无限博弈;根据参与人在实施策略上是否有时间的先后,可分为同根据参与人在实施策略上是否有时间的先后,可分为同时博弈和序贯博弈。时博弈和序贯博弈。第一节 博弈论和策略行为2022年8月6日星期六3第二节 同时博弈:纯策略均衡
4、 假定在某个寡头市场上,只有甲、乙两个厂商。假定在某个寡头市场上,只有甲、乙两个厂商。每个厂商都有两个可供选择的策略,即合作和不合作。每个厂商都有两个可供选择的策略,即合作和不合作。两个厂商各自选择的策略共形成四个两个厂商各自选择的策略共形成四个组合组合。一、例子:寡头博弈 2 3 5 2 1 5 3 4 合作合作厂商甲厂商甲 不合作不合作 厂商乙厂商乙 合作合作 不合作不合作2022年8月6日星期六41.支付矩阵支付矩阵 使用支付矩阵来描述和分析只有两人参加且两人同时使用支付矩阵来描述和分析只有两人参加且两人同时进行决策的简单博弈。进行决策的简单博弈。矩阵的左边表示甲厂商的策略,上边表示乙厂
5、商的策矩阵的左边表示甲厂商的策略,上边表示乙厂商的策略;矩阵中四个单元格里的数字组合分别表示博弈的四个略;矩阵中四个单元格里的数字组合分别表示博弈的四个结果即支付,其中每一个数字组合的第一个数字是甲厂商结果即支付,其中每一个数字组合的第一个数字是甲厂商得到的支付,第二个数字是乙厂商得到的支付。得到的支付,第二个数字是乙厂商得到的支付。2.子矩阵子矩阵 支付矩阵可以一分为二,即拆成两个支付矩阵可以一分为二,即拆成两个“小小”的子支付矩的子支付矩阵。其中阵。其中,一个为甲厂商的支付矩阵,由原矩阵每一单元格一个为甲厂商的支付矩阵,由原矩阵每一单元格中的第一个数字组成;另一个为乙厂商的支付矩阵,由原中
6、的第一个数字组成;另一个为乙厂商的支付矩阵,由原矩阵每一单元格中的第二个数字组成。矩阵每一单元格中的第二个数字组成。二、支付矩阵第二节 同时博弈:纯策略均衡2022年8月6日星期六5 1.甲厂商的甲厂商的条件策略和条件策略组合条件策略和条件策略组合 把甲厂商在乙厂商选择合作条件下的最优策略即合作叫把甲厂商在乙厂商选择合作条件下的最优策略即合作叫做甲厂商的条件优势策略或相对优势策略,简称条件策略。做甲厂商的条件优势策略或相对优势策略,简称条件策略。把与甲厂商的条件策略相联系的策略组合叫做甲厂商的把与甲厂商的条件策略相联系的策略组合叫做甲厂商的条件优势策略组合或相对优势策略组合,简称条件策略组合。
7、条件优势策略组合或相对优势策略组合,简称条件策略组合。甲厂商分别有两个甲厂商分别有两个条件策略和条件策略组合。条件策略和条件策略组合。2.乙厂商的乙厂商的条件策略和条件策略组合条件策略和条件策略组合 把乙厂商在甲厂商选择合作条件下的最优策略即合作叫把乙厂商在甲厂商选择合作条件下的最优策略即合作叫做乙厂商的条件优势策略或相对优势策略,简称条件策略。做乙厂商的条件优势策略或相对优势策略,简称条件策略。把与乙厂商的条件策略相联系的策略组合叫做乙厂商的把与乙厂商的条件策略相联系的策略组合叫做乙厂商的条件优势策略组合或相对优势策略组合,简称条件策略组合。条件优势策略组合或相对优势策略组合,简称条件策略组
8、合。乙厂商也分别有两个乙厂商也分别有两个条件策略和条件策略组合。条件策略和条件策略组合。三、条件策略和条件策略组合第二节 同时博弈:纯策略均衡2022年8月6日星期六61.博弈均衡的概念博弈均衡的概念 当两个厂商的条件策略组合恰好相同,从而,两个厂商都不再有单当两个厂商的条件策略组合恰好相同,从而,两个厂商都不再有单独改变策略的倾向时,整个博弈就达到了均衡,即博弈均衡。独改变策略的倾向时,整个博弈就达到了均衡,即博弈均衡。博弈均衡是博弈各方最终选取的策略组合,是博弈的最终结果,是博弈均衡是博弈各方最终选取的策略组合,是博弈的最终结果,是博弈的解。博弈的解。2.纳什均衡的概念纳什均衡的概念 第一
9、,纳什均衡的概念,所谓纳什均衡,指的是参与人的这样一种第一,纳什均衡的概念,所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。或者说,在一个策略组合中,如果所有其他人都不改变策略时,没有人或者说,在一个策略组合中,如果所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。会改变自己的策略,则该策略组合就是一个纳什均衡。第二,对纳什均衡的理解第二,对纳什均衡的理解 一是一是“单独改变策略单独改变策略”是指任何一个参与人在所有其他人都不改变是指任何一个参与人在
10、所有其他人都不改变策略的情况下改变自己的策略。其他人也同时改变策略的情况不在考虑策略的情况下改变自己的策略。其他人也同时改变策略的情况不在考虑之列。之列。二是二是“不会得到好处不会得到好处”是指任何一个参与人在单独改变策略之后自是指任何一个参与人在单独改变策略之后自己的支付不会增加,这包括两种情况:或者支付减少,或者支付不变。己的支付不会增加,这包括两种情况:或者支付减少,或者支付不变。四、纳什均衡第二节 同时博弈:纯策略均衡2022年8月6日星期六71.基本方法基本方法 先用下划线法分别表示甲厂商和乙厂商的条件策略,最后确定博弈的先用下划线法分别表示甲厂商和乙厂商的条件策略,最后确定博弈的均
11、衡均衡(就是就是找到在两个数字之下都划线的单元格即可,与这些单元格相对找到在两个数字之下都划线的单元格即可,与这些单元格相对应的策略组合就是所要求的均衡策略组合应的策略组合就是所要求的均衡策略组合)。2.条件策略下划线条件策略下划线方法的五步法方法的五步法第一,把整个的支付矩阵分解为甲厂商的支付矩阵和乙厂商的支付矩阵;第一,把整个的支付矩阵分解为甲厂商的支付矩阵和乙厂商的支付矩阵;第二,在甲厂商的支付矩阵中,找出每一列的最大者(每列的最大者可能第二,在甲厂商的支付矩阵中,找出每一列的最大者(每列的最大者可能不只一个),并在其下划线;不只一个),并在其下划线;第三,在乙厂商的支付矩阵中,找出每一
12、行的最大者(每行的最大者也可第三,在乙厂商的支付矩阵中,找出每一行的最大者(每行的最大者也可能不只一个),并在其下划线;能不只一个),并在其下划线;第四,将已经划好线的甲厂商的支付矩阵和乙厂商的支付矩阵再合并起来,第四,将已经划好线的甲厂商的支付矩阵和乙厂商的支付矩阵再合并起来,得到整个的有下划线的支付矩阵;得到整个的有下划线的支付矩阵;第五,在带有下划线的整个的支付矩阵中,找到两个数字之下均划有线的第五,在带有下划线的整个的支付矩阵中,找到两个数字之下均划有线的支付组合,则由该支付组合代表的策略组合就是均衡的策略组合支付组合,则由该支付组合代表的策略组合就是均衡的策略组合五、寻找纳什均衡的方
13、法条件策略下划线法第二节 同时博弈:纯策略均衡2022年8月6日星期六83.总结总结 在一个单元格中,如果两个数字之下均划有线,在一个单元格中,如果两个数字之下均划有线,则两个参与人都没有单独改变策略的动机,因为这两则两个参与人都没有单独改变策略的动机,因为这两个数字分别是列最大值和行最大值;如果两个数字之个数字分别是列最大值和行最大值;如果两个数字之下均没有线,则两个参与人都有单独改变策略的动机,下均没有线,则两个参与人都有单独改变策略的动机,因为这两个数字分别不是列最大值和行最大值;如果因为这两个数字分别不是列最大值和行最大值;如果两个数字中一个下面有线一个下面没线,则有线的数两个数字中一
14、个下面有线一个下面没线,则有线的数字所代表的参与人没有单独改变策略的动机,没线的字所代表的参与人没有单独改变策略的动机,没线的数字所代表的参与人有单独改变策略的动机。数字所代表的参与人有单独改变策略的动机。第二节 同时博弈:纯策略均衡2022年8月6日星期六91.存在性存在性 在同时博弈中,(纯策略的)纳什均衡既可能存在同时博弈中,(纯策略的)纳什均衡既可能存在,也可能不存在。在,也可能不存在。2.唯一性唯一性 在纳什均衡存在的条件下,它既可能是唯一的,也在纳什均衡存在的条件下,它既可能是唯一的,也可能不唯一。可能不唯一。3.最优性最优性 如果纳什均衡存在,则它既可能是最优的,也可能如果纳什均
15、衡存在,则它既可能是最优的,也可能不是最优的。不是最优的。六、纳什均衡的存在性、唯一性和最优性第二节 同时博弈:纯策略均衡2022年8月6日星期六10 1.81.81种可能的支付矩阵种可能的支付矩阵 A A的支付矩阵有的支付矩阵有9 9种可能,种可能,B B的支付矩阵也有的支付矩阵也有9 9种可能,种可能,因此,整个博弈(亦即因此,整个博弈(亦即A A与与B B两人合在一起)的支付矩阵总两人合在一起)的支付矩阵总共就有共就有9 99=819=81种可能。种可能。2.纳什均衡的五种类型纳什均衡的五种类型 全部的纳什均衡可分为五种类型,分别有四个均衡全部的纳什均衡可分为五种类型,分别有四个均衡(包
16、括(包括1种情况)、三个均衡(包括种情况)、三个均衡(包括12种情况)、两个均种情况)、两个均衡(包括衡(包括38种情况)种情况)、一个均衡(包括、一个均衡(包括28种情况)和零个种情况)和零个均衡(包括均衡(包括2种情况)。种情况)。七、二人同时博弈的一般理论第二节 同时博弈:纯策略均衡2022年8月6日星期六11第三节 同时博弈:混合策略均衡1.混合策略混合策略 第一,第一,“确定性确定性”选择选择 在没有纳什均衡的同时博弈里,所有参与人对策略的选择都是在没有纳什均衡的同时博弈里,所有参与人对策略的选择都是“确定确定”的,即某参与人在选择某个策略的时候,他不能再同时选的,即某参与人在选择某
17、个策略的时候,他不能再同时选择其他的策略,此时相应的条件策略也是择其他的策略,此时相应的条件策略也是“确定确定”的;最后,当参的;最后,当参与人的条件策略是与人的条件策略是“确定确定”的时候,最终的博弈的时候,最终的博弈均衡(如果有的话)均衡(如果有的话)也是也是“确定确定”的。的。第二,第二,“混合性混合性”选择选择 在现实生活中,人们对策略的选择常常并不像前面所说的那样在现实生活中,人们对策略的选择常常并不像前面所说的那样“非此即彼非此即彼”,而是会以一定的可能性来选择某个策略,又以另外,而是会以一定的可能性来选择某个策略,又以另外的可能性选择另外一些策略。的可能性选择另外一些策略。第三,
18、第三,“混合混合”策略的概念策略的概念 把甲厂商和乙厂商原来的策略叫做把甲厂商和乙厂商原来的策略叫做“纯纯”策略,把赋予这些纯策略,把赋予这些纯策略的概率向量叫做策略的概率向量叫做“混合混合”策略。策略。一、不存在纯策略均衡时的混合策略均衡2022年8月6日星期六122.混合策略组合 参与人的混合策略组合是一个概率向量组合,其中,每一个概率向量是相应参与人的一个混合策略。3.期望支付 在混合策略博弈中,对于每一个混合策略组合,也存在一个支付组合,其中,每一项也都是相应参与人在该混合策略组合条件下所得到的支付。不过,由于现在每个参与人都是以一定的概率来选择其纯策略的,故相应的支付也就成了所谓的“
19、期望支付”,即支付的期望值。4.条件混合策略 利用计算期望支付的公式可以求得甲厂商和乙厂商的条件混合策略(即具有相对优势的混合策略)。5.混合策略的纳什均衡 参与人的条件混合策略可以分别确定,确定了条件混合策略,就可以进一步来确定混合策略的纳什均衡。第三节 同时博弈:混合策略均衡图101 混合策略的纳什均衡(一)2022年8月6日星期六132022年8月6日星期六14 求解混合策略纳什均衡的方法不仅适用于纯策略纳什均衡不存在的情况,而且也适用于纯策略纳什均衡存在的情况。在后面这种情况下,纯策略纳什均衡将作为特例被包含在相应的混合策略纳什均衡之中。二、存在纯策略均衡时的混合策略均衡第三节 同时博
20、弈:混合策略均衡1.模型 使用与纯策略博弈的一般均衡相对应的混合策略博弈的一般模型进行分析。图102 混合策略的纳什均衡(二)2022年8月6日星期六152022年8月6日星期六162.混合策略与混合策略混合策略与混合策略组合组合 两个参与人的全部策略分别包括了各自的两个纯策略。两个参与人的全部策略分别包括了各自的两个纯策略。3.期望支付期望支付 运用两个参与人的混合策略组合,可以分别表示出运用两个参与人的混合策略组合,可以分别表示出两个两个参与人参与人得到得到的支付。的支付。4.参与人参与人A的条件混合策的条件混合策略略 根据根据A的期望支付公式,可以确定其条件混合策略的期望支付公式,可以确
21、定其条件混合策略。5.参与人参与人B的条件混合策的条件混合策略略 根据根据B的期望支付公式,可以确定其条件混合策略的期望支付公式,可以确定其条件混合策略。第三节 同时博弈:混合策略均衡图103 A的条件混合策略(一)2022年8月6日星期六17图104 A的条件混合策略(二)2022年8月6日星期六18图104 A的条件混合策略(二)2022年8月6日星期六19图105 A的条件混合策略(三)2022年8月6日星期六20图106 A的条件混合策略(四)2022年8月6日星期六212022年8月6日星期六22第三节 同时博弈:混合策略均衡6.纳什均衡纳什均衡 第一,混合策略纳什均衡的决定第一,混
22、合策略纳什均衡的决定 给定给定A A的一个支付矩阵,就有的一个支付矩阵,就有A A的一个条件混合策略曲线,的一个条件混合策略曲线,给定给定B B的一个支付矩阵,又有的一个支付矩阵,又有B B的一个条件混合策略曲线。如的一个条件混合策略曲线。如果把这两个条件混合策略曲线放在同一个图中,则其交点就果把这两个条件混合策略曲线放在同一个图中,则其交点就决定了相应情况下的混合策略纳什均衡。决定了相应情况下的混合策略纳什均衡。第二,第二,A与与B的条件混合策略的的条件混合策略的81种种“搭配搭配”可能可能 A的条件混合策略曲线有的条件混合策略曲线有9种情况,种情况,B的条件混合策略曲的条件混合策略曲线也有
23、线也有9种情况,因此,种情况,因此,A与与B的条件混合策略曲线之间的两的条件混合策略曲线之间的两两两“搭配搭配”共有共有99=81种可能,并最终形成混合策略纳什种可能,并最终形成混合策略纳什均衡的均衡的7种类型的种类型的“集合集合”,即,即“单位平面单位平面”、三条线段、三条线段、两条线段、一条线段、三个点、两个点和一个点两条线段、一条线段、三个点、两个点和一个点。三、混合策略博弈的一般理论2022年8月6日星期六23第四节 序贯博弈1.两个参与者 在该博弈中,两个参与者是竞争者和垄断者。2.两个参与者的决策顺序及其策略 竞争者先决策,它决定进入还是不进入由垄断者独霸的市场;垄断者后决策,它根
24、据竞争者的行动决定对其“容忍”还是“抵抗”。竞争者有进入和不进入两个策略,垄断者也有容忍和抵抗两个策略。因此,总共有四个策略组合。每一策略组合中,第一项是先行动者即竞争者的策略,第二项是后行动者即垄断者的策略。一、例子:竞争者垄断者博弈2022年8月6日星期六241.博弈树的起点 “起点”又叫做“初始决策点”,通常只有一个。起点是博弈树的“根”,是序贯博弈开始的地方,是博弈的最先行动者进行决策的地方。2.博弈树的线段 从初始决策点出发,向右伸展两条线段,分别表示竞争者可以采取的两个行动或策略。3.博弈树的中间点 中间点又叫做“中间决策点”,通常至少应有两个。通常在这些中间决策点的旁边标上另一参
25、与人,表示中间点是另一参与人做决策的地方。二、博弈树第四节 序贯博弈图107 竞争者垄断者博弈2022年8月6日星期六254.博弈树的博弈树的终终点点第一,第一,终点不是决策点终点不是决策点 终点是博弈结束的地方。终点是博弈结束的地方。与起点和中间点不同,终点不是决策点:既不是初始决策点,也与起点和中间点不同,终点不是决策点:既不是初始决策点,也不是中间决策点。因此,终点不属于任何的参与人,终点的旁边没有不是中间决策点。因此,终点不属于任何的参与人,终点的旁边没有标注任何的参与人。标注任何的参与人。第二,第二,终点的两层含义终点的两层含义 一是代表博弈的一个策略组合一是代表博弈的一个策略组合从
26、起点开始导向某个终点的所从起点开始导向某个终点的所有线段按先后秩序排列的一个组合。有线段按先后秩序排列的一个组合。二二是是代表与某一个策略组合相对应的一个支付组合代表与某一个策略组合相对应的一个支付组合在每一个在每一个终点的旁边,有一对用圆括号围住的数字,其中的第一个数字是先行终点的旁边,有一对用圆括号围住的数字,其中的第一个数字是先行动者的支付,第二个数字是后行动者的支付。动者的支付,第二个数字是后行动者的支付。2022年8月6日星期六261.序贯博弈中的纳什均衡 在竞争者垄断者博弈中,第一个终点,即旁边标有支付组合(1,4)所代表的策略组合(进入,容忍)是一个纳什均衡。因为在该策略组合上,
27、没有哪个参与人愿意单独改变自己的策略。2.序贯博弈中的纳什均衡也可能不止一个 比如,在情侣博弈中,有两个纳什均衡,一个是(足球,足球),即男方先选择足球,女方然后也选择足球;另一个是(芭蕾,芭蕾),即男方先选择芭蕾,女方然后也选择芭蕾。三、纳什均衡第四节 序贯博弈图108 情侣博弈2022年8月6日星期六272022年8月6日星期六281.逆向归纳法的两个步骤逆向归纳法的两个步骤 第一步,先从博弈的最后阶段的每一个决策点开始,第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原
28、博弈的一个简化博弈;其他策略删除,从而得到原博弈的一个简化博弈;第二步,再对简化博弈重复步骤一的程序,直到最后,第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博弈得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解。的解。2.逆向归纳策略总是纳什均衡,尽管纳什均衡并不一定也逆向归纳策略总是纳什均衡,尽管纳什均衡并不一定也是逆向归纳策略是逆向归纳策略四、纳什均衡的精炼:逆向归纳法第四节 序贯博弈图109 简化的情侣博弈(1)2022年8月6日星期六制作者:张昌廷(河北经贸大学)29图1010 简化的情侣博弈(2)2022年8月6日星期六制作者:张
29、昌廷(河北经贸大学)302022年8月6日星期六31 3.先动优势 从情侣博弈的例子中可以看到所谓的“先动优势”先行动者的得益大于后行动者的得益。比如,男方先动,逆向归纳的结果就是对男方更加有利的纳什均衡(足球,足球;如果情侣博弈改为女方先行动,则逆向归纳的结果就是对女方更加有利的纳什均衡(芭蕾,芭蕾)。4.序贯博弈与同时博弈的一个重要区别 当博弈是“同时”的时候,如果出现多重纳什均衡,常常无法确定最终实现的是哪一个纳什均衡,但是,当博弈是“序贯”的时候,即使纳什均衡是多重的,往往能够从中确定一个最终的均衡。这是因为,与同时博弈相比,序贯博弈提供了更多的信息关于参与人决策秩序的信息。四、纳什均
30、衡的精炼:逆向归纳法第四节 序贯博弈图1011 情侣博弈:女方先动2022年8月6日星期六制作者:张昌廷(河北经贸大学)32图1012 简化的竞争者垄断者博弈(1)2022年8月6日星期六制作者:张昌廷(河北经贸大学)33图1013 简化的竞争者垄断者博弈(2)2022年8月6日星期六制作者:张昌廷(河北经贸大学)342022年8月6日星期六35附:附:寡头厂商之间的博弈寡头厂商之间的博弈一、博弈论的基本知识一、博弈论的基本知识二、博弈均衡的基本概念及解法二、博弈均衡的基本概念及解法三、囚徒困境的扩展应用:寡头厂商合作的三、囚徒困境的扩展应用:寡头厂商合作的不稳定不稳定 四、重复博弈四、重复博弈 五、可信性问题可信性问题 一一、博弈论的基本知识、博弈论的基本知识 二、博弈均衡的基本概念及解法二、博弈均衡的基本概念及解法 三、囚徒困境的扩展应用:寡头厂商合三、囚徒困境的扩展应用:寡头厂商合作的不稳定作的不稳定 四、重复博弈四、重复博弈