1、第七章、对策与决策模型第七章、对策与决策模型 前言前言7.1 对策问题对策问题 7.2、决策问题、决策问题7.3 层次分析法建模层次分析法建模前言前言 对策与决策是人们在日常生活和工作中经常碰对策与决策是人们在日常生活和工作中经常碰到的择优活动。人们在处理某一问题时,往往会面到的择优活动。人们在处理某一问题时,往往会面临多种可能出现的情形,同时又存在多种可供选择临多种可能出现的情形,同时又存在多种可供选择的行动方案,要求根据自己的行动目的从中选定一的行动方案,要求根据自己的行动目的从中选定一种方案,以期获得最佳的结果。种方案,以期获得最佳的结果。有时,人们面临的问题具有竞争或对抗性质,如有时,
2、人们面临的问题具有竞争或对抗性质,如商业上的竞争、体育中的比赛和军事对抗、政治派商业上的竞争、体育中的比赛和军事对抗、政治派别的斗争等等。这时竞争双方或各方都希望发挥自别的斗争等等。这时竞争双方或各方都希望发挥自己的优势,使己方获得最好结果。因而双方或各方己的优势,使己方获得最好结果。因而双方或各方都要根据不同情况、不同对手作出各自的决择,此都要根据不同情况、不同对手作出各自的决择,此时遇到的问题被称为对策。时遇到的问题被称为对策。在有些情况下,我们面临的并非竞争对手而是在有些情况下,我们面临的并非竞争对手而是可能出现的多种情况,我们不知道究竟哪一种情可能出现的多种情况,我们不知道究竟哪一种情
3、况会发生,但希望我们的决策能获得最好的结果,况会发生,但希望我们的决策能获得最好的结果,此时,我们面临的问题被称为决策问题,不过,此时,我们面临的问题被称为决策问题,不过,如果我们将可能出现的若干种情况也看作是竞争如果我们将可能出现的若干种情况也看作是竞争对手可采取的几种策略,那么也可以把决策问题对手可采取的几种策略,那么也可以把决策问题当作对策问题来处理。当作对策问题来处理。7.1 对策问题对策问题 对策对策问题的特征是参与者为利益相互冲突的各方,问题的特征是参与者为利益相互冲突的各方,其结局并不取决于其中任何一方的努力,而是各方其结局并不取决于其中任何一方的努力,而是各方所采取的策略的综合
4、结果。所采取的策略的综合结果。先考察几个实际例子。先考察几个实际例子。例例7.17.1(田忌赛马)(田忌赛马)田忌赛马是大多数人都熟知的故事。事情发生田忌赛马是大多数人都熟知的故事。事情发生在战国时期,据说齐王欲与大将田忌赛马,双方约在战国时期,据说齐王欲与大将田忌赛马,双方约定每人从自己的上、中、下三个等级的马中各挑选定每人从自己的上、中、下三个等级的马中各挑选赛马一匹来进行三局比赛,进行每局比赛时,双方赛马一匹来进行三局比赛,进行每局比赛时,双方 各派赛马一匹比试,每局的败者要付给胜者一千两黄各派赛马一匹比试,每局的败者要付给胜者一千两黄金。当时,齐王的每一等级的马都比田忌同等级的马要金。
5、当时,齐王的每一等级的马都比田忌同等级的马要强,因而,如果田忌用自己的上等马与齐王的上等马比强,因而,如果田忌用自己的上等马与齐王的上等马比试,用自己的中等马与齐王的中等马比试,用自己的下试,用自己的中等马与齐王的中等马比试,用自己的下等马与齐王的下等马比试,则田忌要输三局,因而要输等马与齐王的下等马比试,则田忌要输三局,因而要输掉黄金三千两。但是结果田忌并没有输,反而赢了一千掉黄金三千两。但是结果田忌并没有输,反而赢了一千两黄金。这是因为田忌的谋士孙膑给他出了一个主意,两黄金。这是因为田忌的谋士孙膑给他出了一个主意,让他用下等马对齐王的上等马,上等马对齐王的中等马,让他用下等马对齐王的上等马
6、,上等马对齐王的中等马,中等马对齐王的下等马,结果田忌二胜一败,反而赢了中等马对齐王的下等马,结果田忌二胜一败,反而赢了一千两黄金。一千两黄金。例例7.2 7.2 (石头(石头剪刀剪刀布)布)这是一个大多数人小时候都玩过的游戏。游戏双这是一个大多数人小时候都玩过的游戏。游戏双方每次出拳只能选石头、剪刀、布中的一种,石头方每次出拳只能选石头、剪刀、布中的一种,石头赢剪刀,剪刀赢布,而布又赢石头,赢者得一分,赢剪刀,剪刀赢布,而布又赢石头,赢者得一分,输者失一分,双方相同时不得分,见下表。输者失一分,双方相同时不得分,见下表。A BA B石头石头剪子剪子布布石头石头0 01 11 1剪子剪子1 1
7、0 01 1布布1 11 10 0表表7-17-1例例7.3 7.3 (嫌犯的困惑)(嫌犯的困惑)警察同时拘捕了两嫌疑犯,为防止串供,将他警察同时拘捕了两嫌疑犯,为防止串供,将他们分开关押。逮捕的原因是他们持有大量伪币。们分开关押。逮捕的原因是他们持有大量伪币。警方怀疑他们伪造钱币,但没有找到充分的证据,警方怀疑他们伪造钱币,但没有找到充分的证据,希望他们能自己供认。这两个人都知道:如果他希望他们能自己供认。这两个人都知道:如果他们双方都不供认,将被以使用和持有大量伪币罪们双方都不供认,将被以使用和持有大量伪币罪被各判刑被各判刑1818个月;如果双方都供认伪造了钱币,个月;如果双方都供认伪造了
8、钱币,将以伪造钱币罪被各被判刑将以伪造钱币罪被各被判刑3 3年;如果一方供认年;如果一方供认而另一方不供认,则供认方将被从宽处理而免予而另一方不供认,则供认方将被从宽处理而免予刑事处分,但另一方则将被判刑刑事处分,但另一方则将被判刑7 7年。将嫌疑犯年。将嫌疑犯A A、B B被判刑的几种可能情况列表如下:被判刑的几种可能情况列表如下:表表7-27-2A BA B供认供认不供认不供认供认供认(3 3,3 3)(0 0,7 7)不供认不供认(7 7,0 0)(1.51.5,1.51.5)表中每对数字是嫌疑犯表中每对数字是嫌疑犯A A、B B分别被判刑的年数的分别被判刑的年数的组合。如果两名嫌疑犯均
9、担心对方供认并希望受到最组合。如果两名嫌疑犯均担心对方供认并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。轻的惩罚,最保险的办法自然是承认制造了伪币。从这些简单实例中可以看出对策现象中包含着几从这些简单实例中可以看出对策现象中包含着几个基本要素。个基本要素。(对策的基本要素)(对策的基本要素)(1 1)局中人。参加决策的各方被称为对策问题)局中人。参加决策的各方被称为对策问题的局中人,一个决策问题至少包含着两名局中人的局中人,一个决策问题至少包含着两名局中人(如棋类比赛等),也可以包含多于两名局中人(如棋类比赛等),也可以包含多于两名局中人(如大多数商业中的竞争、政治派别间的斗争(如大
10、多数商业中的竞争、政治派别间的斗争等)。局中人必须拥有可供其选择并影响最终结等)。局中人必须拥有可供其选择并影响最终结局的策略,在例局的策略,在例7.17.1中,田忌的朋友孙膑不能称之中,田忌的朋友孙膑不能称之为局中人,他只是给田忌了提供了可供参考的策为局中人,他只是给田忌了提供了可供参考的策略,而没有做出决策的权利,最终的决策只能由略,而没有做出决策的权利,最终的决策只能由局中人田忌本人来做出。同样,在例局中人田忌本人来做出。同样,在例7.37.3中,局中中,局中人是人是A A、B B两名嫌疑犯,警方并非局中人。两名嫌两名嫌疑犯,警方并非局中人。两名嫌犯最终被如何判刑,取决于他们各自采取的态
11、度,犯最终被如何判刑,取决于他们各自采取的态度,警方并不能代替他们做出选择。警方并不能代替他们做出选择。(2 2)策略集。局中人所能采取的每一可行方案均被)策略集。局中人所能采取的每一可行方案均被称为策略,某局中人可采取的全部策略称为该局中人的称为策略,某局中人可采取的全部策略称为该局中人的策略集。对策问题中,对应于每一局中人均存在着一个策略集。对策问题中,对应于每一局中人均存在着一个策略集,而每一策略集中至少要求有两个策略,否则,策略集,而每一策略集中至少要求有两个策略,否则,该局中人可从此对策问题中删去,因为对他来讲,他只该局中人可从此对策问题中删去,因为对他来讲,他只有唯一的方案,不存在
12、任何选择策略的余地。应当注意有唯一的方案,不存在任何选择策略的余地。应当注意的是,所谓策略是指在整个竞争过程中对付他方的整套的是,所谓策略是指在整个竞争过程中对付他方的整套策略,并非指竞争过程中某个步骤所采取的具体局部办策略,并非指竞争过程中某个步骤所采取的具体局部办法。例如田忌先出下等马比赛只能看成其完整策略的组法。例如田忌先出下等马比赛只能看成其完整策略的组成部分,而不能看成一个完整的策略。成部分,而不能看成一个完整的策略。因为首先出下等马比赛,比赛还没有结束,接因为首先出下等马比赛,比赛还没有结束,接下来还必须继续为剩余的比赛寻找应对方法。只下来还必须继续为剩余的比赛寻找应对方法。只有当
13、比赛全部结束,各比赛方案组合在一起才能有当比赛全部结束,各比赛方案组合在一起才能构成一个策略,比如,先出下等马,再出上等马,构成一个策略,比如,先出下等马,再出上等马,后出中等马就构成了一个策略。当然,有时也可后出中等马就构成了一个策略。当然,有时也可将具体的局部方法看成一个多阶段对策中的子对将具体的局部方法看成一个多阶段对策中的子对策。策略集合可以是有限集也可以是无限集,策策。策略集合可以是有限集也可以是无限集,策略集为有限集时的对策问题被称为有限对策,否略集为有限集时的对策问题被称为有限对策,否则被称为无限对策。则被称为无限对策。iiS记局中人记局中人的策略集为的策略集为。对策时,对策问题
14、的各方都从各自的策略集合对策时,对策问题的各方都从各自的策略集合中选定了一个策略。中选定了一个策略。各方都采取了自己的策略后,对策问题将产生各方都采取了自己的策略后,对策问题将产生一个结果,该结果可用一个矢量一个结果,该结果可用一个矢量S表示,称之为一个纯局势(简称局势)。表示,称之为一个纯局势(简称局势)。m12,m n1,n例如,若一对策中包含例如,若一对策中包含A A、B B两名局中人,两名局中人,A A有有种策略种策略,B B有有种策略种策略12,AmS 1,BnSA A、B B的策略集合分别为的策略集合分别为和和ij(,)ij 如果局中人如果局中人A A选择策略选择策略而局中人而局中
15、人B B选择策略选择策略则对策结果则对策结果就成为此对策的一个纯局势。就成为此对策的一个纯局势。ASBSm nS显然,策略集显然,策略集与与共构成共构成个纯局势,它们构成表个纯局势,它们构成表7.37.3。由对策问题的全体。由对策问题的全体纯局势构成的集合纯局势构成的集合称为此对策问题的局势集合。称为此对策问题的局势集合。表表7-37-3 在例在例7.17.1中,齐王和田忌双方都要各选派自己中,齐王和田忌双方都要各选派自己的三匹分属上、中、下三个等级的马分别参加一的三匹分属上、中、下三个等级的马分别参加一局比赛。如果用局比赛。如果用1 1、2 2、3 3分别代替齐王的上等马、分别代替齐王的上等
16、马、中等马、下等马,而用三个数字排列的先后顺序中等马、下等马,而用三个数字排列的先后顺序表示参赛次序,例如(表示参赛次序,例如(1 1,2 2,3 3)表示齐王用上等)表示齐王用上等马参加第一局比赛,中等马参加第二局比赛,下马参加第一局比赛,中等马参加第二局比赛,下等马参加第三局比赛,那么齐王的策略集等马参加第三局比赛,那么齐王的策略集AS也包含(也包含(1 1,3 3,2 2)、()、(2 2,1 1,3 3)、()、(2 2,3 3,1 1)、()、(3 3,2 2,1 1)、()、(3 3,1 1,2 2)六个策略,分)六个策略,分别记为别记为126、(此处仍用(此处仍用1 1、2 2、
17、3 3分别代替田忌的上等马、中等分别代替田忌的上等马、中等马、下等马)。局势集合马、下等马)。局势集合S S包含了由双方的策略两包含了由双方的策略两两组合而成两组合而成3636个纯局势。个纯局势。BS同样,田忌的策略集同样,田忌的策略集126、也包含(也包含(1 1,3 3,2 2)、()、(2 2,1 1,3 3)、()、(2 2,3 3,1 1)、()、(3 3,2 2,1 1)、()、(3 3,1 1,2 2)六个策略,分别)六个策略,分别记为记为(此处仍用(此处仍用1 1、2 2、3 3分别代替田忌的上等马、中等分别代替田忌的上等马、中等马、下等马)。局势集合马、下等马)。局势集合S
18、S包含了由双方的策略两包含了由双方的策略两两组合而成两组合而成3636个纯局势。个纯局势。(3 3)赢得函数(或称支付函数)。对策的结果要)赢得函数(或称支付函数)。对策的结果要体现到每位局中人身上,所以一般用矢量表示,称体现到每位局中人身上,所以一般用矢量表示,称之为赢得函数。赢得函数之为赢得函数。赢得函数F F为定义在局势集为定义在局势集S S上的矢上的矢值函数,对于值函数,对于S S中的每一纯局势中的每一纯局势s s,F F(s s)指出了每)指出了每一局中人在此对策结果下应赢得(或支付)的值。一局中人在此对策结果下应赢得(或支付)的值。iIiS记局中人集合为记局中人集合为I=I=(1
19、1,k k),对每一),对每一有一策略集有一策略集,当当I I中每一局中人选定自己的中每一局中人选定自己的策略后得一个局势策略后得一个局势s s;将将s s代入赢得函数代入赢得函数F F,即得,即得一矢量一矢量 1()(),()kF sF sF s其中其中()iF s为在局势为在局势s s下局中人下局中人i i的赢得(或支付)。的赢得(或支付)。11111(,)F 211(,)F 如例如例7.17.1在局势在局势(,)下齐王的赢得值为下齐王的赢得值为3 3,而田忌的赢得值为,而田忌的赢得值为3 3(以(以1 1千两黄金为单位)。千两黄金为单位)。综上所述,一个对策模型由局中人、策略集和综上所述
20、,一个对策模型由局中人、策略集和赢得函数三部分组成。本节讨论只有两名局中人赢得函数三部分组成。本节讨论只有两名局中人的对策问题,其结果可以推广到一般的对策模型的对策问题,其结果可以推广到一般的对策模型中去。中去。一般的对策问题讨论起来相当繁琐,为简单一般的对策问题讨论起来相当繁琐,为简单起见,本节只讨论仅有两名局中人的对策问题起见,本节只讨论仅有两名局中人的对策问题(简称为两人对策)。(简称为两人对策)。对于只有两名局中人的对策问题,其局势集和赢对于只有两名局中人的对策问题,其局势集和赢得函数均可用表格表示。例如,表得函数均可用表格表示。例如,表7.27.2就给出了例就给出了例7.37.3的局
21、势集和赢得函数,为方便起见,我们不妨的局势集和赢得函数,为方便起见,我们不妨仍用仍用 ),(jiij来记一方采用来记一方采用,另一方采用,另一方采用时双方的赢得。时双方的赢得。一类特殊的两人对策问题被称为零和对策问题,一类特殊的两人对策问题被称为零和对策问题,在这类对策中,当纯局势确定后,局中人在这类对策中,当纯局势确定后,局中人A A之所得之所得恰为另一局中人恰为另一局中人B B之所失,或者之所失,或者A A之所失恰为之所失恰为B B之所之所得,即双方所得之和总为零。如例得,即双方所得之和总为零。如例8.18.1的赛马比赛的赛马比赛结果,齐王之所得必为田忌之所失,齐王之所失结果,齐王之所得必
22、为田忌之所失,齐王之所失必为田忌之所得,因此例必为田忌之所得,因此例7.17.1中的两人对策问题就中的两人对策问题就属于零和对策问题。属于零和对策问题。在零和对策中,因在零和对策中,因 )()(21sFsF要指出对策结果只需指出其中一人的赢得即可,故要指出对策结果只需指出其中一人的赢得即可,故赢得函数可用赢得矩阵来表示。例如若赢得函数可用赢得矩阵来表示。例如若A A有有m m种策略,种策略,B B有有n n种策略,赢得矩阵可写成种策略,赢得矩阵可写成111212122212nnm nmmmnaaaaaaRaaa ija表示若表示若A A选取策略选取策略i i而而B B选取策略选取策略j j,则
23、则A A之所得为之所得为ija0ija B B之所失为之所失为(当(当时为赢得)。时为赢得)。例例7.17.1中的两人零和对策问题,赢得函数可以中的两人零和对策问题,赢得函数可以使用齐王或者田忌的赢得矩阵来表示。齐王的赢得使用齐王或者田忌的赢得矩阵来表示。齐王的赢得矩阵(以矩阵(以1 1千两黄金为单位)为:千两黄金为单位)为:12345612345631111-11311-111-13111-11131111-1131111-113 R而田忌的赢得矩阵为而田忌的赢得矩阵为-R-R。在有些两人对策的赢得表中,在有些两人对策的赢得表中,A A之所得并非明显之所得并非明显为为B B之所失,但双方赢得
24、数之和为一常数。例如在之所失,但双方赢得数之和为一常数。例如在表表7.47.4中,无论中,无论A A、B B怎样选取策略,双方赢得总和怎样选取策略,双方赢得总和均为均为1010。这种对策问题可以很容易地转化为。这种对策问题可以很容易地转化为A A之所之所的即为的即为B B之所失的零和对策问题。之所失的零和对策问题。表表7.47.4局中人局中人A A局中人局中人B B1 12 23 31 1(8,2)(8,2)(1,9)(1,9)(7,3)(7,3)2 2(4,6)(4,6)(9,1)(9,1)(3,7)(3,7)3 3(2,8)(2,8)(6,4)(6,4)(8,2)(8,2)4 4(6,4)
25、(6,4)(4,6)(4,6)(6,4)(6,4)此时,若分别把两人的赢得数各减去平均赢得数,此时,若分别把两人的赢得数各减去平均赢得数,即可将赢得表化为零和赢得表,从而可用赢得矩阵即可将赢得表化为零和赢得表,从而可用赢得矩阵来表达。表来表达。表8.48.4中的对策在转化为零和对策后,具有中的对策在转化为零和对策后,具有赢得矩阵赢得矩阵342142313111R(7.17.1)ASBS一个两人对策需要给出局中人一个两人对策需要给出局中人A A、B B的策略集的策略集和和以及表示双方赢得值的赢得矩阵以及表示双方赢得值的赢得矩阵R R。特别地,当遇到零和对策或可转化为零和对策的特别地,当遇到零和对
26、策或可转化为零和对策的问题时,由以上分析,问题时,由以上分析,R R可用通常意义下的矩阵来可用通常意义下的矩阵来表示,否则表示,否则R R的元素应为一个二维矢量。故两人对的元素应为一个二维矢量。故两人对策策G G又可称为矩阵对策,并可简记成又可称为矩阵对策,并可简记成 RSSGBA,例例7.4 7.4 给定二人对策给定二人对策 RSSGBA,,其中,其中 123,AS 和和 14,BS123123412630221421810601016 R从从R R中可以看出,中可以看出,A A的最大可能赢利为的最大可能赢利为3030。若。若A A希望希望获得最大赢利获得最大赢利3030,需采取策略,需采取
27、策略 1但此时若但此时若B B采取策略采取策略 4,A A非但得不到非但得不到3030,反而会,反而会失去失去2222。为了稳妥,。为了稳妥,A A在决策前应事先考虑到对方在决策前应事先考虑到对方可能有使自己损失最大的动机,应该在最坏的可可能有使自己损失最大的动机,应该在最坏的可能中争取最好的结果,能中争取最好的结果,B B也应该做同样的考虑。如也应该做同样的考虑。如果情况果真如此,局中人果情况果真如此,局中人A A会这样来考虑问题:会这样来考虑问题:、采取策略采取策略 123时,时,最坏的赢得结果分别为最坏的赢得结果分别为min 12,-6,30,-22 =-22 min 12,-6,30,
28、-22 =-22 min 14,2,18,10=2min 14,2,18,10=2min-6,0,-10,16=-10 min-6,0,-10,16=-10 其中最好的可能为其中最好的可能为max-22,2,-10=2 max-22,2,-10=2 那么如果那么如果A A采取策略采取策略 2无论无论B B采取什么策略,采取什么策略,A A的赢得均不会少于的赢得均不会少于2 2。B B采取各方案的最大损失为采取各方案的最大损失为max 12,14,-6=14max 12,14,-6=14max-6,2,0=2max-6,2,0=2max 30,18,-10=30max 30,18,-10=30m
29、ax-22,10,16=16max-22,10,16=16当当B B采取策略采取策略2时,其损失不会超过时,其损失不会超过2 2。注意到在赢得矩阵中,注意到在赢得矩阵中,2 2既是所在行中的最小元素既是所在行中的最小元素又是所在列中的最大元素。此时,只要对方不改变又是所在列中的最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变换自己的策略来策略,任一局中人都不可能通过变换自己的策略来增大赢得或减小损失。在这种情况下,看来,对双增大赢得或减小损失。在这种情况下,看来,对双方而言这一结果都应当被看成是最好的结果,应当方而言这一结果都应当被看成是最好的结果,应当采用什么策略似乎并无悬念,称
30、这样的局势为对策采用什么策略似乎并无悬念,称这样的局势为对策问题的一个稳定点(鞍点)或稳定解。问题的一个稳定点(鞍点)或稳定解。定义定义7.1 7.1 对于两人对策对于两人对策 RSSGBA,,若有,若有 maxminminmaxijijGjjiiaaV则称则称G G具有稳定解,并称具有稳定解,并称 GV为对策为对策G G的值。若有纯局势的值。若有纯局势 *(,)ij使得使得*minmaxi jijGjiaaV则称则称 *(,)ij为对策为对策G G的鞍点或稳定解,赢得矩阵中与的鞍点或稳定解,赢得矩阵中与 *(,)ij相对应的元素相对应的元素 *i ja称为赢得矩阵的鞍点,称为赢得矩阵的鞍点,
31、*i*j与与分别称为局中人分别称为局中人A A与与B B的最优策略。的最优策略。对(对(7.17.1)式中的赢得矩阵,容易发现不存在具有上)式中的赢得矩阵,容易发现不存在具有上述性质的鞍点。给定一个对策述性质的鞍点。给定一个对策G G,如何判断它是否具有,如何判断它是否具有鞍点呢?鞍点呢?定理定理7.1 7.1 零和对策零和对策 RSSGBA,记记 maxminminmaxijijjjiiaa,则具有稳定解的充要条件为则具有稳定解的充要条件为 0 定理定理7.17.1给出了对策问题有稳定解(简称为解)给出了对策问题有稳定解(简称为解)的充要条件。但当一个对策问题有解时,其解有可的充要条件。但当
32、一个对策问题有解时,其解有可能不唯一。例如,若赢得矩阵为能不唯一。例如,若赢得矩阵为123451234 94311010115185182641513R则易得,则易得,22(,)24(,)42(,)44(,)、均为此对策问题的解。一般而言,零和对策问题均为此对策问题的解。一般而言,零和对策问题的解具有下列性质:的解具有下列性质:(1 1)无差别性。若)无差别性。若 11(,)ij22(,)ij同为对策同为对策G G的解,则必有的解,则必有 1 12 2i ji jaa(2 2)可交换性。若)可交换性。若 11(,)ij22(,)ij均为对策均为对策G G的解,则的解,则 12(,)ij和和 2
33、1(,)ij也必为也必为G G的解。的解。具有稳定解的零和对策问题是一类特别简单的具有稳定解的零和对策问题是一类特别简单的对策问题,它所对应的赢得矩阵存在鞍点,任一局对策问题,它所对应的赢得矩阵存在鞍点,任一局中人都不可能通过自己单方面的努力来改进结果。中人都不可能通过自己单方面的努力来改进结果。然而,在实际遇到的零和对策中更典型的是然而,在实际遇到的零和对策中更典型的是 0的情形。的情形。由定理由定理7.17.1知,此时的赢得矩阵中不存在鞍点,也知,此时的赢得矩阵中不存在鞍点,也就是说,至少存在一名局中人,在他单方面改变策就是说,至少存在一名局中人,在他单方面改变策略的情况下,有可能改善自己
34、的收益。例如,考察略的情况下,有可能改善自己的收益。例如,考察(7.17.1)式中的赢得矩阵)式中的赢得矩阵R R。若双方都采取保守的若双方都采取保守的maxminmaxmin原则,将会出现纯局势原则,将会出现纯局势 41(,)43(,)但如果局中人但如果局中人A A适当改换策略,他可以增加收入。例适当改换策略,他可以增加收入。例如,如果如,如果B B采用策略采用策略 1而而A A改换策略改换策略 1则则A A可收益可收益3 3。但此时若。但此时若B B改换策略改换策略 2又会使又会使A A输掉输掉4 4,。此时,在只使用纯策略的范围内,对策问题无解。此时,在只使用纯策略的范围内,对策问题无解
35、。如果这类决策只进行一次,局中人除了碰运气以外如果这类决策只进行一次,局中人除了碰运气以外别无办法。别无办法。但如果这类决策要反复进行多次,则局中人固定但如果这类决策要反复进行多次,则局中人固定采用同一种策略显然是不明智的,因为一旦对手看采用同一种策略显然是不明智的,因为一旦对手看出你会采用什么策略,他将会选用对自己最为有利出你会采用什么策略,他将会选用对自己最为有利的策略。(例如,在你和别人玩石头剪子布游戏时,的策略。(例如,在你和别人玩石头剪子布游戏时,你始终采用同一策略显然是很不明智的,可以肯定,你始终采用同一策略显然是很不明智的,可以肯定,输掉的一定是你)。为了预防对手猜到你会采用哪输
36、掉的一定是你)。为了预防对手猜到你会采用哪一种策略,你应当不断变换你使用的策略。换句话一种策略,你应当不断变换你使用的策略。换句话说,此时局中人应采用混合策略的办法,即根据某说,此时局中人应采用混合策略的办法,即根据某种概率来选用各种策略,使自己的期望收益尽可能种概率来选用各种策略,使自己的期望收益尽可能大。大。设设A A方用概率方用概率 ix选用策略选用策略 iB B方用概率方用概率 iy选用策略选用策略 j111mnijijxy双方每次选用什么策略是随机的,不能让对方看出双方每次选用什么策略是随机的,不能让对方看出规律,记规律,记 1(,)TmXxx1(,)TnYyy则则A A的期望赢得为
37、的期望赢得为 11(,)mnTiijjijE X YX RYxa y其中,其中,R R为为A A方的赢得矩阵。方的赢得矩阵。分别称分别称SASA与与SBSB为为A A方和方和B B方的混合策略。方的混合策略。对于需要使用混合策略的对策问题,也有具有对于需要使用混合策略的对策问题,也有具有稳定解的对策问题的类似结果。稳定解的对策问题的类似结果。定义定义7.2 7.2 若存在若存在m m维概率向量维概率向量 X和和n n维概率向量维概率向量 Y使得对一切使得对一切m m维概率向量维概率向量 X和和n n维概率向量维概率向量 YmaxminTTTXYX RYX RYX RY成立,则称成立,则称 ,X
38、 Y为混合策略对策问题的鞍点。为混合策略对策问题的鞍点。定理定理7.2 7.2 任意混合策略对策问题必存在鞍点。即必存在概率向量任意混合策略对策问题必存在鞍点。即必存在概率向量 X和和 Y使得:使得:maxminminmaxTTTXXYYX RYX RYX RY 混合策略对策问题通常可采用线性规划方法求解,混合策略对策问题通常可采用线性规划方法求解,具体解法从略。具体解法从略。(非零和对策)(非零和对策)除了零和对策外,还存在着另一类对策问题,局中除了零和对策外,还存在着另一类对策问题,局中人的获利值之和并非常数。人的获利值之和并非常数。例例7.5 7.5 现有一对策问题,双方获利情况见表现有
39、一对策问题,双方获利情况见表7.57.5。表表7.57.5 B BA A1 12 23 31 1(8,28,2)(0,90,9)(7,37,3)2 2(3,43,4)(9,09,0)(2,72,7)3 3(1,61,6)(6,26,2)(8,18,1)4 4(4,24,2)(4,64,6)(5,15,1)假如假如A A、B B双方仍采取稳妥的办法,双方仍采取稳妥的办法,A A发现如采取策略发现如采取策略4 4,则至少可获利则至少可获利4 4,而,而B B发现如采取策略发现如采取策略1 1,则至少可获利,则至少可获利2 2。因而,这种求稳妥的想法将导至出现局势(因而,这种求稳妥的想法将导至出现局
40、势(4 4,2 2)。)。容易看出,从整体上看,结果并不是最好的,因容易看出,从整体上看,结果并不是最好的,因为双方的总获利有可能达到为双方的总获利有可能达到1010。不难看出,此时依。不难看出,此时依靠单方面的努力不一定能收到良好的效果。看来,靠单方面的努力不一定能收到良好的效果。看来,对这样的对策问题,双方最好还是握手言和,相互对这样的对策问题,双方最好还是握手言和,相互配合,先取得总体上的最大获利,然后再按照某一配合,先取得总体上的最大获利,然后再按照某一个双方均认为较为合理的方式来分享这一已经获得个双方均认为较为合理的方式来分享这一已经获得的最大获利。的最大获利。例例7.57.5说明,
41、总获利数并非常数的对策问题(即说明,总获利数并非常数的对策问题(即不能转化为零和对策的问题),是一类存在着合作不能转化为零和对策的问题),是一类存在着合作基础的对策问题。当然,这里还存在着一个留待解基础的对策问题。当然,这里还存在着一个留待解决而又十分关键的问题:如何分享总获利。决而又十分关键的问题:如何分享总获利。如果不能达成一个双方(或各方)都能接受的如果不能达成一个双方(或各方)都能接受的“公平公平”的分配原则,则这样的合作仍然不能实现。的分配原则,则这样的合作仍然不能实现。怎样建立一个怎样建立一个“公平公平”的分配原则是一个较为困难的分配原则是一个较为困难的问题,的问题,1953195
42、3年,年,ShapleyShapley用公理化方法研究了这一用公理化方法研究了这一问题,并提出了他认为公平的分配方法。因篇幅的问题,并提出了他认为公平的分配方法。因篇幅的限制,本书不准备介绍他的方法,有兴趣的读者可限制,本书不准备介绍他的方法,有兴趣的读者可参阅有关对策论的书籍。参阅有关对策论的书籍。最后,我们来考察一个对策问题的实例。最后,我们来考察一个对策问题的实例。例例7.67.6(战例分析)(战例分析)图图7-17-1 1944 1944年年8 8月,美军第一军和英军占领法国诺曼第月,美军第一军和英军占领法国诺曼第不久,立即从海防前线穿过海峡,向不久,立即从海防前线穿过海峡,向Avra
43、nchesAvranches进进军。美军第一军和英军的行动直接威胁到德军第九军。美军第一军和英军的行动直接威胁到德军第九军。美军第三军也开到了军。美军第三军也开到了AvranchesAvranches的南部,双方的南部,双方军队所处的地理位置如图军队所处的地理位置如图7.17.1所示。所示。美军方面的指挥官是美军方面的指挥官是BradleyBradley将军,德军指挥官将军,德军指挥官是是Von KlugeVon Kluge将军。将军。Von KlugeVon Kluge将军面临的问题是或将军面临的问题是或者向西进攻,加强他的西部防线,切断美军援助;者向西进攻,加强他的西部防线,切断美军援助;
44、或者撤退到东部,占据塞那河流域的有利地形,并或者撤退到东部,占据塞那河流域的有利地形,并能得到德军第十五军的援助。能得到德军第十五军的援助。BradleyBradley将军的问题将军的问题是如何调动他的后备军,后备军驻扎在海峡南部。是如何调动他的后备军,后备军驻扎在海峡南部。BradleyBradley将军有三种可供选择的策略:他可以命令将军有三种可供选择的策略:他可以命令后备军原地待命,当海峡形势危急时支援第一军或后备军原地待命,当海峡形势危急时支援第一军或者出击东部敌人,以减轻第一军的压力。者出击东部敌人,以减轻第一军的压力。双方应如何决策,使自己能有较大的机会赢得战双方应如何决策,使自己
45、能有较大的机会赢得战争的胜利呢?我们将用建立矩阵对策模型的方法,争的胜利呢?我们将用建立矩阵对策模型的方法,来试图求得双方的最优策略。来试图求得双方的最优策略。模型假设:模型假设:1 1、BradleyBradley将军和将军和Von KlugeVon Kluge将军分别为对策将军分别为对策问题的局中人问题的局中人A A和和B B。2 2、局中人、局中人A A的策略集合为的策略集合为 123,AS 其中:其中:1为后备军增援保卫海峡;为后备军增援保卫海峡;2为后备军东征,切断德军后路;为后备军东征,切断德军后路;3为后备军待命。为后备军待命。3 3、局中人、局中人B B的策略集合为的策略集合为
46、 12,BS 其中:其中:1为德国向西进攻海峡,切断美军援助;为德国向西进攻海峡,切断美军援助;2为德军撤退到东部,占领塞纳河流域有利地形。为德军撤退到东部,占领塞纳河流域有利地形。ASBS4 4、构成六种纯局势,综合双方实力,各种构成六种纯局势,综合双方实力,各种局势估计结果如下。若局势估计结果如下。若B B采取策略采取策略 1即德军采取攻势,则有即德军采取攻势,则有(1 1)11(,)估计美军击败德军并占领海峡的估计美军击败德军并占领海峡的可能性(即概率)为可能性(即概率)为1/31/3,(2 2)21(,),估计美军取胜的可能为,估计美军取胜的可能为1/61/6。德军。德军很可能打破美军
47、第一军的防线,并切断美军的退路。很可能打破美军第一军的防线,并切断美军的退路。(3 3)31(,),估计美军可以根据需要增援。如不,估计美军可以根据需要增援。如不需增援,后备军可东进绕行到德军后方。这样,需增援,后备军可东进绕行到德军后方。这样,美军将占领海峡并彻底歼灭德军第九军。美军将占领海峡并彻底歼灭德军第九军。情况(情况(1 1)、()、(2 2)、()、(3 3)如图如图7.27.2(1 1)、()、(2 2)、()、(3 3)所示。)所示。图图7-27-2(a a)()(b b)()(c c)2若若B B采取策略采取策略 ,即德军第九军东撤,占据,即德军第九军东撤,占据塞纳河流域有利
48、地形,则有塞纳河流域有利地形,则有12(,)12(4 4),美方扩大了战线,德军虽占据,美方扩大了战线,德军虽占据可能性。可能性。了有利地形,美军仍有击败德军的了有利地形,美军仍有击败德军的22(,)56(5 5),美后备军东进给德军东撤造成压力并,美后备军东进给德军东撤造成压力并挫伤德军,使美军击败德军的可能性增大到挫伤德军,使美军击败德军的可能性增大到32(,)23(6 6),美后备军待命。在发现德军撤退后,美后备军待命。在发现德军撤退后,奉命向东扰乱敌方撤退,为以后歼灭德第九军奉命向东扰乱敌方撤退,为以后歼灭德第九军创造条件,估计美军击败德军的可能性创造条件,估计美军击败德军的可能性情况
49、(情况(d d)、()、(e e)、()、(f f)见图)见图7-27-2(d d)、()、(e e)()(f f)所示。所示。图图7-2 7-2(d d)、()、(e e)、()、(f f)上述分析估计是由上述分析估计是由BradleyBradley将军作出的,据此构将军作出的,据此构造出造出A A方赢得矩阵方赢得矩阵12123 1 31 2 1 65 612 3这是一个这是一个3 32 2对策矩阵。可以求得对策矩阵。可以求得 1656 0不存在稳定解,需要考虑其他解法。不存在稳定解,需要考虑其他解法。定义定义7.3 7.3 对于赢得矩阵对于赢得矩阵R R,如果对所有,如果对所有jaijak
50、jjaijakj均成立,且至少存在一个均成立,且至少存在一个j j。使得使得aijakjaijakj。则称。则称i i行优于行优于k k行(策略行(策略aiai优于优于akak)。)。00i ji laa则称则称j j列优于列优于l l例例 局中人局中人B B的策略的策略j j优于优于同样,如对一切同样,如对一切i i有有aijaklaijakl,且至少有一个,且至少有一个i0i0使得使得 l)。易见,若一个对策矩阵的第易见,若一个对策矩阵的第i i行优于第行优于第k k行,则无行,则无论局中人论局中人B B选择哪种策略,局中人选择哪种策略,局中人A A采取策略采取策略i i的获利总优于(至少
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。