1、第七章 竞争型决策分析 博弈论第一节第一节 竞争型决策分析与博弈论竞争型决策分析与博弈论一、竞争型决策分析与博弈论一、竞争型决策分析与博弈论 在现实生活中我们经常会遇到一些具有竞争性质的决策问题,在这些竞争中是存在竞争对手的,每个决策主体的行为后果都要受到对手的影响,并且这些决策者之间的利益是相互冲突的,这类特殊的决策问题就是竞争型决策。博弈论是研究理性的决策者之间的冲突与合作的理论,具体讲就是研究当决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题。此外,博弈论研究的决策问题是包括开始、过程和结果的整个决策过程,也是广义上的竞争型决策分析。二、博弈现象二、博弈现象(
2、一)(一)“囚徒困境囚徒困境”“囚徒困境”博弈是博弈理论中的典型实例。“囚徒困境”讲的是警方拘捕两个同案犯罪嫌疑人(囚徒)后,为防其相互间串供,而将两人分别拘押、隔离审问时,两疑犯所面临的认罪策略选择的问题。摆在两疑犯面前的选择有两种:坦白或不坦白。按照我们通常的政策,坦白从宽,抗拒从严。所以,若两人均坦白,则可从轻处理,分别判刑5年;若两人中有一人坦白而另一人拒不坦白,则坦白者可免于处罚,而拒不坦白者,将从重惩处被判10年;当然,若两人均不交代,而警方手中又无足够的证据可以指控犯罪嫌疑人,那他们只可能被按妨碍公务罪被判1年。该博弈问题的最终结果必然是两博弈方都选择坦白,收益均为-5。当然这里
3、有个前提,即两人均没有条件串供,否则无论是对这两个囚徒总体来讲,还是对他们个人来讲,最佳的结果都不是同时坦白得到-5,而是都不坦白所得到的-1。(二)(二)“齐威王与田忌赛马齐威王与田忌赛马”春秋战国时期齐威王经常约手下大将田忌与他赛马。赛马的规则是这样的:每次双方各出三匹马,一对一比赛三场,每一场的败者要输一千金给胜者。齐威王的三匹马和田忌的三匹马按实力都可分为上、中、下三等。由于齐威王的上、中、下三匹马都分别比田忌的上、中,下三匹马略胜一筹,因此田忌每次都是连输三场,要输掉三千金。实际上,田忌的上马虽不如齐威王的上马,却比齐威王的中马和下马都要好,同样,田忌的中马则比齐威王的下马要好一些,
4、田忌每次都连输三场是有些冤枉的。后来田忌的谋士孙膑知道这一情况后,给田忌出了个主意,即让田忌不要用自己的上马去对抗齐威王的上马,而是用下马去对抗齐威王的上马,上马则去对抗齐威王的中马,中马去对抗齐威王的下马。这样,虽然第一场田忌必败无疑,但后两场田忌却都能取胜,二胜一负,田忌反而能赢齐威王一千金。第一节第一节 竞争型决策分析与博弈论竞争型决策分析与博弈论三、博弈的要素三、博弈的要素 (二)博弈方可选择的全部行为或策略的集合(二)博弈方可选择的全部行为或策略的集合 即每个博弈方在进行决策时(同时或先后,一次或多次)可以选择的方法、做法等。策略有纯策略和混合策略之分。记博弈方i的策略为 ,为博弈方
5、i可选择的策略组成的策略集合,又称策略空间,则 。n个局中人各选择一个策略形成的向量 ,称为策略组合。),(1nsssisiSiiSs 参与者、策略和支付是博弈必不可少的三个基本要素。又称博弈方或局中人,是指博弈中独立决策、独立承担结果的决策主体。一般地,记博弈方为 i,(一)博弈的参与者(一)博弈的参与者,2,1nN即共有n个博弈方。(三)博弈方的支付(三)博弈方的支付 每个博弈方从各种策略组合中获得的收益或效用,它是策略组合s的函数,所以也被称为支付函数。记博弈方i的支付函数为 。)(sui第一节第一节 竞争型决策分析与博弈论竞争型决策分析与博弈论 (四)博弈方的信息(四)博弈方的信息 信
6、息是博弈方有关博弈的知识。博弈方应尽可能多地收集有关博弈的信息,从而在采取策略进行决策时掌握主动。(五)博弈的次序(五)博弈的次序 很多时候各博弈方的决策又必须有先后之分,并且,在一些博弈中每个博弈方还要作不止一次的决策选择,这就免不了有一个次序问题。因此,规定一个博弈就必须规定其中的次序,不同的次序必然是不同的博弈,即使其他方面都相同。(六)结果和均衡(六)结果和均衡 结果指博弈中博弈方的行动所产生的每一可能情形。而均衡是指所有博弈方的最优策略的组合,记为其中,为第i个博弈方在均衡情况下的最优策略。),(*2*1*nssss*is四、博弈的分类四、博弈的分类(一)单人博弈、两人博弈和多人博弈
7、(一)单人博弈、两人博弈和多人博弈 按博弈中参与人数目的多少,将博弈分为单人博弈、两人博弈和多人博弈。单人博弈即只存在一个博弈方的博弈。两人博弈就是存在两个各自独立决策,但策略和利益具有相互依存与制约关系的博弈方的决策问题。多人博弈是指有三个或三个以上博弈方参加的博弈。第一节第一节 竞争型决策分析与博弈论竞争型决策分析与博弈论(二)有限博弈和无限博弈(二)有限博弈和无限博弈 根据各博弈方可选策略数量的多少,将博弈分为有限博弈和无限博弈。有限博弈是指各个博弈方的可选策略都是有限的博弈。无限博弈是指至少有某些博弈方的策略是无限多个的博弈。(三)零和博弈、常和博弈和变和博弈(三)零和博弈、常和博弈和
8、变和博弈 按参加博弈的各个博弈方从博弈中所获得的利益的总和,可将博弈划分为零和博弈、常和博弈和变和博弈。零和博弈是所有博弈方的得益总和始终为0的博弈。常和博弈是所有博弈方的得益总和始终为某一非零常数的博弈。零和博弈和常和博弈以外的所有博弈都称为“变和博弈”。(四)静态博弈和动态博弈(四)静态博弈和动态博弈 按参与人行动的先后顺序,博弈可以分为静态博弈和动态博弈。静态博弈是指所有博弈方同时或可看作同时选择策略的博弈。动态博弈指的是参与人的行动有先后顺序,而且后行动者能够观察到先行动者所选择的行动的博弈。(五)完全信息博弈和不完全信息博弈(五)完全信息博弈和不完全信息博弈 根据参与人所掌握的信息可
9、以把博弈分为完全信息博弈和不完全信息博弈。完全信息博弈是指每个参与人对其他参与人的策略空间及支付函数有准确认识的博弈。不完全信息博弈是指至少部分博弈方不完全了解其他博弈方支付情况的博弈。(六)混合划分(六)混合划分 把参与人行动顺序和掌握的信息结合起来划分,可以得到四种类型的博弈,即:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与它们相对应的四种均衡是:纳什均衡,子博弈完美纳什均衡,贝叶斯纳什均衡,及完美贝叶斯纳什均衡。第二节第二节 完全信息静态博弈完全信息静态博弈一、博弈的标准式表述一、博弈的标准式表述 定义定义7.17.1 在一个n人博弈的标准式表述中,参与
10、者的策略空间分别为 ,收益函数分别为 则 表示此博弈。nSS,1nuu,1,;,11nnuuSSG二、纳什均衡二、纳什均衡 定义定义7.27.2 在博弈 中,如果策略组合 中任一博弈方i的策略 都是对其余博弈方的策略组合的最佳对策,也即:,;,11nnuuSSG),(1nss is),(),(111111niijiiniiiisssssusssssu对任意 都成立,则称 为G的一个“纳什均衡”。iijSs),(1nss 纳什均衡有强弱之分,以上是弱纳什均衡,也是最常用的纳什均衡概念,强纳什均衡是指每个博弈方对于对手的策略有唯一的最佳反应,即 为严格纳什均衡,当且仅当对所有i,所有其他 ,均有:
11、isiijSs),(),(111111niijiiniiiisssssusssssu三、两人有限零和博弈三、两人有限零和博弈(一)两人有限零和博弈模型(一)两人有限零和博弈模型 两人有限零和博弈是指只有两个局中人,每个局中人都有有限个可选择的策略,而且在任一局势中两个局中人得失之和总是等于零。第二节第二节 完全信息静态博弈完全信息静态博弈如果我们用 和 表示两人有限零和博弈的两个局中人,并设他们的策略集分别为 m21Sn21S,。局中人 的支付矩阵可记作:mnmnA1111 根据局中人 的支付矩阵A,结合博弈的一般式表述 ,我们可将这种博弈记作 。,;,11nnuuSSG,ASSG;(二)最优
12、纯策略与纳什均衡(二)最优纯策略与纳什均衡定义定义7.37.3 对于博弈 ,如果 ,ASSG;vjiijijijjimaxminminmax 则称 分别为局中人 和 的最优纯策略,称局势()为博弈G的鞍点,v称博弈 的博弈值。j,ij,i不难验证鞍点()是博弈 的纳什均衡,鞍点又称纯策略纳什均衡。j,i,ASSG;两人有限零和博弈存在的鞍点的充要条件是支付矩阵中存在一个元素 ,使对于一切 ,总有:jiami,2,1nj,2,1jijiijaaa第二节第二节 完全信息静态博弈完全信息静态博弈(三)最优混合策略与纳什均衡(三)最优混合策略与纳什均衡 局中人只能以一定的概率在其策略集中随机选择每个策
13、略,这种在纯策略空间上的概率分布为混合策略。设博弈 ,令 分别为局中人 和 在各自的策略集 和 中选择策略 和 的概率,则称,ASSG;m21Sn21Siiyx,SSij)(1mxxx011imiixx且)(1nyyy011jnjjyy且 分别为局中人 和 的一个混合策略。称 为局中人 的期望获得,为 的期望获得,而()为博弈的混合局势。又记 minjjiijyxxyE11)()(xyEy,x1,2,1,0),(|11miiimmxmixxxxxS1,2,1,0),(|11njjjnnynjyyyyyS分别为局中人 和 的混合策略集合。定义定义7.47.4 如果)y,E(xxy)(Emaxmi
14、n)xy(EminmaxmnnmSxSySySx则称 为局中人 和 的最优混合策略,称()为 G的最优混合局势,称 为博弈方 的期望所得。y,xy,x 最优混合局势 构成了混合意义上的纳什均衡,任何一方,单独背离这个局势,则它的期望所得将不会优于最优混合局势下的所得。yx,第二节第二节 完全信息静态博弈完全信息静态博弈(四)最优混合策略的求解方法(四)最优混合策略的求解方法 博弈 有混合意义下的解的充要条件是:存在 满足下列两个不等式组:,ASSG;及数,n*Sy mSxmixxnjxiimiiij2101211,njyymiyjjnjjij2101211,(1)(2)为了求解上述不等式组,可
15、将它们变为线性规划而求出博弈G的最优混合策略。不妨设 (否则令 ,则 一定可大于零)。令 ,则不等式组(1)等价于下面的线形规划:0dijijiixx miixS1minmixnjximiiij2102111,(3)同理,令,问题(2)就变为线形规划(4):njjyS1maxnjymiyjnjjij2102111,(4)第二节第二节 完全信息静态博弈完全信息静态博弈四、应用举例四、应用举例图图7-47-4市场进入阻挠博弈市场进入阻挠博弈 例例7-37-3 市场进入阻扰博弈。一种市场上存在一个垄断企业,另一个企业希望进入这一市场,垄断者为了保持自己的地位需要对进入者进行阻挠。这种博弈中,进入者有
16、两种策略可以选择:“进入”与“不进入”;垄断者也有两种策略:“容忍”与“反击”。他们的支付函数用以下双变量矩阵表示(见图7-4)。例例7-47-4 产量决策的古诺模型。古诺模型是博弈论中最经典的例子。古诺首先提出了这一模型。由于他采用了分析企业各自的最优反应函数从而形成均衡的思路,与纳什均衡非常相似,因此纳什均衡也称古诺一纳什均衡。它描述的是所谓厂商进行数量竞争的形势,以下是最常见的一种较为简化的版本。生产同质产品的两个企业同时选择各自的产量 ,市场需求决定价格 。单位成本均为常数c。求解其中的纳什均衡。)2,1(iqi)(21qqap 例例7-57-5 公共地悲剧模型。假设有n个人共同拥有的
17、一个公共牧场,每个人要决定自己放牧羊的数目 ,总的羊数因此为 。购买和照看1只羊的成本为常数c。设每只羊的价值为 ,随着羊的增加,草地会越来越拥挤,食物也会更紧张,因此会造成羊的价值下降,另一方面,羊的供给增加也会造成羊的价值下降,求此博弈中的纳什均衡。iqiqQ)(Qfv 第三节第三节 完全信息动态博弈完全信息动态博弈一、博弈的扩展式表述一、博弈的扩展式表述 在动态博弈中,参与人的行动有先后顺序,且后行动者在自己行动之前能观测到先行动者的行动且对各博弈方的策略空间及支付有充分的了解,我们称这种博弈为完全信息动态博弈。动态博弈有不同与静态博弈的特征,习惯于用扩展式来描述和分析动态博弈。博弈的扩
18、展式表述包括以下要素:(1)参与人集合;(2)行动次序,即参与人参与行动的次序;(3)收益,即参与人所采取行动的函数;(4)行动,即轮到次序的参与人的选择;(5)信息集,它表示参与人在每次行动时所知道的信息;(6)每一个外生事件的概率分布。二、多阶段可观察行动博弈与子博弈完美纳什均衡二、多阶段可观察行动博弈与子博弈完美纳什均衡 多阶段可观察行动博弈,这种博弈有着多个“阶段”,通常记为k,行动的历史通常记为 ,从而kh (1)在每一个阶段k,每一个参与人都知道所有行为情况,包括自然的行为以及过去各阶段所有参与人的行为 ;(2)在任一给定阶段中,每一个参与人最多只能行动一次;(3)阶段k的信息集不
19、会提供有关这一阶段的任何信息。kh 由于这种博弈存在多个阶段,它与只有一个阶段的完全信息博弈有着本质的区别,因此如果我们仍用纳什均衡思想分析这种博弈问题就难免存在局限性。泽尔滕(Selten,1965)提出了子博弈完美纳什均衡的思想。泽尔滕子博弈完美纳什均衡是指在一个多阶段可观察的博弈中,由各博弈方的策略构成的一个策略组合,这个策略组合满足在整个动态博弈及它的所有子博弈中都构成纳什均衡。第三节第三节 完全信息动态博弈完全信息动态博弈三、完美信息博弈与逆向归纳法三、完美信息博弈与逆向归纳法 在多阶段可观察行动博弈中,如果我们对条件(2)稍加限制,即在任一给定阶段中,每一个参与人最多只能行动一次而
20、且只有一个参与人采取行动,就得到完美信息博弈。由于多阶段可观察行动博弈中,引入了子博弈完美纳什均衡的概念,借助这种概念的思想,多阶段可观察行动博弈通常采用逆向归纳法。“逆向归纳法”这一思路是通过逆向归纳的方法,先解决参与人在面临任何可能情况下的最终行为策略,然后逐步向前推导计算前一步最优选择。逆向归纳法可以在任何完美信息下的多阶段博弈中应用,这一方法从最终阶段k在每一历史情况 下最优选择开始,即在给定历史情况 条件下,通过最大化参与人在面临历史情况 条件的收益确定其最优行动,从而向前推算到阶段k-1,并确定这一阶段中采取行动的参与人的最优行为,只要给定阶段 中采取行动的参与人在历史情况 下将采
21、取我们之前推导出来的最优行动即可。用这一方法不断地向前推算下去,直至初始阶段,这样我们就可以建立一个策略组合。khkh第四节第四节 不完全信息静态博弈不完全信息静态博弈一、概念一、概念 如果在一个博弈中,某些参与人不知道其他参与人的收益,我们就说这个博弈是不完全信息博弈。海萨尼(Harsanyi,19671968)首先给出了一种模拟和处理这一类不完全信息博弈的方法,即引入一个虚拟参与人“自然”,“自然”首先选择参与人1的类型(这里是他的成本)。在这个转换博弈中,参与人2关于参与人1成本的不完全信息就变成了关于“自然”的行动的不完全信息,从而这个转换博弈可以用标准的技术来分析。从不完全信息博弈到
22、不完美信息博弈的转换如图7-3所示,这个图是首先由海萨尼给出的。N代表“自然”,“自然”选择参与人1的类型。这里有一个标准假设,即所有参与人对自然行动的概率分布具有一致的判断。一旦采用这一假设,我们就得到一个标准博弈,从而可以使用纳什均衡的概念。海萨尼的贝叶斯均衡(或贝叶斯纳什均衡)正是指不完美信息博弈的纳什均衡。二、策略和类型二、策略和类型 参与人的“类型”他的私人信息就是他的成本。在通常情况下,一个参与人的类型可能包括与其决策相关的任何私人信息。参与人的收益函数就相当于它的类型。如果参与人的类型过于复杂,模型就可能很难处理,在实际运用中,通常假定参与人关于对手的判断完全由他自己的收益函数决
23、定。海萨尼考虑了更一般的情形。假定参与人的类型 取自某一客观概率分布 ,这里 属于某一空间 。简单起见,假定 存在有限个元素。只能被参与人i观察到。令 代表给定 是参与人i关于其他参与人类型 的条件概率。假定对于每一个 ,边际分布Iii1),(1Ipiiii)|(iipi),(111Iiiiii)(iip是严格正的。第四节第四节 不完全信息静态博弈不完全信息静态博弈 我们通常把博弈的外生因素如策略空间、收益函数、可能类型、先验分布等视为共同知识。一般来说,这些策略空间都比较抽象,有些还包括如扩展式博弈中的相机行动策略。但在这里,为简单起见,我们假定策略空间Si是参与人i的(非相机)行动集。可以
24、用 代表类型为 的参与人i的策略选择(可能是混合策略)。如果参与人i知道其他参与人的策略 是其相应类型的函数,参与人1就可以用条件概率 来计算对应于每一个选择的期望效用从而找出最优反应策略 。)(iiijj)()|(iip)(iii三、贝叶斯均衡三、贝叶斯均衡 定义定义7.47.4 在一个不完全信息博弈中,如果每一参与人i的类型 有限;且参与人类型的先验分布为p,相应纯策略空间为 ,则该博弈的一个贝叶斯均衡是其“展开博弈”的一个纳什均衡,在这个“展开博弈”中,每一个参与人i的纯策略空间是由从 到 的映射构成的集合 。iiSiiSiiS给定策略组合 ,和 ,令 代表当参与人i选择 而其他人选择
25、,且令)(siiiSs)()(),(iiss)(is)(s)(),(),(),(,),()(),(111111IIiiiiiiiiiisssssss代表策略组合在 的值。那么策略组合 是一个(纯策略)贝叶斯均衡,如果对于每一个参与人i均有),(ii)(s),(),(),(),(maxarg)()(iiiiiiiiiSsssupsiiiii第四节第四节 不完全信息静态博弈不完全信息静态博弈四、贝叶斯均衡的举例四、贝叶斯均衡的举例 例例7-87-8 不完全信息下的古诺模型。考虑双寡头垄断古诺模型(产量竞争)。假定企业的利润 ,这里 是线性需求函数的截距与企业i的不变单位成本之差 ,是企业i选择的产
26、量 。企业1的类型 是共同知识(即企业2完全知道关于企业1的信息,或者说企业1只有一种可能类型)。但企业2拥有关于其单位成本的私人信息。企业1认为 的概率是 ,的概率也是 ,而且企业1的判断是共同知识。这样,企业2有两种可能类型,我们分别将其成为“低成本型”()和“高成本型”()。两个企业同时选择产量。)(jiiiiqqqui)2,1(iiqiiqs 114324522121452432 下面来看这个博弈的纯策略均衡。即企业1的产量为 ,企业2在 时产量为 ,在 时的产量为 。企业2的均衡产量必须满足1q452Lq2432Hq22)()(maxarg)(12222122222qqqqqqq企业
27、1不知道企业2是那种类型,因此他的收益只能是对企业2的类型取期望:42)1()21()1()21(maxarg22121121111LHLHqqqqqqqqqqq 将 和 代入 中,我们得到贝叶斯均衡解为(,)(事实上,这也是惟一的均衡)。452432)(22q311q24112Lq2452Hq第五节第五节 不完全信息动态博弈不完全信息动态博弈一、不完全信息动态博弈问题一、不完全信息动态博弈问题 信号博弈的基本特征是博弈方分为信号发出方和信号接受方两类,先行为的信号发出方的行为对后行为的信号接受方来说具有传递信息的作用。信号博弈其实是一类具有信息传递机制的动态贝叶斯博弈的总称。许多博弈或信息经
28、济学问题都可以归结为信号博弈。一个信号博弈可表示为:(1)博弈方0以概率 为信号发出方S选择类型 ;(2)发出方S选择行为 ;(3)接收方R看到 后选择行为 ;(4)双方得益 和 都取决于 和 。)(itp11Aa 22Aa 1a1u2u1,ati2ait)|(1atpi完美贝叶斯均衡的条件是:(1)接收方R在观察到发出方的信号 后,必须有关于发出方的类型判断,即发出方选择行为 时,发出方S是类型 的后验概率:1a1ait0)|(1atpi1)|(1atpiti (2)对于发出方给出的信号 和对发出方类型判断即后验概率 ,接收方R选择的行动 必须是接收方收益最大,即1a)|(iiatp2a),
29、()|(max2112aatuatpiRtiai(3)给定R的策略 时,S的选择 必须使S的得益最大,即 是最大化问题 的解。2a1a1a,max211aatuiSa满足上述要求的双方策略和接收方判断构成信号博弈的完美贝叶斯均衡。第五节第五节 不完全信息动态博弈不完全信息动态博弈二、类型和海萨尼转换二、类型和海萨尼转换 静态贝叶斯博弈中处理不完全信息的方法是将博弈方得益的不同可能理解为博弈方有不同的类型,并引进一个为博弈方选择类型的虚拟博弈方,从而把不完全信息博弈转化成完全但不完美信息动态博弈,这样的处理方法称为海萨尼转换。这种处理方法同样适用于动态贝叶斯博弈,二者的差别是动态贝叶斯博弈转化的
30、不是两阶段有同时选择的不完美信息动态博弈,而是更一般的不完美信息动态博弈。既然通过海萨尼转换可以很容易地将动态贝叶斯博弈转化为完全但不完美信息动态博奔,那么动态贝叶斯博弈分析就可以主要利用贝叶斯均衡、合并均衡和分开均衡等概念和相应的分析方法。三、完美贝叶斯均衡三、完美贝叶斯均衡 完美贝叶斯均衡要求:(1)在每个信息集上,局中人必须有一个定义在属于该信息集的所有节点上的概率分布,这就是局中人的信念,信息集包含了局中人类型的信息,这一信念也相当于在该信息集上对其他局中人类型的概率判断;(2)给定该信息集上的信念和其他局中人的后续策略,局中人的后续策略必须是最优的;(3)局中人根据贝叶斯法则和均衡策
31、略修正后验信念。定义定义7.57.5 完美贝叶斯均衡是一种策略组合 与一种后验概率组合 ,满足:对于所有的局中人i,在每个信息集h,;由先验概率 、所观测的 和最优策略 通过贝叶斯法则形成。)(,),()(*1*1*nnsss),(1nppp),()|(max),(*iiiihiiisiiissuapssii)|(hiiiap)|(iiiphia)(*is第五节第五节 不完全信息动态博弈不完全信息动态博弈四、举例四、举例(一)(一)2 22 2声明博弈声明博弈 22声明博弈中声明能有效传递信息的几个必要条件:(1)不同类型的声明方必须偏好行为方的不同行为。(2)对应声明方的不同类型,行为方必须
32、偏好不同的行为。(3)行为方的偏好必须与声明方的偏好具有一致性。(二)离散型声明博弈模型(二)离散型声明博弈模型 (1)自然抽取声明方的类型 ,抽取的方法是从类型集合 中以概率分布 随机抽取,其中 。i,1I)(,),(1Ipp1)(1Iiip (2)声明方了解到自己的 以后,从 中选择 ,作为自己声明的类型。当然 可以与 相同(说真话),也可以与 不同(说假话)。ijjii(3)行为方在听到声明力的声明 后,在可选择的行为集合 中选择行为 。j,1KaaAka(4)声明方的得益为 ,行为方的得益为 。),(kiSau),(kiRau本章小结本章小结 在这一章里我们做了有关博弈论基本内容的讨论
33、,我们分别介绍了博弈的四种不同模型:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。并引入了几个均衡的概念:纳什均衡,子博弈完美纳什均衡,和贝叶斯均衡。任何一种博弈,由于局中人的相互制约,都会有一个稳定的结局,这个结局就是纳什均衡。纳什均衡虽然是稳定的,但却经常是低效率的。关键词关键词 博弈(game)博弈论(game theory)完全信息静态博弈(static game of complete information)完全信息动态博弈(dynamic game of complete information)不完全信息静态博弈(static game of incomplete information)不完全信息动态博弈(dynamic game of incomplete information)纳什均衡(Nash Equilibrium)子博弈完美纳什均衡(subgame Perfect Nash Equilibrium)贝叶斯均衡(Bayesian Equilibrium)完美贝叶斯均衡(perfect Bayesian Equilibrium)