1、参考书目参考书目1.美美阿维纳什阿维纳什K 迪克西特迪克西特.策略思维策略思维.中国人民大中国人民大学出版社,学出版社,20022.王则柯王则柯.新编新编博弈论平话博弈论平话.中信出版社,中信出版社,20033.谢识予谢识予.经济博弈论经济博弈论(第二版第二版).复旦大学复旦大学 出版社,出版社,20024.美美埃里克埃里克拉斯缪森拉斯缪森.博弈与信息:博弈论概论博弈与信息:博弈论概论.北京大学出版社,北京大学出版社,20035.张维迎张维迎.博弈论与信息经济学博弈论与信息经济学.上海三联书店,上海三联书店,2004第二章第二章 博弈论基本知识博弈论基本知识2.1 2.1 什么是博弈论什么是博
2、弈论2.2 2.2 博弈的结构和分类博弈的结构和分类2.3 2.3 博弈的表达方式博弈的表达方式2.42.4 几类经典的博弈模型几类经典的博弈模型2.1.1 从游戏到博弈从游戏到博弈2.1.2 一个非技术性的定义一个非技术性的定义2.1.3 博弈论模型简介博弈论模型简介第一节第一节 什么是博弈论什么是博弈论2.1.1 2.1.1 从游戏到博弈从游戏到博弈 “博弈论博弈论”译自英文译自英文“Game Theory”,直译就是,直译就是“游戏理论游戏理论”。游戏的共有特征游戏的共有特征 1.一定的规则一定的规则 2.有一个结果(且可以折算有一个结果(且可以折算成数字)成数字)3.策略的相互依存性策
3、略的相互依存性 4.策略至关重要策略至关重要博弈论博弈论-无处不在的游戏 “要想在现代社会做一要想在现代社会做一个有文化的人,你必须对个有文化的人,你必须对博弈论有一个大致了解博弈论有一个大致了解”。保罗保罗萨缪尔森萨缪尔森 年光似鸟翩翩过,世事年光似鸟翩翩过,世事如棋局局新。如棋局局新。(宋宋)僧志文僧志文 博弈论(博弈论(game theorygame theory):):又称对策论,是研究相互依又称对策论,是研究相互依赖、相互影响的决策主体的赖、相互影响的决策主体的理性决策行为理性决策行为以及这些决策以及这些决策的均衡结果的理论。的均衡结果的理论。2.1.2 2.1.2 博弈论的博弈论的
4、基本概念基本概念Governing Dynamics博弈论的基本假设博弈论的基本假设 人是理性人(人是理性人(rationalrational,也,也说自私人)说自私人):行动者具有行动者具有推理推理能力能力,在具体策略选择时的,在具体策略选择时的目的是使决策者自己的目的是使决策者自己的目标目标效用最大化效用最大化。2.1.2 2.1.2 博弈论的博弈论的基本概念基本概念通俗地讲,博弈论是一种通俗地讲,博弈论是一种“游戏理游戏理论论”。其较对博弈为准确的理解是:其较对博弈为准确的理解是:一些个人、团队或其他组织,面对一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约一定的环境条件,在
5、一定的规则约束下,依靠所掌握的信息,同时或束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收施,并从中各自取得相应结果或收益的过程。益的过程。博弈论模型可以用七个方面来描述博弈论模型可以用七个方面来描述 GP,A,S,I,U,O,E 2.1.32.1.3博弈论的模型简介博弈论的模型简介P(players)P(players):):为局中人,博弈的为局中人,博弈的参与者,也称为参与者,也称为“博弈方博弈方”,局中,局中人以最终实现自身利益最大化为目人以最终实现自身利益
6、最大化为目标。标。个人个人团体团体双方双方多方多方虚拟参与人:虚拟参与人:NatureA(action)A(action):为各局中人的所有可能的:为各局中人的所有可能的策略或行动的集合。策略或行动的集合。行动的顺序(行动的顺序(The order of play)根据该集合是有限还是无限进行分类:根据该集合是有限还是无限进行分类:先动优势先动优势后动优势后动优势S(strategies)S(strategies):博弈的进程,也是:博弈的进程,也是博弈进行的次序。它规定什么人在博弈进行的次序。它规定什么人在什么时候选择什么行动。因此,战什么时候选择什么行动。因此,战略是参与人的略是参与人的“
7、相机行动方案相机行动方案”(contingent action plan)分类:根据后行动的人是否能够看分类:根据后行动的人是否能够看到先行动人的具体行动到先行动人的具体行动静态博弈静态博弈动态博弈动态博弈行动与策略的区别?行动与策略的区别?行动是指参与者可能有的具体行动行动是指参与者可能有的具体行动 战略是行动的规则而不是行动本身战略是行动的规则而不是行动本身毛泽东:毛泽东:人不犯我我不犯人人不犯我我不犯人人若犯我我必犯人人若犯我我必犯人敌进我退敌进我退敌退我追敌退我追敌驻我扰敌驻我扰敌疲我打敌疲我打 I(information)I(information):博弈信息。:博弈信息。指的是指的
8、是参与人在博弈中的知识,特别是有关参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行为的其他参与人(对手)的特征和行为的知识知识 分类:根据博弈各方对各种局势下所分类:根据博弈各方对各种局势下所有局中人的信息掌握情况分:有局中人的信息掌握情况分:完全信息博弈完全信息博弈不完全信息不完全信息博弈博弈U(utility)U(utility):也称为支付():也称为支付(pay off).为局中人获得利益,或者是为局中人获得利益,或者是指参与人的期望效用水平。也是博指参与人的期望效用水平。也是博弈各方追求的最终目标。弈各方追求的最终目标。分类:根据各方得益的不同情况分类:根据各方得益的不同
9、情况零和零和博弈博弈变和变和博弈博弈田忌赛马囚徒困境 Ua(t,t)=-8Ua(t,n)=0 Ua(n,n)=-1 Ua(n,t)=-10 Ub(t,t)=-8Ub(t,n)=-10 Ub(n,n)=-1 Ub(n,t)=0 坦白坦白t t不坦白不坦白n n坦白坦白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10,0-10,0-1-1,-1-1嫌疑人嫌疑人a嫌疑人bU(t,t)=0.5*(-8)+0.5*(-8)=-8U(t,n)=0.5*0+0.5*(-10)=-5U(n,t)=0.5*(-10)+0.5*0=-5 U(n,n)=0.5*(-1)+0.5*(-1)=-1
10、结果(结果(outcome)是指博弈分析者是指博弈分析者感兴趣的要素的感兴趣的要素的集合。是均衡行集合。是均衡行动的组合。动的组合。坦白坦白t t不坦白不坦白n n坦白坦白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10,0-10,0-1-1,-1-1嫌疑人嫌疑人A嫌疑人BE(equilibrium)均衡均衡(equilibrium):是所有参与人的最:是所有参与人的最优战略的组合。优战略的组合。所谓博弈均衡,它是一种所谓博弈均衡,它是一种稳定的稳定的博弈结博弈结果。果。纳什均衡纳什均衡(Nash Equilibrium):一策):一策略组合中,所有的参与者面临这样的一略组
11、合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此种情况:当其他人不改变策略时,他此时的策略是最好的。时的策略是最好的。谢识予:谢识予:给定你的给定你的 策略,我的策略是最策略,我的策略是最好的的策略,给定我的好的的策略,给定我的 策略,你的策略策略,你的策略也是最好的的策略也是最好的的策略 两个小偷甲和乙联手作案,私入民宅两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立若一人招供但另一人未招,则招者立即被释放,未招者判入狱即被释放,未招
12、者判入狱10年;若二年;若二人都招则两人各判刑人都招则两人各判刑8年年;若两人都不若两人都不招则未获证据但因私入民宅各拘留招则未获证据但因私入民宅各拘留1年。年。囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B一个纳什均衡点!情侣博弈情侣博弈 足球足球演唱会演唱会足球足球演唱会演唱会王菲李亚鹏两个纳什均衡点!博弈论模型可以用五个方面来描述博弈论模型可以用五个方面来描述 GP,A,S,I,U,O,E描述博弈的最少要素:描述博弈的最少要素:参与人,战略,支付参与人,战略,支付。行动行动和和信息信息是其积木是其积木参与人、行动、结果参与人、行动、结果统称为统称为“博弈规则博
13、弈规则”博弈分析的目的:是使用博弈规则预测博弈分析的目的:是使用博弈规则预测均衡均衡2.1.3 2.1.3 博弈论的模型简介博弈论的模型简介博弈论模型可以用七个方面来描述博弈论模型可以用七个方面来描述 GP,A,S,I,U,O,E2.2.1 博弈方博弈方2.2.2 博弈的行动过程博弈的行动过程2.2.3 策略策略2.2.4 支付(效用、得益)支付(效用、得益)2.2.5 博弈的信息结构博弈的信息结构2.2.6 博弈方的能力和理性博弈方的能力和理性2.2.7 博弈的分类和理论结构博弈的分类和理论结构第二节第二节 博弈论的结构与分类博弈论的结构与分类2.2.1 2.2.1 博弈中的博弈方博弈中的博
14、弈方博弈方(博弈方(player/players)博弈中独立决策、独立承担博弈结博弈中独立决策、独立承担博弈结果的个人或组织称为博弈方。果的个人或组织称为博弈方。1.单人博弈单人博弈 2.双人博弈双人博弈 3.多人博弈多人博弈1.单人博弈单人博弈设有一商人要从设有一商人要从A地运输一批货物,地运输一批货物,从从A地到地到B地有水、陆两条路线,地有水、陆两条路线,走陆路运输成本走陆路运输成本10 000元,而走水元,而走水路运输成本只要路运输成本只要7000元。但非常元。但非常危险,出现坏天气的概率为危险,出现坏天气的概率为0.25,此时会损失此时会损失10%的货物。货物总价的货物。货物总价值值
15、90 000元。元。此人怎样决策?此人怎样决策?好天气好天气(75%)(75%)坏天气坏天气(25%)(25%)水路水路陆路陆路自然商人囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B2.双人博弈双人博弈情侣博弈情侣博弈 足球足球演唱会演唱会足球足球演唱会演唱会王菲李亚鹏选修课另一版本选修课另一版本 博弈论博弈论舞蹈舞蹈博弈论博弈论舞蹈舞蹈王菲李亚鹏石头石头剪子剪子布布石头石头剪子剪子布布石头石头0,01,1-1,1剪子剪子-1,10,01,-1布布1,-1-1,10,0博弈方博弈方2 2博博弈弈方方1 1双人博弈小结双人博弈小结注意二点:注意二点:1.博弈方之间并非
16、总是对抗的。博弈方之间并非总是对抗的。2.个人理性决策常不能实现自己的个人理性决策常不能实现自己的 最大利益。最大利益。3、多人博弈、多人博弈三个或三个以上的博弈方参加的博弈。三个或三个以上的博弈方参加的博弈。竞争者竞争者破坏者破坏者竞争者竞争者北京申办北京申办2000年奥运会失利年奥运会失利第一轮第一轮第二轮第二轮第三轮第三轮第四轮第四轮北京北京32374043悉尼悉尼28303745曼彻斯特曼彻斯特111111柏林柏林910伊斯坦布伊斯坦布尔尔82.2.2 策略策略1.有限博弈(有限博弈(finite games):如:如果博弈中每个博弈方的策略是有果博弈中每个博弈方的策略是有限的,称为有
17、限博弈。限的,称为有限博弈。2.无限博弈(无限博弈(infinite games):如:如果博弈中至少有某些博弈方的策果博弈中至少有某些博弈方的策略是无限多个的,称为无限博弈。略是无限多个的,称为无限博弈。(函数表示函数表示)2.2.3 2.2.3 博弈的行动过程博弈的行动过程 1.静态博弈(静态博弈(static games):所有博弈方同时所有博弈方同时选择策略的博弈。选择策略的博弈。2.动态博弈(动态博弈(dynamic games):):各博弈方的各博弈方的选择和行动有先后次序,而且后选择的、后行动选择和行动有先后次序,而且后选择的、后行动的博弈方,在自己选择行动方案之前,可以看到的博
18、弈方,在自己选择行动方案之前,可以看到其他博弈方的选择和行动。也称为多阶段博弈其他博弈方的选择和行动。也称为多阶段博弈(multistage games)3.重复博弈(重复博弈(repeated games):):同一个博弈同一个博弈反复进行多构成的博弈。反复进行多构成的博弈。2.2.4 2.2.4 博弈的支付博弈的支付(效用,得益)(效用,得益)效用的计算方法:将每一个博弈方在效用的计算方法:将每一个博弈方在同一策同一策略结果中略结果中的得益相加,算出所有博弈方的的得益相加,算出所有博弈方的得益总和。得益总和。Ua(1,2)=Ua1+Ua2Ub(1,2)=Ub1+Ub2 1.零和博弈零和博弈
19、:Ua(1,2)=Ub(1,2)=0 2.常和博弈常和博弈:Ua(1,2)=Ub(1,2)=m 3.变和博弈变和博弈:Ua(1,2)Ub(1,2)两个人通过猜硬币的正反赌输赢,其两个人通过猜硬币的正反赌输赢,其中一人用手盖住一枚硬币,有另一方中一人用手盖住一枚硬币,有另一方在是正面还是反面朝上。若猜对,则在是正面还是反面朝上。若猜对,则猜着赢猜着赢1元,盖着输元,盖着输1元;若猜错,则元;若猜错,则猜着输猜着输1元,盖着赢元,盖着赢1元。元。假设赢着收益为假设赢着收益为1,输者收益为,输者收益为-1。猜硬币游戏猜硬币游戏猜硬币游戏猜硬币游戏 正面正面z z反面反面f f正面正面z z-1,1-
20、1,11,-11,-1反面反面f f1 1,-1-1-1,1-1,1猜硬币方-2 U1z(z,z)=-1U1z(z,f)=1 U1f(f,z)=1 U1f(f,f)=-1 U2z(z,z)=-1U2z(f,z)=1 U2f(z,f)=1 U2f(f,f)=-1Uz=U1z+U2z=-1+1-1+1=0Uf=U1f+U2f=1-1+1-1=0盖硬币方-1石头石头剪子剪子布布石头石头剪子剪子布布石头石头0,01,1-1,1剪子剪子-1,10,01,-1布布1,-1-1,10,0博弈方博弈方2 2博博弈弈方方1 1周末约会周末约会 足球足球g g演唱会演唱会d d足球足球g g2,12,10,00,
21、0演唱会演唱会d d-1-1,-1-11,21,2王菲b李亚鹏a Uag(g,g)=2Uag(g,d)=0 Uad(d,g)=-1 Uad(d,d)=1 Ubg(g,g)=1Ubg(d,g)=-1 Ubd(g,d)=0 Ubd(d,d)=2UU=Uag+Ubg=2+0+1-1=2Ud=Uad+Ubd=-1+1+0+2=2Un=Uan+Ubn=-1-10-10-1=-22 Uat(t,t)=-8Uat(t,n)=0 Uan(n,t)=-10 Uan(n,n)=-1 Ubt(t,t)=-8Ubt(n,t)=0 Ubn(t,n)=-10 Ubn(n,n)=-1 坦白坦白t t不坦白不坦白n n坦白坦
22、白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10,0-10,0-1-1,-1-1嫌疑人嫌疑人b嫌疑人aUt=Uat+Ubt=-8+0-8+0=-16囚徒困境囚徒困境奖金分配奖金分配 绩效高绩效高g g 绩效低绩效低d d绩效高绩效高g g绩效低绩效低d d王菲b李亚鹏a Uag(g,g)=5Uag(g,d)=7 Uad(d,g)=3 Uad(d,d)=5 Ubg(g,g)=5Ubg(d,g)=7 Ubd(g,d)=3 Ubd(d,d)=5Ug=Uag+Ubg=5+7+5+7=24Ud=Uad+Ubd=3+5+3+5=16Ud=Uad+Ubd=30+80+30+80=220
23、 Uag(g,g)=50Uag(g,d)=10 Uad(d,g)=80 Uad(d,d)=30 Ubg(g,g)=50Ubg(d,g)=10 Ubd(g,d)=80 Ubd(d,d)=30 高价高价g g低价低价d d高价高价g g5050,505010,8010,80低价低价d d80,1080,103030,3030联通联通b移动aUg=Uag+Ubg=50+10+50+10=120寡头定价寡头定价2.2.5 2.2.5 博弈的信息结构博弈的信息结构1.关于得益的信息关于得益的信息 完全信息和不完全信息完全信息和不完全信息(1)完全信息(完全信息(complete information)
24、是是指在博弈过程中,每一位博弈方对其他博弈指在博弈过程中,每一位博弈方对其他博弈方的特征、策略空间及收益函数有准确的信方的特征、策略空间及收益函数有准确的信息。息。(2)不完全信息()不完全信息(incomplete information):如果博弈方对其他博弈方的特征、策略空间如果博弈方对其他博弈方的特征、策略空间及收益函数信息了解的不够准确、或者不是及收益函数信息了解的不够准确、或者不是对所有博弈方的特征、策略空间及收益函数对所有博弈方的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。也成博弈就是不完全信息博弈。
25、也成不对称信息不对称信息或者或者信息不对称信息不对称(asymmetric information)2.2.关于博弈过程的信息关于博弈过程的信息 完美信息和不完美信息完美信息和不完美信息完美信息(完美信息(perfect informationperfect information):对对已经发生的的事情有清楚的了解,称具已经发生的的事情有清楚的了解,称具有完美信息。否则,称为有完美信息。否则,称为不完美信息不完美信息(imperfect informationimperfect information)2.2.6 博弈方的理性与能力博弈方的理性与能力 完全理性与完全理性与有限理性有限理性 个
26、体理性与个体理性与集体理性集体理性 战争战争和平和平战争战争-50-50,-5050100,0100,0和平和平0,1000,1005050,5050A国国B国国战争与和平战争与和平2.2.7 博弈的类型1 根据参与者能否形成约束性的协议,以便集体行动(1)合作博弈(cooperative game)研究人们达成合作时如何分配合作得到的收益,即收益分配问题。(2)非合作博弈(non-cooperative/uncooperative game)研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。行动次序行动次序信息信息静态静态动态动态完全信完全信息息完全信息静态博弈完全信
27、息静态博弈纳什均衡(纳什均衡()完全信息动态博弈完全信息动态博弈子博弈精练纳什均衡子博弈精练纳什均衡()不完全不完全信息信息不完全信息静态博弈不完全信息静态博弈贝叶斯均衡(贝叶斯均衡(不完全信息动态博弈不完全信息动态博弈精炼贝叶斯均衡精炼贝叶斯均衡 2.2.7 博弈的分类博弈的分类 22囚徒困境囚徒困境(prisoners dilemma)乙的对策乙的对策甲甲的的对对策策合作合作(沉默)(沉默)背叛背叛(认罪)(认罪)合作合作(沉默)(沉默)(-1,-1)(-10,0)背叛背叛(交代)(交代)(0,-10)(-8,-8)完全信息静态博弈完全信息静态博弈空城计空城计 进攻进攻后退后退坚持坚持被擒
28、被擒,大胜大胜0,0,1010逃脱逃脱,无胜无胜5 5,0,0逃跑逃跑被擒被擒,大胜大胜0,100,10逃脱逃脱,无胜无胜5,05,0诸葛亮诸葛亮司马懿司马懿不完全信息静态博弈不完全信息静态博弈 走大路走大路走小路走小路守大路守大路被擒被擒10,10,0 0逃脱逃脱0 0,10,10守小道守小道逃脱逃脱0,100,10被擒被擒10,010,0诸葛亮(关羽)诸葛亮(关羽)曹操曹操不完全信息静态博弈不完全信息静态博弈曹操败走华容道曹操败走华容道相亲相亲王实甫王实甫张生和崔莺莺张生和崔莺莺 红娘红娘王实甫王实甫.西厢记西厢记不完全信息静态博弈不完全信息静态博弈完全信息动态博弈完全信息动态博弈黔之驴黔
29、之驴黔驴技穷黔驴技穷 柳宗元柳宗元(唐)(唐)不完全信息不完全信息动态博弈动态博弈斗鸡博弈斗鸡博弈斗鸡博弈斗鸡博弈(Chicken Game)其实是一种误译。其实是一种误译。Chicken在美国口语中是在美国口语中是“懦夫懦夫”之意,之意,Chicken Game本应译成本应译成懦夫博弈懦夫博弈。不过这个错误并不。不过这个错误并不算太严重,非要把算太严重,非要把chicken game叫作斗鸡博弈,也不是不可以。叫作斗鸡博弈,也不是不可以。试想有两人狭路相逢,每人有两个行动选择:一是退下来,一是进试想有两人狭路相逢,每人有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对
30、方获得胜利,这人就很丢攻。如果一方退下来,而对方没有退下来,对方获得胜利,这人就很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两人都前进,那么则两败俱方退下来,自己则胜利,对方则失败;如果两人都前进,那么则两败俱伤。因此,对每个人来说,最好的结果是,对方退下来,而自己不退。伤。因此,对每个人来说,最好的结果是,对方退下来,而自己不退。赢利矩阵赢利矩阵(payoff matrix)如下:甲如下:甲/乙乙 前进前进 后退后退前进前进(-2,-2)(1,-1)后退后退(-1,1)(
31、-1,-1)上表中的数字的意思是:两者如果均选择上表中的数字的意思是:两者如果均选择“前进前进”,结果是两败俱,结果是两败俱伤,两者均获得伤,两者均获得-2的支付;如果一方的支付;如果一方“前进前进”,另外一方,另外一方“后退后退”,前,前进者获得进者获得1的支付,赢得了面子,而后退者获得的支付,赢得了面子,而后退者获得-1的支付,输掉了面子,的支付,输掉了面子,但没有两者均但没有两者均“前进前进”受到的损失大;两者均受到的损失大;两者均“后退后退”,两者均输掉了,两者均输掉了面子,获得面子,获得-1的支付。当然表中的数字只是相对的值。的支付。当然表中的数字只是相对的值。这个博弈有两个纯策略这
32、个博弈有两个纯策略纳什均衡纳什均衡:一方前进,另一方后退;或一方:一方前进,另一方后退;或一方后退,另一方前进。但关键是谁进谁退?当然,该博弈也存在一个混合后退,另一方前进。但关键是谁进谁退?当然,该博弈也存在一个混合策略均衡,即大家随机的选择前进或后退。不过相对而言,我们更关注策略均衡,即大家随机的选择前进或后退。不过相对而言,我们更关注于纯策略均衡。一博弈,如果有惟一的纳什均衡点,那么这个博弈是可于纯策略均衡。一博弈,如果有惟一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是事先知道的惟一的博弈结果。但是如果预测的,即这个纳什均衡点就是事先知道的惟一的博弈结果。但是如果一博弈有多
33、个纳什均衡,则要预测结果就必须附加另外的有关博弈的细一博弈有多个纳什均衡,则要预测结果就必须附加另外的有关博弈的细节信息。比如,这里谁进谁退,可能就需要附加额外的细节信息才能做节信息。比如,这里谁进谁退,可能就需要附加额外的细节信息才能做出判断。出判断。斗鸡博弈斗鸡博弈 斗鸡博弈斗鸡博弈(Chicken Game)试想有两人试想有两人(鸡鸡)狭路相逢,每人有两个行狭路相逢,每人有两个行动选择:一是退下来,一是进攻。如果一方退动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这下来,而对方没有退下来,对方获得胜利,这人就很丢面子;如果对方也退下来,双方则打人就很丢面子
34、;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两人都前进,自己则胜利,对方则失败;如果两人都前进,那么则两败俱伤。假设两败俱伤为那么则两败俱伤。假设两败俱伤为-2,赢的一,赢的一方为方为1,输的一方为,输的一方为-1。请用战略式和扩展式。请用战略式和扩展式写出他们的表达方式。并说明纳什均衡点。写出他们的表达方式。并说明纳什均衡点。斗鸡博弈斗鸡博弈 进进退退进进-2,-2-2,-21,-11,-1退退-1,1-1,1-1,-1-1,-1Chicken AChicken B完全信息动态博弈完全信息动态博弈行动
35、次序行动次序信息信息静态静态动态动态完全信完全信息息完全信息静态博弈完全信息静态博弈纳什均衡纳什均衡()囚徒困境,周末约会囚徒困境,周末约会完全信息动态博弈完全信息动态博弈子博弈精练纳什均衡子博弈精练纳什均衡()田忌赛马,破釜沉舟,田忌赛马,破釜沉舟,昭君出塞昭君出塞不完全不完全信息信息不完全信息静态博弈不完全信息静态博弈贝叶斯均衡贝叶斯均衡(不完全信息动态博弈不完全信息动态博弈精炼贝叶斯均衡精炼贝叶斯均衡 2.2.7 博弈的分类和均衡博弈的分类和均衡2.3.1 战略式表达战略式表达2.3.2 扩展式表达扩展式表达第三节第三节 博弈的表达方式博弈的表达方式2.3.1 战略式表达战略式表达 战略
36、式表达(战略式表达(strategic representation),又称标准式表达又称标准式表达(normal from representation)。更适。更适合静态博弈。用合静态博弈。用支付矩阵支付矩阵表示。表示。三个要素:三个要素:1.博弈的参与人集合博弈的参与人集合 2.每个参与人的战略空间每个参与人的战略空间 3.每个参与人的支付函数(由战略组合每个参与人的支付函数(由战略组合决定)决定)囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B案例:智猪博弈案例:智猪博弈(pigs game)猪圈中有一头大猪和一头小猪,在猪圈的一猪圈中有一头大猪和一头小猪,在
37、猪圈的一端设有一个按钮,每按一下,位于猪圈另一端端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有的食槽中就会有10单位的猪食进槽,但每按一单位的猪食进槽,但每按一下按钮会耗去相当于下按钮会耗去相当于2单位猪食的成本。如果大单位猪食的成本。如果大猪先到食槽,则大猪吃到猪先到食槽,则大猪吃到9单位食物,小猪仅能单位食物,小猪仅能吃到吃到1单位食物;如果两猪同时到食槽,则大猪单位食物;如果两猪同时到食槽,则大猪吃吃7单位,小猪吃单位,小猪吃3单位食物;如果小猪先到,单位食物;如果小猪先到,大猪吃大猪吃6单位而小猪吃单位而小猪吃4单位食物。请用战略式单位食物。请用战略式和扩展式写出他们的表达方式
38、。并说明纳什均和扩展式写出他们的表达方式。并说明纳什均衡点衡点智猪博弈智猪博弈 局中人:大猪,小猪局中人:大猪,小猪 策策 略:大猪:按,等待略:大猪:按,等待 小猪:按,等待小猪:按,等待 支付矩阵:支付矩阵:智猪博弈智猪博弈 按按等待等待按按等待等待小猪大猪完全信息静态博弈完全信息静态博弈案例:田忌赛马案例:田忌赛马上中下上中下上下中上下中中上下中上下中下上中下上下上中下上中下中上下中上上中下上中下3,-31,-11,-11,-1-1,1 1,-1上下中上下中1,-13,-31,-11,-11,-1-1,1中上下中上下1,-1-1,1 3,-31,-11,-11,-1中下上中下上-1,1
39、1,-11,-13,-31,-11,-1下上中下上中1,-11,-11,-1-1,1 3,-31,-1下上中下上中1,-11,-1-1,1 1,-11,-13,-3田忌田忌齐威王齐威王2.3.2 扩展式表达扩展式表达 扩展式表达(扩展式表达(extensive form representation)。更适合动态博弈。用)。更适合动态博弈。用博博弈树弈树来表示来表示 六个要素:六个要素:1.博弈的参与人集合博弈的参与人集合 2.参与人的行动顺序参与人的行动顺序 3.参与人的战略行动空间参与人的战略行动空间 4.参与人的信息集参与人的信息集 5.参与人的支付函数参与人的支付函数 6.外生事件(即
40、自然选择)的概率分布)外生事件(即自然选择)的概率分布)博弈树的基本建筑材料博弈树的基本建筑材料1 1.结(结(nodes):2.枝枝(branches):3.信息集信息集(information sets)博弈树的基本建筑材料博弈树的基本建筑材料1 1.结(结(nodes):初始结(初始结(begining nodes)决策结(决策结(decision nodes)终点结(终点结(terminal nodes)博弈从空心圆开始,空心圆表示开始决策,博弈从空心圆开始,空心圆表示开始决策,A选择后,博弈进入标有选择后,博弈进入标有B的实心圆。的实心圆。初始结用初始结用 其他决策结用其他决策结用博
41、弈树的基本建筑材料博弈树的基本建筑材料2 2.枝枝(branches):是从一个决策结到:是从一个决策结到它的直接后续结的连线,某一个枝代它的直接后续结的连线,某一个枝代表参与人的一个行动选择。表参与人的一个行动选择。博弈树的基本建筑材料博弈树的基本建筑材料2 3.信息集信息集(information sets):某个参与人某个参与人都知道些什么。信息集是用来标注某个人都知道些什么。信息集是用来标注某个人知道些什么信息的,不同的标注表示这个知道些什么信息的,不同的标注表示这个人知道不同的信息。人知道不同的信息。博弈树上的所有决策结分割成不同的信息集。每博弈树上的所有决策结分割成不同的信息集。每
42、一个信息集是决策结集合的一个子集,该子集一个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结。包括所有满足下列条件的决策结。(1)每一个决策结都是同一个参与人的决)每一个决策结都是同一个参与人的决策结策结(2)该参与人知道博弈进入该集合的某个该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决决策结,但不知道自己究竟处于哪一个决策结策结2.3.2 扩展式表达扩展式表达坦白坦白坦白不坦白不坦白(-8,-8)(0,-10)不坦白坦白坦白囚徒困境囚徒困境不坦白不坦白(-10,0)(-1,-1)ABB案例案例 案例一:姑娘案例一:姑娘(girl)爱上小伙子,父亲爱上小伙
43、子,父亲(father)不同意。威胁说,如果分手,)不同意。威胁说,如果分手,我们还是好父女,两人和好;如果嫁给小我们还是好父女,两人和好;如果嫁给小伙子,那就一刀两断。伙子,那就一刀两断。局中人:姑娘局中人:姑娘(girl),父亲(,父亲(father)策策 略:略:girl:分手,不分手:分手,不分手 father:和好,不和好:和好,不和好 支付矩阵:支付矩阵:2.3.2 扩展式表达扩展式表达girl不分手不分手和好和好不和好不和好father(2,1)(1,0)father分手分手和好和好父女威胁父女威胁不和好不和好(1,1)(0,0)和好和好不和好不和好分手分手1,11,10,00,
44、0不分不分手手2,12,11,01,0girlfather 有两家房地产公司,决定是否开发房地产。有两家房地产公司,决定是否开发房地产。需求大,开发需求大,开发者者利润利润8千万,千万,不开发者不开发者利润利润0。需求大,需求大,两者都开发两者都开发利润各为利润各为4千万。千万。需求小,开发需求小,开发者者利润利润1千万,千万,不开发者不开发者利润利润0。需求小,需求小,两者都开发两者都开发利润各为利润各为-3千万千万 两者都两者都不开发利润各为不开发利润各为0。博弈树:房地产开发博弈I博弈树:房地产开发博弈IA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4
45、)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4博弈树:不允许的情形博弈树:不允许的情形博弈树的基本建筑材料博弈树的基本建筑材料2 3.信息集信息集(information sets):某个参与人某个参与人都知道些什么。信息集是用来标注某个人都知道些什么。信息集是用来标注某个人知道些什么信息的,不同的标注表示这个知道些什么信息的,不同的标注表示这个人知道不同的信息。人知道不同的信息。博弈树上的所有决策结分割成不同的信息集。每博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集,该子集一个信息集是决策结集合的一个
46、子集,该子集包括所有满足下列条件的决策结。包括所有满足下列条件的决策结。(1)每一个决策结都是同一个参与人的决)每一个决策结都是同一个参与人的决策结策结(2)该参与人知道博弈进入该集合的某个该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决决策结,但不知道自己究竟处于哪一个决策结策结博弈树:房地产开发博弈IA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4另一种描述:房地产开发博弈IN 大(1/2)小(1/2)开发 不开发 开发 不开
47、发开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)A A B1 B2 B3 B4信息集:房地产博弈信息集:房地产博弈IIA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4信息集:房地产博弈信息集:房地产博弈IIIA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1
48、 N2 B1 B2 B3 B4第二种描述:房地产开发博弈IIIN 大(1/2)小(1/2)开发 不开发 开发 不开发开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)A A B1 B2 B3 B4第三种描述:房地产博弈房地产博弈IVN 大 小 开 不开 开 不开开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)B1 B2 A1 A2 A3 A4囚徒困境囚徒困境 A 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖 B B坦白坦白 抵赖抵赖(-8,-8
49、)(0,-10)(-10,0)(-1,-1)B 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)A A囚徒困境囚徒困境 A 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖 B B坦白坦白 抵赖抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)B 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖 坦白坦白 抵赖抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)A A2.4.1 静态博弈静态博弈2.4.2 动态博弈动态博弈第四节第四节 如何寻找博弈的均衡点如何寻找博弈的均衡点纳什均衡纳什均衡纳什均衡的定义纳什均衡的定义 对于一个给
50、定的策略组合,如果各博弈方都对于一个给定的策略组合,如果各博弈方都没有单独改变策略组合的意愿,则称该策略组没有单独改变策略组合的意愿,则称该策略组合为纳什均衡合为纳什均衡.纳什均衡的一致预测性质纳什均衡的一致预测性质 各博弈方都能预测到,并且能预测到其他博各博弈方都能预测到,并且能预测到其他博弈方能预测到,能预测到其他博弈方也能预测弈方能预测到,能预测到其他博弈方也能预测到自己能预测到到自己能预测到.完全信息静态博弈纳什均衡完全信息静态博弈纳什均衡 各博弈方同时决策,且所有博弈方各博弈方同时决策,且所有博弈方对博弈中的各种情况下的得益都完全了对博弈中的各种情况下的得益都完全了解的博弈问题。解的