1、清华诚志1博弈论博弈论的定义和的定义和主要思想主要思想清华诚志2一、什么是博弈论一、什么是博弈论博弈论(Game Theory),又称对策论,是指一些个人、队组、或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行动或策略中进行选择并加以实施,从中各自取得相应的结果的过程。清华诚志3张维迎的定义“博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的”也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。所以在这个意义上说,博弃论又称为“对策论”.
2、清华诚志4产生与发展产生与发展一般认为,1944年冯诺依曼和摩根斯坦合作出版的博弈论和经济行为,标志着系统的博弈理论的形成。20世纪50年代以来,纳什、泽尔腾、海萨尼等人使博弈论最终成熟并进入实用。到20世纪70年代,博弈论正式成为主流经济学。清华诚志5三位大师主要的贡献1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。因为在现实世界中,非合作博弈要比合作博弈普遍得多。清华诚志6Selten and Harsanyi泽尔腾(1965)将纳什
3、均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念;以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”而海萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(19671968)。总之,他俩进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论,提供了基本思路和模型 清华诚志7博弈论与诺贝尔奖博弈论与诺贝尔奖1994年诺贝尔经济学奖授予了三位博弈论专家和。1996年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克瑞;2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性贡献。2005年诺奖
4、授予有以色列和美国双重国籍的罗伯特奥曼和美国人托马斯谢林,以表彰他们在博弈论领域作出的贡献。清华诚志8主要思想博弈论并不是经济学的一个分支,它只是一种方法,这也是为什么许多人将其看成数学的一个分支的缘故。在对参与者行为研究这一点上,博弈论和经济学家的研究模式是完全一样的。经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和相互作用,人与人之间利益和冲突、竞争与合作,而这正是博弈论的研究对象。清华诚志9博弈论是一个强有力的分析工具。现在,它不仅在经济学领域、在军事、政治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响,工程学中如控制论工程也少不了它。帮助大家形成博
5、弈论的基本概念,实际上它是非常精深的。现在与它紧密联系的经济学分支是信息经济学。信号游戏、拍卖形式、激励机制、委托人-代理人理论和公共财政学是博弈论和信息经济学研究的重要课题。著名经济学家保罗.萨缪尔森说:“要想在现代社会做一个有文化的人,您必须对博弈论有一个大致了解。”清华诚志10我们从博弈中学习什么博弈论告诉人们,要学会理解他人都有自己的思想,每个个体都是理性的,所以必须了解竞争对手的思想。商业关系被认为是一种相互作用。但博弈论并不是疗法,并不是处方,它并不告诉你该付多少钱买东西,这是计算机或者字典的任务。博弈论只是提供一些关系的例证,一些有用的解决问题的方法。这种思维方法也许是企业家应该
6、学习的。对于经济学家,也许需要学习它的理论模型,它的实验方式。清华诚志11博博弈论的组成要素论的组成要素1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体,如企业,国家等);2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策(坦白,抵赖);3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排;清华诚志124、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识;5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西;6、均衡是所有参与
7、人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。清华诚志13两种均衡占优策略是无论其他局中人采取什么策略对于自己来说都是最好的策略。占优均衡所有局中人都有占优策略而形成的均衡。纳什均衡是指某一局中人在其他局中人的策略给定时选择最好策略而形成的均衡。清华诚志14占优均衡“不管你做什么,我所做的都是最佳选择。不管你做什么,我所做的都是最佳选择。”“不管我做什么,你所做的都是最佳选择。不管我做什么,你所做的都是最佳选择。”纳什均衡“给定你的行为,我所做的是最佳选择。给定你的行为,我所做的是最佳选择。”“给定
8、我做什么,你所做的是最佳选择。给定我做什么,你所做的是最佳选择。”占优均衡一定是纳什均衡,但占优均衡一定是纳什均衡,但纳什均衡不一定是占优均衡。纳什均衡不一定是占优均衡。清华诚志15博弈的分类博弈的分类1)根据参与人的多少,可将博弈分为两人博弈和多人博弈;2)根据博弈结果的不同,又可分为零和博弈、常和博弈和变和博弈;3)根据博弈方策略的数量,可分为有限博弈和无限博弈;清华诚志164)根据参与人是否合作,可将博弈分为合作博弈或非合作博弈;合作博弈是指参与人之间有着一个对各方具有约束力的协议,参与人在协议范围内进行的博弈。合作博弈强调的是集体主义,团体理性是效率、公平、公正;非合作博弈主要研究人们
9、在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。清华诚志17例子比如两家企业、合作建设一条的生产线,协议由方提供生产的技术,方则提供厂房和设备。在对技术和设备进行资产评估时就形成非合作博弈,因为每一方都试图最大化己方的评估值,这时方如果能够获得方关于技术的真实估价或参考报价这类竞争情报,则可以使自己在评估中获得优势;同理,方也是一样。至于自己的资产评估是否会影响合作企业的总体运行效率这样的集体利益,则不会非常重视。这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益。清华诚志185)从行动的先后次序来分,博
10、弈可以分为静态博弈和动态博弈。静态博弈指在博弈中,参与人同时选择行动,或虽非同时但后行动者并不知道前行动者采取了什么具体行动;动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动的博弈。清华诚志196)从参与人对其他参与人的各种特征信息的获得差异来分,博弈可分为完全信息博弈和不完全信息博弈。完全信息指的是每一个参与人对所有其他参与人的特征,如策略集合及得益函数都有准确完备的知识;否则就是不完全信息。将上述5)和6)两个角度的划分结合起来,我们就得到四种不同类型的博弈,这就是:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。清华诚志20博弈的
11、分类及对应的均衡博弈的分类及对应的均衡行动次序信息静态动态完全信息纳什均衡(1950)子博弈精练纳什均衡(1965)不完全信息贝叶斯均衡(1967-1968)精炼贝叶斯均衡(1975-1991)清华诚志21完全信息静态博弈完全信息静态博弈囚犯困境囚犯困境(Prisoners Dilemma):警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有
12、一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;如果两人都坦白认罪,则他们将被各判8年监禁。问:两个罪犯会如何选择(即是坦白还是抵赖)?清华诚志22得益矩阵表示为 囚徒B-8,-80,-10-10,0-1,-1囚徒A 坦白抵赖坦白抵赖清华诚志23囚徒困境说明了什么在(坦白、坦白)这个组合中,和都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡,也叫非合作均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果和都选择抵赖,各判刑年,显然比都选择坦白各判刑年好得多。当然,和可以在被警察抓到之前订立一个攻守同盟,但是这可能不会有用,因为它不构成纳什均衡
13、,没有人有积极性遵守这个协定,显然最好的策略是双方都抵赖.清华诚志24囚徒困境的意义“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。清华诚志25对经典经济学的冲击“纳什均衡”首先对亚当斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。国富论:“通过追求(个人的)自身利益,他常
14、常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。清华诚志26怎么看待这个问题二者是对立统一的,范围不同,在非竞争环境中效率会受到损失;在完全竞争条件下,边际利润等于边际成本,达到效率纳什均衡条件下的行为规则。合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。所谓“己所不欲勿施于人”。但前提是人所不欲勿施于我。清华诚志27囚徒困境在经济
15、学上的应用1、两个寡头企业选择产量的博弈、两个寡头企业选择产量的博弈 如两企业联合起来形成卡特尔,选择垄断利如两企业联合起来形成卡特尔,选择垄断利润最大化的产量,每个企业都可以得到更多的润最大化的产量,每个企业都可以得到更多的利润,但卡特尔协定不是一个纳什均衡,因为利润,但卡特尔协定不是一个纳什均衡,因为给定对方遵守协议的情况下,每个企业都想增给定对方遵守协议的情况下,每个企业都想增加产量,结果是,每个企业都只得到纳什均衡加产量,结果是,每个企业都只得到纳什均衡产量的利润,它小于卡特尔产量下的利润。产量的利润,它小于卡特尔产量下的利润。有有些情况下,个人理性与集体理性的冲突对整个些情况下,个人
16、理性与集体理性的冲突对整个社会来说也许是一件好事。社会来说也许是一件好事。清华诚志282、公共产品的供给博弈、公共产品的供给博弈 大家都出钱兴办公用事业,所有人的福利都大家都出钱兴办公用事业,所有人的福利都会增加。问题是,如果我出钱你不出钱,我得会增加。问题是,如果我出钱你不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以,每个人的最优选择都是你的便宜。所以,每个人的最优选择都是“不不出钱出钱”,这种纳什均衡使得所有人的福利都得,这种纳什均衡使得所有人的福利都得不到提高。不到提高。3、军备竞赛博弈、军备竞赛博弈 纳什均衡是两国都大量增加军
17、费预算,两国纳什均衡是两国都大量增加军费预算,两国的社会福利都变得更糟。的社会福利都变得更糟。4、企业改革、企业改革 在许多改革中,改革者要付出成本,而改革在许多改革中,改革者要付出成本,而改革的成果大家分享,结果是,尽管人人都认为改的成果大家分享,结果是,尽管人人都认为改革好,却没有人真正去改革,大家只好在都不革好,却没有人真正去改革,大家只好在都不满意的体制下继续生活下去。满意的体制下继续生活下去。清华诚志29价格战 从这个案例中我们可以引伸出两个问题:一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(rivalry game)其结果
18、会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。清华诚志30有趣的联系我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情
19、况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。清华诚志31智猪博弈猪圈里有两头猪,一头大猪,一头小猪。猪圈猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,先吃到另一边落下的食物。当小猪踩动踏板时,
20、大猪会在小猪跑到食槽之前刚好吃光所有的食大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半吃完落下的食物之前跑到食槽,争吃到另一半残羹。那么,两只猪各会采取什么策略?残羹。那么,两只猪各会采取什么策略?清华诚志32答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。在这个例子中,对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲历亲为了。故事
21、中的游戏规则导致了“小猪躺着大猪跑”的现象,如果改变一下核心指标:每次落下的食物数量和踏板与投食口之间的距离。猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?我们假设以下三种新的游戏规则。清华诚志33 我们假设以下三种新的游戏规则:新规则一:减量方案。投食仅原来的一半分量。谁去踩踏板,就意味着为对方贡献食物。结果是小猪大猪都不去踩踏板了。也就不会有踩踏板的动力。如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。新规则二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板,反正对方不会一次把食物吃完。所以竞争意识却不会很强。对于游戏规则的设计者来说,这个规则的成本相当高(每
22、次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。新规则三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。清华诚志34 原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心
23、指标设置是否合适了。清华诚志35 所以在企业人力资源管理中,进行激励制度设计时,如果奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,重要的是激励因素转变成了保健因素,员工的积极性并没有提高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份,一度十分努力的大猪也不会有动力了,企业将会没有生命力,就出现“智猪博弈”减量方案所产生的结果。最好的激励机制设计就像改变方案三-减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。清华诚志36智猪博弈的应用1、股份
24、公司中大股东和小股东监督经理的博弈 纳什均衡是大股东担当收集信息、监督经理的责任,而小股东则搭大股东的便车。2、股票市场上大户、小户炒股票 对小户而言,“跟大户”是最优选择,而大户口、必须自己收集信息,进行分析。清华诚志37龟兔赛跑与运行机制设计 在现实的企业里面,类似龟兔赛跑的情形很多。例如,企业一方面感觉人才匮乏,另一方面又在大量浪费人才。本该放在“高端”的人才却长期放在“低端”,高端人才在低端环境里找不到兴奋点,找不到挑战,就象兔子撒开腿跑就找不着龟,此时它还有什么心情再跑下去,睡吧,长睡的结果失去了斗志,也失去了善跑的能力。又例如决策层和执行层,执行层和作业层之间的脱节,造成决策层(执
25、行层)就象“龟”四平八稳的在蠕动;而执行层(作业层)就好象兔在前方睡觉,这是企业老化的真实写照。清华诚志38怎样避免类似上述两个例子的情形发生呢?企业应在组织、经营、生产的运行机制设计上跳出龟兔赛跑的思维定式,应用博弈的观点,理智的科学的设计出符合本企业实际的运行机制。这里有两条原则,一是机制要有充分的竞争性及竞争平台,二是对竞争要有评价系统及评价的权威性、公正性程序设计。清华诚志39掩耳盗铃故事中盗铃者与护铃者构成博弈双方,但盗铃者错误地将决定博弈利益的信息因素阻断把自己的耳朵捂住,盗铃的失败是必然的,故事非常可笑。但经过几千年的文明净化和发展,在我们的现实生活中,这样的故事还在不断的演义着
26、。决策失误经常见诸报端,其实现实中的决策失误报纸是盛不下的,究其原因除制度外就是决策者们通过各种形式阻断了决策所必须的信息,单凭个人喜好,听不进去半点不同意见,这种失误实属必然。清华诚志40博弈论是决策的科学工具,在使用这个工具的过程中,信息是否完全是决策正确与否的基础,因此企业的各级决策者应在工作中疏通信息的通道。这里有三条建议:一是从文山会海中脱出身来,改变开会就是工作的单一思维;二是少听汇报,多下去搞些调查研究,了解真实情况;三是把对报喜者的灿烂笑脸分些给报扰者吧!清华诚志41性别战(battle of sexes)一男一女谈恋爱,男的偏好足球,女的喜欢芭蕾,但他们宁愿在一起,不愿分开。
27、下表所列为收益。2,10,00,01,2 女足球 芭蕾 足球 芭蕾男清华诚志42双均衡的性别战 在此情况下,给定一方看足球,另一方也会去;给定一方看芭蕾,另一方也会去。所以在这个博弈里有两个纳什均衡:足球,足球,芭蕾,芭蕾。究竟哪种结果会发生?不能确定。可能取决于偶然因素,但先动优势会起作用。清华诚志43纯战略与混合战略如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动,称为纯战略。如果一个战略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动,称为混合战略。清华诚志44监督博弈的纳税检查A 为应纳税款,C为检查成本,F是偷税罚款。假定 CA+F。不存在纯战略纳什均
28、衡。A-C+F,-A-FA-C,-A0,0A,-A纳税人税收机关 检查 不检查 纳税人逃税 不逃税 清华诚志45纳税检查边际S 为税务机关检查的概率,E为纳税人逃税概率。给定E,税收机关选择检查与否的期望收益:K(1,E)=(A-C+F)E+(A-C)(1-E)=EF+A-C K(0,E)=0E+A(1-E)=A(1-E)解K(1,E)=K(0,E),得:E=C/(A+F)纳税人逃税概率小于E,税收机关的最优决策是不检查,否则则反。清华诚志46逃税边际给定S,纳税人选择逃税与否的期望收益是:K(S,1)=(-A-F)S+0(1-S)=-(A+F)SK(S,0)=-AS+(-A)(1-S)=-A
29、解K(S,1)=K(S,0),得S=A/(A+F)即,如果税收机关检查的概率小于S,纳税人的最优选择是逃税,否则交税。混合纳什均衡是S,E,即税收机关以S的概率查税,而纳税人以E的概率逃税。清华诚志47对博弈论的两种极端评价从20世纪70年代末期,学者们逐渐形成一个共识,当一个人或群体与他或他们的博弈论对手都能以理性的方式做出决策行为的时候,那就是博弈论大显身手的场合。有人将博弈论比作Mendel的遗传理论和Darwin的自然选择对生物学的影响,或者Newton的天体力学对物理学的奠基作用。真正的社会并不严格是博弈论的理想对象,无论是股票市场上的投机现象,还是受制于传统文化的惯性影响下的体制选
30、择。如同混沌动力系统理论带给人们的初始兴奋之后,博弈论并不具有有历史上像物理学中理论的预测能力。清华诚志48五、完全信息动态博弈纳什均衡的问题:多均衡、单选择性(静态性),不可置信威胁的存在性(市场进入博弈)泽尔腾剔除了不可置信威胁战略,减少了纳什均衡的个数扩展型表述的要素:参与人、参与人行动的时点、行动集合、信息,支付函数清华诚志49子博弈精炼纳什均衡当参与人的战略在每一个子博弈中都构成纳什均衡。每一个子博弈都是最优的。城市姑娘爱上农村小伙子导致姑娘父亲的反应。承诺行动(commitment),当事人使自己威胁战略变得可信的行为。清华诚志50例子(要挟诉讼,曾诺行动与精炼均衡的关系)成功可能
31、性非常小,目的是希望和解得到补偿。不指控指控要求S拒绝接受起诉放弃(0,0)PPDP(S-C,-S)(TX-P-C,-TX-D)(-C,0)清华诚志51原告指控的目的本身意味着TX-C-P,只要胜诉的可能大于0,原告将起诉。如果SC+P,原告提起诉讼;即使TXC+P仍有可能。(TX+D/2-C-P,-TX-D/2)案件私了。清华诚志53不完全信息静态博弈不了解对方的偏好、战略空间及各种战略组合下的利润水平。市场进入博弈40,5030,100-10,0-10,1400,3000,4000,3000,400 在位者默许 斗争 进入进入者 不进入高成本低成本 清华诚志54海萨尼转换引入虚拟参与人“自
32、然”在所有后果间是无差异的。自然的选择提供了被选择的参与人真实类型的概率分布。分布函数是共同知识。“不完全信息”转换为“完全但不完美信息”清华诚志55贝叶斯纳什均衡Bayesian equilibrium给定自己的类型和对方类型的概率分布的情况下,每个参与者的期望效用达到了最大化,没有人有积极性选择其他战略的类型战略依存组合。期望利润=40 x+(-10)(1-x)清华诚志56不完全信息动态博弈 -精炼贝叶斯纳什均衡垄断限价模型(低成本价格与高成本价格透露的信息)信号传递模型成本的信息含量清华诚志57求爱博弈如果男人是柳下惠,女人穿少的时候他会看的概率是20%;如果男人是登徒子,女人穿少的时候
33、他会看的概率是100%。女人根据现有的信息判断男人是柳下惠的概率为70%,因此女人估计自己穿少的时候,男人看的概率为:0.7*0.2+0.3*1=0.44这是女人给定男人所属类型的先验概率下,男人可能采取看的概率。清华诚志58 当男人的确看了的时候,使用贝叶斯法则,根据男人看的这一行动,女人认为男人是柳下惠的概率变为:0.7*0.2/0.44=0.32 根据这一新的概念,女人估计自己穿少的时候男人会看的概率为:0.32*0.2+0.68*1=0.744 清华诚志59 如果女人将这种行为再重复一次,男人又看了,则女人认为男人是柳下惠的概率变为:0.32*0.2/0.744=0.086 这样女人通过男人一次次的看的行为,越来越认为男人是登徒子而不是柳下惠。这就是参与人行为传递信息的作用。清华诚志60谢谢大家