1、博弈论初步博弈论初步博弈论与主流经济学的发展n传统经济学的假设及其局限性传统经济学的假设及其局限性两个基本假设:完全竞争,完美信息两个基本假设:完全竞争,完美信息局限性:交易主体的数量其实很有限;信息是不对称的局限性:交易主体的数量其实很有限;信息是不对称的一般均衡理论是整个经济学的理论基石和道义基础,市场机一般均衡理论是整个经济学的理论基石和道义基础,市场机制是完美的,帕累托最优成立,平等与效率可以兼顾。然而制是完美的,帕累托最优成立,平等与效率可以兼顾。然而在以下情况不成立:在以下情况不成立:n非完全竞争:垄断越来越普遍非完全竞争:垄断越来越普遍n外部性:市场不可能把所有的成本收益都计算在
2、内外部性:市场不可能把所有的成本收益都计算在内n公共产品:市场无非解决公共产品:市场无非解决“搭便车搭便车”问题问题n逆向选择问题:柠檬市场逆向选择问题:柠檬市场n道德风险问题:为什么市场的交易费用比较高道德风险问题:为什么市场的交易费用比较高?博弈论与主流经济学的发展n博弈论研究的是:在策略性环境中如何进博弈论研究的是:在策略性环境中如何进行策略性决策和采取策略性行动的科学。行策略性决策和采取策略性行动的科学。当成果无法由个体完全掌握,而结局须视当成果无法由个体完全掌握,而结局须视群体共同决策而定时,个人为了取胜,应群体共同决策而定时,个人为了取胜,应该采取什么策略该采取什么策略n博弈论成为
3、通用方法论,经济学、政治学、博弈论成为通用方法论,经济学、政治学、管理、军事、外交、国际关系、公共选择、管理、军事、外交、国际关系、公共选择、犯罪学犯罪学博弈论与主流经济学的发展n传统微观经济学与博弈论的比较传统微观经济学与博弈论的比较传统微观经济学的个人决策是在给定一个价格参数和收入传统微观经济学的个人决策是在给定一个价格参数和收入的条件下最大化自己的效用,个人的效用与其他人无关,的条件下最大化自己的效用,个人的效用与其他人无关,所有其他人的行为都被总结在所有其他人的行为都被总结在“价格价格”参数之中参数之中博弈论中,个人效用不仅依赖于自己的选择,还以来于他博弈论中,个人效用不仅依赖于自己的
4、选择,还以来于他人的选择,研究在存在外部经济条件下的个人选择问题人的选择,研究在存在外部经济条件下的个人选择问题事实上事实上,行为主体的数量通常不多行为主体的数量通常不多,相互之间存在明显影响相互之间存在明显影响经济学对博弈论寄予厚望,认为用博弈论可以重写经济学经济学对博弈论寄予厚望,认为用博弈论可以重写经济学原理原理博弈论改写经济学,从放宽新古典的完全竞争和完全信息博弈论改写经济学,从放宽新古典的完全竞争和完全信息两个条件展开两个条件展开博弈论的代表人物及其贡献博弈论的代表人物及其贡献1944年,J冯诺依曼、O摩根斯坦恩在博弈理论与经济行为首先提出一些博弈论的概念。1994年,纳什、泽尔腾和
5、海萨尼获得诺贝尔经济学奖。1996年,莫里斯和维克里获得诺贝尔经济学奖。2001年,阿克洛夫、斯蒂格利茨和斯宾塞获得诺贝尔经济学奖2005年,奥曼和谢林获得诺贝尔经济学奖。囚徒困境 两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑8年;若两人都 不招则未获证据但因私入民宅 各拘留1年。表1 囚徒困境博弈 乙 招 不招 招 甲 不招(问题:甲、乙如何选择?)-8,-80,-10-10,0-1,-1 尽管甲不知乙是否招供,但他认为自己选“招”最好,因 而 甲 会 选
6、择“招”,乙也同样会选择“招”,结果各判8年;但若两人都不招,结果是两人只被判1年,但这种结果是不会出现的。我们可以运用“剔除劣战 略”的方法来获得这样的结果。甲或乙可以作出的选择被称为“战略”,如“招”或“不招”都是战略。思想n“囚徒困境囚徒困境”博弈的经济和社博弈的经济和社会意义在于,个人理性不一定会意义在于,个人理性不一定导致集体理性,或者说导致集体理性,或者说人人为人人为自己未必导致整体利益。自己未必导致整体利益。n这与市场机制的思想是不同的。这与市场机制的思想是不同的。不过,两者是相辅相成的。不过,两者是相辅相成的。n囚徒困境的几个事例:囚徒困境的几个事例:价格大战价格大战两个寡头企
7、业选择产量两个寡头企业选择产量军备竞赛军备竞赛做广告做广告围观时踮脚尖围观时踮脚尖应试教育应试教育贸易自由与壁垒,地方保护主义贸易自由与壁垒,地方保护主义博弈论要点n博弈:决策主体在互相对抗中,对抗双方博弈:决策主体在互相对抗中,对抗双方(或多方或多方)互相依存的一系列策略和行动的互相依存的一系列策略和行动的过程集合过程集合参与人的利益有冲突参与人的利益有冲突博弈是一个过程集合博弈是一个过程集合(参与人、策略、行动、参与人、策略、行动、信息等信息等)。把博弈视为集合是思维从具体到抽。把博弈视为集合是思维从具体到抽象的重要一步象的重要一步博弈的一个本质特征是策略的相互依存性博弈的一个本质特征是策
8、略的相互依存性n博弈论:专门研究博弈如何出现均衡的规博弈论:专门研究博弈如何出现均衡的规律的学问律的学问博弈论要点n博弈论的基本概念包括:参与人、参与人的博弈论的基本概念包括:参与人、参与人的策略、参与人的支付(效用)策略、参与人的支付(效用)n博弈有不同的种类:博弈有不同的种类:从行动顺序角度:从行动顺序角度:n静态博弈静态博弈。参与人同时选择行动参与人同时选择行动n动态博弈。参与人的行动有先后顺序动态博弈。参与人的行动有先后顺序从拥有信息角度:从拥有信息角度:n完全信息博弈。每个参与人对所有其他参与人的特征、完全信息博弈。每个参与人对所有其他参与人的特征、战略空间、支付函数有准确的知识战略
9、空间、支付函数有准确的知识n不完全信息博弈。不完全信息博弈。博弈的分类与对应的均衡概念行动顺序/信息状况静 态动 态完全信息完全信息静态博弈;纳什均衡完全信息动态均衡;子博弈精炼纳什均衡不完全信息不完全信息静态均衡;贝叶斯纳什均衡不完全信息动态均衡;精炼贝叶斯纳什均衡静态博弈静态博弈:博弈中参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取什么行动;动态博弈(序贯博弈)动态博弈(序贯博弈):参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。完全信息完全信息指的是每个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识,否则就是不完全信息不完全信息。博弈的
10、种类博弈的种类合作博弈与非合作博合作博弈与非合作博弈弈 厂商之间的经济博弈可以是合作的,也可以是非合作的。区别在于是否存在一个有约束力的协议。如果有,就是合作博弈;如果没有,就是非合作博弈。前者强调团体理性,即效率、公平和公正;后者强调个人理性和个人最优决策。同时博弈与序贯博同时博弈与序贯博弈弈前者是博弈各方在不了解对方情况下制定决策;后者是一方看到另一方的行动之后再采取行动。一次博弈与重复博一次博弈与重复博弈弈博弈行动只进行一次的是一次博弈;博弈行动进行多次的是重复博弈双人博弈与双人博弈与 多多人博弈人博弈前者只有两人参加行动,后者有多人参加行动零和博弈与非零零和博弈与非零和博弈和博弈在零和
11、博弈中,一方之所得即为另一方之所失;在非零和博弈中,双方的得失取决于各自选择采取的行动。二、同时博弈:纯策略博弈同时博弈与序贯博弈同时博弈是参与人同时进行决策或行动的博弈;所谓同时或先后主要是看参与人在决策时是否已经知道其他参与人的决策序贯博弈是参与人的决策和行动有先有后的博弈。支付矩阵(也称报酬矩阵)被用来描述和分析一个博弈。占优策略无论其他参与者采取什么策略,某参与者都存在唯一的最优策略选择,这一最优策略就是他的占优策略。如果某个参与者具有占优策略,那么,无论其他参与者选择什么策略,该参与者确信自己所选择的唯一策略都是最优的。博弈均衡指博弈中的所有参与者都不想改变自己的策略的一种状态。纳什
12、均衡是指这样一种状态,任何一个参与者都不会改变自己的策略,如果其他参与者不改变策略;在该策略组合上,任何参与人单独改变策略都不会得到好处;条件策略下划线法条件策略,参与人给定条件下的相对优势策略,如甲厂商在乙厂商选择合作条件下的条件(优势)策略为不合作。首先用下划线表示甲厂商的条件策略其次用下划线表示乙厂商的条件策略最后找到在两个数字之下都画线的单元格即为博弈的均衡。n智猪博弈智猪博弈(boxed pigs)猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单
13、位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。表4给出这个博弈的支付矩阵。纳什均衡小猪小猪按按 等待等待大猪大猪按按等待等待5,14,49,-10,0小猪的最优策略:等待小猪的最优策略:等待 大猪无最优策略:即大猪的最优策略是依赖于大猪无最优策略:即大猪的最优策略是依赖于 小猪的策略小猪的策略 此时用重复剔除严格劣策略的思路找出均衡:小此时用重复剔除严格劣策略的思路找出均衡:小猪的严格劣策略为按,剔除猪的严格劣策略为按,剔除“按按”后,小猪只后,小猪只有一种策略等待,大猪仍有两个策略,但此时,有一种策略等待,
14、大猪仍有两个策略,但此时,“等待等待”已成为大猪的劣策略,剔除,大猪的已成为大猪的劣策略,剔除,大猪的最优策略最优策略按按这是一个这是一个“多劳不多得,少劳不少得多劳不多得,少劳不少得”的均衡的均衡股市博弈 在股票市场上,大户是大猪,他们要进行技术分析,收集信息、预测股价走势,但大量散户就是小猪。他们不会花成本去进行技术分析,而是跟着大户的投资战略进行股票买卖,即所谓“散户跟大户”的现象。为什么中小企业不会花钱去开发新产品?在技术创新市场上,大企业是大猪,它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后生产,模仿大企业的新
15、产品的产品去销售。三、序贯博弈在序贯博弈中,参与人的决策有先有后,特别是,后行动的参与人可以观察到先行动的参与人已经采取了的策略。在图中,有两个房地产开发商A和B分别决定在同一地段上开发一栋写字楼。由于市场需求有限,如果他们都开发,则在同一地段会有两栋写字楼,超过了市场对写字楼的需求,难以完全出售,空置房太多导致各自亏损1百万。当只有一家开发商在这个地段开发一栋写字楼时,它可以全部售出,赚得利润1百万。假定A先决策,B在看见A的决策后再决策 是否开发写字楼。在图中,用“博弈树”表示博弈过程。房地产开发博弈A不开发开发BB开发不开发开发不开发(-1,-1)(1,0)(0,1)(0,0)n 在其中
16、每一条“路径”的末端用向量给出A和B的支付,称为支付向量。下面用“逆向归纳法”可以求解这个博弈。在B进行决策的2个“决策结”上,B在左边的决策结上选择“不开发”;而在右边的决策结上选择“开发”。即给定A开发,B就不开发;给定A不开发,B就开发。B应避免同时与A都选择开发而蒙受损失。n 在这种情况下,A在自己的决策结上当然选择“开发”,因为他预计当自己选择“开发”后,B会选择“不开发”,自己就净赚一百万。当B威胁A说:“不管你是否开发,我都会在这里开发写字楼。”倘若A将B的话当了真,A就不敢开发,让B单独开发写字楼占便宜。但是,B的威胁是“不可置信”的。当A不理会B的威胁而果断地开发出一栋写字楼
17、时,B其实不会将事前的威胁付诸实施。因为“识时务者为俊杰”,在A已开发的情况下,B的最优决策是“不开发”而不是“开发”。但是,如果B在向A发出威胁的同时又当着A的面与第三者C打赌一定要在该地段上开发出一栋写字楼,否则输给C 2百万元。B与C为此签定合同并加以公证有效。思考:这时情况又会发生什么样的变化呢?情侣博弈丈夫丈夫足球足球芭蕾芭蕾妻子妻子足球足球芭蕾芭蕾足球足球芭蕾芭蕾(2 2,1 1)(0 0,0 0)(-1-1,-1-1)(1 1,2 2)妻子妻子先动优势在夫妻博弈中,有两个纳什均衡,即(足球,足球)和(芭蕾,芭蕾),前者对男方更加有利,后者对女方更加有利,但是由于男方是先行动者,通过逆向归纳法得到的最终结果就是对男方更加有利的纳什均衡。先动优势先行动者的得益大于后行动者每天读点博弈论n零和游戏:双赢和多赢才是正道n智猪博弈:做一头聪明的小猪n纳什均衡:合作是有利的“利己策略”n柠檬理论:逆向选择的困惑n