决策理论与方法第03章12Oc11课件.ppt_163文库

资源描述

1、第第3章章效用函数效用函数引言效用的定义和公理系统效用函数的构造风险与效用货币的效用.3.1 引言引言用定量化的方法研究决策问题：（1）自然状态不确定-用主观概率量化；（2）量化后果的价值-用“效用”来度量。本章的研究目的就是解决后果的价值待定问题. 在定量评价可能的行动的各种后果时，会遇到两个主要问题：（1）无形后果（非数字量）。后果本身是用后果本身是用语言表述的语言表述的，可能没有任何合适的直接测量标度。（2）即使有一个明确的标度（通常是钱）可以测量后果，按这个标度测得的量也还可能并不反映后果对决策人的真正价值决策人的真正价值。.实例实例例3.1 考虑钱对同一个人的

2、价值。假设一个学生手头紧张，正好有机会挣100 元钱，但是所要做的是他相当讨厌的工作。根据他当时的经济状况和收入水平，他会认为 100元钱的实际价值足够大，所要做的工作即使是相当讨厌，他仍会去干；但是如果他先有了 10000元，要他为 100元钱去干这份让他讨厌的工作，他就很可能不干了。 .例例3.2 3.2 决策人面临图决策人面临图3.13.1中决策树所示中决策树所示的选择：的选择：（1）收入礼品1000元；（2）参与一次抽奖：有50%的机会得0元，50%的机会得2500元。礼品抽奖图3.1 例3.2的决策树0.50.5250001.010001a2a.分析：分析：抽奖的期望值有1250元

3、，大于礼品的确定性收入1000元，一定有一部分人会选这确定性的1000元的收入；（因为对宁可选择礼品，即确定性的1000元的人而言，抽奖的期望值虽大，风险也大，实际价值还不如保险的1000元）有的人则认为礼品不如抽奖，因为抽奖提供了获得2500元的机会。图3.1作为商业、经营中实际问题的数学模型有着普遍意义。. 由上面两个例子可知：在进行决策分析时，存在如何描述或表达后果对决策人的实际价值，以便反映决策的人心目中各种后果的偏好次序偏好次序(preference order)的问题。偏好次序是决策人的个性与价值观的反映，与决策人所处的社会地位、经济地位、文化素养、心理和生理(身体)状态有关。

4、.如何来量化如何来量化“偏好偏好”？贝努利（Daniel Bernoulli）在1738年就指出，若一个人面临决策问题，也就是如何从给定行动集合中作选择，如果这个人知道将来的自然状态以及相关的概率，则应选择对各种可能后各种可能后果的偏好的期望值最高果的偏好的期望值最高的行动。 “效用效用”（utility）来量化偏好3.2 3.2 效用的定义和公理系统效用的定义和公理系统.3.2.1 3.2.1 效用的定义效用的定义1. 基本概念与符号(1) 严格序严格序“ ” (或者记作aPb)的含义是“a优于b”严格序满足两个性质：传递性传递性：若，且，则必有非对称性非对称性：若且，则不可能有

5、ca ba cb ba Acba,ba Aba,ab . 无差异“” ab(或记作aIb)的含义是“a无差异于b” 。无差异关系满足传递性、对称性和自反性，即传递性：若，且 ab，bc则ac ；对称性：若且ab，则有ba ；自反性：。 Acba,Aba,aaAa,. 弱序“ ” a b(或记作 aRb)的含义是“a 不劣于b ”，亦即 a 优于或者无差异于 b 。弱序满足连通性、传递性、与严格优于和无差异的一致性。 . 连通性亦称可比性: 对， a b或b a或两者同时成立。传递性：，若a b且b c，则 a c ; 与无差异的一致性：当且仅当 a b且b a ;

6、与严格优于的一致性：a b 当且仅当 a b且非b a。因此是最基本的次序关系。 Ab,a Ac , b ,a ba. 展望(prospect) 展望或称预期，指决策的可能的前景，即各种后果及后果出现的概率的组合，记作P ：rrcpcpcpP,;,;,2211. 在例3.2的决策问题中，后果集C=1000, 2500, 0，采取行动a1和a2时的展望分别是 P1= 和 P2=。展望既考虑各种后果ci，又考虑了各种后果出现的概率( 客观概率pi或主观概率i )，全面地描述了在决策问题中采取某种行动的可能前景。. 以上所述的展望是简单展望，有时会遇到复合展望。例如，在例3.2中，某个决

7、策人认为采取行动 a1 或 a2 的结果无差异，拿不定主意选a1好还是选a2好，此人可能会通过抛硬币来决定：出现正面选a1，出现反面选a2。这时的展望P3就是复合展望：213, 5 . 0;, 5 . 0PPP.复合展望的一般形式为：，其中为简单展望。 ssPPP,;,1111siisjcpcpcpPrjrjjj, 1,;,;,2211. 复合展望可以简化成简单展望其中所有展望P，包括所有可能的简单展望和复合展望的集合记作。确定性后果是展望的特殊情况，因此在不至于引起误解时，出于语言习惯，我们对后果与展望不作严格区分。 ,;,;,2211rrcpcpcpPrippskkiki, 1

8、,1.(5)抽奖与确定当量由机会点和该机会点发出的n个机会枝的概率及相应后果构成的图形称为抽奖抽奖( (lottery) )，抽奖又称彩票，记作。图3.3中的右半部分就是最简单的只有两个机会枝的抽奖。在一般情况下，有n种自然状态，就有n个机会枝和同样数量的后果。nncpcpcpL,;,;,2211.图3.3 抽奖与确定当量 p11-p1c1c21.0cl.抽奖与展望的区别抽奖与展望的区别展望P中包含决策问题所有可能的后果，其中有些后果发生的概率为0；抽奖L中只包含采取某种行动时所出现的那些后果。 .若决策人认为某个确定性后果与抽奖无差异，即则称确定性后果为抽奖的确定当量(

9、certainty equivalent)。图3.3所示为抽奖与确定当量。 lc nnc ,p;c ,p;c ,pL2211lcnncpcpcp,;,;,2211nncpcpcp,;,;,2211lclc2111),1 ( ;,cpcpL.(2) 效用的定义(A) 定义定义3.1 在集合上的实值函数u，若它和上的优先关系一致，即：若 , P1 P2当且仅当u( )u( ).则称 u 为效用函数。把效用函数定义在展望集上而不是定义在后果集C上，是为了使效用函数能够反映决策人对风险的态度。21,PP1P2P.定义3.1给出的效用函数不一定存在。 Von Neumann-Morgens

10、tern, 1944年给出效用的存在性公理，又称理性行为公理。公理3.1 连通性(connectivity)又称可比性（comparability）在上的优先关系是连通的，即如果 ,则，或者，或者。 3.2.2 3.2.2 效用存在性公理效用存在性公理 21,PP21PP 21 PP12PP .公理3.2 传递性 (transitivity) 在上的优先关系是传递的，即如果 , 且，则。公理3.3 替代性若 , 且 0 1，则必有或者表达成：若， , 则 321,PPP21PP32PP 31PP321,PPP3231)1 ()1 (PPPP21,PP21PP0

11、12121)1 ()1 (PPPP21PP .公理3.4 连续性(偏好的有界性) 若，，则存在，使321,PPP321PPP0131231)1 ()1 (PPPPP. 公理3.1要求集合中的元素具有成对可比性，即决策人能够判定中任何两个元素之间的优劣。公理3.1和公理3.2合称次序性公理，满足次序性公理的集合是全序集。全序集合中的元素可以根据决策人的偏好排列优先次序。. 公理3.3表明两个有序的展望各有相同的比例被相等的量替代后，优先关系不变。公理3.3的另一种表达方式是说，二种后果中，决策人所偏好的后果出现可能性较大的情况是决策人所喜爱的。)1 (3)1 (P. 公理

12、3.4是说，没有无穷好的和无穷差的酬报。因为由式的左半部分可知，不是无穷劣，即 u( ) ，否则将有 u u( )，式的左半部分不可能成立。同样的，由式(3.5)的右半部分可知，不是无穷优，即。231)1 (PPP3P3P3)1 (P)1 (3P1P)(1Pu. 或许有人会说，如果决策问题的某个后果是决策人死亡，难道这种后果的效用还不是无穷劣吗？我们说，即使是死亡，亦不至于是无穷劣，看下面的例子。3P.例3.3 一个人在街道的一侧，为了到另一侧办事或到另一侧的商店购物，当地及附近没有过街天桥和地道，就必须过马路。以往的统计资料显示，因过马路发生交通事故，造成死亡的概率约在数量级

13、。据此可以作过马路问题的决策树如图3.4所示。810. 图3.4 过马路问题的决策树不过马路过马路10-81-10-8死亡达到目的1.0无法到达目的地. 若后果死亡的效用为无穷劣( )，则无论死亡的概率多小，只要不为0，过马路的期望效用都将是，小于不过马路的期望效用，也就是说不能过马路；实际上很少有人因为过马路存在死亡的威胁而放弃过马路的。所以即使是死亡，亦不至于是无穷劣。.例3.4 为了防止被狗咬伤后得狂犬病，可以注射狂犬病疫苗，注射狂犬病疫苗的费用是20元。设某地区因得狂犬病而死亡的概率是百万分之一，则可作注射狂犬病疫苗问题的决策树如图3.5。.图3.5 注射狂犬病疫苗的决策树注射疫

14、苗不注射10-6110- 6死亡01.0-20元. 如果后果死亡是无穷劣，效用是，则任何人都应该去接种狂犬病疫苗。然而大部分人都没有去接种。对不去接种狂犬病疫苗的人，即使货币的价值是线性的，死亡的价值小于二千万元；若考虑货币的边际价值的递减性，死亡的价值更小，远非有些人所设想的负无穷。. 例3.5 Allais悖论（Allais paradox） Allais, 1953年提出如图3.6情况A所示的问题，请效用理论权威 Savage 回答： 0.89$500,0000.11b10情况B0. 900$2,500,0000.10b20.890. 01$500,0000$2,500,0000.10

15、$500,0001.00情况A2a1a.Savage的回答：对情况A,由于a1的后果不存在任何风险，可以稳稳当当得到$500,000；而选择a2有1%的概率得0，因此选择a1。对情况B，由于这时无论选择哪一种，都有很大的可能性（89%、90%）得 0 ；而10%的机会得$2,500,000，显然优于11的机会得$500,000。于是，得到的回答是在情况B下，选择b2。.Allais指出，上述选择存在偏好的不一致性作如下替换在情况A中，我们在a1以0.89的概率获得$0取代获得$500,000；同时在a2中同样以0.89的概率获得$0取代获得$500,000。于是，就成了情况B中的b1和

16、b2。依照公理3.3 A、B两种情况下的a1和a2的优先关系与b1和b2的优先关系相对应，在情况A中偏好a1，则在情况B中应该偏好b1。但实际结果不同。.换种方式说明：问题相当于把编号为1100的100张彩票充分和匀后放入口袋，从中抽取一张，每张彩票被抽到的机会都是1。情况A：a1相当于无论抽到哪一张彩票都能得到$500,000的奖金；a2则相当于有1的机会抽到1号彩票，奖金为$0，抽到211号彩票的机会是10，奖金为$2,500,000，抽到12100号彩票有89的机会，和a1一样能得到$500,000的奖金。情况B：抽到1号到11号彩票时，b1和b2提供的奖金分别与a1和a2相同，只是抽

17、到12100号彩票时的奖金都改为0。.这一问题可列成下表表3.1 Allais问题的另一种表示方法彩票编号彩票编号 1 211 12100 情况情况A $500,000 $500,000 $500,000 $0 $2,500,000 $500,000 情况情况B $500,000 $500,000 $0 $0 $2,500,000 $0 1a2a1b2b. 根据公理3.3，如果决策人的偏好有一致性，选a1就应选b1；如果认为b2比b1好，也该认为a2比a1好。由一般人对Allais问题的回答来看，公理3.3并非一般的合乎理性的人都能满足的。关于决策人偏好的不一致性，我们在后面还会讨论。 .

18、定义3.2（效用的公理化定义）在上述公理系统中，若上存在实值函数u，有：对，当且仅当u( )u( ) 对满足上述条件的任意两个实值函数 , ，必有，其中 b, cR, b0。则u(P)称为（基数）效用函数。3.2.3 3.2.3 效用的公理化定义和效用的存在性效用的公理化定义和效用的存在性 21,PP21PP 1P2P)()1 ()()1 (2121PuPuPPu1u2ucPbuPuii)()(21. 在上述定义中，性质被称为效用函数的线性性。关于线性性，可将中的推广到一般：若，，，则 iPmii， 1, 011mii)()(11imiiimiiPuPu. 关于效用函数的存在性

19、定理定理3.1 如果上的优先关系满足公理3.1到公理3.4，则必存在与优先关系一致的效用函数 u，且效用函数 u 在正线性变换下惟一。定理的证明可参见Berger,1980或陈珽, 1987。 .3.2.4 3.2.4 基数效用与序数效用基数效用与序数效用以上定义的效用函数是基数效用函数。基数效用函数不仅能反映决策人对后果的偏好次序，还能反映决策人的偏好强度。序数效用函数只反映决策人对后果的偏好次序，并不反映偏好强度。 .基数效用函数与序数效用函数区别基数效用定义在展望集上(考虑后果及其概率分布)，是实数；序数效用可以定义在后果集C上，不涉及概率，可以是正整数。基数效用反映

20、偏好强度，在正线性变换下惟一；序数效用不反映偏好强度，它在保序变换下惟一。 .序数效用的存在性公理公理3.1（连通性）在后果C上的优先关系是连通的，即如果 ,则或者或者。公理3.2（传递性）在后果C上的优先关系是传递的，即如果 , 且，则。公理3.3（连续性）对任何确定性后果，它的劣势集和优势集都是闭集。 Ccc21,21cc21cc12cc Cccc321,21cc 32cc 31cc )(cI)(cS.定理3.2 如果后果C上的优先关系满足上述公理3.1到公理3.3，则在C上存在(序数)效用函数，使：在保序变换下惟一，即f为严格递增函数时，仍为序数效用函数。该定

21、理的证明可以参见Harsanyi,1955, JPE。 )(cu)()(jijicucucc)(cu)()( cufcu.3.3 3.3 效用函数的构造效用函数的构造 3.3.1估计效用函数值的方法概率当量法根据公理3.4，若 ,且，则存在使321,PPP321PPP0131231)1 ()1 (PPPPP. 也就是说存在，使由于确定性的后果，所以对确定性后果，上式亦即利用此式，通过确定值（即概率当量）去设定三个后果（或抽奖、展望）之间的偏好关系，并因此设定效用值的做法称为概率当量法。因为它直接从Von Neumann- Morgenstern的公理导出，所以又称NM法。 3

22、12)1(PPPiiiPxx , 1ix312)1 (xxx. 确定当量法若对于给定的 x1和 x3 ，取=0.5(或取介于0-1之间的其他给定值)，则前式即： x20.5x1+0.5x3 (3.11) 由式(3.11)确定0.5x1+0.5x3的确定当量x2；再令u(x1)=1，u(x3)=0，则后果x2的效用等于0.5。这种方法称作确定当量法，又称修正的NM法。以上两种是最常用的估计效用函数的方法。 . 增益当量法对，通常可以把最优的后果 x1 称为增益，把最差的后果x3称为损失。如果已知式(3.11)中x2和x3，由决策人估计增益x1的值使式(3.11)成立，这种方法称作增益当量法

23、。321xxx. 损失当量法已知式(3.11)中x2和x1，由决策人估计损失x3的值使式(3.11)成立，这种方法称作损失当量法。从纯理论角度看，四种方法没有实质性的区别；但是实验结果表明：使用确定当量法时决策人对最优后果（增益）的保守性和对损失的冒险性都比概率当量法严重（Hershey,1982）；采用增益当量法与损失当量法时产生的误差也比用概率当量法大。因此应该尽可能使用概率当量法。 .3.3.2离散型后果的效用设定后果为离散型随机变量时，后果集C中元素为有限个，构造后果集上的效用函数有两方面的内容：确定各后果之间的优先序，确定后果之间的优先程度。离散型后果效用值的设定可以采

24、用概率当量法，简称NM法。该方法的具体步骤如下：. 第一步：选定c1,c2C，使c2c1，令u(c1)=0, u(c2)=1，所选择的c1、c2应使比较易于进行。第二步：对c2c3c1,求(01)，使 c3 c2+(1-)c1。则 u(c3)=u(c2+(1-)c1)=u(c2)+(1-)u(c1)。第三步：若c4c1，求(01)，使 c1 c2+(1-)c4，则 u(c1)=u(c2+(1-)c4)=u(c2)+(1-)u(c4)，u(c4)=/(-1)。 . 第四步：若c5 c2，求(0 0；风险中立时k = 0；风险追求时k 0 时效用函数u在x处凹, 决策人风险厌恶； r(x) =

25、 0 时效用函数u在x处线性, 决策人风险中立； r(x) 0时，因u(x) 0，则u(x) 0 时价值函数v在x处凹, 边际价值递减； m(x) = 0 时价值函数v在x处线性,边际价值不变； m(x) 0时，因v(x) 0，则 v(x) 0，即 r(x) m(x)，则决策人在 x 处相对风险厌恶；若 rr(x) = 0，即 r(x) = m(x)，则决策人在 x 处相对风险中立；若 rr(x) 0，即 r(x) 0 时，u(x)通常是凹的，原因有二：钱有递减的边际价值，决策人通常是风险厌恶的。 x 0 处与 x 0 处的形状不同, 因为当决策人负债较多时有追求风险的倾向。钱对决策人的

26、效用函数通常是随诸多因素的改变而变化的，除了个人的资产以外，还有经济环境、收入预期、心理状况等等。 .3.5.2 货币的效用曲线的构造货币的效用曲线的构造在构造某个人钱的效用函数时应结合他的总的财产值。为了使效用函数的构造更容易，可根据现有资产值w及变量x来考虑。如果u(w)是整个财产的效用函数，则附加的货币x的效用函数应为。而且在一般情况下，一个人的效用函数是随时间变化的，因此，如果可能，最好在每次决策时研究决策人在当时总的财产上附加一定数量的钱的效用函数。)()()(wuxwuxu. 例：例：设某人现有1000元存款(某商店有资产10万，企业有1000万等等)，则最容易构造效用函数的做

27、法是分为 (-1000，-500)、(-500，0)、(0，1000)三段，分段设定。.(0,1000)区间的效用函数值的设定区间的效用函数值的设定用确定当量法（即修正的NM法）取x3 = 0，x1 = 1000，并令u(0) = 0，u(1000) = 1，可以确定效用值等于0.5的x2，即x2。其含义是求0与1000各以0.5的概率发生的抽奖的确定当量。由决策人决定确定性酬报为某个值，如 x2 = 300，它与0，1000 机会各半相当，因此： u(300) = 0.5u(0) + 0.5u(1000) = 0.5. 同样可以设定(0, 1000)区间内与其他效用值对应的后果值。假设接

28、着决定： 100，则u(100) = 0.5u(0) + 0.5u(300) = 0.25。进而决定： 500，则u(500) = 0.5u(300) + 0.5u(1000) = 0.75. 为了检验一致性，决策人确定x使 x (注：效用值为0.5)；如果决策人回答x = 250。这与上面设定矛盾，需要重新设定某些值。经过反复检查，决策人最终得出一致的选择是： u(125)= = 0.25 u(300)= = 0.5 u(550)= =0.75 又已知u(0) = 0, u(1000) = 1.(0,1000)区间的效用函数值的设定区间的效用函数值的设定(续续) 可以画出区间的效用函数

29、曲线，即图3.16 所示的效用函数曲线的右半部分。图3.16 钱的效用(右半部分).(-500,0)区间的效用函数值的设定区间的效用函数值的设定在(-500,0)区间可以先用NM法即用 x2 x1 + (1-)x3求-500的效用值。令x1 = 500, x2 = 0, x3 = -500；由决策人确定当取什么值时上式成立。假设决策人认为：0 (=0.6)，则u(0) = 0.4u(-500) + 0.6u(500)，因为，u(0) = 0，可知，u(500) = 0.71，所以u(-500)= -1.06。再用修正的NM法：x2 ，确定x2 = -200，则u(-200) = -0.5

30、3。 .(-1000,-500)区间的效用函数值的设定区间的效用函数值的设定用NM法，令x2 x1 + (1- )x3，式中x1= 0, x2 = -500,x3 = -1000；由决策人确定值。假设决策人认为：-500 (=0.65)则u(-1000) = -3.03。.Friedmann-Savage 效用曲线效用曲线 Friedmann-Savage（1948）给出了一种效用曲线，如图所示。.Friedmann-Savage 效用曲线有关说明效用曲线有关说明此效用函数出现多次凹、凸的原因在于：一般决策人的价值函数在(-w,w)是S型的，且在此范围内相对风险态度不变，为风险厌恶型；在 0 附近的 (-w, w) 区间（通常 0.1），一般人是风险中立的。在大于决策人资产总额 w 的一定数量时，由于利益驱动，容易产生冒险倾向；区间(-,-w)下凸是由于负债到一定程度以上有冒险倾向，即俗话所说债多不愁。.思考题什么是效用？基数效用和序数效用有何区别？采用效用进行决策分析有何利弊？什么是风险？风险与效用函数有何关系？.作业题教材，第54页第四题第四题：问题1和2，并画出相关的决策树；第五题第五题：问题1.

展开阅读全文