1、 贝叶斯决策分析贝叶斯决策分析一、贝叶斯决策概述(一)贝叶斯决策的意义(一)贝叶斯决策的意义 在管理决策的实际过程中,往往存在两种偏向:(1)缺乏市场调查,对状态变量的概率分布情况掌握和分析还十分粗略就匆忙进行决策,使得决策结果与市场现实出入较大,造成决策失误;忽视了信息对决策的价值。(2)市场调查或局部试验的费用过高,收集的信息没有给企业带来应有的效益。没有考虑信息本身的成本。因此,我们既要充分重视信息对决策的价值,用补充信息的方法,使状态变量的概率分布更加符合现实市场状况,又要充分注意信息自身的价值,少花钱对办事。只有将两者合理地结合起来,才能提高决策分析的科学性和效益性。而如何将两者有机
2、结合并加以科学分析,这就是贝叶斯决策所要解决的问题。(二)概率论与数理统计基础(二)概率论与数理统计基础在讨论贝叶斯决策方法之前,先回顾概率论与数理统计中的一些知识,在后面的学习中经常会用到。1.1.全概率公式和贝叶斯公式(重要)全概率公式和贝叶斯公式(重要),(,(jinjiji ;,2,1,j njj1 )0)()()/(1 jnjjjppHpHp (公式1)1(/)()/()(/)()(/)()(1,2,;()0)iiiiinjjjp HppHp Hp Hpp Hpin p H(公式2)()p()()(/)()(/)(/)()()(/)()0)()(/)hpdpkhphpd ()h(/)
3、(公式3)(公式4)2.2.条件概率条件概率设0,称()p A()(/)()p ABp B Ap A,1,2,.,kkP Xxp k1kkkE Xx p1kkkx p连续型随机变量的数学期望设连续型随机变量X有概率密度f(x),若积分绝对收敛,则称为X的数学期望。二维随机变量的函数的数学期望()xf x dx()E Xxf x dx,iiijP Xx Yyp11(,)ijijjig x yp 11,(,)ijijjiE ZE g X Yg x yp若二维连续型随机变量(X,Y)的概率密度为f(x,y),且绝对收敛,则Z=g(X,Y)的数学期望,g x yf x y dxdy,E g X Yg
4、x yf x y dxdy ix/ijjijE YXxy P YyXx/(/)/(/)YXE YXxyfy Xx dyE X Yyxfx Yy dx(/)Yfy Xx(/)Xfx Yy其中 及 分别是在X=x的条件下Y的条件概率密度和在Y=y条件下关于X的条件概率密度。/y/ijijjE X Yx P XxYy=kkn knP X kC p q贝叶斯决策概述贝叶斯决策意义概率论与数理统计全概率公式贝叶斯公式条件概率数学期望二项分布二、贝叶斯决策的基本方法(一)引例:(一)引例:例例1:某公司经营一种高科技产品,产品的销售情况有畅销状态状态畅销(畅销(1 1)滞销滞销(2 2)概率概率P(i)0
5、.8 0.2利润(万元)利润(万元)1.5 0.5预测的准确率为0.9:P(H Hi/j)1 1 2 2H10.95 0.10H20.05 0.902 215000500000ijQqP(1)=0.8,P(2)=0.22111222115000 0.8(5000)0.2110000jjjjjjE aq PE aq P 1212,E aE aaa1optaa如果补充市场调查分析的信息,应如何决策分析?根据市场预测的准确率,即在实际状态j(j=1,2)的条件下,利用预测值Hi(i=1,2)的条件概率P(Hi/j)进行决策。这里预测值H1表示预测市场畅销,H2表示预测市场滞销。据题意,i1i212(
6、/)(/)0.950.100.050.90P HP HHH2111()()(/)0.95 0.80.10 0.20.78jjjP Hpp H8182.022.02.09.0)()()/()/(1818.022.08.005.0)()()/()/(0256.078.02.01.0)()()/()/(9744.078.08.095.0)()()/()/(222222211221122112111111 HppHpHpHppHpHpHppHpHpHppHpHp 2221()()(/)0.05 0.80.90 0.20.22jjjP Hpp H分布。后验分布表示为矩阵,称为后验分布矩阵。即1i2i12
7、(/)(/)0.97440.02560.18180.8182PHPHHH21111111111221/=/15000 0.9744(5000)0.025614487.2jjjE aHq PHqpHqpH(元)21/0E aH(元)2121211112122221/15000 0.1818(5000)0.81821346/0jjjE aHq PHqpHqpHE aH (元)(元))/()/()/()/()/()/()/()/()/(212221212111nmmmnnHpHpHpHpHpHpHpHpHp 本步骤可以省略,直接进行调查和收集信息,并依据获取的补充信息转入下一步骤。验前分析预验分析验
8、后分析相同:都是通过贝叶斯公式修正先验分布。不同:主要在于侧重点不同,预验分析是依据可能的调查结果,侧重于判断是否补充信息。验后分析是根据实际调查结果,侧重于选出最满意方案。4)(主要针对多阶段决策)指把复杂的决策问题的决策分析全过程划分为若干阶段,每一阶段都包括先验分析、预验分析和验后分析等步骤,序贯分析32133321101010102530202050)(aaaqQij P(Hi/j)1 1 2 2 3 3H10.6 0.20.2H20.3 0.50.2H30.1 0.30.6 1016173.04.03.0101010102530202050)()()(321aEaEaEE(a1),E
9、(a2),E(a3)E(a1)=因此验前分析后的决策为:引进大型设备。即:aopt a1为不进行试销(市场调查)的期望收益。njjjiipHpHp1)()/(2)预验分析预验分析由全概率公式得:由贝叶斯公式 33.035.032.03.04.03.06.03.01.02.05.03.02.02.06.0)()()(321HpHpHp )()()/(/ijjiijHppHpHp 1875.032.03.02.0)()()/()/(25.032.04.02.0)()()/()/(5625.032.03.06.0)()()/()/(133113122112111111 HppHpHpHppHpHpH
10、ppHpHp 1715.035.03.02.0)()()/()/(5714.035.04.05.0)()()/()/(2571.035.03.03.0)()()/()/(233223222222211221 HppHpHpHppHpHpHppHpHp 5455.033.03.06.0)()()/()/(3636.033.04.03.0)()()/()/(0909.033.03.01.0)()()/()/(333333322332311331 HppHpHpHppHpHpHppHpHp 于是,后验分布矩阵为P(j/Hi)1 1 2 2 3 3H10.5625 0.25 0.1875H20.257
11、1 0.57140.1715H30.0909 0.36360.5455 (万元)(万元)375.291875.0)20(25.0205625.050/)20(/20/50/13121111 HpHpHpHaE (万万元元)25.211875.0)10(25.0255625.030/)10(/25/30/13121112 HpHpHpHaE (万万元元)10/10/10/10/13121113 HpHpHpHaE E(aopt/H1)max E(a1/H1),E(a2/H1),E(a3/H1)E(a1/H1)=29.375(万元)当市场调查值H=H1 时,最满意方案为a1,即 aopt(H1)a
12、1即试销为产品需求量大时,最优方案是引进大型设备。(万元)(万元)853.201715.0)20(5714.0202571.050/)20(/20/50/23222121 HpHpHpHaE (万元)(万元)283.201715.0)10(5714.0252571.030/)10(/25/30/23222122 HpHpHpHaE E(aopt/H2)max E(a1/H2),E(a2/H2),E(a3/H2)E(a1/H2)=20.853(万元)当市场调查值H=H2 时,最满意方案为a1,即aopt(H2)a1即试销为产品需求量一般时,最优方案是引进大型设备。32/10E aH(万元)当市场
13、调查值为H=H3,即市场调查结果表示该产品需求量小时,用事件H3发生的后验分布替代先验分布,计算各方案的期望收益值。(万元)(万元)907.05455.0)20(3636.0200909.050/)20(/20/50/33323131 HpHpHpHaE (万元)(万元)362.65455.0)10(3636.0250909.030/)10(/25/30/33323132 HpHpHpHaE E(aopt/H3)max E(a1/H3),E(a2/H3),E(a3/H3)E(a3/H3)=10(万元)当市场调查值H=H3 时,最满意方案为a3,即aopt(H3)a3即试销为产品需求量小时,最优
14、方案是引进小型设备。33/10E aH(万元)(万万元元)200.331035.0853.2032.0375.29)/()/()/(3322112 HpHaEHpHaEHpHaEEoptoptopt(万元)(万元)3172012 EE 该企业收益期望值能增加:只要市场调查费用不超过3万元,通过市场调查补充信息在经济上是可行的,就应该进行市场调查;如果市场调查费用超过3万元,市场调查给企业将造成负效益,一般不宜进行市场调查。v若试销结果是该产品需求量大或一般,则应该选择方案a1,即引进大型设备;v若调查结果是该产品需求量小,则应该选择方案a3,即引进小型设备。三、贝叶斯决策信息的价值 ,maxo
15、ptaaQaQ ,max ,max optaoptaaQEaEaQaEEVPI (公式5))(1.02.05.08.00 ,max 万元万元 optaaQaEEVPI状态状态畅销(畅销(1 1)滞销滞销(2 2)概率概率P(i)0.8 0.2利润(万元)利润(万元)1.5 0.52 215000500000ijQq2121EVPI=max()jijoptijpqE a 2121 max,max 15000 0.80 0.212000()jijaijEapq 元),(),(/optaQaQEEEVAI ,),(/optaEaQEEEVAI ),(,/aREEaREEVAIopt )(13.178
16、.00256.0)5.0(9744.05.1)()/(0)/(0)()/()5.0()/(5.1)(),()(),(),(12221112112211/万万元元 HpHpHpHpHpHpHpaQEHpaQEaQEE EVAI=1.13-1.1 =0.03万元 ),(,/aREEaREEVAIopt max,optoptaEVPIEaQ aE R a/(),EVAIEVPIEER a 12(,)N,.,四、抽样贝叶斯下面看2道例题:状态状态j(次品率)次品率)1=0.022=0.053=0.14=0.155=0.2概率概率p(j)0.40.30.150.10.052154321740740740
17、74074024001800120060024005.01.015.03.04.0)(aaCpj(费用)(费用)(元元)756024005.001801.0120015.06003.02404.0)(1 aE(元)(元)740)(2aE 2793.0)()/1(151 jjjpXpXp (元)(元)92623.02400103.001804900.012001451.06004053.02403903.0)(1 aE(元元)740)(2aE2100010550.050.12.02.03.05.0)(aaQpjj(收收益益)次次品品率率 (元)(元)0)(2aE(元)(元)1102.053.0)
18、5(5.0)(1 aE 5645.0)()/0(031 jjjpXpXp (元)(元)8150.2102885.053487.0)5(3628.0)0/(1 XaE(元)(元)0)0/(2 XaE 3266.0)()/1(131 jjjpXpXp (元)(元)7461.0101050.052679.0)5(6271.0)1/(1 XaE(元)(元)0)1/(2 XaE 0941.0)()/1(131 jjjpXpXp (元)(元)0187.3100287.051550.0)5(8163.0)2/(1 XaE(元)(元)0)2/(2 XaE(元)(元)(59.10.5645105645.0152
19、.8)1()1/()0()0/(212 XPXaEXpXaEE(元元)59.0159.112 EE五、贝叶斯风险和贝叶斯原则)()(Haa 或或最佳决策法则:最佳决策法则:在一个决策问题的所有决策法则中,按照某在一个决策问题的所有决策法则中,按照某一原则选出的最佳者,称为该决策问题的最佳决策法则。一原则选出的最佳者,称为该决策问题的最佳决策法则。212121122221122111)()1()()3()()2()()1(HHHaHHHaHHaHHHaHHaHHHHaH或或,或或 按照期望收益值最大原则选出的最佳决策法则是2(H)。),(,|RE 设贝叶斯决策法则()的任一值,当补充信息值确定后
20、,行动方案a=()也就相应确定,则对应的损失值为R(),),损失值越小,决策法则越优。1.风险函数风险函数(,):损失值损失值R(),)对所有补充信息值的对所有补充信息值的数学期望。数学期望。风险函数(,)是在状态值下,决策法则对全部补充信息值的平均损失。例1中,损失矩阵为 05.15.00R (万万元元)005.0095.00)/(0)/(0,121111 HpHp (万万元元)5.09.05.01.05.0)/(5.0)/(5.0,222121 HpHp决策法则决策法则2(H)的风险函数值为:的风险函数值为:(万万元元)075.005.05.195.00)/(5.1)/(0,121112
21、HpHp (万万元元)05.09.001.05.0)/(0)/(5.0,222122 HpHp同理可求出决策法则3(H)和4(H)的风险函数值:(万万元元)(万万元元)45.0,425.1,2313 (万万元元)(万万元元)0,5.1,2414 ,EB 贝叶斯风险B()是一个常数,表示决策法则,对一切补充信息值和状态值的平均损失值。在例1中:(万元)(万元)1.02.05.08.00)(),()(),(2211111 ppB同理可求出决策法则B(2)、B(3)和B(4)(万万元元)07.02.005.08.0075.02 B (万万元元)23.12.045.08.0425.13 B (万万元元)2.12.008.05.14 B