1、第八章物流决策和对策第八章物流决策和对策本章将讨论以下几个方面的内容 v物流决策的概述v不确定型决策 悲观主义决策准则 乐观主义决策准则 等可能性准则 最小机会损失准则 折衷主义准则v风险决策 最大期望收益决策准则 最小机会损失决策准则 决策树方法 贝叶斯决策v效用决策v多目标决策 目标规划法 分层序列法v定性决策决策的含义 v决策是指人们为达到某一目标,从若干可能的方案(或措施、途径、行动)中经过分析、比较,选择最优(或次优、满意、非劣)的方案的行为。 v物流决策,就是在物流管理中,与物流活动相关的决策问题。如:物流中心选址决策、物流经济决策等等。 决策的要素 v决策者 v方案。方案是为实现
2、既定目标而采取的一系列活动或措施 v自然状态。自然状态是指决策者会遇到的不受决策者个人意志控制的客观状况 v损益值。每一个可行方案在每一个客观情况下产生的后果,称之为损益值 决策问题的特征 v存在着决策者希望达到的一个明确目标。v至少存在两种自然状态,各状态出现的概率可能已知,也可能未知。v至少存在两种可选择的方案。v各个方案在每一自然状态下的损益值可以估算出来。决策过程 v确定目标 v拟定可行方案 v优选方案 v执行决策 确 定目 标拟 订方 案优 选方 案执 行决 策重新选择改进原方案补充新方案修 订目 标修 订目 标改进原方案补充新方案不确定型决策 v所谓不确定型的决策是指决策者对环境情
3、况一无所知,这时决策者是根据自己的主观倾向进行决策,由决策者的主观态度不同基本可分为四种准则,它们是:v悲观主义准则v乐观主义准则v等可能性准则v最小机会准则v 例1 某超市每天清晨是按批购进鲜奶,每箱鲜奶的进价为20元,售价为每箱30元。如果每天销售不完,那么每箱损失2元。超市进货是按批进货,每一批是10箱,每天最多能销售50箱。超市负责人可选择的进货方案为0,10,20,30,40,50六种。假设超市负责人对鲜奶的需求情况完全不知,试问这时他应该如何决策进货数量? 损益表 单位:元事件01020304050策略000000010-2010010010010010020-4080200200
4、20020030-606018030030030040-804016028040040050-10020140260380500悲观主义决策准则 v悲观主义(max min)决策准则亦称保守主义决策准则。当决策者面临着各事件的发生概率不清楚时,决策者考虑可能由于决策错误而造成重大经济损,由于自己的经济实力比较弱,他在处理问题时就比较谨慎。他分析各种最坏的可能结果,从中选择最好者,以它对应的策略为决策策略,用符号表示为max min决策准则。 损益表 单位:元 事件min01020304050策略0000000010-20100100 100100100-2020-4080200 2002002
5、00-4030-6060180 300300300-6040-8040160 280400400-8050-10020140 260380500-100根据max min决策准则有: max(0,20,40, 60,80,-100)0乐观主义决策准则 v持乐观主义 (max max) 决策准则的决策者对待风险的态度与悲观主义者不同,当他面临情况不明的策略问题时,他决不放弃任何一个可获得最好结果的机会,以争取好中之好的乐观态度来选择他的决策策略。决策者在分析收益矩阵各策略的“策略事件”对的结果中选出最大者,记在表的最右列,再从该列数值中选择最大者,以它对应的策略为决策策略。损益表 单位:元 事件
6、max01020304050策略0000000010-2010010010010010010020-408020020020020020030-606018030030030030040-804016028040040040050-10020140260380500500根据max max 决策准则有:max ( 0, 100, 200, 300, 400,500 ) = 500等可能性准则 v等可能性 ( Laplace ) 准则是十九世纪数学家 Laplace 提出的。他认为:当一人面临着某事件集合,在没有什么确切理由来说明这一事件比那一事件有更多发生机会时,只能认为各事件发生的机会是均等
7、的,即每一事件发生的概率都是1事件数。决策者计算各策略的收益期望值,然后在所有这些期望值中选择最大者,以它对应的策略为决策策略 。损益表 单位:元 iSE事件01020304050策略0000000010-201001001001001008020-408020020020020014030-606018030030030018040-804016028040040020050-10020140260380500200 200200,200,180,140,80, 0maxmaxiSE最小机会损失准则 v最小机会损失决策准则也称为最小遗憾值决策准则。首先将收益矩阵中各元素变换为每一“策略事件”
8、对的机会损失值(遗憾值,后悔值)。其含义是:当某一事件发生后,由于决策者没有选用收益最大的策略,而形成的损失值,从所有最大机会损失值中选取最小者,它对应的决策为决策策略 。损益表 单位:元 事件max01020304050策略0010020030040050050010-20010020030040040020-4020010020030030030-604020010020020040-80604020010010050-10080604020080min (500,400,300,200,100,80) = 80 折衷主义准则 v当用max min 决策准则或max max决策准则来处理问
9、题时,有的决策者认为这样太极端了,于是提出把这两种决策准则给予综合,令 为乐观系数,且 ,并用以下关系式表示:v 、 分别表示第i个策略可能得到的最大收益值与最小收益值。然后选择最大的 Hi作为最终决策。10minmax1iiiaaHmaxiaminia损益表 单位:元事件Hi01020304050策略0000000010-201001001001001002020-40802002002002004030-60601803003003006040-80401602804004008050-10020140260380500100max (0,20,40,60,80,100) = 100 风险
10、决策 v风险决策是指决策者对客观情况不甚了解,但对将发生各事件的概率是已知的。决策者往往通过调查,根据过去的经验或主观估计等途径获得这些概率。在风险决策中一般采用期望值作为决策准则,常用的有最大期望收益决策准则和最小机会损失决策准则。 最大期望收益决策准则(EMV) v最大期望收益决策准则(Expected Monetary Value,EMV)是指决策矩阵的各元素代表“策略事件”对的收益值,各事件发生的概率为 先计算各策略的期望收益值:v然后从这些期望收益值中选取最大者,它对应的决策为决策应选策略 。jopniapijij, 2 , 1, 损益表 单位:元事件EMV010203040500.
11、10.20.250.20.150.1策略0000000010-201001001001001008820-408020020020020015230-606018030030030018640-8040160280400400196 max50-10020140260380500188例例1 某钻井大队在某地进行石油勘探,主观估计某钻井大队在某地进行石油勘探,主观估计该地区为有油该地区为有油( 1 )地区的概率为地区的概率为P( 1)0.5 ,没没油油( 2 )的概率为的概率为P( 2 )0.5,为提高勘探效果,为提高勘探效果,先做地震试验,根据积累资料得知先做地震试验,根据积累资料得知:咨询
12、意见实施结果合计合计定性决策 v专家会议法 v头脑风暴法 v德尔菲法 SS ,;SSA ,654321S,654321S123456123456311111131111113111111311111131111113 A 为 的值,记作 ,称 分别为相应局中人的最优(纯)策略;而称局势( )为 的解。ASS;,maxminminmaxijiji jjiijaaa i ja i jva ,ij,ijnmSS,2121mnijaA)(定理定理 1 矩阵对策在纯策略意义下有解的充要条件是 。证:充分性: 由 可以得到 。又因为 和 ,于是有 。 容易证明,对于任意矩阵A,都有 。 综上得 , 即 。
13、jijiijaaa*jijiijaaa*jijjiijiaaa*minmaxjiiijijaa*maxmaxminijjijijaaminmaxmin*ijjijiijijaaaminmaxmaxmin*ijijijjiaamaxminminmax*maxminminmaxjiijijijjiaaa*jiav 必要性:设 在 达到最大,而 在 时达到最小,即 ,由于定义有 ,可得所以对于一切 ,有 。定理得证。ijjamin*ii ijiamax*jj ijjijijaaminmaxmin*ijijijiaamaxminmax*ijijijjiaamaxminminmaxjijijijijij
14、ijiaaaaa*minmaxminmaxnjmi, 2 , 1, 2 , 1jiijijijijijaaaaa*maxmin【例1】设有矩阵对策 ,其中 局中人 的收益矩阵为 求解 。解:由 得又已知得 。从而 。21, 41, 0 , 4 , 4maxminmax或且 iaiijjiASS;,4321S,4321S1138372046474546A, 1min, 0min, 4min, 4min, 4, 3, 2, 1jjjjjjjjaaaa, 4max, 7max, 4max, 8max4321iiiiiiiiaaaa42, 44 , 7 , 4 , 8minmaxmin或且 jajij
15、ij4minmaxmaxminijjiijijaa所以局中人 的最优策略为 ,局中人 的最优策略为 ,而 的解为 或 , 的值 。从上例可以看出,对策的解可能不唯一,但对策的值是唯一的。一般地,最优策略有以下性质(1)无差别性无差别性:若(2)可交换性可交换性:若21或21或),(),(),(224121),(424v的最优解,是和),(),(2211jiji;2211jijiaa则的最优解,是和),(),(2211jiji.),(),(1221的解是和则jijiASS;,*jia*jia*jia*jia【例2】在矩阵对策在矩阵对策 中,若中,若 , ,则则 显然二者不等,因此,在纯策略意义下
16、,此对策显然二者不等,因此,在纯策略意义下,此对策无解。无解。ASS;,023210101Amaxmin0,minmax2ijijjjiiaa 在这种情况下,一个比较自然的想法是:既然局在这种情况下,一个比较自然的想法是:既然局中人没有最优策略可出,是否可以给出一个选择不同中人没有最优策略可出,是否可以给出一个选择不同策略的概率分布,并用期望值代替对策值?事实上,策略的概率分布,并用期望值代替对策值?事实上,我们有下面矩阵对策的我们有下面矩阵对策的。:设有矩阵对策 ,其中 , 记则称 , 分别为局中人 和 的混合策略集, 分别称为局中人 和 的混合策略。ASS;,nmSS,2121mnijaA
17、)(njjjnmiiimynjyRYSxmixRXS1*1*1, 2 , 1, 10 |,1, 2 , 1, 10 |*S*S*SySx和对于 ,称(x, y)为一个混合局势(或局势)。局中人 的收益为如下形式的期望这样得到的新的对策模型记成称 为矩阵对策的。:概率 可解释为局中人 在一局对策中,对各个纯策略的偏爱程度,或解释为在多局对策中, 局中人 采用纯策略 的频率。 的解释类似。m,21*,SySxjijjiTyxayAxyxEi),(ESS;*,*ixjy:设 是矩阵对策的混合扩充,如果存在混合局势 使得对于一切 总有成立,则称 分别为局中人 和 的最优混合策略。 称为对策 的值,记为
18、 。称 为对策 的解。 ),(*yxEESS;*,ASS;,),(*yx,*2*SySx),(),(maxmin),(minmax*yxEyxEyxESxSySySx*, yx*v),(*yx 设 是矩阵对策的混合扩充,则 为 的解的充要条件是存在 使得对于一切 有 定理2 可解释为:如果局中人 不采用策略 而采用其他策略,那么他的收益就会减少;局中人 不采用策略 而采用其他策略,那么他的损失就会增大。),(),(),(*yxEyxEyxEASS;,),(*yx*x*yESS;*,*, yx,*2*SySx设 是矩阵对策的混合扩充,则 为 的解的充要条件是对于一切 都成立。设 是矩阵对策的混合
19、扩充,则 为 的解的充要条件是存在数 ,使得 分别是下列不等式组P, D的解,且 。),(),(),(*jixEyxEyEESS;*,ASS;,),(*yxnjmi, 2 , 1;, 2 , 1),(*yxESS;*,ASS;,*v*, yx*vvmixxnjvxaPimiimiiij, 2 , 1, 01, 2 , 1,11*njyymivyaDjnjnjjijj, 2 , 1, 01, 2 , 1,11*ASS;,设有两个矩阵对策设有两个矩阵对策 , 其中其中为任一常数,则为任一常数,则其中其中 分别表示分别表示 的解集。的解集。11;,ASS22;,ASSLLaAaAijij),(),(
20、21)()()(212) 1 (12TTLvv)()(21,TT ,设有两个矩阵对策设有两个矩阵对策 , , 其中其中 为任一常数,则为任一常数,则其中其中 分别表示分别表示 的解集。的解集。.2;) 1 (2112)()()(TTvv)()(21,TT ,ASS;,1ASS;,20基基 本本 思思 想想矩阵对策,21ASS,局势),(*yx是混合平衡局势 njmixayxayamiiijminjjiijnjjij,.,2 , 1,.,2 , 1;1*11*1* njmixaVyamiiijnjjij,.,2 , 1,.,2 , 1;1*1* njmiyxnjxVxamiyVyajimiimi
21、iijnjjnjjij,.,2 , 1,.,2 , 1; 0, 0,.,2 , 1; 1;,.,2 , 1; 1;1111 mixnjxVxatsVimiimiiij,.,2 , 1; 0,.,2 , 1; 1. .max11 和 njymiyVyaVjnjjnjjij,.,2 , 1; 0,.,2 , 1; 1;min11 miVxnjVVxVxatsVimiimiiij,.,2 , 1; 0/,.,2 , 1;/1)/(1)/(. .max11 njVymiVVyVyaVjnjjnjjij,.,2 , 1; 0/,.,2 , 1;/1)/(; 1)/(min11 mixxatsximiii
22、jmii,.,2 , 1; 01. .min11 njVyyayjnjjijnjj,.,2 , 1; 0/; 1max11 算算 例例给定矩阵对策的支付矩阵 223124331A 求最优策略和值。 解解:等价于求线性规划 0,1231223134. .min321321321321321xxxxxxxxxxxxtsxxx 和 0,1223124133. .max321321321321321yyyyyyyyyyyytsyyy 结结 果果利用 LinDo 计算结果为 X1 0.142857 X2 0.000000 X3 0.285714 和 Y1 0.142857 Y2 0.000000 Y3 0.285714 所以最优策略为(1/3,0,2/3)和(1/3,0,2/3) , 最优值为 7/3。