1、第第11章章 决策论决策论 Theory of Decision11.1 决策分析的基本问题决策分析的基本问题11.2 确定型和非确定型决策确定型和非确定型决策11.3 风险型决策风险型决策 11.4 效用理论效用理论11.5马尔可夫决策马尔可夫决策 运运 筹筹 学学 Operations Research 11.1 决策分析的基本问题决策分析的基本问题Ch11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 3 决策决策(Decision Making)是一种对已知目标和方案的选择过程,是一种对已知目标和方案的选择过程,当
2、人们已知确定需实现的目标是什么,根据一定的决策准则,当人们已知确定需实现的目标是什么,根据一定的决策准则,在供选方案中做出决策的过程。诺贝尔奖获得者西蒙认为,管在供选方案中做出决策的过程。诺贝尔奖获得者西蒙认为,管理就是决策,他认为决策是对稀有资源备选分配方案进行选择理就是决策,他认为决策是对稀有资源备选分配方案进行选择排序的过程。学者排序的过程。学者Gregory在在决策分析决策分析中提及,决策是对决中提及,决策是对决策者将采取的行动方案的选择过程。策者将采取的行动方案的选择过程。决策科学包括决策心理学、决策的数量化方法、决策评价以决策科学包括决策心理学、决策的数量化方法、决策评价以及决策支
3、持系统、决策自动化等。及决策支持系统、决策自动化等。随着计算机和信息通信技术的发展,决策分析的研究也得到随着计算机和信息通信技术的发展,决策分析的研究也得到极大的促进,随之产生了计算机辅助决策支持系统(极大的促进,随之产生了计算机辅助决策支持系统(Decision Support System),许多问题在计算机的帮助下得以解决,在),许多问题在计算机的帮助下得以解决,在一定程度上代替了人们对一些常见问题的决策分析过程。一定程度上代替了人们对一些常见问题的决策分析过程。11.1 决策分析的基本问题决策分析的基本问题Ch11 Theory of Decision 2022年7月29日星期五 制作
4、与教学 中国计量学院管理学院 王黎萤 Page 4 11.1.1 决策分析基本概念决策分析基本概念决策决策 狭义决策认为决策就是作决定,单纯强调最终结果;广义狭义决策认为决策就是作决定,单纯强调最终结果;广义决策认为将管理过程的行为都纳入决策范畴,决策贯穿于整个决策认为将管理过程的行为都纳入决策范畴,决策贯穿于整个管理过程中。管理过程中。决策目标决策目标 决策者希望达到的状态,工作努力的目的。一般而言,决策者希望达到的状态,工作努力的目的。一般而言,在管理决策中决策者追求的当然是利益最大化。在管理决策中决策者追求的当然是利益最大化。决策准则决策准则 决策判断的标准,备选方案的有效性度量。决策判
5、断的标准,备选方案的有效性度量。决策属性决策属性 决策方案的性能、质量参数、特征和约束,如技术指决策方案的性能、质量参数、特征和约束,如技术指标、重量、年龄、声誉等,用于评价它达到目标的程度和水平。标、重量、年龄、声誉等,用于评价它达到目标的程度和水平。科学决策过程科学决策过程 任何科学决策的形成都必须执行科学的决策程序,任何科学决策的形成都必须执行科学的决策程序,如图如图11-1所示。决策最忌讳的就是决策者拍脑袋决策,只有经历所示。决策最忌讳的就是决策者拍脑袋决策,只有经历过图过图11-1所示的所示的“预决策预决策决策决策决策后决策后”三个阶段,才有可能三个阶段,才有可能产生科学的决策产生科
6、学的决策 11.1 决策分析的基本问题决策分析的基本问题Ch11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 5 11.1 决策分析的基本问题决策分析的基本问题调查研究调查研究 确定决策目标确定决策目标搜集有关的信息资料搜集有关的信息资料预测技术预测技术预测未来的可能情况预测未来的可能情况拟订各种可行方案拟订各种可行方案可行性研究可行性研究方案评估方案评估决策准则决策准则方案选择方案选择方案实施方案实施预预决决策策决决策策实实施施情情况况反反馈馈意意见见决策后决策后图图11-1 科学决策过程科学决策过程Ch11 Theo
7、ry of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 6 11.1 决策分析的基本问题决策分析的基本问题11.1.2 决策分析基本原则决策分析基本原则1.最优化(满意)原则最优化(满意)原则2.系统原则系统原则3.可行性原则可行性原则4.信息对称、准全原则信息对称、准全原则Ch11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 7 11.1.3 决策分析基本分类决策分析基本分类表表111按影响范围按影响范围战略决策、战役决策、战术决策战略决策、战役决策、战术决策按状态
8、空间按状态空间确定型决策、非确定型决策、风险型决策确定型决策、非确定型决策、风险型决策按决策时间按决策时间程序化决策、半程序化决策、非程序化决策程序化决策、半程序化决策、非程序化决策按描述方法按描述方法定性化决策、定量化决策定性化决策、定量化决策按目标数量按目标数量单目标决策、多目标决策单目标决策、多目标决策按连续性按连续性单级决策、序贯决策单级决策、序贯决策按决策者数量按决策者数量个人决策、群决策个人决策、群决策按问题大小按问题大小宏观决策、微观决策宏观决策、微观决策表表112 程序化、非程序化、半程序化决策程序化、非程序化、半程序化决策决策类型决策类型传统方法传统方法现代方法现代方法程序化
9、程序化现有的规章制度现有的规章制度运筹学、管理信息系统(运筹学、管理信息系统(MIS)半程序化半程序化经验、直觉经验、直觉灰色系统、模糊数学等方法灰色系统、模糊数学等方法非程序化非程序化经验、应急创新能力经验、应急创新能力人工智能、风险应变能力培训人工智能、风险应变能力培训11.1 决策分析的基本问题决策分析的基本问题11.2 确定型和非确定型决策确定型和非确定型决策Ch11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 9 11.2 确定型和非确定型决策确定型和非确定型决策11.2.1 确定型决策确定型决策确定型决策确定
10、型决策是指决策的未来状态是已知的,只需从备选的决策方是指决策的未来状态是已知的,只需从备选的决策方案中,挑选出最优方案。案中,挑选出最优方案。【例【例11.1】某企业根据市场需要,需添置一台数控机床,可采】某企业根据市场需要,需添置一台数控机床,可采用的方式有三种:用的方式有三种:甲方案:引进外国进口设备,固定成本甲方案:引进外国进口设备,固定成本1000万元,产品每件万元,产品每件可变成本为可变成本为12元;元;乙方案:用较高级的国产设备,固定成本乙方案:用较高级的国产设备,固定成本800万元,产品每件万元,产品每件可变成本为可变成本为15元;元;丙方案:用一般国产设备,固定成本丙方案:用一
11、般国产设备,固定成本600万元,产品每件可变万元,产品每件可变成本为成本为20元;元;试确定在不同生产规模情况下的购置机床的最优方案。试确定在不同生产规模情况下的购置机床的最优方案。Ch11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 10【解】【解】此题为确定型决策利用经济学知识,选取最优决此题为确定型决策利用经济学知识,选取最优决策最优决策也就是在不同生产规模条件下,选择总成本较低策最优决策也就是在不同生产规模条件下,选择总成本较低的方案各方案的总成本线如图的方案各方案的总成本线如图11.2 图图11.2TC甲甲F甲
12、甲Cv甲甲Q100012QTC乙乙F乙乙Cv乙乙Q80015QTC丙丙F丙丙Cv丙丙Q60020Q 图中出现了图中出现了A、B、C三个交点,三个交点,其中其中A点经济意义:在点经济意义:在A点采用甲点采用甲方案与丙方案成本相同方案与丙方案成本相同TC甲甲TC丙丙,F甲甲Cv甲甲QAF丙丙Cv丙丙QA)(5012206001000万件甲丙丙甲CvCvFFQAQ5011.2 确定型和非确定型决策确定型和非确定型决策Ch11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 11 同理:同理:B点点TC乙乙TC丙丙,F乙乙Cv乙乙Q
13、BF丙丙Cv丙丙QB)(401520600800万件乙丙丙乙CvCvFFQBC点:点:TCL甲甲TC乙乙,F甲甲Cv甲甲QCF乙乙Cv乙乙QC B点经济意义为:当生产点经济意义为:当生产40万件时,采用乙方案和采用丙方案成万件时,采用乙方案和采用丙方案成本相同均为本相同均为1400万元万元(万件)甲乙乙甲320012158001000CvCvFFQC图图11.211.2 确定型和非确定型决策确定型和非确定型决策Ch11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 12 得到生产规模最优方案为:当得到生产规模最优方案为:当
14、生产规模产量小于生产规模产量小于40万件时,万件时,采用丙方案;当生产规模产量采用丙方案;当生产规模产量大于大于40万件,小于万件,小于200/3万件万件时,采用乙方案;当生产规模时,采用乙方案;当生产规模产量大于产量大于200/3万件时,采用万件时,采用甲方案甲方案 其经济意义为:当生产规模为万件时,采用甲、乙方案成本相其经济意义为:当生产规模为万件时,采用甲、乙方案成本相同从图中可知:当生产规模同从图中可知:当生产规模QB时,采用丙方案;当时,采用丙方案;当QB 生生产规模产规模 QC时,采用乙方案;当时,采用乙方案;当QC E(A1),E(B2)E(A2)一般来说效用值在一般来说效用值在
15、0,1之间取值之间取值.凡是决策者最看好、最倾凡是决策者最看好、最倾向、最愿意的事物(事件)的效用值可取向、最愿意的事物(事件)的效用值可取1;反之,效用;反之,效用值取值取0当各方案期望值相同时,一般用最大效用值决策当各方案期望值相同时,一般用最大效用值决策准则,选择效用值最大的方案准则,选择效用值最大的方案 11.4 效用理论效用理论Utility TheoryCh11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 39 通过效用指标将某些难于量化、有质的区别的事件给予量化,通过效用指标将某些难于量化、有质的区别的事件
16、给予量化,得到各方案的综合效用值,选择效用值最大的方案作为决策准得到各方案的综合效用值,选择效用值最大的方案作为决策准则。则。11.4.2 效用曲线效用曲线确定效用曲线的基本方法有两种:一种是直接确定效用曲线的基本方法有两种:一种是直接提问法提问法,需要决,需要决策者回答提问,主观衡量应用较少;第二种是策者回答提问,主观衡量应用较少;第二种是对比提问法对比提问法,此法使用较多此法使用较多 设现有设现有A0,A1两种方案供选两种方案供选A0表示决策者不需要花费任何风表示决策者不需要花费任何风险可获益险可获益x0;而;而A1有两种自然状态,可以概率有两种自然状态,可以概率P获得收益获得收益x1,以
17、,以概率(概率(1P)获得收益)获得收益x2;且;且x1x0 x2 令令yi表示效益表示效益xi的效用值则的效用值则x0,x1,x2的效用值分别表示为的效用值分别表示为y0,y1,y2 若在某条件下,决策者认为若在某条件下,决策者认为A0,A1两方案等价,则有:两方案等价,则有:021)1(yyPPy11.4 效用理论效用理论Utility TheoryCh11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 40 4个数个数p,x0,x1,x2中给定中给定3个,提问第个,提问第4个变量由决策者确定,个变量由决策者确定,求出
18、效用值。求出效用值。一般采用改进一般采用改进VM(Von NeumannMorgenstern)方法,固定方法,固定P0.5,x1,x2改变改变x0三次,得出相应的三次,得出相应的y的值,确定三点,作出效用的值,确定三点,作出效用曲线曲线)()(5.0)(5.0021xyxyxy11.4 效用理论效用理论Utility TheoryCh11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 41)()(5.0)(5.0021xyxyxy【例【例11.7】x1=100,x2=400,取取y(x1)=0,y(x2)=1-10040
19、0第一次提问:第一次提问:x0为何值时,上式成立?答:为何值时,上式成立?答:“0”y(0)=0.50+0.510.51(0,0.5)第二次提问:第二次提问:x0为何值时,上式成立?答:为何值时,上式成立?答:“200”y(200)=0.5y(0)+0.51 =0.50.5+0.510.75第三次提问:第三次提问:x0为何值时,为何值时,上式成立?答:上式成立?答:“100”y(100)=0.5y(0)+0.5y(200)=0.50.5+0.50.750.625(200,0.75)(100,0.625)100200 300011.4 效用理论效用理论Utility TheoryCh11 The
20、ory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 42 不同决策者对待风险态度不同,因而会得到不同形状的效用曲不同决策者对待风险态度不同,因而会得到不同形状的效用曲线一般可分为保守型线一般可分为保守型、中间型、中间型、风险型、风险型,如下图,如下图 y1IIIx(Xmax,1)(Xmin,0)XmaxXmin011.4.3 效用曲线类型效用曲线类型图中图中I为保守型,其特点为:当收益为保守型,其特点为:当收益值较小时,效用值增加较快;随收值较小时,效用值增加较快;随收益值增大时,效用值增加速度变慢,益值增大时,效用值增加速度变慢,表
21、明决策者不求大利,谨慎小心,表明决策者不求大利,谨慎小心,保守保守图中图中II为中间型,其特点为:收为中间型,其特点为:收益值和效用值成正比,表明决策益值和效用值成正比,表明决策者完全按机遇办事,心平气和者完全按机遇办事,心平气和图中图中III为风险型,其特点为与为风险型,其特点为与I保守型恰好相反,当收益值较小保守型恰好相反,当收益值较小时,效用值增加较慢;随收益值时,效用值增加较慢;随收益值增大时,效用值增加速度变快,增大时,效用值增加速度变快,表明决策者对增加收益反应敏感,表明决策者对增加收益反应敏感,愿冒较大风险,谋求大利,不怕愿冒较大风险,谋求大利,不怕冒险冒险 III11.4 效用
22、理论效用理论Utility TheoryCh11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 43 常用的效用函数:常用的效用函数:11.4 效用理论效用理论Utility TheoryCh11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 44 11.4.4 效用值的应用效用值的应用【例【例11.8】若某决策若某决策问题的决策树如下图所问题的决策树如下图所示,其决策者的效用期示,其决策者的效用期望值同时附在效益期望望值同时附在效益期望值后,请做出决
23、策值后,请做出决策 E(2)=0.53000.5(200)=50 E(3)0.52000.5(100)=50 根据最大效益期望值准则,无法判断优劣根据最大效益期望值准则,无法判断优劣 y2=0.510.500.5,y3=0.50.9+0.50.3=0.6 解:解:(1)计算效益期望值分别为)计算效益期望值分别为11.4 效用理论效用理论Utility TheoryCh11 Theory of Decision 2022年7月29日星期五 制作与教学 中国计量学院管理学院 王黎萤 Page 45 A2方案效用值方案效用值A1方案效用值,因此取方案效用值,因此取A2方案为决策方案方案为决策方案绘制效用曲线图见下图,可知,该决策者偏向于保守型,不求大绘制效用曲线图见下图,可知,该决策者偏向于保守型,不求大利,谨慎小心利,谨慎小心 11.4 效用理论效用理论Utility Theory-20030010100200-100yx