1、第二节 动态规划应用举例 本节将通过动态规划的三种应用类型资源分配问题、复合系统可靠性问题、设备更新问题,进一步介绍动态规划的特点和处理方法。一、资源分配问题1. 问题的一般提法 设有某种资源,总数量为a,用于生产n种产品;若分配数量xi用于生产第i种产品,其收益为gi(xi)。问应如何分配,可使总收益最大?2. 数学规划模型xi种产品的资源数量为设分配给第决策变量: niiixgMaxz1)( 目标函数:nixaxinii,1,0 1约束条件:模型的特点变量分离。3.用动态规划方法求解阶段k状态sk决策xk=1,n表示把资源分配给第k种产品的过程;表示在给第k种产品分配之前还剩有的资源量;表
2、示分配给第k种产品的资源量;状态转移sk+1= sk- xk ;阶段指标vk指标函数vkn ;nkiiikkxgxg)()(,1,0,11nkffvMaxfnkkxkk基本方程12S1=ax1x2g1(x1)g2(x2) nxnsngn(xn)s2s3.例3 某公司拟将某种高效设备5台分配给所属甲、乙、丙3厂。各厂获此设备后可产生的效益如下表。问应如何分配,可使所产生的总效益最大?效益厂设备台数甲 乙 丙0 0 0 01 3 5 42 7 10 63 9 11 114 12 11 125 13 11 12解:阶段k状态sk决策xk=1,2,3依次表示把设备分配给甲、乙、丙厂的过程;表示在第k阶
3、段初还剩有的可分台数;表示第k阶段分配的设备台数;状态转移sk+1= sk- xk ;阶段指标vk指标函数vk3 ;阶段分配后产生的效益表示第3k)(iiixvk,1,0,1234kffvMaxfkkxkk基本方程问题:本问题是属于离散型还是属于连续型?怎样解?离散型,用表格的方式求解。效益厂设备台数甲 乙 丙0 0 0 01 3 5 42 7 10 63 9 11 114 12 11 125 13 11 12k Sk xk vk vk+fk+1 fkknP3012345012345 0 4 6111212 0+0 4+0 6+011+012+012+0 0 4 6111212012345k
4、Sk xk vk vk+fk+1 fkknP0123452 0 0 0+0 0 0-0 0 0 0+4 1 5 5+0 5 1-0 0 0 0+6 1 5 5+4 2 10 10+010 2-0 0 0 0+11 1 5 5+6 2 10 10+4 3 11 11+014 2-1 0 0 0+12 1 5 5+11 2 10 10+6 3 11 11+4 4 11 11+016 1-3 2-2 0 0 0+12 1 5 5+12 2 10 10+11 3 11 11+6 4 11 11+4 5 11 11+021 2-3k Sk xk vk vk+fk+1 fkknP15012345 0 3
5、7 912130+21 3+167+149+1012+513+021 0-2-3 2-2-1最优策略:P*13 为0-2-3或2-2-1, 即分给甲厂0台、分给乙厂2台、分给丙厂3台, 或分给甲厂2台、分给乙厂2台、分给丙厂1台。最优值: f1=21。可见,最优解可以是不唯一的,但最优值是唯一的。资源分配问题的应用很广泛,例如: 1.某学生正在备考4门功课,还剩7天时间,每门功课至少复习1天。若他已估计出各门功课的复习天数与能提高的分数之间的关系,问他应怎样安排复习时间可使总的分数提高最多? 2.背包问题:旅行者携带的背包中能装的物品重量为a,现他要从n种物品中挑选若干数量装入背包,问他应如何
6、挑选可使所带的物品总价值最大?二、复合系统工作可靠性问题1. 问题的一般提法 设某工作系统由n个部件串接而成,为提高系统的可靠性,在每个部件上装有备用件。已知部件i上装有xi个备用件时,其正常工作的概率为pi(xi);每个部件i的备用件重量为wi,系统要求总重量不超过W。问应如何安排备用件可使系统可靠性最高?串接:122. 数学规划模型个备用件个部件安排设给第决策变量:ixi )( 1iinixpMaxz目标函数:为非负整数约束条件:iniiixWxw1 模型的特点变量分离。3.用动态规划方法求解12S1=Wx1x2p1(x1)p2(x2) nxnsnpn(xn)s2s3.阶段k状态sk决策x
7、k=1,n表示安排第k个部件备用件的过程;表示在给第k个部件安排之前还剩有的容许重量;表示第k个部件上安排的备用件数量;状态转移sk+1= sk- wkxk ;阶段指标vk指标函数vkn ;的可靠性;部件安排备用件后产生表示第)(niikixpk,1,1n1nkffvMaxfkkxkk1基本方程可靠性问题的应用很广泛,例如: 1.某重要的科研攻关项目正在由3个课题组以3种不同的方式进行,各组已估计出失败的概率。为减少失败的概率,选派了2名高级专家去充实科研力量。若可估计出各组增加专家后的失败概率,问应如何分派专家可使总的失败概率最小? 2.已知x1+x2+xn=c,求z=x1x2xn的最大值。
8、三、设备更新问题例4 某运输公司购进一批卡车投入运营,公司每年初需对卡车作出更新或继续使用的决定。假设第k年中,rk(tk)表示车龄为tk的车使用一年的收入,uk(tk)表示车龄为tk的车使用一年的维修费用,ck(tk)表示车龄为tk的车更新成新车的费用。现公司需制定一个10年计划,以决定如何安排使10年的总收入最大。12S1=?x1x2 10 x10s10v1v2v10s2问题:状态和决策怎样设置? 决策是更新与否,可用0-1变量表示;状态可设为车龄。阶段k状态sk决策xk= 1,10表示第k年的决策过程;= tk表示第k年的车龄;年不更新,第年更新第kk0 1, 状态转移tk+1= tk
9、+1(1-xk)阶段指标vk指标函数vkn = rktk - uktk - ck(tk)(1-xk)(1-xk)xk;10kiiv,110,0,111kffvMaxfkkxkk1 ,M基本方程四、其他随机型问题举例例5 某瓷厂接受订制一个瓷瓶的任务。瓷瓶用电炉烧制。据技术分析估计,每个瓷瓶出炉后的合格率为0.5,各瓶合格与否相互独立(即一炉如装有n个瓷瓶,那么出炉后都不合的概率为0.5n)。制造一个瓷瓶的原料费为100元,烧一炉的费用为300元。现因厂中条件限制最多只能烧3炉,每炉最多装4个瓷瓶。若3炉的瓷瓶无1个合格,则因不能履行合同而被罚款1600元。试用动态规划方法确定一种生产方案(即每炉该装几个瓷瓶),使总的期望成本为最小。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。