动态规划学习-精选课件.ppt

上传人(卖家):晟晟文业 文档编号:4774104 上传时间:2023-01-09 格式:PPT 页数:104 大小:1.97MB
下载 相关 举报
动态规划学习-精选课件.ppt_第1页
第1页 / 共104页
动态规划学习-精选课件.ppt_第2页
第2页 / 共104页
动态规划学习-精选课件.ppt_第3页
第3页 / 共104页
动态规划学习-精选课件.ppt_第4页
第4页 / 共104页
动态规划学习-精选课件.ppt_第5页
第5页 / 共104页
点击查看更多>>
资源描述

1、精选课件求解最短路问题求解最短路问题 A1 6 4 1 4 3 3 3 3 5 1 4 2 4 7 4 3 6 3 4 2 Q A2 T A3 B1 B2 C2 B3 C1 精选课件分阶段的最短路径 :C1T 3 -:B1C1T 4-:A2B1C1T 7-:QA2B1C1T 11 Q-A3B1C1T 11 Q-A3B2C2T 11精选课件最短路径最短路径 A1 6 4 1 4 3 3 3 3 5 1 4 2 4 7 4 3 6 3 4 2 Q A2 T A3 B1 B2 C2 B3 C1 34476117811精选课件最短路径解的特点 1、可以将全过程求解分为若干阶段求解;-2、在全过程最短路

2、径中,将会出现阶段的最优路径;-3、前面的终点确定,后面的路径也就确定了,且与前面的路径(如何找到的这个终点)无关;-3、逐段地求解最优路径,势必会找到一个全过程最优路径。-精选课件 动态规划是解决多阶段最优决策的方法动态规划是解决多阶段最优决策的方法,由美国数学家贝尔曼由美国数学家贝尔曼(R.Bellman)于于 1951年首先提出年首先提出;1957年贝尔曼发表动态规划方面的第一部年贝尔曼发表动态规划方面的第一部专著专著“动态规划动态规划”,标志着运筹学的一标志着运筹学的一 个个新分支的创立。新分支的创立。精选课件 动态规划将复杂的多阶段决策问题分解为动态规划将复杂的多阶段决策问题分解为一

3、系列简单的、离散的单阶段决策问题一系列简单的、离散的单阶段决策问题,采用顺序求解方法采用顺序求解方法,通过解一系列小问题通过解一系列小问题达到求解整个问题目的达到求解整个问题目的;动态规划的各个决策阶段不但要考虑本阶动态规划的各个决策阶段不但要考虑本阶段的决策目标段的决策目标,还要兼顾整个决策过程的还要兼顾整个决策过程的整体目标整体目标,从而实现整体最优决策从而实现整体最优决策.精选课件 离散确定型离散确定型 离散随机型离散随机型 连续确定型连续确定型 连续随机型连续随机型精选课件依赖分析者的经验和技巧依赖分析者的经验和技巧精选课件 通常多阶段决策过程的发展是通过状态的一系列变换来通常多阶段决

4、策过程的发展是通过状态的一系列变换来实现的。一般情况下,系统在某个阶段的状态转移除与本阶实现的。一般情况下,系统在某个阶段的状态转移除与本阶段的状态和决策有关外,还可能与系统过去经历的状态和决段的状态和决策有关外,还可能与系统过去经历的状态和决策有关。因此,问题的求解就比较困难复杂。而适合于用动策有关。因此,问题的求解就比较困难复杂。而适合于用动态规划方法求解的只是一类特殊的多阶段决策问题,即具有态规划方法求解的只是一类特殊的多阶段决策问题,即具有“无后效性无后效性”的多阶段决策过程。的多阶段决策过程。具有无后效性的多阶段决策过程的特点是系统过去的历史,具有无后效性的多阶段决策过程的特点是系统

5、过去的历史,只能通过现阶段的状态去影响系统的未来,当前的状态就是只能通过现阶段的状态去影响系统的未来,当前的状态就是后过程发展的初始条件。后过程发展的初始条件。精选课件 动态规划在工程技术动态规划在工程技术,企业管理企业管理,军事部军事部门有广泛的应用门有广泛的应用;可解决资源分配可解决资源分配,生产生产调度调度,库存管理库存管理,路径优化路径优化,设备更新设备更新,投投资规划资规划,排序问题和生产过程的最优控制排序问题和生产过程的最优控制等问题等问题精选课件使用动态规划方法求解决策问题首先要将使用动态规划方法求解决策问题首先要将问题改造成符合动态规划求解要求的形式问题改造成符合动态规划求解要

6、求的形式,要涉及以下概念要涉及以下概念:(1)(1)阶段阶段 (2)(2)状态状态(3)(3)决策与策略决策与策略 (4)(4)状态转移方程状态转移方程 (5)(5)指标函数指标函数 (6)(6)基本方程基本方程精选课件 把一个复杂决策问题按时间或空间特把一个复杂决策问题按时间或空间特征分解为若干征分解为若干(n)(n)个相互联系的阶段个相互联系的阶段(stage),(stage),以便按顺序求解以便按顺序求解;阶段变量描述当前所处的阶段位置,一阶段变量描述当前所处的阶段位置,一般用下标般用下标 k 表示表示;精选课件 每阶段有若干状态每阶段有若干状态(state),表示某一阶段决策表示某一阶

7、段决策面临的条件或面临的条件或所处位置及运动特征的量所处位置及运动特征的量,称为称为状态。反映状态变化的量叫作状态变量。状态。反映状态变化的量叫作状态变量。k 阶段的状态特征可用状态变量阶段的状态特征可用状态变量 sk 描述描述;每一阶段的全部状态构成该阶段的状态集合每一阶段的全部状态构成该阶段的状态集合Sk,并有并有sk Sk。每个阶段的状态可分为初始状态每个阶段的状态可分为初始状态和终止状态,或称输入状态和输出状态,阶和终止状态,或称输入状态和输出状态,阶段的初始状态记作段的初始状态记作sk,终止状态记为,终止状态记为sk+1,也,也是下个阶段的初始状态。是下个阶段的初始状态。精选课件 所

8、谓决策就是确定系统过程发展的方案,所谓决策就是确定系统过程发展的方案,决策的实质是关于状态的选择,是决策者决策的实质是关于状态的选择,是决策者从给定阶段状态出发对下一阶段状态作出从给定阶段状态出发对下一阶段状态作出的选择。的选择。用以描述决策变化的量称之决策变量,用以描述决策变化的量称之决策变量,和状态变量一样,决策变量可以用一个数,和状态变量一样,决策变量可以用一个数,一组数或一向量来描述也可以是状态变量一组数或一向量来描述也可以是状态变量的函数,记以的函数,记以 ,表示于,表示于 k 阶段状阶段状态态 sk 时的决策变量时的决策变量()kkkxx s精选课件 决策变量的取值往往也有一定的容

9、许范围,决策变量的取值往往也有一定的容许范围,称之允许决策集合决策变量称之允许决策集合决策变量 xk(sk)的允许决的允许决策集用策集用 XK(SK)表示,表示,xk(sk)XK(SK),允许决允许决策集合实际是决策的约束条件。策集合实际是决策的约束条件。精选课件策略策略(Policy)也叫决策序列策略有全过程也叫决策序列策略有全过程策略和策略和 k 部子策略之分,全过程策略是指具部子策略之分,全过程策略是指具有有n 个阶段的全部过程,由依次进行的个阶段的全部过程,由依次进行的 n 个个阶段决策构成的决策序列,简称策略,表示阶段决策构成的决策序列,简称策略,表示为为 。从。从 k 阶段到第阶段

10、到第 n 阶段,阶段,依次进行的阶段决策构成的决策序列称为依次进行的阶段决策构成的决策序列称为 k 部子策略部子策略,表示为表示为 ,显然当,显然当 k=1时的时的 k 部子策略就是全过程策略。部子策略就是全过程策略。1,12,nnpx xx,1,k nkknpx xx精选课件 状态转移确定从一个状态到另一个状态的转状态转移确定从一个状态到另一个状态的转移过程移过程,由状态转移方程描述由状态转移方程描述:sk+1=T(sk,xk);状态转移方程在大多数情况下可以由数学公状态转移方程在大多数情况下可以由数学公式表达式表达,如如:sk+1=sk+xk;精选课件 用来衡量策略或子策略或决策的效果的用

11、来衡量策略或子策略或决策的效果的某种数量指标,就称为指标函数。它是定义某种数量指标,就称为指标函数。它是定义在全过程或各子过程或各阶段上的确定数量在全过程或各子过程或各阶段上的确定数量函数。对不同问题,指标函数可以是诸如费函数。对不同问题,指标函数可以是诸如费用、成本、产值、利润、产量、耗量、距离、用、成本、产值、利润、产量、耗量、距离、时间、效用,等等。时间、效用,等等。精选课件 用用vk(sk,xk)表示第表示第 k 段处于状态段处于状态 sk且所作且所作决策为决策为 xk 时的指标,则它就是第时的指标,则它就是第 k 段指标函段指标函数,简记为数,简记为vk。用用f(sk,xk)表示第表

12、示第k k子过程的指标函数。表子过程的指标函数。表示处于第示处于第 k 段段 sk 状态且所作决策为状态且所作决策为xk时,时,从从 sk 点到终点的距离。由此可见,点到终点的距离。由此可见,f(sk,xk)不仅跟当前状态不仅跟当前状态 sk 有关,有关,(2 2)过程指标函数)过程指标函数(也称目标函数)(也称目标函数)(1)阶段指标函数阶段指标函数(也称阶段效应)(也称阶段效应)精选课件还跟该子过程策略还跟该子过程策略 pk(sk)有关有关,严格说来,应严格说来,应表示为表示为 fk(sk,pk(sk)。它是由各阶段的阶段。它是由各阶段的阶段指标函数指标函数 vk(sk,xk)累积形成的,

13、对于累积形成的,对于 k 部子部子过程的指标函数可以表示为:过程的指标函数可以表示为:,11111(,)(,)(,)(,)k nk nkkkknnkkkkkknnnffs x sxs xv sxvsxv s x 式中式中,表示某种运算,可以是加、减、,表示某种运算,可以是加、减、乘、除、开方等乘、除、开方等精选课件 多阶段决策问题中,常见的目标函数形式多阶段决策问题中,常见的目标函数形式之一是取各阶段效应之和的形式,即之一是取各阶段效应之和的形式,即:(,)nkkkkikfvsu有些问题,如系统可靠性问题,其目标函有些问题,如系统可靠性问题,其目标函数是取各阶段效应的连乘积形式,数是取各阶段效

14、应的连乘积形式,(,)nkkkkikfvsu精选课件 用用 fk*(sk)表示第表示第 k 子过程指标函数子过程指标函数Fk(sk,pk(sk)在状态在状态 sk 下的最优值,即下的最优值,即:()()(,()1,2,kKkkkkkkkpPsfsoptF sp skn 称称 fk(sk)为第为第 k 子过程上的最优指标函数;子过程上的最优指标函数;与它相应的子策略与它相应的子策略 pk(sk)称为状态称为状态 sk 下的最下的最优子策略,记为优子策略,记为 pk*(sk)精选课件用动态规划求解最短路问题用动态规划求解最短路问题 A1 6 4 1 4 3 3 3 3 5 1 4 2 4 7 4

15、3 6 3 4 2 Q A2 T A3 B1 B2 C2 B3 C1 精选课件阶段阶段:可分为可分为4个阶段个阶段,k=1,.,4。状态状态:可用城市编号可用城市编号,S1=Q,S2=A1,A2,A3,S3=B1,B2,B3,S4=C1,C2,S5=T 决策决策:决策变量也可用城市编号决策变量也可用城市编号;状态转移方程状态转移方程:sk+1=xk;阶段指标函数:阶段指标函数:过程指标(阶段递推)函数过程指标(阶段递推)函数:,kkkkks xvsxc11()(,)()kkkkkkkfsmin v sxfs A1 6 4 1 4 3 3 3 3 5 1 4 2 4 7 4 3 6 3 4 2

16、Q A2 T A3 B1 B2 C2 B3 C1 精选课件 k=4f4(C1)=3,f4(C2)=4 k=3f3(B1)=min1+f4(C1)=4*,4+f4(C2)=8=4 f3(B2)=min6+f4(C1)=9,3+f4(C2)=7*=7 f3(B3)=min3+f4(C1)=6*,3+f4(C2)=7=6 k=2 f2(A1)=min7+f3(B1),4+f3(B2),6+f3(B3)=min11*,11*,12=11f2(A2)=min3+f3(B1),2+f3(B2),4+f3(B3)=min7*,9,10 =7 f2(A3)=min4+f3(B1),1+f3(B2),5+f3(

17、B3)=min8*,8*,11 =8 k=1 f1(Q)=min2+f2(A1),4+f2(A2),3+f2(A3)=min13,11*,11*=11 最短路是:最短路是:Q A2 B1 C1 T,p=A2,B1,C1,T Q A3 B1 C1 T,p=A3,B1,C1,T Q A3 B2 C2 T,p=A3,B2,C2,T A1 6 4 1 4 3 3 3 3 5 1 4 2 4 7 4 3 6 3 4 2 Q A2 T A3 B1 B2 C2 B3 C1 精选课件 整个过程的最优策略应具有这样的性质整个过程的最优策略应具有这样的性质:无无论过去的状态和决策如何论过去的状态和决策如何,对前面

18、的决策所对前面的决策所形成的状态而言形成的状态而言,后续的诸决策必须构成最后续的诸决策必须构成最优策略;优策略;上一条成立的条件是阶段递推函数严格单上一条成立的条件是阶段递推函数严格单调。调。精选课件在例题中,求解最短路线的计算公式可以概在例题中,求解最短路线的计算公式可以概括写成:括写成:5511()()0()min (,()()4,3,2,1kkkkkkkkkkkxXsfsfsv s x sfsk 其中,其中,vk 在这里表示从状态在这里表示从状态 sk 到由决策到由决策 xk 所决定的状态所决定的状态 sk+1 之间的距离。之间的距离。f5(s5)=0 是边是边界条件,表示全过程到第四阶

19、段终点结束。界条件,表示全过程到第四阶段终点结束。精选课件 一般地,对于一般地,对于 n 个阶段的决策过程,假设只个阶段的决策过程,假设只考虑指标函数是考虑指标函数是“和和”与与“积积”的形式,第的形式,第 k 阶段和第阶段和第 k+1 阶段间的递推公式可表示如下:阶段间的递推公式可表示如下:当过程指标函数为下列当过程指标函数为下列“和和”的形式时的形式时()()(,()kKkkkkkkkpP sfsoptf s p s()(,)kkkniiipPsi koptv s x精选课件相应的函数基本方程为相应的函数基本方程为 :1111()0()(,()(),1,2,1kknnkkkkkkkkxXf

20、sfsopt v s x sfsk nn精选课件 当过程指标函数为下列当过程指标函数为下列“积积”的形式时的形式时()()(,()kKkkkkkkkp P sf soptf s p s()(,)ikiniiipPsi koptv s x精选课件相应的函数基本方程为相应的函数基本方程为:1111()1()(,()(),1,2,1kknnkkkkkkkkxXfsfsopt v s x sfskn n精选课件动态规划的优缺点 可以解决线性可以解决线性,非线性非线性,整整数规划无法有效求解的复数规划无法有效求解的复杂问题杂问题;容易找到全局最优解容易找到全局最优解;可以得到一组解可以得到一组解;没有标

21、准的模型可供应用没有标准的模型可供应用,构构模依赖于个人的经验和技巧模依赖于个人的经验和技巧;状态变量需满足无后效性状态变量需满足无后效性,有有较大的局限性较大的局限性;动态规划的维数灾难限制了动态规划的维数灾难限制了对规模较大问题的求解效率对规模较大问题的求解效率;精选课件动态规划的步骤:动态规划的步骤:1.将问题按时间或空间划分为满足递推关系将问题按时间或空间划分为满足递推关系的若干阶段的若干阶段,对非时序问题可人为地引入对非时序问题可人为地引入“时段时段”概念概念;2.正确选择状态变量正确选择状态变量 sk,满足满足:可知性可知性:正确描述动态过程演变正确描述动态过程演变,可直接或可直接

22、或间接确定状态变量的值间接确定状态变量的值;无后效性无后效性:后面的决策与前面的决策无关后面的决策与前面的决策无关;精选课件3.确定决策变量确定决策变量 xk以及允许决策集合以及允许决策集合Xk;4.写出状态转移方程写出状态转移方程 sk+1=T(sk,xk);5.决策变量的取值范围决策变量的取值范围 6.写出过程指标函数(阶段函数)的递推写出过程指标函数(阶段函数)的递推关系关系,应满足应满足:a)是定义在所有阶段上的数量函数;是定义在所有阶段上的数量函数;b)具有可分离性,并满足递推关系;具有可分离性,并满足递推关系;c)阶段函数应严格单调。阶段函数应严格单调。精选课件1.最优路径问题最优

23、路径问题2.资源配置问题资源配置问题3.生产与库存问题生产与库存问题4.机器负荷分配问题机器负荷分配问题5.复合系统工作可靠性问题复合系统工作可靠性问题6.二维背包问题二维背包问题7.设备更新问题设备更新问题8.货郎担问题货郎担问题9.非线性规划的求解非线性规划的求解精选课件 某厂要确定一种新产品在今后五年内的价格,并已拟定只在5、6、7、8元这四种单价中进行选择。据预测,今后五年不同价格下每年盈利(万元)见下表,但是各相邻年度价格增减不得超过1元。问今后五年内每年定价各为多少,可逾七五年总利润最大。价格/元 盈利/万元第一年第二年第三年第四年第五年5924586758647659738876

24、64精选课件价格/元盈利/万元第一年 第二年 第三年 第四年 第五年592458675864765973887664131411843410182223172428283037353638精选课件解:1、建立动态规划模型:阶段:以年划分阶段,k=5,4,3,2,1;状态变量sk为每个阶段初的价格,则Sk=5,6,7,8;决策变量xk为每年所确定的价格,则Xk=5,6,7,8;状态转移方程:阶段指标函数vk(sk,xk)为每个阶段选择xk所取得的盈利;例如v(sk,)过程指标函数为第k阶段状态为sk时到最后一个阶段的总利润。基本函数方程为:1kksx6611()()0()max(,)()5,4,

25、3,2,1kkkkkkkkkkxXsfsfsv sxfsk精选课件、逆序求解:k=5 f5(s5,x5)v5(s5,x5)+f6*(s6)f5*(s5)x5*s x 5 6 7 8 5 8+0 8 5 6 4+0 4 6 7 3+0 3 7 8 4+0 4 8精选课件 k=4 f4(s4,x4)v4(s4,x4)+f5*(s5)f4*(s4)x4*s x 5 6 7 8 5 5+8 5+4 13 5 6 6+8 6+4 6+3 14 5 7 7+4 7+3 7+4 11 6,8 8 6+3 6+4 10 7精选课件 k=3 f3(s3,x3)v3(s3,x3)+f4*(s4)f3*(s3)x3

26、*s x 5 6 7 8 5 4+13 4+14 18 6 6 8+13 8+14 8+11 22 7 7 9+14 9+11 9+10 23 6 8 6+11 6+10 17 7精选课件 k=2 f2(s2,x2)v2(s2,x2)+f3*(s3)f2*(s2)x2*s x 5 6 7 8 5 2+18 2+22 24 6 6 5+18 5+22 5+23 28 7 7 5+22 5+23 5+17 28 7 8 7+23 7+17 30 7精选课件 k=1 f1(s1,x1)v1(s1,x1)+f2*(s2)f1*(s1)x1*s x 5 6 7 8 5 9+24 9+28 37 6 6

27、7+24 7+28 7+28 35 6,7 7 6+28 6+28 6+30 36 8 8 8+28 8+30 38 8S1=8 X1=8 s2=8 x2=7 s3=7 x3=6 s4=6 x4=5 s5=5 x5=5精选课件如何将有限的资源分配给若干种生产活动,并使资源如何将有限的资源分配给若干种生产活动,并使资源利用的收益最大是经济活动中常见的问题,动态规划利用的收益最大是经济活动中常见的问题,动态规划可以求解一些线性规划无法解决的资源配置问题。可以求解一些线性规划无法解决的资源配置问题。一般的资源分配问题可以描述为如下的规划问题:一般的资源分配问题可以描述为如下的规划问题:精选课件分厂利

28、润(万元)0套1套2套 3套 4套5套 6套1035676520467891030259887精选课件1.阶段阶段与分厂相联系与分厂相联系,阶段阶段 k 只考虑分配分厂只考虑分配分厂 k 的设备套数的设备套数;2.状态变量状态变量 sk 表示表示 k 分厂分厂可分配的设备套数可分配的设备套数;3.决策变量决策变量 xk 表示决定在表示决定在 k 分厂分厂使用的设备套数使用的设备套数;4.状态转移方程状态转移方程:sk+1=sk-xk;5.阶段函数阶段函数:vk(sk,xk)为为k分厂使用设备分厂使用设备xk时的获利时的获利,从第一分厂到第,从第一分厂到第k分分厂的总获利厂的总获利 fk(sk)

29、=max vk(sk,xk)+fk+1(sk+1)6.基本状态方程基本状态方程4411()()0()max(,)()3,2,1kkkkkkkkkkxXsfsfsvsxfsk精选课件k=3精选课件s3=s2 x2精选课件k=1:s2=s1-x1因此得到:因此得到:x1=2,s2=6-2=4,x2=1,s3=4-1=3,x3=3 x1=1,s2=6-1=5,x2=2,s3=5-2=3,x3=3即:即:p=2,1,3或或1,2,3获利获利18万元万元精选课件 为保证设备可靠运行为保证设备可靠运行,一些关键部件往往由多个器一些关键部件往往由多个器件并联运行件并联运行,如果器件如果器件 i 的失效概率为

30、的失效概率为 pi,则则 xi 个器个器件并联工作的可靠性为件并联工作的可靠性为(1-pixi),假定每个器件的采假定每个器件的采购费用为购费用为 ci,在满足总采购费用不超过预算限制在满足总采购费用不超过预算限制 C 的前提下的前提下,使设备可靠性最高的规划问题可以描述使设备可靠性最高的规划问题可以描述为为:max:z=)1(1 nixiips.t.niiicxc1精选课件该问题为整数非线性规划,可以用动态规该问题为整数非线性规划,可以用动态规划求解,设关键器件数划求解,设关键器件数n=3,总费用为,总费用为120万元。器件的单价与可靠性如下表:万元。器件的单价与可靠性如下表:器件号器件号i

31、 单价单价(万元万元)失效概率失效概率pi精选课件阶段与器件挂钩,第阶段与器件挂钩,第 k 阶段仅考虑器件阶段仅考虑器件k的采购数量的采购数量;sk 表示表示k 阶段可使用的采购费用阶段可使用的采购费用;xk 表示表示 k阶段决定购买阶段决定购买k 器件的数量;器件的数量;状态转移方程状态转移方程:sk+1=sk-ck xk;递推阶段函数递推阶段函数:vk(sk,xk)=1-pkxk总可靠性总可靠性fk(sk)=max (1-pkxk)fk+1(sk+1)基本状态方程:基本状态方程:4411()()0()max(,)*()3,2,1kkkkkkkkkkxXsfsfsv sxfsk精选课件k=3

32、精选课件s3=s2 c2x2精选课件k=1:s2=s1 c1 x1因此得到:因此得到:x1=1,s2=120-30=90,x2=2,s3=90-2*15=60,x3=3 即:即:p=1,2,3 可靠性为可靠性为0.756精选课件4、生产调度(生产与库存)问题 某厂根据市场预测,确认今后某厂根据市场预测,确认今后4个月该厂个月该厂的一种主要产品每月的需求的量的一种主要产品每月的需求的量d为为3,2,3,2万件。已知每月生产固定费用万件。已知每月生产固定费用b为为2千元,但若当月不生产则为千元,但若当月不生产则为0;产品成本;产品成本c为为1千元千元/件,贮存费用件,贮存费用h为为 0.2千元千元

33、/万件万件/月。最大存贮能力月。最大存贮能力w为为4万件。若第万件。若第1月月初五库存产品,第初五库存产品,第4月末也不留库存,则月末也不留库存,则该厂怎样安排生产,才能使今后该厂怎样安排生产,才能使今后4个月的个月的总费用最少?总费用最少?精选课件5511()()0()m in(,)()4,3,2,1kkkkkkkkkkxXsfsfsvsxfsk建立动态规划模型:建立动态规划模型:1、阶段与时间相联系、阶段与时间相联系,阶段阶段 k表示月份表示月份 2、状态变量、状态变量 sk 表示表示 k 月初的库存量月初的库存量;3、决策变量、决策变量 xk 表示表示 k月的产量月的产量;4、若、若dk

34、为需求量,则状态转移方程为需求量,则状态转移方程:sk+1=sk+xk-dk;5、阶段函数、阶段函数:vk(sk,xk)为为k月月的生产费用的生产费用,过程函数:过程函数:fk(sk)为从第一月到第为从第一月到第k月的总生产费用月的总生产费用 fk(sk)=max vk(sk,xk)+fk+1(sk+1)6.基本状态方程基本状态方程,0,0kkkkkkkkbcxhxxvsxhsx 当当精选课件k=4这是最后一个月,需求为这是最后一个月,需求为2,无库存,无库存s5=0。由。由状态方程知:状态方程知:s4=2-x4,x4 0,则则s4只能是只能是0,1,2精选课件k=3这是第这是第3个月,需求为

35、个月,需求为3。由状态方程知:。由状态方程知:s4=s3+x3-3,又由于又由于 2 s4 0,即即2 s3+x3-3 0,s3 w=4则则s3取值是取值是0,1,2,3,4。X3=x3|3s3+x35,s3=0,1,2,3,4精选课件k=2这是第这是第2个月,需求为个月,需求为2。第一个月无库存第一个月无库存s1=0,s2=s1+x1-3=x1-3,又因,又因x1 5,则则s2取值取值是是0,1,2。由状态方程知:由状态方程知:s3=s2+x2-2,又由又由于于 4 s3 0,即即4 s2+x2-2 0;X2=x2|2s2+x26且且x2 5,s2=0,1,2精选课件k=1这是第这是第1个月

36、,需求为个月,需求为3。第一个月无库存第一个月无库存s1=0,s2=x1-3=x1-3,又因,又因x1 5,s2取值是取值是0,1,2。X1=x1|3x15精选课件设备在使用全过程中会遭受磨损设备在使用全过程中会遭受磨损,使用一段使用一段时间后就要维修时间后就要维修,而且使用的时间越长而且使用的时间越长,维维修费用越高修费用越高,设备使用多少时间在经济上最设备使用多少时间在经济上最合算合算,就是设备更新问题。就是设备更新问题。精选课件精选课件精选课件精选课件精选课件精选课件精选课件精选课件 精选课件 有某种机床,可以在高低两种不同的负荷下进行生产,在高有某种机床,可以在高低两种不同的负荷下进行

37、生产,在高负荷下生产时,产品的年产量为负荷下生产时,产品的年产量为 g,与年初投入生产的机床,与年初投入生产的机床数量数量 u1 的关系为的关系为 g=g(u1)=8u1,这时,年终机床完好台数将,这时,年终机床完好台数将为,为,au1 (a为机床完好率,为机床完好率,0 a 1,设,设 a=0.7)。在低负荷。在低负荷下生产时,产品的年产量为下生产时,产品的年产量为 h,和投入生产的机床数量的关,和投入生产的机床数量的关系为系为 h=h(u2)=5u2,相应的机床完好率为,相应的机床完好率为 b(0b2,设,设 b=0.9),一般情况下,一般情况下(a b )。假设某厂开始有。假设某厂开始有

38、 x1=1000 台完台完好的机床,现要制定一个五年生产计划,问每年开始时如何好的机床,现要制定一个五年生产计划,问每年开始时如何重新分配完好的机床在两种不同的负荷下生产的数量,以使重新分配完好的机床在两种不同的负荷下生产的数量,以使在在5年内产品的总产量为最高。年内产品的总产量为最高。精选课件首先构造这个问题的动态规划模型。首先构造这个问题的动态规划模型。1分阶段:分阶段:设阶段变量设阶段变量 k 表示年度,因此,表示年度,因此,阶段总数阶段总数 n=5。2.状态变量:状态变量:用用 sk 表示第表示第 k 年度初拥有的年度初拥有的完好机床台数,同时也是第完好机床台数,同时也是第 k-1 年

39、度末时年度末时的完好机床数量。的完好机床数量。3.决策变量:决策变量:用用 uk 表示第表示第 k 年度中分配年度中分配于高负荷下生产的机床台数。于是于高负荷下生产的机床台数。于是 sk-uk 便便为该年度中分配于低负荷下生产的机床台为该年度中分配于低负荷下生产的机床台数。数。精选课件4状态转移方程为:状态转移方程为:1()0.70.9()0.90.21,2,6kkkkkkkkksa ubsuususuk决策变量的取值:决策变量的取值:在第在第 k 段为段为 su0u)s(Ukkkkk精选课件6阶段指标函数阶段指标函数令令 vk(sk,uk)表示由第表示由第 k 年的状态年的状态 sk 出发,

40、采出发,采取取uk分配方案的产品产量分配方案的产品产量.(,)85()kkkkkkv s uusu7条件最优目标函数递推方程条件最优目标函数递推方程令令 fk(sk)表示由第表示由第 k 年的状态年的状态 sk 出发,采取出发,采取最优分配方案到第最优分配方案到第5年度结束这段时间的产品年度结束这段时间的产品产量,根据最优化原理有以下递推关系产量,根据最优化原理有以下递推关系:精选课件*11166()max(,)()max85()0.70.9()1,2,5()0kkkkkkkkkkkuUkkkkkkkuUfsv s ufsusufusukfs精选课件下面采用逆序递推计算法下面采用逆序递推计算法

41、,从第从第5年度开始递年度开始递推计算推计算K=5 时有时有)()(max)(ksusfususfk6555055585 )(max5550585ususuk 显然,当显然,当 u5*=s5 时,时,f5(s5)有最大值,相应有最大值,相应的有的有 f5(s5)=8s5。精选课件K=4 K=4 时有:时有:)(.)(max)(444544404490705844usufususfsu )(.)(max4444440907085844usuususu )(.max444021261344ususu 精选课件 因此,当因此,当 u4*=s4 时,有最大值时,有最大值 f4(s4)=13.6s4K=

42、3=3 时有:时有:)()(max)(443330335833sfususfsu )(.max33302217551733ususu 可见,当可见,当 u3*=s3 时,有最大值时,有最大值 f3(s3)=17.55s3 。K=2=2 时有:时有:)()(max)(332220225822sfususfsu 精选课件)(.)(max2222220907055175822usuususu )(.max2220820252022ususu 此时,当此时,当 u2*=0 时有最大值,即时有最大值,即 f2(s2)=20.8s2,其中其中 s2=0.7u1+0.9(s1-u1)K=1=1 时有:时有:

43、)(.)(max)(11111101190708205811usuususfsu 精选课件)(.max1110723552211ususu 当当 u1*=0 时时,有最大值,即有最大值,即 f1(s1)=23.7s1,因因为为 s1=1000,故故 f1(s1)=23700 个产品。个产品。按照上述计算顺序寻踪得到下述计算结果:按照上述计算顺序寻踪得到下述计算结果:237005000100001111111 )(),(*sfusgsu18720450090002222222 )(),(*sfusgsu14216648081033333333 )(),(*sfusgssu771145365671

44、4444444 )(),(*sfusgssu3176317638711333555 )(),(*sfusgssu精选课件 上面所讨论的最优决策过程是所谓始端上面所讨论的最优决策过程是所谓始端状态固定,终端状态自由如果终端也附加状态固定,终端状态自由如果终端也附加上一定的约束条件,那么计算结果将会与之上一定的约束条件,那么计算结果将会与之有所差别例如,若规定在第五个年度结束有所差别例如,若规定在第五个年度结束时,完好的机床数量为时,完好的机床数量为500台台(上面只有上面只有278台台),问应该如何安排五年的生产,使之在满,问应该如何安排五年的生产,使之在满足这一终端要求的情况下产量最高?足这一

45、终端要求的情况下产量最高?由状态转移方程由状态转移方程精选课件)us(9.0u7.0)us(bauskkkkkk1k有有25005.455su500)us(9.0u7.0s5556由此式得由此式得当当 k=5 时有时有)us(5u8max)s(f555su0555k)2500u5.4s(5)2500u5.4(855575005.185s当当 k=4 时有时有精选课件)s(f)us(5u8max)s(f55444su044447500u5.18)us(5u8max5444su0447500)us(9.0u7.0 5.18)us(5u8max444444su0447500u75.0s7.21max

46、44su044显 然,只 有 取显 然,只 有 取 u4*=0 ,有 最 大 值有 最 大 值 f4(s4)=21.4s4-7500精选课件当当 k=3 时有时有:)s(f)us(5u8max)s(f44333su033337500)us(9.0u7.0 7.21)us(5u8max333333su0337500s5.24u3.1max33su033显然,只有取显然,只有取 u3*=0,f3(s3)有最大值有最大值 f3(s3)=24.5s3-7500 。精选课件当当 k=2 时有时有:)s(f)us(5u8max)s(f33222su022227500)us(9.0u7.0 5.24)us(

47、5u8max222222su0227500s1.27u9.1max22su022显然,只有取显然,只有取 u2*=0,f2(s2)有最大值有最大值 f2(s2)=27.1s2-7500 。精选课件当当 k=1 时有时有:)s(f)us(5u8max)s(f22111su011117500)us(9.0u7.0 1.27)us(5u8max111111su0117500s4.29u4.2max11su011显然,只有取显然,只有取 u1*=0,f1(s1)有最大值有最大值 f1(s1)=29.4s1-7500 。精选课件0u1000s*11(台)0u810s9.0)us(9.0u7.0s*32*

48、22*230u729s9.0)us(9.0u7.0s*43*33*34656s 9.0)us(9.0u7.0s4*44*454542500s5.4u5*5204us*55500)us(9.0u7.0s5556*2111120.70.9()0.99000sususu111()29.4750029400750021900f ss精选课件7、非线性规划问题求解、非线性规划问题求解某公司拥有资金某公司拥有资金 10 万元,若投资于项目万元,若投资于项目 i(i1,2,3)的投资额为的投资额为 xi 时,其收益分别为时,其收益分别为 g1(x1)=4x1 ,g2(x2)=9x2 ,g3(x3)=2x32

49、,问应如何问应如何分配投资数额才能使总收益最大分配投资数额才能使总收益最大?这是一个与时间无明显关系的静态最优化这是一个与时间无明显关系的静态最优化问题,可列出其静态模型为:问题,可列出其静态模型为:精选课件2321294maxxxxz)3,2,1(010321ixxxxi满足满足 我们可以人为地赋予它我们可以人为地赋予它“时段时段”的概念,的概念,用动态规划方法求解用动态规划方法求解 首先用逆序构造动态规划模型。首先用逆序构造动态规划模型。1分阶段:分阶段:设阶段变量设阶段变量 k 表示依次对第表示依次对第 k 个个项目投资,因此,阶段总数项目投资,因此,阶段总数 n=3。(k=1,2,3)

50、精选课件2.状态变量:状态变量:用用 sk 表示已经对第表示已经对第 1 至至 第第 k-1 个项目投资后的剩余资金;即第个项目投资后的剩余资金;即第 k 段段初拥有的可以分配给第初拥有的可以分配给第 k 到第到第3个项目的个项目的资金额资金额(单位:万元)(单位:万元)。3.决策变量:决策变量:用用 xk 表示对第表示对第 k 个项目投个项目投资资 的资金数量(单位:万元)。的资金数量(单位:万元)。决策变量的取值:决策变量的取值:0 xk sk 4状态转移方程为:状态转移方程为:kk1kxss精选课件6.基本方程为:基本方程为:0)(1,2,3)()(max)(44110sfksfxgsf

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(动态规划学习-精选课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|