1、极大值原理极大值原理(1/4)(1/4)第第 4 章章 极大值原理极大值原理q 前一章讨论的最优控制问题都基于以下基本假定:控制量u(t)的取值范围U不受任何限制,即控制域U充满整个r维控制空间,或者U是一个开集。即控制量u(t)受等式条件约束但是,大多数情况下控制量总是受限制的。例如,控制量可能受如下大小限制|ui(t)|a i=1,2,r 式中,a 为已知常数。极大值原理极大值原理(2/4)(2/4)q 上述约束条件即相当于容许控制空间U是一个超方体。甚至,有些实际控制问题的控制量为某一孤立点集。例如,继电器控制系统的控制输入限制为ui(t)=a i=1,2,rq 一般情况下,可将控制量所
2、受的约束用不等式来表示Mi(u(t),t)0,i=1,2,当控制变量u(t)受不等式约束条件不等式约束条件限制时,古典变分法就无能为力了。最优控制往往需要在闭集的边界上取值。这就要求人们去探索新的理论和方法。极大值原理极大值原理(3/4)(3/4)q 应用古典变分法的另一个限制条件是要求函数L(x,u,t),f(x,u,t),S(x(tf),tf)对其自变量的连续可微性其自变量的连续可微性,特别是要求H/u=0存在。因此,对于有较大实际意义的性能指标泛函就无能为力了。所以,类似消耗燃料最小这类常见最优控制就无法用古典变分法来解决。fttttuJ0d|)(|极大值原理极大值原理(4/4)(4/4
3、)q 鉴于古典变分法的应用条件失之过严,引起了不少数学界和控制界学者的关注。贝尔曼的动态规划贝尔曼的动态规划和庞特里亚金的极大值原理庞特里亚金的极大值原理是较为成功的,应用很广泛,成为解决最优控制问题的有效工具。本节主要介绍极大值原理的结论及其启发性证明。讲授内容为 自由末端的极大值原理自由末端的极大值原理 极大值原理的证明极大值原理的证明 极大值原理的几种具体形式极大值原理的几种具体形式 约束条件的处理约束条件的处理自由末端的极大值原理自由末端的极大值原理(1/8)1/8)4.1 自由末端的极大值原理自由末端的极大值原理q 最优控制问题的具体形式是多种多样的,在第2章的讨论中可知,3种泛函问
4、题(拉格朗日问题、波尔扎问题和麦耶尔问题)的表达形式可以互相转换。这里,研究泛函为定常的末值型性能指标的最优控制问题(麦耶尔问题),然后将结论逐步推广逐步推广至其他最优控制问题。下面,就定常的末值型性能指标定常的末值型性能指标、末态自由末态自由的控制问题来叙述极大值原理。自由末端的极大值原理自由末端的极大值原理(2/8)2/8)定理定理7-97-9q 定理定理 9(极大值原理极大值原理)设u(t)U,tt0,tf,是一容许控制。指定的末值末值型性能指标泛函为Ju()=S(x(tf),式中,x(t)是定常的被控系统相应于控制量u(t)的状态轨线,tf为未知的末态时刻。设使该性能指标泛函极小的最优
5、控制函数为u*(t)、最优状态轨线为x*(t)。则必存在不恒为零的n维向量函数(t),使得1)(t)是方程00()(),(),()ttttxf xuxx)()(),()(tttHtxuxfx自由末端的极大值原理自由末端的极大值原理(3/8)3/8)满足2)边界条件 的解,其中哈密顿函数为3)3)则有即()()()fffStttxx*()(),(),()min(),(),()tUHtttHtttuxuxu)(),()()(),(),(ttttttHuxfux*0(),(),()(),(),(),()fHtttHttttt ttU xuxuu自由末端的极大值原理自由末端的极大值原理(4/8)4/8
6、)4)沿最优轨线哈密顿函数应满足 q 下面先对上述极大值原理的涵义作简单的解释,再给出该定理的启发性证明。*(),(),()0(),(),()(),(),()ffffffffHttttHtttHtttt自由常值固定xuxuxu自由末端的极大值原理自由末端的极大值原理(5/8)5/8)1)容许控制条件的放宽。容许控制条件的放宽。古典变分法应用于最优控制问题,要求控制域U=Rr,即控制域U充满整个r维控制空间。然后,从控制量的变分u(t)的任意性出发,导出极值条件H/u=0。这一条件是非常严格的。其一,它要求哈密顿函数H对控制量u(t)连续可微;其二,它要求控制量的变分u(t)具有任意性,即控制量
7、u(t)不受限制,或仅在受等式约束条件限制的开集中取值。自由末端的极大值原理自由末端的极大值原理(6/8)6/8)2)2)定理9中的式(93)和(94)同样称为协态方程协态方程和横截条件横截条件,其相应求解方法与基于古典变分法的最优控制求解方法类似。变分法的极值条件是一种解析形式,而极大值原理的极值求解条件(96)是一种定义形式定义形式,不需不需要哈密顿函哈密顿函数数H对控制量对控制量u(t)的可微性加以约束的可微性加以约束,而且对于通常的对u(t)的约束都是适用的,v 例如,u(t)受不等式约束条件约束,即在闭集中取值。*()(),()()()(93)()()(94)()(),(),()mi
8、n(),(),()(96)ffftUHttttStttHtttHttt ufxuxxxxxuxu自由末端的极大值原理自由末端的极大值原理(7/8)7/8)3)3)由极值求解条件(96)可知,极大值原理得到的是全局最小值,而非局部极值,而古典变分法中由极值条件H/u=0得到的是局部极小值。再则,如果把条件(96)仍称为极值条件,则极大值原理得到的是强极值。而古典变分法在欧拉方程推导时,对极值曲线x*(t)和其导数都引入变分,得到的是弱极值。不难理解,当满足古典变分法的应用条件时,极值条件H/u=0只是极大值原理的极值求解条件(96)的一个特例。*()(),(),()min(),(),()(96)
9、tUHtttHtttuxuxu自由末端的极大值原理自由末端的极大值原理(8/8)8/8)4)在上述定理中,最优控制u*(t)使哈密顿函数取最小值。所谓“极小值原理”一词正源于此,称“极大值原理”是习惯性叫法。若实际控制问题需求极大值,可将极值求解条件的求最小(min)改为求最大(max)即可。5)极大值原理只给出最优控制的必要条件必要条件,并非充分条件充分条件。得到的解是否能使泛函泛函J最小最小,还有待证实。极大值原理更没有涉及解的存在性问题。如果实际问题的物理意义已经能够判定所讨论的问题的解是存在解是存在的,而由极大值原理所求出的控制仅仅有一个,可以断定,此控制就是最优控制。v 实际遇到的问
10、题往往属于这种情况。极大值原理的证明极大值原理的证明(1/2)1/2)7.4.2 极大值原理的证明极大值原理的证明q 庞特里亚金对极大值原理作了严格的证明,涉及拓扑学、实函数分析等很多数学问题,这是作为工科教材难以详细论述的。本教材利用增量法给出极大值原理的一个启发性证明。q 证明中所作的假设是:1)函数 f(x,u)和 S(x(tf)都是其自变量的连续函数;2)函数f(x,u)和S(x(tf)对于x是连续可微的,即f/x和S/x(tf)存在且连续,但并不要求函数 f(x,u)对u可微;极大值原理的证明极大值原理的证明(2/2)2/2)3)为了保证微分方程解的存在和惟一性,假定f(x,u)在任
11、意有界集上对自变量 x 满足如下李普希茨(Lipschitz)条件f(x1,u)-f(x2,u)x1-x2 0,x1,x2XRn,uURrq 下面叙述用增量法证明极大值原理的过程,证明步骤为:构造泛函构造泛函J的增量的增量 求取求取 x(t)的表达式的表达式 对对 x(t)进行估计进行估计 极值条件的推证极值条件的推证 tf的考虑的考虑然后介绍一基于极大值原理的最优控制算例最优控制算例泛函泛函J的增量的增量(1/2)1/2)(1)泛函泛函J的增量的增量q 假定末态时刻tf已知,根据S(x(tf)对x(tf)的连续可微性泛函J的增量J可表示为式中u*(t)和x*(t)分别表示最优控制函数及相应的
12、最优轨线;x(t)为x(t)在最优轨线x*(tf)附近的变分变分;o(x(tf)表示泰勒展开式中x(tf)的高阶项。)()()()()()()()()()(*ffffffftotttStSttSJJJxxxxxxxuuuJu()=S(x(tf)泛函泛函J的增量的增量(2/2)2/2)q 要从Ju*()0的条件导出最优控制必要条件最优控制必要条件,首先应找出x(t)与控制量u(t)的变分 u(t)的关系,进而对x(t)作出估计作出估计。下面为表述更简洁,时间函数x(t)与u(t)的时间变量t略去不写。x(t)的表达式的表达式(1/3)1/3)(2)x(t)的表达式的表达式q 根据f(x,u)对x
13、的可微性,由状态方程(92)可得如下由控制量的变分u(t)引起的状态方程(92)的变分*(,)(,)(,)(,)()(,)(,)(,)(,),(,()oo xf x uxf xx uuf x uf x uuf x uuxxf x uxf x uuxf x uxf x uf x uuxxx()(),()(92)ttt xf xu x(t)的表达式的表达式(2/3)2/3)令矩阵函数(t,s)为线性状态方程的状态转移矩阵,即(t,s)满足如下微分方程组 考虑到x(t0)=0,则x(t)在t=tf时的解为*(),()()()ttttf xuxxxIsssttttst),(),()(),(d),(d*
14、xuxf000*()(,)(),()()(),()d(),()()(),()(,)()d(,)()dffftffttfttftttsssssssssssstsssts oss xf xuuf xuf xuuf xuxxxx x(t)的表达式的表达式(3/3)3/3)将上述方程代入式(98),则得泛函J的增量J为 上式虽然给出了泛函增量J与(u,x)的关系,但是对一般形式的u,还很难估计上式的 J。然而,对任意的u,上式均成立,故对特定的u也应成立。为此,下面讨论时取一特定的变分u,以利于对上式的估计。000*()(,)(,)(,)d()()(,)(,)(,)()d()()(,)()d()()f
15、fftfftftfftftffftfStJtsstSttssstStts ossott xf xuuf xuxxf xuuf xuxxxxxxxx*()()()(98)()ffffStJtott xxxx对对x(t)的估计的估计(1/11)1/11)(3)对对 x(t)的估计的估计q 设u(t)是控制u(t)的任意变分,对应x(t)的增量x(t)应满足如下方程 将上式的第一式改写为0()(,)(,)()0tt xf xx uuf x ux(,)(,)(,)(,)xf xx uuf x uuf x uuf x u对对x(t)的估计的估计(2/11)2/11)q 对于给定的u(t)和u(t),由于
16、它们的分段连续性,必存在有界的U1U及XRn,使u(t)+u(t)U1,x(t)X,对所有的tt0,tf,根据李卜希茨条件,必存在0,满足f(x+x,u+u)-f(x,u+u)0,则f(x,u+u)-f(x,u)|b(t)|tt0,tf其中 于是由式(105)可知,x(t)满足 0()0()0()0tb tbtuu()()()tatb txx(,)(,)(,)(,)(105)xf xx uuf x uuf x uuf x u对对x(t)的估计的估计(3/11)3/11)引理引理 2 2q 为了作进一步的估计,下面先引入一个引理。q 引理引理 2q 证明证明 由欧几里德范数(2-范数)的定义,有
17、 从而有证毕 ddt xx 1d12d2niiixxt xxxxxxxxx1/221niixx对对x(t)的估计的估计(4/11)4/11)q 因此,由引理 2和式(109),有即 将两边乘以e-t,得 解得d()()()dtatb ttxxd()()datateteb ttxd()()()dtatb ttxx()()()(109)d2dtatb tt xxxx引理 ttstassbet0d)()()(x对对x(t)的估计的估计(5/11)5/11)q 至今我们还没有对u(t)作任何限制。为了使变分后的控制u(t)仍属于容许控制空间,即u(t)U,对所有的tt0,tf,为了便于导出极值求解条件
18、,采用一种异于古典变分的特定形式的变分-针状变分针状变分。图图5 针状变分示意图针状变分示意图 令为最优控制u*(t)的任意一个连续点,l0是某一确定的数,0是一个充分小的数。可将控制量的变分u(t)取成一个依赖于,l和的针状变分,如图5所示。对对x(t)的估计的估计(6/11)6/11)上述针状变分记为u(t),可表示为 式中,U表示任意容许控制,这就是说,在充分小的时间区间,+l内,可以取控制域U内的任何点。当然,也可以取闭集上的点。变分 是一个有限量。当是一个充分小的量时,则由u(t)所引起的变分 x(t)是否是否仍为一个充分小的量。*,()()()tlttt uuuu其它uu*()()
19、,tttl uuu对对x(t)的估计的估计(7/11)7/11)q 下面证明由针状变分u(t)引起的状态增量x(t)是一个与同阶的无穷小量。事实上,当控制量作针状变分时,式(108)可表示为 于是,由式(111)可知,由针状变分u(t)引起的状态增量x(t)为 上式表明,x(t)与0是同阶无穷小量。0,()0btlb t 其它000()()()d()d()dd)fffffftta tsa t stttlatatatteb sseb sseb ssteb sb lex0()0()0()(108)0()0()()d(111)ta t sttb tbtteb ssuux对对x(t)的估计的估计(8/
20、11)8/11)q 据此,由式(103)可得如下由针状变分u(t)所引起的泛函J的变分J的表达式*()(,)(,)(,)d()()(,)(,)(,)d()()(,)()d()()lffflffflffflfStJtsstSttsstStts ossott xf x uuf x uxxf x uuf x uxxxxxxxx000*()(,)(,)(,)d()()(,)(,)(,)()d()()(,)()d()(103)()ffftfftftfftftffftfStJtsstSttssstStts ossott xf x uuf x uxxf x uuf x uxxxxxxxx对对x(t)的估计的
21、估计(9/11)9/11)上式中后3项都是的高阶无穷小量,可归并成一项,则上式可记为*()(,)(,)(,)d()lfffStJtss ot xf x uuf x ux*()(,)(,)(,)d()()(,)()()(,)(,)(,)d)d)(lffflfffflfflfSttsstSttsStJtssootsstt xf x uufxf x uuf x uxxxxxxxxxx u对对x(t)的估计的估计(10/11)10/11)令 则向量(t)必满足状态方程的协态方程及边界条件*()()(,)()fffStstsHamiltont 为构建函数xx)()(),()(*ttttxuxf)()()
22、(*fffttStxx对对x(t)的估计的估计(11/11)11/11)若记则共轭方程(118)可写成 于是,泛函增量表达式(116)可改写成(),(),()()(),()Httttttxuf xu*(),()()()(118)tttt fxux*(),(),()()Htttt xux *(,)(,)d(,)(,)dllJsoHHso f x uuf x ux uux u*()(,)(,)(,)d(7116)()lfffStJtssot xf x uuf x ux极值条件的推证极值条件的推证(1/4)1/4)(4)极值条件的推证极值条件的推证q 已记u*(t)是使泛函J取最小值的最优控制,x*
23、(t)为相应的轨线,而(t)是协态方程的解。所以,对任意的控制变分,当然也包含对u(t)的针状变分,泛函的增量(122)必满足 因为x*(t)和(t)在tt0,tf范围内是连续函数,而u*(t)和 =u*(t)-u(t)在上式的积分范围内积分范围内也是连续的,所以哈密顿函数H是一连续函数连续函数。*(,)(,)d0lJHHso x uux u*(,)(,)d(122)lJHHso x uux uu极值条件的推证极值条件的推证(2/4)2/4)根据中值定理及H的连续性,则有式中,00,则有或写作 由于上式在区间t0,tf内u*(t)的所有连续点都成立。同时考虑到 要取遍容许控制域U中所有的点,因
24、此,上式也可表示为 式中,是区间t0,tf内u*(t)的任意连续点。*(),(),()(),(),()0HHxuxu*(),(),()()(),(),()0ol HH xuuxu*(),(),()(),(),()HHxuxu*()(),(),()min(),(),()UHHuxuxuu极值条件的推证极值条件的推证(4/4)4/4)由于假定u(t)是分段连续函数,而u*(t)的不连续点上的函数值如何,并不影响控制效果,因此,不妨认为(127)对于任意的t0,tf都成立。这就是说,如果u*(t)U,tt0,tf是最优控制,则对所有tt0,tf都必须满足从而证明了极值条件。*()(),(),()mi
25、n(),(),()tUHtttHtttuxuxu*()(),(),()min(),(),()(127)UHHuxuxu tf的考虑的考虑(1/9)1/9)(5)tf的考虑的考虑q 前面仅仅考虑了末态时刻tf给定的情况。当tf可变时,还要考虑由tf的改变量tf所引起的泛函改变量。设u*(t)是使性能指标泛函最小的最优解,x*(t)是相应的最优轨线。若令tf的改变量tf=T1,其中T1为任意常数,并同时考虑控制u(t)的针状变分u()。Ju()=S(x(tf)tf的考虑的考虑(2/9)2/9)根据S(x(tf)的可微性,则有 上式对任意T1及任意控制变分均成立,对u(t)0时也成立。当u(t)0时
26、,显然有u(tf)=0,考虑到T1为任意实数,于是可得*1*()()()()()()()()()(),()()fffffffffffStJttoStttoSttfttTot xxxxxxxxxxuxJu()=S(x(tf)*()(),()0fffStfttxxux tf的考虑的考虑(3/9)3/9)因此,有从而证明了式(97)的第1部分。当取T1=0,对于针状变分u(t)应有 因此,依上述证明过程(1)(4),同样可以证明式(128)成立。*(),(),()()(),()()(),()0(128)fffffffffHttttttStfttxuf xuxxux*(),(),()0(),(),()
27、(97)(),(),()constant()(),()0fffffffffffHttttHtttHttttStfttxuxuxuxxux自由固定0)()()(*ottSJffxxx tf的考虑的考虑(4/9)4/9)q 下面证明当 tf 固定,x(tf)自由时,式(97)的第2部分的证明。哈密顿函数H的增量可表示为 考虑到哈密顿函数H(x,u)对x和 的连续可微性,因此,由泰勒展开式可得哈密顿函数的一阶增量表示式*(),(),()(),(),()(),(),()(),(),(),()(),(),()(),(),(),()HtttHtttHttttttHtttHttttttHttHtttttt
28、xxuuxxuxuxuuux*(),(),()0(),(),()(97)(),(),()constantffffffffHttttHtttHttttxuxuxu自由固定 若定义 =u*(t+t),则由上式有如下H的一阶增量式 考虑到u*(t)是最优控制函数,由极值条件则有*(),(),()(),(),()(),(),()HtttHtttHtttxuxuxu*(),(),()0Htttxuu tf的考虑的考虑(5/9)5/9)*(,)(),(),()()()(,)()()(),(),()(),(),()(),(),()()(),(),()()()()HHttttttHtttHttttHtttHt
29、tttHttttttttHt x uxuxxxx uxuxuxuxuxx*(),(),()(),(),()ttttHttt xuxu tf的考虑的考虑(6/9)6/9)考虑到时间增量t的任意性,其值可正可负。因此,由上式可知,当t0时,H0,则意味着哈密顿函数H随时间t递增;而当t0,t0,1,可得 u*(t)=-1 t0,1*()*11211()1*1 12111()1*1 12111()1(),(),()min(),(),()min()minmintUu tu tu tHtttHtttxuxxxuxxu uxuxu111()0*()1()0tutt1(t)=1-et-1 2(t)=1 tf
30、的考虑的考虑(9/9)9/9)因此,由得 同样,可求得 因此,该问题的最优控制函数u*(t)和最优轨线x*(t)分别为*11111(0)1xxuxx *1()21tx te1(t)=1-et-1 2(t)=122)(*2tetxt*1*2*()1()21()22ttutx tex tet 极大值原理的几种具体形式极大值原理的几种具体形式(1/1)1/1)4.3 极大值原理的几种具体形式极大值原理的几种具体形式 q 前面讨论了定常系统的定常末值型性能指标、末态自由的最优控制问题的极大值原理。经数学变换,上述最优控制问题的极大值原理的结论可以推广至 时变系统时变系统 积分型或复合型性能指标积分型或
31、复合型性能指标等控制问题的最优控制中,不再详加证明。下面将给出几种具体的极大值原理形式和分析证明的思路。时变情况时变情况(1/7)1/7)1.时变情况时变情况q 如果描述最优控制问题的一些函数,如状态方程的 f()中显含时间t,或末值型性能指标 S()中显含时间tf,则该问题称为时变(非定常)的,并可描述如下。时变系统最优控制问题时变系统最优控制问题 对时变的被控系统 求一容许控制u(t)U,tt0,tf,使如下末值型性能指标泛函取极值。Ju()=S(x(tf),tf)00()(),(),),()ttt ttxf xuxx时变情况时变情况(2/7)2/7)q 对于时变问题,可以通过引进新的状态
32、变量的方法将时变的问题变换成定常的问题,再应用定常问题的极大值原理(定理9),便可推导出时变问题的极大值原理。证明:对时变的状态方程和性能指标,引入如下辅助状态变量xn+1(t)=t使其满足辅助状态方程和初始条件xn+1(t0)=t0,xn+1(tf)=tf1()1nxt时变情况时变情况(3/7)3/7)则上述时变的状态方程和性能指标泛函可分别变换为如下定常的状态方程和性能指标泛函 对上述辅助的定常最优控制问题,应用极大值原理(定理9),则有如下时变最优控制问题的极大值原理。11()(),(),)()1()(),()nfnfttt txtJStxtxf xuux时变情况时变情况(4/7)4/7
33、)定理定理1010q 定理定理10(10(时变系统极大值原理时变系统极大值原理)时变系统最优控制问题时变系统最优控制问题的最优控制函数u*(t)、最优状态轨线x*(t)和协态向量函数(t)使得:1)x*(t)和(t)满足规范方程式中,哈密顿函数为(,)()(),(),)(,)(),(),)()()Htttt tHttt ttt x u xf xux u fxuxx),(),()(),(),(),(ttttttttHuxfux时变情况时变情况(5/7)5/7)2)边界条件 3)哈密顿函数H作为u(t)U的函数,在u(t)=u*(t),tt0,tf时取绝对极小,即或4)在最优轨线的末端,哈密顿函数
34、应满足0(),)(),()()ffffStttttxxxx*()(),(),(),)min(),(),(),)tUHttt tHttt tuxuxuUttttttttHttttHf)(,),(),(),(),(),(),(0*uuxuxffffffftttSttttH),(),(),(),(*xux时变情况时变情况(6/7)6/7)5)沿最优轨线哈密顿函数满足如下关系 q 定理10的证明可直接应用定常情况的极大值原理(定理9)给出(略)。*(,)(),(),(),)(),(),(),)dftfffftHsHttt tHttttssx uxuxu时变情况时变情况(7/7)7/7)q 比较定理10
35、和定理9可知,时变性并没有改变极大值原理的规范方程、横截条件及极值条件,却改变了最优轨线末端哈密顿函数的值。在定常情况下,沿最优轨线哈密顿函数的值为常数(当tf自由时为零),而时变时却不是常数,它由定理10的条件5)决定。q 值得指出的是,定理10的条件(5)不是求解该最优控制问题的必要条件,只是描述最优轨线上哈密顿函数的一个性质。定理10的前4个条件才是必要的,由它们已经能决定出最优控制函数u*(t)、最优轨线x*(t)和最优末态时刻。积分型性能指标积分型性能指标(1/7)1/7)2.积分型性能指标积分型性能指标q 最优控制的极大值原理讨论的性能指标泛函为末值型的,实际上许多控制问题的指标函
36、数为积分型。对该类性能指标函数的控制问题可描述如下。积分型泛函最优控制问题积分型泛函最优控制问题 对定常的被控系统(92),求容许控制u(t)U,tt0,tf,使如下积分型性能指标泛函取极值。0()(),(),)dfttJLtt ttuxu()(),()(92)ttt xf xu积分型性能指标积分型性能指标(2/7)2/7)q 对积分型泛函指标(138),引入辅助状态变量x0,使其满足则有则上述积分型性能指标泛函的最优控制问题可变换成状态方程和性能指标泛函分别为 的最优控制问题。00()(),()d()ftftJLtttx tuxu0()(),(),)d(138)fttJLtt ttuxu00
37、0()(),().()0 x tLttx txu00()(),()()(),()()()fx tLtttttJx txuxf xuu积分型性能指标积分型性能指标(3/7)3/7)定理定理1111q 对上述辅助的最优控制问题,应用极大值原理(定理 9),则有如下积分型性能指标泛函的最优控制问题的极大值原理。q 定理定理1111(积分型泛函积分型泛函极大值原理极大值原理)积分型泛函积分型泛函最优控制问题最优控制问题的最优控制函数u*(t)、最优状态轨线x*(t)和协态向量函数(t),使得:1)x*(t)和(t)满足规范方程式中,哈密顿函数为(,)()(),()(,)(),()(),()()()Ht
38、ttHLtttttt x u xf xux u xufxuxxx(),(),()(),()()(),()HtttLtttttxuxuf xu积分型性能指标积分型性能指标(4/7)4/7)2)边界条件 3)哈密顿函数H作为u(t)U的函数,在u(t)=u*(t),tt0,tf时取绝对极小,即或4)在最优轨线的末端,哈密顿函数应满足0(),()0fttxx*()(),(),()min(),(),()tUHtttHtttuxuxu*0(),(),()(),(),(),()fHtttHttttt ttU xuxuu*(),(),()0(),(),()(),(),()constantffffffffHt
39、tttHtttHttttxuxuxu自由固定积分型性能指标积分型性能指标(5/7)5/7)q 定理11的证明可直接应用定常情况的极大值原理(定理9)给出(略)。比较定理11和定理9可知,积分型性能指标泛函的极大值原理与末值型性能指标的极大值原理相比,除哈密顿函数H的定义和协态变量向量函数(t)的边界条件有一定区别之外,其他条件与结论基本一致。积分型性能指标积分型性能指标(6/7)6/7)q 不难验证,若性能指标泛函为复合型的,即则相应的哈密顿函数为 复合型性能指标泛函的最优控制问题的极大值原理与积分型性能指标泛函的基本一致,但协态变量向量函数(t)的边界条件(横截条件)变为 可见末值型性能指标
40、不影响哈密顿函数的定义,但会影响边界条件(横截条件)。fttftttLtSJ0d)(),()()(uxxu)(),()()(),()(),(),(tttttLtttHuxfuxux)()()(fffttStxx积分型性能指标积分型性能指标(7/7)7/7)q 上面讨论的是时变的、末值型性能指标泛函的最优控制问题,和定常的、积分型性能指标泛函的最优控制问题的极大值原理。由于前面所述的各种最优控制问题经数学变换都可等效到同一类型的最优控制问题来处理,故其他情况的最优控制问题的极大值原理可由定理9、定理10和定理11推广而得。自由末端的极大值原理自由末端的极大值原理(1/1)1/1)4.4 末端受约
41、束的极大值原理末端受约束的极大值原理q 前面讨论了自由末端问题的极大值原理,下面考虑存在 末态约束末态约束 积分型限制积分型限制的最优控制问题。末态约束问题末态约束问题(1/6)1/6)1.末态约束问题末态约束问题q 末态x(tf)受约束的控制问题可描述如下。末态约束最优控制问题末态约束最优控制问题 对定常的被控系统(7-92),其末态满足约束(目标集)式中,g1(x(tf)和g2(x(tf)分别表示p维和q维关于x(tf)的连续可微向量函数。求一容许控制u(t)U,tt0,tf,使末值型性能指标(91)取极小值。()()(91)()(),()(92)fJSttttuxxf xu12:()=0
42、,()0ffMttg xg x末态约束问题末态约束问题(2/6)2/6)q 末态约束(144)中末态时刻tf是状态轨线x(t)与目标集M首次相遇的时刻。若式(144)中性能指标含有末值项,pn;否则,pn。而维数q不受限制。q 与自由末端问题不同,现在要求末态x(tf)只能落在由约束条件(144)所规定的目标集上。对于这种约束条件下的泛函极值问题,如同等式和不等式约束下求函数极值一样,通过引入拉格朗日乘子 和,将末态约束化为等价的末值型性能指标J1u()=S(x(tf)+g1(x(tf)+g2(x(tf)式中,和 为不同时为零的p维和q维常向量。12:()=0,()0(144)ffMttg x
43、g x末态约束问题末态约束问题(3/6)3/6)类似不等式约束的函数极值问题的库恩-塔克尔定理,考虑不等式约束条件的乘子要满足约束条件q 类似于前面定常的末值型性能指标泛函的最优控制问题的极大值原理的证明,有如下末态受等式和不等式条件约束的定常末值型性能指标泛函的最优控制问题的极大值原理。2()00,1,2,.,iifigtiqx末态约束问题末态约束问题(4/6)4/6)定理定理7-127-12q 定理定理12(末态约束极大值原理末态约束极大值原理)末态约束最优控制问题末态约束最优控制问题的最优控制函数为u*(t)、最优状态轨线为x*(t)和协态向量函数(t),以及不同时为零的 p 维常向量
44、和 q维常向量 ,使得:1)x*(t)和 (t)满足规范方程 式中,哈密顿函数为(,)()(),()(,)(),()()()HtttHtttt x u xf xux u fxuxx(),(),()()(),()Httttttxuf xu末态约束问题末态约束问题(5/6)5/6)2)边界条件 3)哈密顿函数H作为u(t)U的函数,在u(t)=u*(t),tt0,tf时取绝对极小,即或012122(),()()()()()()()()=0()0()00,1,2,.,fffffffffiifitStttttttttgtiqxxxgxgxxxxg xg xx*()(),(),()min(),(),()
45、tUHtttHtttuxuxu*0(),(),()(),(),(),()fHtttHttttt ttU xuxuu末态约束问题末态约束问题(6/6)6/6)4)在最优轨线的末端,哈密顿函数应满足q 上面给出的是末态受约束的定常性能指标泛函的最优控制问题的极大值原理,对于其他情况,如时变的、积分型的或复合型的性能指标泛函的最优控制问题的极大值原理,可参照定理12及相应的定理10或定理11得到。这里不再进行详细讨论。*(),(),()0(),(),()(),(),()constantffffffffHttttHtttHttttxuxuxu自由固定积分约束问题积分约束问题(1/7)1/7)2.积分约
46、束问题积分约束问题q 实际被控系统由于所处环境的复杂性,所受的限制、约束条件是各异的。例如,航天器材上要求总的消耗能量是有限的。这些约束条件有时可用对状态变量x(t)和控制变量u(t)的积分型约束条件来表示。这类有积分型约束条件的最优控制问题可描述如下。积分约束问题积分约束问题(2/7)2/7)q 积分型约束最优控制问题积分型约束最优控制问题 对定常的被控系统(92),其系统状态轨线x(t)和控制函数u(t)满足积分型约束式中,L1(x(t),u(t)和L2(x(t),u(t)分别为k维和l维向量函数。求一容许控制u(t)U,tt0,tf,使积分型性能指标(138)取极值。q 处理这类问题与前
47、面类似,同样可以采用引进新的状态变量的方法将受上述积分限制的最优控制问题转换到前面已经讨论过的最优控制问题,从而获得该最优控制问题的极大值原理。0()(),()(92)()(),(),)d(138)ftttttJLtt tt xf xuuxu001122(),()d0(),()d0ffttttJLtttJLtttxuxu积分约束问题积分约束问题(3/7)3/7)如,引入辅助状态变量x0,x1和x2如下则积分型性能指标泛函变换为辅助末值型性能指标泛函Ju()=x0(tf)上述积分型约束变换为如下辅助状态变量的末端条件x1(tf)=J1=0 x2(tf)=J20那么,再应用极大值原理,可推导得受积
48、分限制的、积分型性能指标泛函指标的最优控制的极大值原理。0001122(),()d(),()d0(),()d0fffttttttJLtttJLtttJLtttxuxuxu00011102220()(),(),()0()(),(),()0()(),(),()0 x tLttx ttLttttLtttxuxxuxxxux积分约束问题积分约束问题(4/7)4/7)定理定理1313q 定理定理13(积分型约束极大值原理积分型约束极大值原理)积分型约束最优控制问题积分型约束最优控制问题的最优控制函数u*(t)、最优状态轨线x*(t)和协态向量函数(t),以及k维常向量 1和l维常向量 2,使得:1)x*
49、(t)和(t)满足规范方程式中,哈密顿函数为(,)()(),()(,)(),()(),()()()HtttHLtttttt x u xf xux u xufxuxxx121122(),(),()(),()()(),()(),()(),()HtttLtttttLttLttx uxuf xuxuxu积分约束问题积分约束问题(5/7)5/7)2)边界条件 3)哈密顿函数H作为u(t)U的函数,在u(t)=u*(t),tt0,tf时取绝对极小,即或00001122222()()0(),()d0(),()d000,1,2,.,fffttttiiittJLtttJLtttJilxxxuxu*1212()(
50、),(),()min(),(),()tUHtttHtttux ux u*12120(),(),()(),(),(),()fHtttHttttt ttU x ux uu积分约束问题积分约束问题(6/7)6/7)4)在最优轨线的末端,哈密顿函数应满足q 综上所述,积分型约束限制条件可通过拉格朗日乘子向量转化成等价的积分型性能指标泛函。因此,相应的哈密顿函数的定义中,引进了乘子向量 1和 2。*12*12*12(),(),()0(),(),()(),(),()constantffffffffHttttHtttHttttx ux ux u自由固定积分约束问题积分约束问题(7/7)7/7)q 上面讨论的