1、Ch.7 最优控制原理最优控制原理 本本 章章 简简 介介(1/1)(1/1)本本 章章 简简 介介q 本章讨论最优控制问题初步,目的是使读者掌握求解最优控制问题的主要理论和方法,能对一些常见的最优控制问题进行有效的分析和求解。 主要内容包括 泛函基础、 变分法和极大值原理、 线性二次型最优控制问题,以及 离散系统的最优控制问题。 本章最后介绍基于Matlab的线性系统的线性二次型最优控制系统的设计计算与运动仿真问题的程序设计与仿真计算。目录目录(1/1)(1/1)目目 录录q 7.1 最优控制概述最优控制概述 q 7.2 变分法变分法q 7.3 变分法在最优控制中的应用变分法在最优控制中的应
2、用q 7.4 极大值原理极大值原理q 7.5 线性二次型最优控制线性二次型最优控制q 7.6 动态规划与离散系统最优控制动态规划与离散系统最优控制q 7.7 Matlab问题问题q 本章小结本章小结最优控制概述最优控制概述(1/1)1/1)最优控制概述最优控制概述 q 从20世纪50年代末迅速发展起来的现代控制理论中,最优控制是其中一个主要内容,亦是目前较活跃的一个分支。 最优控制问题是从大量的实际问题中提炼出来的,它的发展与航空、航天、航海的制导、导航和控制技术密不可分。 下面先通过几个应用实例来引出最优控制问题,然后讨论最优控制问题的描述及数学表达。 内容为 最优控制问题的提出最优控制问题
3、的提出 最优控制问题的描述最优控制问题的描述 最优控制发展简史最优控制发展简史 最优控制问题的提出(1/1)(1/1)7.1.1 最优控制问题的提出最优控制问题的提出q 考虑下面几个实际最优控制问题的例子。 飞船的月球软着陆问题飞船的月球软着陆问题 间歇化学反应器的最大产量控制问题间歇化学反应器的最大产量控制问题 连续搅拌槽的温度控制问题连续搅拌槽的温度控制问题飞船的月球软着陆问题飞船的月球软着陆问题(1/3)(1/3)1) 飞船的月球软着陆问题飞船的月球软着陆问题q 飞船靠其发动机产生一个与月球的重力方向相反的推力,以控制飞船实现软着陆,即落到月球时的速度为零。 问题要求选择发动机推力程序,
4、使飞船携带的燃料最少或着陆时间最短(最速升降问题)。q 设飞船的质量为,高度和垂直速度分别为和,月球的重力加速度可视为常数,飞船的自身质量及所携带的燃料分别为和。 若飞船于某一初始时刻起开始进入着陆过程,由牛顿第二定理和物料(燃料)平衡关系可知,飞船的运动方程为0kkfmgmfvvh飞船的月球软着陆问题飞船的月球软着陆问题(2/3)(2/3) 要求控制飞船从初始状态h(0)=h0, v(0)=v0, m(0)=M+F出发,在某一末态时刻tf实现软着陆,即h(tf)=0, v(tf)=0 控制过程中,推力f(t)不能超过发动机所能提供的最大推力fmax,即-fmaxf(t) fmax 满足上述约
5、束条件,使飞船实现软着陆的推力程序并非一种,其中消耗燃料最少的称为燃料控制问题,着陆时间最短的称为最速升降问题或时间最优控制问题。飞船的月球软着陆问题飞船的月球软着陆问题(3/3)(3/3) 这两个问题可归结为分别求J1=m(tf)J2=m(tf)为最小的数学问题。 间歇化学反应器的最大产量控制问题间歇化学反应器的最大产量控制问题(1/3)(1/3)2) 间歇化学反应器的最大产量控制问题间歇化学反应器的最大产量控制问题q 设间歇化学反应器内进行如下常见的化学反应式中,k1(t)和k2(t)为反应速率常数,并与温度T满足如下关系 该化学反应式可代表一大类化工操作,通常希望中间产物B的产量尽可能大
6、,因而要求防止后面的反应继续进行下去。CBATkTk)()(212 , 1exp)(01iRTEATkii间歇化学反应器的最大产量控制问题间歇化学反应器的最大产量控制问题(2/3)(2/3)q 为更清楚地讨论上述产量最大的控制问题,设化学反应式的第一步反应是二级反应,第二步反应是一级反应。 这样,可得如下间歇化学反应器内的物料平衡方程式中,C1(t)和C2(t)分别是物质A和B的浓度。 将反应速率常数k1(t)和k2(t)代入上式,则有 设反应时间区间t0,tf,反应器内温度T(t)满足T*T(t)T* t0ttf 21111022112220( )( )( )( )1.0( )( )( )(
7、 )( )( )0C tk T CtC tC tk T Ctk T C tC t 2 , 1exp)(01iRTEATkii间歇化学反应器的最大产量控制问题间歇化学反应器的最大产量控制问题(3/3)(3/3) 该问题的目标是确定反应器内温度T(t)应该如何变化,才能使在时刻tf时B物质的产量C2(tf)为最大,即归结到在约束条件下,求J=C2(tf)最大的数学问题。连续搅拌槽的温度控制问题连续搅拌槽的温度控制问题(1/2)1/2)3) 连续搅拌槽的温度控制问题连续搅拌槽的温度控制问题 q 设有一盛液体的连续搅拌槽,如图7-1所示。槽内开始装有0oC的液体,现需将其温度经1小时后升高到40oC。
8、图图7-1 连续搅拌槽示意图连续搅拌槽示意图 为此在入口处以常速流入温度为u(t)的液体,经槽内不停转动的搅拌器使槽内液体温度均衡上升。 在出口处,设流出的液体保持槽内液面恒定,其温度与槽内液体一致。 试寻找u(t)的变化规律,使槽中液体的温度经1小时后上升到40oC,并要求所散失的热量最少。连续搅拌槽的温度控制问题连续搅拌槽的温度控制问题(2/2)2/2)q 因假定槽内液体温度均衡,设为x(t)。 由题设条件可知,x(t)的边界条件为x(0)=0oC, x(1)=40oC 由热力学知识可知,槽内的液体温度的变化率与温差u(t)-x(t)成正比,即式中,k1为比例系数。 我们的目标是确定流入的
9、液体的温度u(t)如何变化,使得散失的热量最少,即归结为在上述状态方程和边界条件下,求函数最小的数学问题。 1( ) ( )( ),( )0, (1)40 x tk u tx tx txC102322d)()(ttuktxkJ最优控制问题的描述最优控制问题的描述(1/1)(1/1)7.1.2 最优控制问题的描述最优控制问题的描述q 从前面的应用实例可以看出,最优控制问题可以抽象成共同的数学问题描述,这将给最优控制理论的研究带来方便。 所谓最优控制问题的描述,就是将通常的最优控制问题抽象成一个统一描述的数学问题,并用数学语言严格地表述出来。 最优控制问题的描述包括: 被控系统的数学模型被控系统的
10、数学模型 目标集目标集 容许控制容许控制 性能指标性能指标 最优控制问题的描述最优控制问题的描述 被控系统的数学模型被控系统的数学模型(1/2)(1/2)1. 被控系统的数学模型被控系统的数学模型q 前面讨论的飞船控制系统和搅拌槽温度系统都是非线性系统,所建立的描述该最优控制问题的数学模型都为状态空间表达式。 因此,对一般被控系统的最优控制问题,其数学模型可以用如下非线性时变系统的状态空间表达式来描述: 式中,x为n维状态向量;u为r维输入向量;y为m维输出向量; f(x,u,t)和g(x,u,t)分别为n维和m维关于状态向量x、输入向量u和时间t的非线性函数向量。),(),(ttuxgyux
11、fx 被控系统的数学模型被控系统的数学模型(2/2)(2/2)q 对许多实际被控系统,在一定精度范围内,其最优控制问题中的数学模型也可以分别采用 线性定常系统、 线性时变系统和 非线性定常系统的状态空间表达式来描述。目标集目标集(1/3)(1/3)2. 目标集目标集q 动态系统在控制u(t)的作用下总要发生从一个状态到另一个状态的转移,这种转移可以理解为状态空间的一个点或系统状态的运动。 在最优控制问题中,系统运动的初始状态(称初态)通常是已知的,即x(t0)=x0为已知, 而所要达到的最终状态(称末态)是控制所要求达到的目标。目标集目标集(2/3)(2/3) 因问题而异,末态可以是状态空间的
12、一个点,更为一般的情况是末态要落在事先规定的范围内,如要求末态满足如下约束条件g1(x(tf),tf)=0 g2(x(tf),tf)0式中,g1(x(tf),tf)和g2(x(tf),tf)为关于末态时刻tf和末态状态x(tf)的非线性向量函数。 上述末态约束条件概括了对末态的一般要求。 实际上,该末态约束条件规定了状态空间中的一个时变的或时不变的集合,此种满足末态约束的状态集合称为目标集,记为M,并可表示为M=x(tf):x(tf)Rn,g1(x(tf),tf)=0,g2(x(tf),tf)0目标集目标集(3/3)(3/3) 需要指出的是,有些最优控制问题并没有对末态加以约束,则该问题的目标
13、集为整个状态空间Rn,但此时并不意味着对末态没有要求,系统还可以通过下面要介绍的性能指标等约束末态。 至于末态时刻tf,它可以事先规定,也可以由对末态的约束条件和性能指标等约束。容许控制容许控制(1/1)(1/1)3. 容许控制容许控制q 输入向量u(t)的各个分量ui(t)往往是具有不同的物理属性和意义的控制量,在实际系统中,大多数控制量受客观条件的限制,只能在一定范围内取值。 如飞船控制系统中控制量有大小范围的限制;又如在控制量为开关量的控制系统中,输入仅能取有限的几个值,如-1,+1。 由控制量约束条件所规定的点集称为控制域,并记为U。 凡在闭区间t0,tf上有定义,且在控制域U内取值的
14、每一个控制函数u(t)称为容许控制,并记为u(t)U。 通常假定容许控制u(t)是一个有界连续函数或者是分段连续函数。性能指标性能指标(1/3)(1/3)4. 性能指标性能指标q 从前面的应用实例可以看出,最优控制问题最后归结到从所有容许控制中找出一种效果最好的控制律,这就需要一个能衡量控制效果好坏或评价控制品质优劣的性能指标函数。 例如, 飞船控制系统要求所携带的燃料最少或到达末态的时间最短,而连续搅拌槽系统的性能指标为一个带函数积分的指标,需求其最小。 由于各种最优控制问题所要解决的主要矛盾不同,设计者的着眼点不同,因此归结出的性能指标是不同的。性能指标性能指标(2/3)(2/3)q 一般
15、形式的性能指标为式中,右边第1项称为末态性能指标,体现了对末态的要求; 第2项称为积分性能指标,体现了对系统状态变化过程中的状态x(t)和u(t)的要求。 在通常情况下,可将各种不同的性能指标视为一般形式的性能指标的一种特例。 如飞船控制系统的性能指标可以视为当S(x(tf),tf)=m(tf) L(x,u,t)=0时上述一般形式性能指标的一个特例。fttffttttLttSJ0d),(),(),(uxx性能指标性能指标(3/3)(3/3)q 性能指标函数又称为指标泛函、目标函数、代价函数和评价函数等。最优控制问题的描述最优控制问题的描述(1/2)1/2)5. 最优控制问题的描述最优控制问题的
16、描述 q 总结上述最优控制问题的数学模型、目标集、容许控制以及性能指标,则最优控制问题的描述可叙述为: 已知被控系统的状态方程及给定的初态为 规定的末态目标集为M=x(tf): x(tf)Rn, g1(x(tf),tf)=0, g2(x(tf),tf)0 求一容许控制u(t)U,tt0,tf,使被控系统由给定的初态x0出发,在tft0时刻转移到目标集M,并使如下性能指标为最小 00( )( ( ), ( ), ),( )ttt tt xf xuxxfttffttttLttSJ0d),(),(),(uxx最优控制问题的描述最优控制问题的描述(2/2)2/2)q 值得注意的是,所谓的“最优性”,是
17、指被控系统相对于性能指标函数意义下的最优性。 不同的性能指标函数,最优控制结果是不相同的。最优控制发展简史最优控制发展简史(1/5)(1/5)7.1.3 最优控制发展简史最优控制发展简史q 20世纪50年代,随着现代化生产的发展,特别是空间技术的发展,被控系统日趋复杂,对自动控制提出的要求愈来愈高。 于是,那种建立在传递函数、频率特性基础上的经典控制理论,日益暴露出它的局限性。 主要表现在: 首先,它只适用于集中参数的SISO线性定常系统,且只适应于以解决伺服系统稳定性为主要目标的设计问题,难以适应综合性能指标设计控制系统的要求。 再者,在应用经典控制理论设计时,需要凭经验试凑及大量手工计算,
18、难以用来解决复杂问题。最优控制发展简史最优控制发展简史(2/5)(2/5) 现代化生产的发展使系统所要求的品质指标,如时间、成本或综合性能指标,取极值直至最优的控制方法成为控制理论与工程的关键问题。q 现代控制理论能处理的问题的范围很广。 原则上,它可以用来处理时变系统、非线性系统、MIMO系统以及分布参数系统的问题。 用它来处理随机系统和离散系统问题同样是很方便的。 最优控制理论是现代控制理论的重要组成部分,同样,它能处理的控制问题的范围也非常广泛。最优控制发展简史最优控制发展简史(3/5)(3/5)q 早在20世纪50年代初期,就发表了用工程观点研究最短时间控制问题的文章,为最优控制理论的
19、发展提供了第一批实际模型。 由于最优控制问题的严格数学表述形式的建立,更因为空间技术的迫切需要,从而引起了一大批数学家的注意。 人们发现,最优控制问题从本质上来说是一个变分学问题。 然而,经典变分学只能解决其容许控制为开集约束的最优控制问题,而更多的实际系统的容许控制属于闭集。 这就要求人们建立求解最优控制问题的新途径。 在种种新方法中,有两种方法最富有成效。最优控制发展简史最优控制发展简史(4/5)(4/5) 一种是前苏联著名数学家庞特里亚金提出的“极大值原理”;另一种是美国数学家贝尔曼的“动态规划”。v 庞特里亚金等人首先把“极大值原理”作为一种猜想提出来,随后不久提供了严格证明,并于19
20、58年在爱丁堡召开的国际数学会议上首次宣读。 “动态规划”是贝尔曼在20世纪50年代研究多阶段离散决策优化问题时逐步创立的,其核心思想为“最优性原理”。v 之后,他发展了变分学中的哈密顿-雅可比(Hamilton-Jacobi)理论,构成了最优控制问题的动态规划法。最优控制发展简史最优控制发展简史(5/5)(5/5)q 50多年来,最优控制理论的研究,无论在深度和广度上,都有较大的发展,诸如分布参数系统的最优控制、随机系统的最优控制、大系统的最优控制和微分对策等等。 随着人们认识世界的不断深入,又提出了一系列有待解决的新课题。 可以毫不夸张地说,最优控制理论仍然是控制理论中的一个极其活跃的研究
21、领域。变分法变分法(1/1)(1/1)7.2 变分法变分法q 本节在讨论变分法之前,先简单讨论多元函数的极值问题,然后引出泛函的极值问题。 内容为 多元函数的极值问题多元函数的极值问题 泛函泛函 欧拉方程欧拉方程 横截条件横截条件 欧拉方程和横截条件的向量形式多元函数的极值问题多元函数的极值问题(1/1)1/1)7.2.1 多元函数的极值问题多元函数的极值问题 q 多元函数极值问题可分为 无约束条件极值问题无约束条件极值问题、 等式约束条件极值问题等式约束条件极值问题和 不等式约束条件极值问题不等式约束条件极值问题。下面分别讨论。 无约束条件的多元函数极值无约束条件的多元函数极值(1/3)(1
22、/3)1. 无约束条件的多元函数极值无约束条件的多元函数极值q 无约束条件的多元函数的极值问题讨论的是: 假定多元函数f(x1,x2,xn)对其所有自变量都连续,且具有连续的一阶和二阶偏导数。 将所有自变量x1,x2,xn记为向量x的形式,则问题为求x,使x=x*时,f(x)达到极小值。 该问题可记为 min( )fxx无约束条件的多元函数极值无约束条件的多元函数极值(2/3)-(2/3)-定义定义7-1 q 函数极小的定义是一个相对概念,并不是在函数的定义域上的一个绝对概念,其基本定义可表述如下。 定义定义7-1 若存在一个0,由x-x*所规定的x*的邻域内总有y(x*)y(x),则称点x*
23、是函数y(x)的一个相对极小点,简称为极小点。 由数学分析知识可知,无约束条件时的多元函数极小值问题的解x*满足如下必要条件0dd)(d0d)(d*2xxxxxxxxxff无约束条件的多元函数极值无约束条件的多元函数极值(3/3)(3/3) 如果函数f(x)对x的二阶导数矩阵在x*为正定矩阵,则上述多元函数极小值问题的必要条件亦为充分条件,即是x*为该多元函数极值问题的解的一个充分条件。0dd)(d0d)(d*2xxxxxxxxxff有等式约束条件的多元函数极值有等式约束条件的多元函数极值(1/5)1/5)2. 有等式约束条件的多元函数极值有等式约束条件的多元函数极值 q 有等式约束条件的多元
24、函数极值问题可描述为式中,g(x)为p维的向量变量x的向量函数,并假定其连续可微; g(x)=0即为等式约束条件。min( )( )0fs.t.xxg x有等式约束条件的多元函数极值有等式约束条件的多元函数极值(2/5)2/5)q 拉格朗日乘子法是解决有等式约束条件的函数极值问题的有效方法,其求解基本方法如下。1) 先引入拉格朗日乘子 =1 2 p,定义如下拉格朗日函数2) 该极值问题的解x*满足如下必要条件 如果函数L(x)对x的二阶偏导数矩阵在x*为正定矩阵,则该必要条件亦为充分条件,即( , )( )( )Lfx x g x*2*(, )0,()0(, )0LL xg xxxx x有等式
25、约束条件的多元函数极值有等式约束条件的多元函数极值(3/5)3/5)例例7-17-1q 例例7-1 求给定关于n维变量向量x的二次型标量函数在约束条件下的极小值。 其中,e为m维常数向量;A,H和b分别为适宜维数的常数矩阵和向量;c为常数。 *2*(, )0,()0(, )0LL xg xxxx x( )fAcxxxb xex H有等式约束条件的多元函数极值有等式约束条件的多元函数极值(4/5)4/5)q 解解 先定义如下拉格朗日函数式中, 为m维拉格朗日乘子向量,那么 当(A+A)可逆时 由约束条件Hx=e,有即( , )()LAcHx xxb xxe0LAAHxbx bxHAA1 ebHA
26、AH1eb111AAHHAAH有等式约束条件的多元函数极值有等式约束条件的多元函数极值(5/5)5/5) 将上述 的表达式代入式(1),可得当矩阵H为行满秩矩阵时,矩阵H(A+A)-1H是可逆的,此时上述解成立。 由极值问题的充分条件可知,当时,上述极值为极小值。 11111AAAAHH AAHH AA xbbe2*(, )0LAA xx x 1(1)AAH xb有不等式约束条件的多元函数极值有不等式约束条件的多元函数极值(1/7)1/7)3. 有不等式约束条件的多元函数极值有不等式约束条件的多元函数极值 q 有不等式约束条件的多元函数极值问题可描述为式中,g(x)为p维的向量变量x的向量函数
27、,并假定其连续可微; 式g(x)=0即为不等式约束, 符号“”的意思为函数向量g(x)中每个元素“小于等于0”。min( )( )0fs.t.xxg x有不等式约束条件的多元函数极值有不等式约束条件的多元函数极值(2/7)2/7)q 有不等式约束条件的函数极值问题的求解比等式约束条件的函数极值问题复杂。 受前面讨论的引入拉格朗日乘子的启发,求解不等式约束的函数极值问题也引入了乘子的概念,其求解基本方法可由如下库恩-塔哈克(Kuhn-Tucker)定理给出。有不等式约束条件的多元函数极值有不等式约束条件的多元函数极值(3/7)3/7)定理定理7-17-1q 定理定理7-1(库恩-塔哈克定理) 对
28、上述不等式约束的极值函数问题,那么必存在p个不同时为零的数1,2,p,满足为式中, =1 2 p为库恩-塔哈克乘子向量; L(x, )为如下库恩-塔哈克函数*i1*1)()00;1,2,.,d()(, )d ()2)0dd3)()01,2,.,ipiiiipgLfgip g xxxxxxxx)()(),(xgxx fL有不等式约束条件的多元函数极值有不等式约束条件的多元函数极值(4/7)4/7)例例7-27-2q 例例7-2 求给定关于n维变量向量x的二次型标量函数解解 先定义库恩-塔哈克函数如下22,2min( , )220s.t.50 x yf x yxyyyx2221212( , ,)2
29、(2)(5)L x yxyyyx 有不等式约束条件的多元函数极值有不等式约束条件的多元函数极值(5/7)5/7) 根据库恩-塔哈克定理,极小值的必要条件如下: 式中,现在依次考虑下述4种可能情况:(1) 1=2=0,即在两个不等式约束的边界之内求解。此时,则由解得x=y=0。由于该问题的第一个不等式约束条件不满足,因此,不是极小解。 21211222220,420(2)0,0(5)0,020,50LLxyyxyyyxyyx 20,40LLxyxy 有不等式约束条件的多元函数极值有不等式约束条件的多元函数极值(6/7)6/7)(2) 1=0,20。因此,有: 解得 上述第一个解中20不满足问题的
30、约束条件,故不为该问题的极小值解;2222042050 xyyyx2221150,6,61022xxxyyy 有不等式约束条件的多元函数极值有不等式约束条件的多元函数极值(7/7)7/7)v只有第三个解满足库恩-塔哈克定理的所有条件,因此是该问题的极小值解。(3) 类似前面求解过程,可知在10,2=0及10,20两种情况下,该问题无解。 综上所述,该极值问题的解为1,6xy 2221150,6,61022xxxyyy 泛函泛函(1/14)1/14)7.2.2 泛函泛函 q 变分法是研究泛函极值问题的一种经典方法,从17世纪末开始逐渐发展成为一门独立的数学分支。 它在力学、光学、电磁学等方面有着
31、极为广泛应用。 下面先讨论泛函的基本概念。q 泛函是函数概念的一种扩充。 函数表示从数到数的对应关系,如y(x)=2x2-x+1规定了自变量x和因变量y之间的对应关系,是数x到数y的一种映射。 而泛函则表示函数y到数J的一种映射关系,见下面的例子。泛函泛函(2/14)2/14)最短弧长问题最短弧长问题 显然,上述弧长的积分式对于任意给定的连续可微的函数y(x)都存在对应的一个积分值,即存在函数y(x)到数S(y(x)的一种映射关系。 因此,有下面泛函的定义。图图7-2最短弧长问题最短弧长问题q 最短弧长问题最短弧长问题 如图7-2所示,设y(x)是连接点(x1,y1)到(x2,y2)的一条曲线
32、。 若y(x)是连续可微的,则A,B两点的区间y(x)的弧长为xxyxySxxd)(1)(212泛函泛函(3/14)3/14)定义定义7-27-2q 定义定义7-2 对于某一类函数集合中的每一个函数y(x),都存在一个确定的数J与之对应,那么就称J为依赖于函数y(x)的泛函,记为J=Jy(x)或简记为J。 相应地,自变量函数y(x)称为宗量。 q 从上述定义可知,泛函规定了数J与函数y(x)的对应关系,可理解为“函数的函数”。 需要强调的是,上述定义中的宗量y(x)是某一特定函数的整体,而不是对应于某一自变量x的函数值y(x)。 为强调泛函的宗量是函数的整体,有时将泛函表示为J=Jy()。泛函
33、泛函(4/14)4/14)q 在泛函的定义中,强调泛函的宗量y(x)属于某一类函数。 由泛函的定义所确定的宗量属于的函数类称为容许函数类或容许函数空间。 如最短弧长问题最短弧长问题中泛函Sy(x)的容许函数类为通过A,B两点的连续可微或分段连续可微的函数。q 线性泛函是研究泛函极值问题的基础,下面先给出线性泛函的定义。泛函泛函(5/14)5/14)定义定义7-37-3q 定义定义7-3 泛函Jy(x)如果满足下列叠加性和齐次性两个条件Jy1(x)+ y2(x)=Jy1(x)+Jy2(x)Jcy(x)=cJy(x)式中,y1(x)和y2(x)为任意的两个函数;c为任意常数。 此时,称Jy(x)为
34、线性泛函。 线性泛函具有可叠加性和齐次性。泛函泛函(6/14)6/14)q 泛函的极值则是在容许函数类中求得使泛函达到极值的函数。 如最短弧长的例子中,就是从函数序列中求得一个使最短的函数。 在不考虑约束的条件下,连接两点的是一条连接两点的直线。q 为导出泛函的极值条件,还需要定义宗量和泛函的变分。为此,不妨回顾一下函数微分的定义。泛函泛函(7/14)7/14)q 若函数y=f(x)具有连续的导数,则它的增量可以表示如下 上式右边第1项是x的线性函数,第2项是x的高阶无穷小量。 因此,当x充分小时,第1项起主要作用,它与y很接近。 所以,第1项为函数增量的线性主部,亦称为函数的微分,记为q 类
35、似于上述变量x和函数y(x)的微分的定义,泛函宗量和泛函的变分的定义如下。),()()()(xxrxxfxfxxfyxxfyd)(d泛函泛函(8/14)8/14)定义定义7-4,7-57-4,7-5q 定义定义7-4 泛函宗量的变分是指同一函数类中两函数之差,记为 q 显然,宗量的变分y(x)也是独立的自变量x的函数。q 定义定义7-5 若连续泛函Jy(x)的增量可以表示为式中,右边第1项为y(x)的线性连续泛函, 第2项为关于y(x)的高阶无穷小。 那么,则将第1项称为泛函Jy(x)的变分,并记为0( )( )( )y xy syx ( ) ( )( ) ( )( ( ),( )( ( ),
36、( )J y xJ y xy xJ y xL y xy xr y xy x)(),(xyxyLJ泛函泛函(9/14)9/14)q 如同函数的微分是函数的增量的线性主部一样,泛函的变分是泛函的增量的线性主部,所以,泛函的变分也可以称为泛函的微分,此时称泛函是可微的。q 引理引理7-1 泛函Jy(x)的变分为 q 证明证明 可微泛函的增量可以写作 0 ( )( )JJ y xy x ( ) ( )( ) ( )( ( ),( )( ( ),( )J y xJ y xy xJ y xL y xy xr y xy x泛函泛函(10/14)10/14) 由于L(y(x),y(x)是关于y(x)的线性连续
37、泛函,且r(y(x),y(x)为y(x)的高阶无穷小,因此有 故( ( ),( )( ( ),( )L y xy xL y xy x00( ( ),( )( ( ),( )LimLim( )0( )r y xy xr y xy xy xy xJxyxyLxyxyrxyxyLxyJxyxyJxyxyJ)(),(Lim)(),()(),(Lim)()()(Lim)()(0000泛函泛函(11/14)11/14)例例7-37-3q 此引理,可将求泛函的变分化为求函数的微分,因此可以利用函数的微分法则,方便地计算泛函的变分。q 例例7-3 求如下泛函的变分。 q 解解120( )dJyx x120 0
38、 011200 0 ( ) d( )d2 ( ) ( )dJJ yyyyxyyxy xy xx泛函泛函(12/14)12/14)定理定理7-27-2q 由上述例子可以看出,根据引理7-1,计算泛函的变分如同计算函数的微分一样简单。 基于上述泛函变分的定义和计算方法,有如下泛函Jy(x)的极小值定理。q 定理定理7-2 若可微泛函在y0(x)上达到极小(极大)值,则在y=y0(x)上有 q 证明证明 对于任意给定的y来说,Jy0+y是实变量的函数。 根据定理的假设可知,变量的函数Jy0+y在=0上达到极值。0J泛函泛函(13/14)13/14) 由函数极值的必要条件,有 由引理7-1可知,上式的
39、左边等于泛函Jy(x)的变分,即J。 因 此 , 考 虑 到 变 分 y 的 任 意 性 , 从 而 定 理 得 证 。 0 0J yy泛函泛函(14/14)14/14)q 泛函的变分实际上就是关于其宗量变分y(x)的线性连续泛函,因此,在实际求解过程中,可以通过求泛函对其所有宗量的一阶偏微分得到泛函的变分。 泛函Jy1(x),y2(x),ym(x)的变分为q 在本书后面的部分,将经常使用上述计算式计算变分。 利用上式重新计算例7-3,可以得到相同的结论。1212( )( )( )( )( )( )mmJJJJy xy xyxy xy xyx欧拉方程欧拉方程(1/4)1/4)7.2.3 欧拉方
40、程欧拉方程q 从容许函数类中求某一函数x(t),使积分型泛函 取极小的变分问题,通常称为拉格朗日问题。 它是古典变分学中3个基本问题之一。 前面讨论的最短弧长问题即属于拉格朗日问题。 此外,三个变分基本问题还有麦耶尔(Mayer)问题和波尔扎(Bolza)问题。fttttxtxtFJ0d)(),(,(欧拉方程欧拉方程(2/4)2/4)q 所谓麦耶尔问题,是指使末值型泛函取极小的变分问题。 波尔扎问题是指使复合型泛函取极小的变分问题。q 容易看出,拉格朗日问题和麦耶尔问题可以看成波尔扎问题的一种特例,波尔扎问题是最一般形式的变分问题。 可以证明,上述3个问题可以互相转换。( (),)ffJx t
41、tfttfttxtxtLttxSJ0d)(),(,(),(欧拉方程欧拉方程(3/4)3/4) 比如,若令假定初值S(x(t0),t0)恒定不变,则波尔扎问题就可以化为一个等价的拉格朗日问题。 若引进一个新的变量x0(t),使 令则又可把波尔扎问题化为一个等价的麦耶尔问题。FSL000( )( , ( ), ( )( )0 x tL t x t x tx t0( (),)( (),)()fffffx ttS x ttx t欧拉方程欧拉方程(4/4)4/4)q 某些实际的变分问题,其原始形式可能不属于这3个基本变分问题中的一个,但都可经数学变换将其化为3个基本变分问题之一。 因此,研究3个基本变分
42、问题的任何一个都具有普遍意义。 下面就分别介绍 变分法的基本预备定理变分法的基本预备定理 拉格朗日极值问题的必要条件拉格朗日极值问题的必要条件-欧拉方程欧拉方程。变分法的基本预备定理变分法的基本预备定理(1/4)(1/4)定理定理7-37-31. 变分法的基本预备定理变分法的基本预备定理q 定理定理7-37-3 如果函数F(t)在区间t0,tf上是连续的,而且对于只满足某些一般条件的任意选定的函数(t) 如,(t)为一阶或若干阶可微函数,在t0,tf上的端点处(t0)=(tf)=0,并且|(t0)|,或|(t0)|且|(t0)|0,x1,x2XRn,uURrq 下面叙述用增量法证明极大值原理的
43、过程,证明步骤为: 泛函泛函J的增量的增量 x(t)的表达式的表达式 对对x(t)的估计的估计 极值条件的推证极值条件的推证 tf的考虑的考虑然后介绍一基于极大值原理的最优控制算例最优控制算例泛函泛函J的增量的增量(1/2)1/2)(1) 泛函泛函J的增量的增量q 假定末态时刻tf已知,根据S(x(tf)对x(tf)的连续可微性泛函J的增量J可表示为式中u*(t)和x*(t)分别表示最优控制函数及相应的最优轨线; x(t)为x(t)在最优轨线x*(tf)附近的变分;o(x(tf)表示泰勒展开式中x(tf)的高阶项。)()()()()()()()()()(*ffffffftotttStSttSJ
44、JJxxxxxxxuuuJu()=S(x(tf)泛函泛函J的增量的增量(2/2)2/2)q 要从Ju*()0的条件导出最优控制必要条件, 首先应找出x(t)与控制量u(t)的变分u(t)的关系, 进而对x(t)作出估计。 下面为表述更简洁,时间函数x(t)与u(t)的时间变量t略去不写。 x(t)的表达式的表达式(1/3)1/3)(2) x(t)的表达式的表达式q 根据f(x,u)对x的可微性,由状态方程(7-92)可得如下由控制量的变分u(t)引起的状态方程(7-92)的变分*(,)(,)(,)(,)(,)()(,)(,)(,)(,)(,)()oo xf xx uuf x uf x uuf
45、x uuf x uxxxf x uxf x uuf x uxf x uuf x uxxxx( )( ( ), ( )(792)tttxf xu x(t)的表达式的表达式(2/3)2/3) 令矩阵函数(t,s)为线性状态方程的状态转移矩阵,即(t,s)满足如下微分方程组 考虑到x(t0)=0,则x(t)在t=tf时的解为*( ),( )( )( )ttttf xuxxxIsssttttst),(),()(),(d),(d*xuxf000*()(, )( ),( )( )( ),( ) d( ),( )( )( ),( )(, )( )d(, ) ( ) )dffftffttfttftttssss
46、sssssssstsssts oss xf xuuf xuf xuuf xuxxxx x(t)的表达式的表达式(3/3)3/3) 将上述方程代入式(7-98),则得泛函J的增量J为 上式虽然给出了泛函增量J与u和x的关系,但是对一般形式的u,还很难估计上式的J。 因为对任意的u,上式成立,故对特定的u也应成立。 为此,下面讨论取一特定的变分u,以利于对上式的估计。000*()(, )(,)(,) d()()(,)(,)(, )( )d()()(, ) ( ) )d()()ffftfftftfftftffftfStJtsstSttssstStts ossott xf xuuf xuxxf xuu
47、f xuxxxxxxxx*()()()(798)()ffffStJtott xxxx对对x(t)的估计的估计(1/11)1/11)(3) 对对x(t)的估计的估计q 设u(t)是控制u(t)的任意变分,对应x(t)的增量x(t)应满足如下方程 将上式的第一式改写为0( )(,)( , )( )0tt xf xx uuf x ux(,)( ,)( ,)( , ) xf xx uuf x uuf x uuf x u对对x(t)的估计的估计(2/11)2/11)q 对于给定的u(t)和u(t),由于它们的分段连续性,必存在有界的U1U及XRn,使u(t)+u(t)U1,x(t)X,对所有的tt0,t
48、f,根据李卜希茨条件,必存在0,满足f(x+x,u+u)-f(x,u+u)0,则f(x,u+u)-f(x,u)|b(t)| tt0,tf其中 于是由式(7-105)可知,x(t)满 0( )0( )0( )0tb tbtuu( )( )( )tatb txx(,)( ,)( ,)( , )(7105) xf xx uuf x uuf x uuf x u对对x(t)的估计的估计(3/11)3/11)引理引理7-27-2q 为了作进一步的估计,下面先引入一个引理。q 引理引理7-2q 证明证明 由欧几里德范数(2-范数)的定义,有 从而有证毕 ddt xx 1d12d2niiixxt xxxxxx
49、xxx1/221niixx对对x(t)的估计的估计(4/11)4/11)q 因此,由引理7-2和式(7-109),有即 将两边乘以e-t,得 解得d( )( )( )dtatb ttxxd( )( )datateteb ttxd( )( )( )dtatb ttxx( )( )( )(7109)d72dtatb tt xxxx引理ttstassbet0d)()()(x对对x(t)的估计的估计(5/11)5/11)q 至今我们还没有对u(t)作任何限制。 为了使变分后的控制u(t)仍属于容许控制空间,即u(t)U,对所有的tt0,tf,并且利于导出极值求解条件,采用一种异于古典变分的特定形式的变
50、分-针状变分。图图7-5 针状变分示意图针状变分示意图 令为最优控制u*(t)的任意一个连续点,l0是某一确定的数,0是一个充分小的数。 可将控制量的变分u(t)取成一个依赖于,l和的针状变分,如图7-5所示。对对x(t)的估计的估计(6/11)6/11) 上述针状变分记为u(t),可表示为 式中, U表示任意容许控制,这就是说,在充分小的时间区间,+l内, 可以取控制域U内的任何点。 当然,也可以取闭集上的点。 所以变分 是一个有限量。 但当是一个充分小的量时,则由u(t)所引起的变分x(t)仍可能是一个充分小的量。其它)(,)()(*tltttuuuuuu*( )( ) ,tttl uuu