变分法与最优控制课件.ppt_163文库

资源描述

1、变分法与最优控制变分法与最优控制主要内容主要内容2.1 变分法概述2.2 无约束最优化问题无约束固定端点泛函极值必要条件无约束自由端点泛函极值必要条件2.3 等式约束最优化问题2.4 变分法求解最优控制问题引入哈密顿函数求解拉格朗日问题求解综合型（波尔扎）问题2.1 变分法概述1、泛函定义2、泛函的连续性3、泛函的极值4、线性泛函5、泛函的变分6、泛函变分的求法7、泛函变分的规则8、泛函极值的条件2.1 变分法概述变分法概述1、泛函定义、泛函定义l定义：定义：如果变量如果变量y对于某一函数类中的每一个函数对于某一函数类中的每一个函数x(t)，都有一个都有一个确定的值确定的值与之对应，那么就与之

2、对应，那么就称变量称变量y为依赖于函数为依赖于函数x(t)的泛函，记为：的泛函，记为：y=J x(t)。说明：说明：由于函数的值是由自变量的选取而确定的，而泛函的值是由自变量的函数的选取而确定的，所以将泛函理解为“函数的函数”。【例2.1】是一个泛函。变量J的值是由函数x(t)的选取而确定。当时,有。当时,有。【例2.2】曲线的弧长求：平面上连接给定两点A(x0，y0)和B(x1，y1)的曲线的弧长 J。A、B两点间的曲线方程为：y=f(x)A、B两点间的弧长为：dxdxdyJxx1021 泛函的上述概念，可以推广到含有几个函数的泛函的情况，例如：10)()(dttytxJdtttxt

3、xLtxJftt0),(),()(求一般函数极值微分法求泛函极值变分法2 2、泛函的连续性、泛函的连续性l函数相近(零阶相近)当函数x(t)与 x0(t)之差的绝对值，即 x(t)-x0(t),t1t t2 对于x(t)的定义域中的一切t（t1 t t2）都很小时，称函数x(t)与函数x0(t)是相近的，也称为零阶相近。l一阶相近当函数x(t)与 x0(t)之差的绝对值以及它们的一阶导数和之差的绝对值，即 t1 t t2 都很小，称函数x(t)与函数x0(t)是一阶相近的。)(tx)(0tx)()()()(00txtxtxtx和注意：一阶相近的两个函数，必然是零阶相近，反之不成立。l

4、K阶相近当 t1 t t2 都很小时，称函数x(t)与函数x0(t)是k阶相近的。)()(,)()(,)()()(0)(00txtxtxtxtxtxkkl函数间距离在不同的函数空间，函数间的距离定义也不同。l在函数空间Ca，b（在区间a，b上连续的函数的全体构成的函数空间）中，通常采用下式定义距离：l在函数空间Cka，b（在区间a，b上连续且具有连续的k阶导数的函数的全体构成的函数空间）中，任意两个函数间的距离定义为：)()(max)(),(00txtxtxtxdbta)()(,)()(,)()(max)(),()(0)(000txtxtxtxtxtxtxtxdkkbta显然，式（2.1）

5、定量地表示两个函数之间的零阶相近度，而式（2.1）定量地表示两个函数之间的k阶相近度。（2.1）（2.2）零阶距离零阶距离零阶距离零阶距离l函数间距离在不同的函数空间，函数间的距离定义也不同。l在函数空间Ca，b（在区间a，b上连续的函数的全体构成的函数空间）中，通常采用下式定义距离：l在函数空间Cka，b（在区间a，b上连续且具有连续的k阶导数的函数的全体构成的函数空间）中，任意两个函数间的距离定义为：)()(max)(),(00txtxtxtxdbta（2.1）零阶距离零阶距离零阶距离零阶距离)()(,)()(,)()(max)(),()(0)(000txtxtxtxtxtxtxtxdk

6、kbtal函数间距离在不同的函数空间，函数间的距离定义也不同。l在函数空间Ca，b（在区间a，b上连续的函数的全体构成的函数空间）中，通常采用下式定义距离：l在函数空间Cka，b（在区间a，b上连续且具有连续的k阶导数的函数的全体构成的函数空间）中，任意两个函数间的距离定义为：)()(,)()(,)()(max)(),()(0)(000txtxtxtxtxtxtxtxdkkbtal函数间距离在不同的函数空间，函数间的距离定义也不同。l在函数空间Ca，b（在区间a，b上连续的函数的全体构成的函数空间）中，通常采用下式定义距离：l在函数空间Cka，b（在区间a，b上连续且具有连续的k阶导数的函

7、数的全体构成的函数空间）中，任意两个函数间的距离定义为：)()(,)()(,)()(max)(),()(0)(000txtxtxtxtxtxtxtxdkkbtal函数间距离在不同的函数空间，函数间的距离定义也不同。l在函数空间Ca，b（在区间a，b上连续的函数的全体构成的函数空间）中，通常采用下式定义距离：l在函数空间Cka，b（在区间a，b上连续且具有连续的k阶导数的函数的全体构成的函数空间）中，任意两个函数间的距离定义为：)()(,)()(,)()(max)(),()(0)(000txtxtxtxtxtxtxtxdkkbtal函数间距离在不同的函数空间，函数间的距离定义也不同。l在函数

8、空间Ca，b（在区间a，b上连续的函数的全体构成的函数空间）中，通常采用下式定义距离：l在函数空间Cka，b（在区间a，b上连续且具有连续的k阶导数的函数的全体构成的函数空间）中，任意两个函数间的距离定义为：)()(,)()(,)()(max)(),()(0)(000txtxtxtxtxtxtxtxdkkbtal函数间距离在不同的函数空间，函数间的距离定义也不同。l在函数空间Ca，b（在区间a，b上连续的函数的全体构成的函数空间）中，通常采用下式定义距离：l在函数空间Cka，b（在区间a，b上连续且具有连续的k阶导数的函数的全体构成的函数空间）中，任意两个函数间的距离定义为：)()(,)()

9、(,)()(max)(),()(0)(000txtxtxtxtxtxtxtxdkkbtal函数间距离在不同的函数空间，函数间的距离定义也不同。l在函数空间Ca，b（在区间a，b上连续的函数的全体构成的函数空间）中，通常采用下式定义距离：l在函数空间Cka，b（在区间a，b上连续且具有连续的k阶导数的函数的全体构成的函数空间）中，任意两个函数间的距离定义为：k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离l函数间距离在不同的函数空间，函数间的距离

10、定义也不同。l在函数空间Ca，b（在区间a，b上连续的函数的全体构成的函数空间）中，通常采用下式定义距离：l在函数空间Cka，b（在区间a，b上连续且具有连续的k阶导数的函数的全体构成的函数空间）中，任意两个函数间的距离定义为：零阶距离零阶距离零阶距离零阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离l函数间距离在不同的函数空间，函数间的距离定义也不同。l在函数空间Ca，b（在区间a，b上连续的函数的全体构成的函数空间）中，通常采用下式定义

11、距离：l在函数空间Cka，b（在区间a，b上连续且具有连续的k阶导数的函数的全体构成的函数空间）中，任意两个函数间的距离定义为：l泛函的连续性如果对于任意给定的正数，可以找到这样一个0，当 dx(t)，x0(t)时，存在 Jx(t)Jx0(t)那么，就说泛函J在点x0(t)处是连续的。根据所采用的函数之间距离定义的不同，对应的泛函分别称为零阶连续泛函(2.1)或k阶连续泛函(2.2)。3 3、泛函的极值、泛函的极值l如果是在与仅仅具有零阶接近度的曲线的泛函中比较得出的极值，称为强极值。l如果是在与具有一阶或一阶以上接近度的曲线的泛函中比较得出的极值，则称为弱极值。)(0txJ)(0tx)

12、(tx)(0txJ)(0tx)(tx4 4、线性泛函、线性泛函连续泛函如果满足下列条件：（1）叠加原理：Jx1(t)+x2(t)=Jx1(t)+Jx2(t)（2）齐次性：Jcx(t)=c Jx(t)其中，c是任意常数，就称为线性泛函。例如：21)()(sin)()(ttdttxtttxtxJ21)()()()()(ttdttxtqtxtptxJ2)()(ttxtxJ都满足上述两个条件，故均为线性泛函。5 5、泛函的变分、泛函的变分l宗量的变分宗量的变分若函数x(t)是变量J的自变量函数，则称x(t)为泛函Jx(t)的宗量函数。宗量的变分是指在同一函数类中的两个宗量函数间的差：)(),(tx

13、txLJ也就是说，泛函的变分是泛函的变分是泛函增量的线性主部泛函增量的线性主部。当一个泛函具有变分时，称该泛函是可微的泛函是可微的。l泛函的变分泛函的变分当宗量x(t)有变分时，泛函的增量可以表示为)()()()(txJtxtxJtxJ)(),()(),(txtxrtxtxL其中，Lx(t)，x(t)是关于x(t)的线性连续泛函；rx(t)，x(t)是关于x(t)的高阶无穷小；Lx(t)，x(t)称为泛函的变分，记为线性线性主部主部6 6、泛函变分的求法、泛函变分的求法定理定理2 21 1 连续泛函J(x)的变分，等于泛函对的导数在=0 时的值.即定理定理2 22 2 连续泛函J(x)的二

14、次变分定义为（证明略）（证明略）7 7、泛函变分的规则、泛函变分的规则求泛函的变分。【例2.3】8 8、泛函极值的条件、泛函极值的条件泛函极值的泛函极值的必要条件必要条件：定理定理2 23 3 连续可微泛函J(x)在x0(t)上达到极值的必要条件为：J(x)在x=x0处必有泛函极值的泛函极值的充要条件充要条件：定理定理2 24 4 设可微泛函J(x)存在二次变分，则在x=x0处达到极小值的充要条件为：同理，设可微泛函J(x)存在二次变分，则在x=x0处达到极大值的充要条件为：主要内容主要内容2.1 变分法概述2.2 无约束最优化问题无约束固定端点泛函极值必要条件无约束自由端点泛函极值必要条件

15、2.3 等式约束最优化问题2.4 变分法求解最优控制问题引入哈密顿函数求解拉格朗日问题求解综合型（波尔扎）问题2.2 无约束最优化问题无约束最优化问题1 1、无约束固定端点泛函极值必要条件、无约束固定端点泛函极值必要条件),(),(ttxtxL问题问题 2-12-1无约束固定终端泛函极值问题为无约束固定终端泛函极值问题为:其中,及x(t)在t0,tf上连续可微，t0及tf固定，nRtx)(求满足上式的极值轨线x*(t)。x(t0)=x0，x(tf)=xf，fttdtttxtxLtxJ0),(),()(),(),(ttxtxL定理定理2 25 5 若给定曲线x(t)的始端x(t0)=x0和终端x

16、(tf)=xf，则泛函达到极值的必要条件是，曲线x(t)满足欧拉方程其中x(t)应有连续的二阶导数，则至少应是二次连续可微的。欧拉(Euler)方程（证明略）边界条件0 xxLdtdL或欧拉方程的全导数形式欧拉方程的全导数形式在中，第二项为全导数)(txLdtd令),(txxgxLdtdzxLdtddtdtxLtdtdxxLxdtxdxLxxtLdtdxxxLdtxdxL222202222xLxxxLxxtLxL 0 xxxxt xxLxLxLL 得欧拉方程的全导数形式或【例2.4】求泛函在边界条件下的极值曲线及极值.几种特殊的欧拉方程（可以得到封闭形式的解）几种特殊的欧拉方程（可以得

17、到封闭形式的解）被积函数L不依赖于，即被积函数L不依赖于x，即被积函数L不依赖于t，即在这种情况下，欧拉方程的首次积分为其中c是待定的积分常数。实际上，将上式左边对t求全导数，有x),(txLL),(txLL),(xxLLcLxLxxxxxxxxxLxxLxLxLxLxLxLdtd 2)(0)(xxxxxLxLxLx cLxLxx xtxtxL),(),(0 xxxxt xxLxLxLL 被积函数L 线性地依赖于，即【例2.5】最速降线(又称捷线)问题设在竖直平面内有两点A和B，它们不在同一条铅垂线上。现有一质点受重力的作用自较高的A点向较低的B点滑动，如果不考虑各种阻力的影响，问

18、应取怎样的路径，才能使所经历的时间最短？在A、B两点所在的竖直平面内选择一坐标系，如上图所示。A点为坐标原点，水平线为x轴，铅垂线为y轴。结论:最速降线是一条圆滚线。对于向量空间的泛函，也存在着欧拉方程，不过是欧拉方程组（即向量欧拉方程）。定理定理2 26 6 在n维函数空间中，若极值曲线X(t)=x1(t),x2(t),xn(t)T的始端X(t0)=x1(t0),x2(t0),xn(t0)T和终端X(tf)=x1(tf),x2(tf),xn(tf)T是给定的，则泛函fttdtttXtXLtXJ0),(),()(达到极值的必要条件是曲线X(t)满足向量欧拉方程0XXLdtdL其中X(t)应有连

19、续的二阶导数，而则至少应是二次连续可微的。),(),(ttXtXL向量欧拉方程向量欧拉方程或0XLdtdXL向量欧拉方程向量欧拉方程向量欧拉方程可写成标量方程组0XLdtdXL0002211nnxLdtdxLxLdtdxLxLdtdxL【例2.6】求泛函满足边界条件的极值函数。2022212121)2()(),(dtxxxxtxtxJ1)2(,0)0(,1)2(,0)0(2211xxxx思考：能否利用MATLAB符号工具箱求解微分方程组？当极值曲线x*(t)的端点变化时，要使泛函达到极小值，x*(t)首先应当满足欧拉方程：fttttxtxLtxJ0),(),()(0 xxLdtdL若端

20、点固定,可以利用端点条件:ffxtxxtx)()(00确定欧拉方程中的两个待定的积分常数。问题：问题：若端点可变，如何确定这两个积分常数？若端点可变，如何确定这两个积分常数？2.2 无约束最优化问题无约束最优化问题2、无约束自由端点泛函极值必要条件（横截条件）、无约束自由端点泛函极值必要条件（横截条件）图形分析图形分析 ,都固定，图a 即)(0tx)()(*fftxtx即 0)(0tx0)(ftx 固定,自由图 b)()(00*txtx0)(0tx即因为自由所以0)(ftx0)(ftx 终端仅在上滑动 ftt 求出最优许多状态轨线)(ftx)()(00*txtx)(0tx)(ftx

21、)(tx)(0tx)(ftx)(ftx)(tx)(ftx)(0tx)(ftx 自由，固定，图c 则横截条件变为：fxffxtx)(0)(0tx始端仅在上滑动 0tt 端点变动的情况：自由端点，无约束条件的变分，如图:始点在曲线上变动 0 x)(tx终点在曲线上变动 fx)(tx)(0tx)(ftxt)(ftx)(0tx)(tx)(t0 xfxfftt0t00ttft)(0th)(t)(tx)()(thtx)(th)(fth)(tx0)(*0ttxLxL0)(*fttxLxL问题描述：问题描述：假定极值曲线的始端A(t0，x0)是固定的，而终端B(tf，xf)是可变的，并沿着给定的曲线

22、)()(ffttx现在的问题是：需要确定一条从给定的点A(t0，x0)到给定的曲线上的某一点B(tf，xf)的连续可微的曲线x(t)，使得泛函fttttxtxLtxJ0),(),()(达到极小值。变动，如右下图所示。)(ft横截条件定理定理2-72-7 若曲线x(t)由一给定的点(t0，x0)到给定的曲线x(tf)=(tf)上的某一点(tf，xf)，则泛函fttttxtxLtxJ0),(),()(达到极值的必要条件必要条件是，x(t)满足欧拉方程0 xxLdtdL和横截条件0)(*fttxLxL其中x(t)应有连续的二阶导数，则至少应是二次连续可微的，而(t)则应有连续的一阶导数。),(),

23、(ttxtxL（证明略）若极值曲线的始端不是固定的，并沿着曲线)()(00ttx变动，则同样可以推导出始端的横截条件0)(*0ttxLxL定理定理2-72-7扩展扩展根据定理定理2-7和上式，可得到端点可变时，Lagrange问题的解，除有欧拉方程外，还有横截条件：(1)始端、终端可变，即x(t0)=(t0)，x(tf)=(tf)，则横截条件为：0)(*0ttxLxL0)(*fttxLxL(2)当t0、tf 可变，而x(t0)与x(tf)固定时，则横截条件为：,0*0ttxLxL0*fttxLxL(3)当t0、tf 固定，而x(t0)与x(tf)可变时，即始端与终端分别在t=t0、t=tf上

24、滑动，则横截条件为：0*0ttxL0*fttxL横截条件总结横截条件总结定理2-7和以上几种情况的横截条件，都可以将其推广到n维函数向量X(t)=x1(t),x2(t),xn(t)T的泛函的情形。定理定理 2-82-8 在n维函数空间中，若曲线X(t)=x1(t),x2(t),xn(t)T 的始端 X(t0)=x1(t0),x2(t0),xn(t0)T是固定的，而终端X(tf)=x1(tf),x2(tf),xn(tf)T是可变的，且在曲面X(tf)=(tf)上变动，则泛函fttdtttXtXLtXJ0),(),()(达到极值的必要条件是，曲线X(t)满足向量欧拉方程0XXLd

25、tdL和横截条件0)(*fttXTLXL 若曲线X(t)=x1(t),x2(t),xn(t)T的始端不是固定的，而是可变的，并在给定的曲面)()(00ttX上变动，其中，则同样可以推导出始端的横截条件为：Tntttt)(,),(),()(0020100)(*0ttXLXL【例2.7】泛函求极值若x(0)与x(2)任意，求极值曲线x*及极值J(x*).dtxxxxxxJx20221)(min【例2-8】求固定点A（0，1）到给定直线的弧长最短的曲线方程tt 2)(主要内容主要内容2.1 变分法概述2.2 无约束最优化问题无约束固定端点泛函极值必要条件无约束自由端点泛函极值必要条件2.3 等式

26、约束最优化问题2.4 变分法求解最优控制问题引入哈密顿函数求解拉格朗日问题求解综合型（波尔扎）问题回顾等式约束条件下函数极值问题的解法设有函数),(yxgZ（2.2）现在需要求函数Z在以下约束条件下的极值。0),(yxf（2.1）（1）消元法：从约束条件（2.2）中将y解出来。用x表示y，即 y=y(x)然后将y(x)代入g(x,y)中，得到 Z=gx,y(x)（2.3）这样，函数Z只含有一个自变量x.等式等式(2.2)约束条件下的函数约束条件下的函数(2.1)极值问题极值问题无约束条件的函数无约束条件的函数(2.3)极值问题极值问题存在两个问题：从方程(2.2)中将y解出来往往很困难；对

27、x和y这两个自变量未能平等看待。（2）拉格朗日乘子法（Lagrange factor）步骤如下：作一个辅助函数 F=g(x,y)+f(x,y)式中，是待定常数，称为拉格朗日乘子；0,0yFxF(2.4)联立求解方程（2.2）和（2.4），求出驻点（x0，y 0）和待定常数值;判断（x0，y 0）是否是函数g(x,y)的极值点。（2.2）0),(yxf约束条件约束条件求辅助函数F的无条件极值，即令Lagrange函数函数等式约束条件下的函数极值问题等式约束条件下的函数极值问题无约束条件的函数极值问题无约束条件的函数极值问题（2）拉格朗日乘子法（Lagrange factor）扩展：扩展：1、拉

28、格朗日乘子法对于求n元函数Z=g（x1，x2，xn）在约束条件下的极值问题，同样适用。2、拉格朗日乘子法对于求在多个约束方程 fi（x1，x2，xm）=0，i=1，2，m；下的极值问题，同样适用。3、m n是必要的。向量向量函数函数向量向量方程约束方程约束2.3 等式约束最优化问题等式约束最优化问题1 1、等式约束固定终端泛函极值必要条件、等式约束固定终端泛函极值必要条件问题问题 2-22-2等式约束固定端点泛函极值问题为等式约束固定端点泛函极值问题为:情况下的极值轨线X*(t)。（2.5）求泛函fttdtttXtXgJ0),(),(在约束方程为,0),(),(0ftttttXtXf和端点条件

29、为ffXtXXtX)()(00（2.6）向量形式向量形式【解决方法】引入拉格朗日向量乘子，将等式约束泛函极值问题转化为无约束泛函极值问题。步骤如下：（1）构造辅助泛函其中(t)=1(t),2(t),m(t)T是m维待定向量乘子。（2.7）无约束条件的泛函（无约束条件的泛函（2.72.7）极值问题）极值问题有约束条件（有约束条件（2.62.6）的泛函（）的泛函（2.52.5）极值问题）极值问题dtttXtXftttXtXgJfttT0),(),()(),(),(0（2）令写出欧拉方程 0XXLdtdL),(),()(),(),(ttXtXftttXtXgLT（3）联立求解欧拉方程（2.8）和

30、约束方程（2.6），可以得到n维向量函数X(t)和m维向量乘子(t)。（4）利用端点条件确定欧拉方程解中的2n个积分常数，得到候选函数X*(t)。（5）检验候选函数X*(t)是否使泛函（2.7）达到极值，以及是极大值还是极小值。（2.8）定理2-92-9 如果n维向量函数 X(t)=x1(t),x2(t),xn(t)T 能使泛函fttdtttXtXgJ0),(),(在等式约束,0),(),(0ftttttXtXf条件下达到极值，这里f是m维向量函数，m n，必存在适当的m维向量函数 (t)=1(t),2(t),m(t)T 使泛函dtttXtXftttXtXgJfttT0),(),()(),

31、(),(0达到无条件极值。即函数X(t)是上述泛函J0的欧拉方程0XXLdtdL的解，其中),(),()(),(),(),(ttXtXfttttXtXgLT而X(t)和(t)由欧拉方程和约束方程共同确定。无约束条件的泛函无约束条件的泛函J J0 0极值问题极值问题有约束条件的泛函有约束条件的泛函J J极值问题极值问题等价等价证明：证明：202)(21dttxJ 取极小值。给定的边界条件为0)2(,1)0(,0)2(,1)0(xxxx例例2-92-9 已知受控系统的动态结构如图所示。求最优控制u*(t)及最优轨线x*(t)，使目标泛函2.3 等式约束最优化问题等式约束最优化问题2 2、等式约束自

32、由端点泛函极值必要条件、等式约束自由端点泛函极值必要条件如何求解？如何求解？主要内容主要内容2.1 变分法概述2.2 无约束最优化问题无约束固定端点泛函极值必要条件无约束自由端点泛函极值必要条件2.3 等式约束最优化问题2.4 变分法求解最优控制问题引入哈密顿函数求解拉格朗日问题求解综合型（波尔扎）问题2.4 变分法求解最优控制问题变分法求解最优控制问题当状态变量和控制变量均不受约束，即X(t)Rn，U(t)Rm时，最优控制问题是个在等式约束条件下求泛函极值的变分问题，因此，可以利用在上一节中介绍的拉格朗日乘子法来求解。在这一节中，利用拉格朗日乘子法求解最优控制问题时，将引入哈密顿（Hami

33、lton）函数，推导出几种典型的最优控制问题应满足的必要条件。2.4 变分法求解最优控制问题变分法求解最优控制问题1 1、引入哈密顿函数求解拉格朗日问题、引入哈密顿函数求解拉格朗日问题),(),()(ttUtXftX(2.10)初始条件00)(XtX(2.9)终端条件：tf固定，X(tf)自由和性能泛函fttdtttUtXLJ0),(),(2.11)给定系统状态方程要求从容许控制U(t)Rm中确定最优控制U*(t)，使系统（2.9）从给定的初态X(t0)转移到某个终态X(tf)，并使性能泛函（2.11）达到极小值。这是拉格朗日问题，又称为积分型最优控制问题。问题问题 2-32-3 解：将状态方

34、程（2.9）改写为0)(),(),(tXttUtXf(2.12)最优控制问题微分方程（2.12）在约束条件下求泛函极值的变分问题。fttdtttUtXLJ0),(),(),(),()(ttUtXftX利用拉格朗日乘子法，引入n维拉格朗日乘子向量(t)=1(t),2(t),n(t)T(t)称为协态变量，以便与状态变量相对应。fttTdttXttUtXftttUtXLJ0)(),(),()(),(),(0(2.13)dtttUttXtXFftt0),(),(),(),(求泛函在等式约束条件下的极值问题求泛函（2.13）J0的无约束条件的极值问题。fttdtttUtXLJ0),(),(构

35、造辅助泛函：构造辅助泛函：0)(),(),(tXttUtXf定义定义哈密顿（哈密顿（HamiltonHamilton）函数）函数为：为：),(),()(),(),(),(),(),(),(ttUtXftttUtXLttUttXtXHT)()(),(),(),(),(),(),(),(tXtttUttXHttUttXtXFT)()(),(),(),(ttXttUttXHT)(),(),()(),(),(),(),(),(),(tXttUtXftttUtXLttUttXtXFT辅助泛函辅助泛函标量函数标量函数哈密顿函数与辅助函数之间关系为：哈密顿函数与辅助函数之间关系为：000UFdtdUFFdt

36、dFXFdtdXF将代入欧拉方程，得0),(),()()(UHttUtXfHtXXHt 协态方程（共轭方程）状态方程规范方程（正则方程）控制方程l利用变分法写出辅助泛函利用变分法写出辅助泛函的欧拉方程的欧拉方程),(),(),(),(ttUttXtXF)()(),(),(),(),(),(),(),(tXtttUttXHttUttXtXFT初始状态为00)(XtX由于终端时刻tf固定，终端状态X(tf)自由，所以横截条件为 0fttXF得0)(ftl联立求解规范方程联立求解规范方程可以得到两个未知函数X(t)和(t)。l由边界条件确定积分常量：由边界条件确定积分常量：混合边界问题或两点边界

37、值问题。),(),()()(ttUtXfHtXXHt求解两点边值问题步骤：l由控制方程由控制方程求得求得 U=UX(t)，(t)，t ；l将上式代入规范方程消去其中的将上式代入规范方程消去其中的U(t)，得到得到l利用边界条件联立求解方程以上方程，可得唯一确定的解利用边界条件联立求解方程以上方程，可得唯一确定的解X(t)和和(t)；l将所求得的将所求得的X(t)和和(t)代入代入U=UX(t)，(t)，t，求得相应的，求得相应的U(t)。,),(),(),()(ttttXUtXftX,),(),(),()(ttttXUtXHXt0UH说明：利用引入哈密顿函数的方法求解拉格朗日型最优控制问题，

38、是将求泛函在等式约束条件下对控制函数在等式约束条件下对控制函数U(t)的条件极的条件极值问题值问题转化为求哈密顿函数求哈密顿函数H H对控制变量对控制变量U(t)的无条件极值问的无条件极值问题题。这种方法称为哈密顿方法哈密顿方法。定理定理2-102-10 设系统的状态方程为设系统的状态方程为 ),(),()(ttUtXftX为将系统从给定的初态为将系统从给定的初态00)(XtX转移到终端时刻转移到终端时刻 tf固定，终端状态固定，终端状态X(tf)自由的某个终自由的某个终态，并使性能泛函态，并使性能泛函fttdtttUtXLJ0),(),(达到极小值的最优控制应满足的必要条件是：达到极小值的最

39、优控制应满足的必要条件是：（1 1）设）设U*(t)是最优控制，是最优控制，X*(t)是对应于是对应于U*(t)的最优轨线，则的最优轨线，则必存在一与必存在一与U*(t)和和X*(t)相对应的相对应的n维协态变量维协态变量(t)，使得使得X(t)与与(t)满足规范方程满足规范方程),(),()(ttUtXfHtXXHt)(其中其中),(),()(),(),(ttUtXftttUtXLHT（2 2）边界条件为）边界条件为00)(XtX0)(ft（3 3）哈密顿函数）哈密顿函数H H对控制变量对控制变量U(t)（t0ttf）取极值，即取极值，即0UH*沿着最优控制和最优轨线，哈密顿函数沿着最优控制

40、和最优轨线，哈密顿函数H H对时间对时间t t求求全导数，得全导数，得UUHHXXHtHdtdHTTTUUHXHHHXHtHTTTtH若H不显含t时，则有 H(t)=常数 tt0，tf;也就是说，当H不显含t时，哈密顿函数H是不依赖于t的常数。202)(21dttxJ 取极小值。给定的边界条件为0)2(,1)0(,0)2(,1)0(xxxx解法解法2 2：哈密顿方法：哈密顿方法例例2-92-9 已知受控系统的动态结构如图所示。求最优控制u*(t)及最优轨线x*(t)，使目标泛函202)(21dttxJ 取极小值。给定的边界条件为)2(,1)0(,0)2(,1)0(xxxx自由例例2-102-1

41、0 已知受控系统的动态结构如图所示。求最优控制u*(t)及最优轨线x*(t)，使目标泛函11)(ct 212)(ctct21)(ctctu3221221ctctcx43223112161ctctctcx由例由例2-92-9哈密顿方法：哈密顿方法：由协态方程得：由协态方程得：由控制方程得：由控制方程得：由状态方程得：由状态方程得：例例2-112-11 已知系统方程和边界条件为uxxxx22211)0(1)0(21xx0)1(0)1(21xx（1）求使性能泛函102)(21dttuJ为极小值的最优控制函数与最优轨线。可以利用MATLAB符号工具箱求解微分方程（2）若终端条件为x1(1)=0，x2

42、(1)自由，求该最优控制问题。2.4 变分法求解最优控制问题变分法求解最优控制问题2 2、求解综合型（波尔扎）问题、求解综合型（波尔扎）问题),(),()(ttUtXftX(2.10)初始条件00)(XtX(2.9)和性能泛函(2.14)给定系统状态方程要求从容许控制U(t)Rm中确定最优控制U*(t)，使系统（2.9）从给定的初态X(t0)转移到某个终态X(tf)，并使性能泛函（2.14）达到极小值。这是波尔扎问题，又称为复合型最优控制问题。问题问题 2-42-4fttffdtttUtXLttXJ0),(),(),(注意：注意：给定的端点条件不同，上述最优控制问题的解将不同。给定的端点条件不

43、同，上述最优控制问题的解将不同。1.1.终端时刻终端时刻tf固定，终端状态固定，终端状态X(tf)自由的情况自由的情况构造构造辅助泛函辅助泛函为：为：),(0ffttXJfttTTdttXtttUtXftttUtXL0)()(),(),()(),(),(若令哈密顿函数哈密顿函数为),(),()(),(),(),(),(),(ttUtXftttUtXLttUttXHHT（2.15）（2.16）并对式（2.15）积分号内第三项进行分部积分，则辅助泛函变为ffttTttTfftXtdttXtttUttXHttXJ00)()()()(),(),(),(),(0dtXtttUttXHtXttXtttX

44、fttTTffTff0)()(),(),(),()()()()(),(00（2.17）求上式对状态变量X(t)和控制变量U(t)的变分，得fttTTTTffTfTfffdtXUUHXXHtXttXttXtXttXJ0)()()()()()(),(000（2.19）由于泛函J0达到极值的必要条件为00J（2.18）由于X(t0)=0，X(tf)0，X(t)0，U(t)0，则由式（2.18）和（2.19）可得上述波尔扎型最优控制问题的解应终端时刻终端时刻tf固定，终端状态固定，终端状态X(tf)自由的波尔扎型最优自由的波尔扎型最优控制问题的解应满足的控制问题的解应满足的必要条件必要条件为：为：00

45、)(),(),()(0)(XtXttUtXfHtXUHXHt这些关系与拉格朗日型最优控制问题的完全相同，所不同的这些关系与拉格朗日型最优控制问题的完全相同，所不同的只是只是横截条件横截条件，即，即协态变量的终端值协态变量的终端值)(),()(fffftXttXt 2.2.终端时刻终端时刻tf固定，终端状态固定，终端状态X(tf)受约束的情况受约束的情况设终端状态受到如下等式的约束0),(ffttX（2.20）其中为r（当L=0，rn-1；当L0，rn）维向量，即Tr,21这时，终端状态X(tf)即不是固定的，也不是完全自由的，只能在终端流型（2.20）上变动。在构造辅助泛函时，应考虑终端约束

46、条件（2.20），为此，需要引入待定的拉格朗日乘引入待定的拉格朗日乘子向量子向量Tr,21),(),(0ffTffttXttXJfttTTdttXtttUtXftttUtXL0)()(),(),()(),(),(考虑到考虑到哈密顿函数哈密顿函数为：为：),(),()(),(),(),(),(),(ttUtXftttUtXLttUttXHHT（2.21）并对式（2.21）积分号内第三项进行分部积分，则辅助泛函变为dtXHtXttXtttXttXdtXHtXtttXttXJfffttTTffTffTffttTttTffTff000)()()()(),(),()()(),(),(000构造的构造的辅

47、助泛函辅助泛函为：为：求J0对状态变量X(t)和控制变量U(t)的变分，得ffttTTTTffTTfffTTfffttTTTTffTfTfffTfTfffdtXUUHXXHtXttXttXttXtXttXdtXUUHXXHtXttXttXtXttXtXtXttXJ00)()()()()(),()(),()()()()()()(),()()(),(00000考虑到 J0=0,X(t0)=0，X(tf)0，X(t)0，U(t)0，则得到所述最优控制问题的解应满足的必要条件00)(),(),()(0)(XtXttUtXfHtXUHXHt这些关系与1中的完全相同，所不同的是状态变量的终端约束条状态变量

48、的终端约束条件和横截条件：件和横截条件：fttTfffXXtttX)(0),(终端时刻终端时刻tf固定，终端状态固定，终端状态X(tf)受约束的最优控制问受约束的最优控制问题的解应满足的必要条件：题的解应满足的必要条件：3.终端时刻终端时刻tf可变，终端状态可变，终端状态X(tf)受约束的情况受约束的情况设终端状态设终端状态X(tf)受到式（受到式（2.20）的约束条件：）的约束条件：),(),(0ffTffttXttXJfttTTdttXtttUtXftttUtXL0)()(),(),()(),(),(ffttTttTdtXHttXttX0)(),(),(),(),()(),(),(),(

49、),(),(ttUtXftttUtXLttUttXHHT其中，其中，哈密顿函数哈密顿函数为：为：这时，不仅存在这时，不仅存在最优控制和最优轨线最优控制和最优轨线，还存在一个，还存在一个最优的终端最优的终端时刻时刻。（2.22）0),(ffttX辅助泛函为辅助泛函为00)(0XtXUHfttTfffXXtttX)(0),(为了确定最优的终端时刻，令式（为了确定最优的终端时刻，令式（2.222.22）对时间）对时间t t的全导数的全导数等于零，即等于零，即00fttdtdJ得0fttTTTTTXHtXXtXX代入XHtttUtXfHtX)(),(),()(最优控制和最优轨线应满足2中的必要条件，即

50、0fttTttH（2.23）式（2.23）也称为横截条件横截条件。定理定理2-112-11 设系统状态方程为设系统状态方程为 ),(),()(ttUtXftX则为将系统从给定的初态则为将系统从给定的初态00)(XtX的某个终态的某个终态X(tf)，其中，其中 tf是可变的，并使性能泛函是可变的，并使性能泛函转移到满足约束条件转移到满足约束条件0),(ffttXfttffdtttUtXLttXJ0),(),(),(达到极小值的最优控制应满足的必要条件。达到极小值的最优控制应满足的必要条件。（1 1）设）设U*(t)是最优控制，是最优控制，X*(t)是对应于是对应于U*(t)的的最优轨线，最优轨线

展开阅读全文