1、最优控制理论与应用最优控制理论与应用 第一章第一章 最优控制问题最优控制问题的一般概念的一般概念第二章第二章 最优控制的变分方法最优控制的变分方法第三章第三章 极小值原理极小值原理及其应用及其应用第四章第四章 线性二次型问题的最优控制线性二次型问题的最优控制第五章第五章 动态规划动态规划2022-12-11一一 基本概念基本概念最优控制理论中心问题:最优控制理论中心问题:给定一个控制系统(给定一个控制系统(已建立的被控对象的数学模型),选择一个容许已建立的被控对象的数学模型),选择一个容许的控制律,使被控对象按预定要求运行,并使给的控制律,使被控对象按预定要求运行,并使给定的某一性能指标达到极
2、小值(或极大值)定的某一性能指标达到极小值(或极大值)第一章第一章 最优控制问题最优控制问题的一般概念的一般概念2022-12-111 1 例子例子 飞船软着陆问题飞船软着陆问题 宇宙飞船在月球表面着陆宇宙飞船在月球表面着陆时速度必须为零,即软着陆,这要靠发动机的推时速度必须为零,即软着陆,这要靠发动机的推力变化来完成。问题是如何选择一个推力方案,力变化来完成。问题是如何选择一个推力方案,使燃料消耗最小。使燃料消耗最小。m m 飞船的质量,飞船的质量,h h 高度,高度,v v 垂直速度,垂直速度,g g 月球重力加速度常数,月球重力加速度常数,M M 飞船自身质量飞船自身质量F F 燃料的质
3、量燃料的质量2022-12-11hvuvgmmKu 软着陆过程开始时刻软着陆过程开始时刻t t为零为零 K K为常数为常数 ,初始状态,初始状态 0(0)hh0(0)vvFMm)0(末端条件末端条件 0)(Th0)(Tv2022-12-11性能指标性能指标()Jm T控制约束控制约束max0()u tu 任务:满足控制约束条件下,求发动机推力的任务:满足控制约束条件下,求发动机推力的最优变化律,使登月舱由初始出发点到达目标处最优变化律,使登月舱由初始出发点到达目标处(末态),并使性能指标达到极值(燃耗量最小)(末态),并使性能指标达到极值(燃耗量最小)2022-12-11例例2 2 火车快速运
4、行问题火车快速运行问题 设火车从甲地出发,设火车从甲地出发,求容许控制,使其到达乙地时间最短。求容许控制,使其到达乙地时间最短。m m 火车质量;火车质量;火车加速度;火车加速度;u u(t t)产生)产生加速度的推力且加速度的推力且 火车运动方程火车运动方程 x|()|u tM()mxu t000f0t ()()0(T)(T)0Jux txx txxxTt0T初始条件终端条件 性能指标 ()=dt2022-12-112 2 问题描述问题描述(1)(1)状态方程状态方程 一般形式为一般形式为 00()(),(),)()|t tx tf x t u t tx tx()nx tR为为n n维状态向
5、量维状态向量 ()ru tR为为r r维控制向量维控制向量),(),(ttutxf为为n n维向量函数维向量函数 给定控制规律给定控制规律)(tu),(),(ttutxf满足一定条件时,方程有唯一解满足一定条件时,方程有唯一解 2022-12-11(2)(2)容许控制容许控制 Uu0)(uGU:Uu,(3)(3)目标集目标集 ()(),)0Sx Tx T T(),)xT T n维向量函数维向量函数()Tx Tx固定端问题固定端问题 nSR自由端问题自由端问题 2022-12-11(4)(4)性能指标性能指标 0()(),)(),(),)dfttJ ux T TL x t u t tt对状态、控
6、制以及终点状态的要求,复合型性能对状态、控制以及终点状态的要求,复合型性能指标指标 0),(TTx积分型性能指标,表示对整个状积分型性能指标,表示对整个状态和控制过程的要求态和控制过程的要求 0),(),(ttutxL终点型指标,表示仅对终点状态终点型指标,表示仅对终点状态的要求的要求 2022-12-11n积分型1)最小时间控制2)最小燃耗控制3)最小能量控制00fttJdtTt0(),(),fttJL x t u t t dt01|()|fmtjtjJu tdt0()()ftTtJut u t dt12/11/202210n末值型n复合型1)状态调节器2)输出跟踪系统()(),)J ux
7、T T011()()()()()()22ftTTTtJx T Fx Tx t Qx tu t Ru t dt011()()()()()()22()()()ftTTTtJeT Fe Tet Qe tut Ru t dte tz ty t为跟踪误差2022-12-1111n解析法:适用于性能指标及约束条件有明显解析式n数值计算方法:性能指标比较复杂1)一维搜索法:适合单变量求极值2)多维搜索法:适合单变量求极值n梯度法:解析与数值方法相结合1)无约束梯度法2)有约束梯度法2022-12-11 2.1 2.1 泛函与变分法基础泛函与变分法基础平面上两点连线的长度问题平面上两点连线的长度问题 其弧长为
8、其弧长为1211()dJx tt2022-12-11一般来说,曲线不同,弧长就不同,即弧长依赖一般来说,曲线不同,弧长就不同,即弧长依赖于曲线,记为于曲线,记为 。()J x()J x,称为泛函。,称为泛函。)(tx,称泛函的宗量,称泛函的宗量 泛函定义泛函定义:x(t)x(t)是自变量是自变量t t的函数,若对的函数,若对每个函数每个函数x(t)x(t),有一个,有一个J J值与之对应,则值与之对应,则变量变量J J称为依赖于称为依赖于x(t)x(t)的泛函,记的泛函,记J(x(t)J(x(t)()Jx例举:例举:10()()J xx t dt0()(),(),fttJ xL x tx t
9、t dt2022-12-11线性泛函与连续泛函:线性泛函与连续泛函:线性泛函线性泛函 泛函对宗量是线性的泛函对宗量是线性的连续泛函连续泛函 若定义在线性赋范空间上的泛函又满足连续条件,称J(x)为连续线性泛函 121212()()(),()()nJ xxJ xJ xx xJxJ x0n0n0()(),()xlimJ()()J;J xD JD JxJ xxn中点列x 收敛到点,有称 在 处连续2022-12-11泛函与函数的几何解释泛函与函数的几何解释()()()x tx tx t宗量的变分宗量的变分 泛函的增量泛函的增量()()()(,)(,)J xJ xxJ xL xxr xx 泛函的变分泛
10、函的变分(,)L xxJ2022-12-11定理定理 2.1 2.1 泛函的变分为泛函的变分为0()JJ xx 0()J xx00()()limlimJJ xxJ x 01lim()()L xxr xx),()(lim),(0 xxLxxxxrxxL2022-12-11例例 2.1 2.1 求泛函的变分求泛函的变分 f0tL(,)dtJx x tt f0f0t0t()L(,)dLL()dttJJ xxxx xx ttxxtxx1202100010010 J=x(t)()()d2()d2ddtJJ xxxxtxxxtx x t例:求的变分2022-12-1100 xxJJ定理定理 2.2 2.2
11、 若泛若泛函函)(xJ 有极值,则必有有极值,则必有0J*0 x|x-x|J(x)J(x)J(x)xx,满足,同号则在处有极值2022-12-111001tT01t01(t)t,t(t)n(t)(t)0,(t)(t)dt0,(t)0t t,t 设向量在上连续,为任意 维向量函数,且若则必有,2022-12-11f0tx(t)min()L(,)dtJ xx x ttLdL0 xdtx0f0fn*00ff L(x,x,t)x(t)t,t ttx(t)x,x(t)x,x(t),x(t)其中,及在上连续可微,及 给定。已知则极值轨线满足如下欧拉方程及横截条件及横截条件f0TTtft0LL|x(t)|x
12、(t)0 xx12/11/202221 2.2 2.2 欧拉方程欧拉方程LdL0dxtx 0LL()dTtJxx txx变分变分 f0ttf0tLdLL()ddtJx txxtxx分部积分分部积分 xf0t0tf0tLdL()d0dtJx txtx证明:证明:2022-12-11例例 2.2 2.2 求平面上两固定点间连线最短的曲线求平面上两固定点间连线最短的曲线 0t2()1()dftJ xx tt21()Lx t,dd0ddLLLxtxtx 2d20d1xtxcxx21atx)(battx)(直线直线 2022-12-112220min()(t)()dJ xxx tt(0)0,()2,2x
13、x*()x t221212(t)()2(2()22()0(t)=c cos()c sin():x(0)0,x(/2)2 c=0 c=2 Lxx tLdLdxx txx txdtxdttt *求得通解为:x代入边界条件得,;则:x(t)=2sin(t)2022-12-11f0tx(t)min()g(,)d.(,)0tJ xx x tts tf x x tLdL0 xdt xL(,)(,)LTg x x tf x x t其中为拉格朗日函数,为-乘子0f0fn*00ff f=0g(x,x,t)x(t)t,t ttxxfx(t)x,x(t)x,x(t),x(t)nR其中,为系统运动的微分方程,及在上连
14、续可微,及 给定。,已知则极值轨线满足如下欧拉方程及横截条件及横截条件f0TTtft0LL|x(t)|x(t)0 xx12/11/202225220*010()()()001()10(0),(2)10()().x tx tu tu t dtxxx tu t 1指标泛函取J=2边界条件为试求是指标泛函去极值的极值轨线和极值控制2022-12-11f0TTtft0LL|x(t)|x(t)0 xx(*)f0000tt,(),()()()0LL|0|0 xxffft tx tx tx tx t设定任意变化时,(*)式化为:,0L,L()0fftttxxff设定自由,且x(t)=(t)时,0000,()
15、,()()()0ffffttx tx x txx tx t设定时,时,(*)式显然成立0L,L0fftttxxf设 定自 由,且 x(t)自 由 时,12/11/202227左端固定右端沿曲线变动左端固定右端沿曲线变动 ()0ftLLxx横截条件横截条件C的推导的推导2022-12-11 00(,)d|fftttJF xx xx tt00d()ddfffttttftLLLx txLtxtxx00ffttfLJxLtx()()0ffftftfftLLxtLtLxtxx2022-12-1120()1()dftJ xx tt例例 2.5 2.5 设性能指标泛函 末值时刻 ft未定,已知 *(0)1,
16、()2,Jffxx tt*f求使泛函为极值的最优轨线x(t)及相应的t 和,dd0ddLLLxtxtx battx)(解:由欧拉方程得解:由欧拉方程得由由x(0)=1x(0)=1求出求出b=1b=1;由横截条件知;由横截条件知22()1(1)|01ffttLxLxxxxx 2022-12-11*()1.()aa1()1()()120.5,0.707fffffffx tx tx ttttx tc tttt *解得因为,所以有,从而最优轨线为当时,最优时刻为带入指标泛函可得J2022-12-11 2.4 2.4 含有多个未知函数泛函的极值含有多个未知函数泛函的极值 泛函泛函 0111(,)(,;,
17、;)dTnnntJ xxL xxxx tt欧拉方程欧拉方程 d0diiLLxtxd0dLLxtx 边界值边界值,00,()1,2,()1,2,ffitiit titx txinx txin00t txxfft ttxx ()0ftLLxx横截条件横截条件 2022-12-11 2.5 2.5 条件极值条件极值状态方程状态方程 0),(txxf 泛函泛函 0(,)dfttJL x x tt引进乘子引进乘子 T1()(),()nttt构造新的函构造新的函数和泛函数和泛函 TLLf00T()ddffttttJLftL t欧拉方程欧拉方程 约束方程约束方程 *d0dLLxtx*d0dLLft2022-
18、12-11例例 2.6 2.6 泛函泛函2201()d2JQ tt约束方程约束方程 )()(tutQ 边界条件边界条件 1)0(Q1)0(Q0)2(Q0)2(Q)(tuJ试求试求使泛函使泛函有极值。有极值。解:化为标准形式解:化为标准形式 2220011()d()d22JQ ttutt121()()()()()x tQ tx tx tQ t把问题化为标准形式,令把问题化为标准形式,令2022-12-11122()()0()()0 x tx tx tu t约束方程可定为约束方程可定为1(0)1x2(0)1x1(2)0 x2(2)0 x边界条件为边界条件为2022-12-11引进乘子引进乘子T12
19、()(),()ttt构造函数构造函数T2112221()()2FFfuxxxu欧拉方程欧拉方程 *111d0dFFxtx*1222d0dFFxtx*2d0dFFuutu2022-12-11解出解出 11a212ata 12uata1a2a其中,其中,和和为任意常数。为任意常数。32112342212311()621()2x tata ta tax tata ta()u t代入约束方程,并求解可得代入约束方程,并求解可得将将13a 272a 31a 41a 利用边界条件,可得:利用边界条件,可得:2022-12-1132117()124x tttt 2237()122x ttt273)(ttu于
20、是,极值曲线和于是,极值曲线和)(tu为:为:2022-12-11问题:确定最优控制问题:确定最优控制 和最优轨线和最优轨线 ,使系统,使系统 由已知初态转移到要求的目标集由已知初态转移到要求的目标集 2.6 2.6变分法解最优控制问题变分法解最优控制问题并使指定的目标泛函并使指定的目标泛函达到极值达到极值*()u t*()x t()(,)x tf x u t(),0ffx tt0()(),)(),(),)dfttJ ux T TL x t u t tt2022-12-11 2.6.1 2.6.1末端时刻固定时最优解的必要条件末端时刻固定时最优解的必要条件(1 1)末端受约束的情况)末端受约束
21、的情况引入拉格朗日乘子构造引入拉格朗日乘子构造广义泛函广义泛函 0T()()(,)(,)dftTfftJx tx tL x u tf x u txt 00TTTt()()(,)dfftTffttJx tx tH xu txtxx 0T()()(,)dftTfftJx tx tH xu txt 有有T(,)(,)HL x u tf x u t构造构造哈米顿函数哈米顿函数 2022-12-1100TTTTTTTTT()()()()()()()()()()()()d ()|()()()dfffffTfffffftttTtftx tx tJx tx ttx tx tx tHHxux txuHHx tx
22、utxxxu 变分变分(,)()00()()()TfffH xu ttxHJutx tx t 协态方程极值条件横截条件2022-12-11定理定理2.52.5:对于如下最优控制问题:对于如下最优控制问题:0()00min()()(),(),)d(1)()(,),().(2)()0ftftu tfJ ux tL x t u t ttx tf x u tx txstx tu(t)u(t)无约束,无约束,t tf f固定固定.最优解的必要条件最优解的必要条件001)()()(),()H(,)(,)()(,)2)x(t)=x,()0,()()()3)TTffffx ttHHx ttxx utL x u
23、 tt f x u tx ttx tx tH 和满足正则方程其中边界条件与横截条件极值条件02022-12-11定理定理2.62.6:对于如下最优控制问题:对于如下最优控制问题:0()00min()()(),(),)d.()(,),()ftftu tJ ux tL x t u t ttstx tf x u tx txu(t)u(t)无约束,无约束,t tf f固定,固定,x x(t(tf)自由自由.最优解的必要条件最优解的必要条件001)()()(),()H(,)(,)()(,)2)x(t)=x,()0,()()3)Tfffx ttHHx ttxx utL x u tt f x u tx tt
24、x tH 和满足正则方程其中边界条件与横截条件极值条件0(2 2)末端自由的情况)末端自由的情况2022-12-11定理定理2.72.7:对于如下最优控制问题:对于如下最优控制问题:0()00min()(),(),)d.()(,),()fttu tJ uL x t u t ttstx tf x u tx txu(t)u(t)无约束,无约束,t tf f固定,固定,x x(t(tf)固定固定.最优解的必要条件最优解的必要条件0001)()()(),()H(,)(,)()(,)2)x(t)=x,()x,3)Tfx ttHHx ttxx utL x u tt f x u tx tH 和满足正则方程其
25、中边界条件极值条件0(3 3)末端固定的情况)末端固定的情况2022-12-11例例 2.7 2.7 考虑状态方程和初始条件为考虑状态方程和初始条件为)()(tutx00()x tx02211()d22ftftJcx tut的简单一阶系统,其指标泛函为的简单一阶系统,其指标泛函为,使,使ft0c)(tu其中其中,给定,试求最优控制给定,试求最优控制J有极小值。有极小值。0t,2022-12-11,uutuxfttxLH221),()(),(伴随方程伴随方程()0Htx 边界条件边界条件 21 c()2()c()()ffffx ttx tx t由必要条件由必要条件 0uuH)(t解解:引进伴随变
26、量引进伴随变量,构造哈米顿函数,构造哈米顿函数2022-12-1100()()1()ffcxu tcx tc tt 则最优控制为则最优控制为 ()fucx t 得得00()()()fx tcx tttx 代入状态方程求解得代入状态方程求解得00()1()ffxx tc tt令令ftt,则有,则有2022-12-11边界条件边界条件 1(0)1x2(0)1x1(2)0 x2(2)0 x2201d2Jut指标泛函指标泛函 哈米顿函数哈米顿函数 212212Huxu伴随方程伴随方程 11()0Htx 212()()Httx ,例例 2.8 2.8 12()()x tx t2()()x tu t重解例
27、重解例 2.4 2.4 11()ta212()tata 其解为其解为 2022-12-1120Huu212uata 12xx 212xua ta32112341162xa ta ta ta2212312xa ta ta273)(ttu32117()124x tttt 2237()122x ttt2022-12-11习题1:设一阶系统方程为性能指标取为式中常数试求使J取极小值的最优控制和相应的性能指标0()(),()x tu tx tx02211()()22ftftJcxtut dt0f0,()fcttx t给定自由习题2:设二阶系统方程为性能指标取为求系统由已知初态 在 转移到目标集 且使J取
28、极小的最优控制和最优轨迹122()(t),()()x txx tu t1201()2Jut dt11(0)0;(0)01fxxt12(1)(1)1xx2022-12-11 2.6.2 2.6.2 末端时刻自由的最优解问题末端时刻自由的最优解问题tf有时是可变的,是指标泛函,选控制使有tf极小值TT(),)(),)()()()()Tx T Tx T TJx TTHxTx TT 0TTT()()dtHHxuxtxu TT(),)(),)()()()()Tx T Tx T Tx TTHxTx TT0TT()|()()dTTtHHxxutxu 变分变分 2022-12-11()()TTTTx TxxT
29、xx TxTT(),)(),)()()()()()x T Tx T TJTx TTH TTx TT 0TT()()d0TtHHxutxuHx,(),)()()x T TTx T0(),)()Hux T TH TT 必要条件必要条件2022-12-11例例 2.7 2.7)()(tutx1)0(x220()(1)dTJsx Tut指标泛函指标泛函 哈米顿函数哈米顿函数 uuH21伴随方程伴随方程 0Hx(),)()2()()x T TTsx Tx T02uuH必要条件必要条件 0)(1)(2TTuuTH)()(Tsxtu1()1u tss sT112022-12-11 3.1 3.1 古典变分法
30、的局限性古典变分法的局限性u u(t t)受限的例子受限的例子 矛盾矛盾!例例 3.1 3.1)()()(tutxtx1)0(x1)(tu10()dJx tt()()()()Hx ttx tu t1)()(txHt伴随方程伴随方程 0)(tuH极值必要条件极值必要条件 0)1(2022-12-11 3.2 3.2 最大值原理最大值原理()x t()Hx t()Htx 且且 min(),(),(),)(),(),(),)u UH x tt u t tH x tt u t t()x t)(tu()x t)(t)(tu定理定理 3.1(最小值原理最小值原理)设为设为容许控制,容许控制,为对应的积分轨
31、线,为使为对应的积分轨线,为使为最优控制,为最优控制,)(t为最优轨线,必存在一向量函数为最优轨线,必存在一向量函数,使得,使得和和满足正则方程满足正则方程 2022-12-11最小值原理只是最优控制所满足的必要条件。但最小值原理只是最优控制所满足的必要条件。但对于线性系统对于线性系统 ()()()()()x tA t x tB t u t1111()()()()()nnnnatatA tatat,1()()()nb tB tb t最小值原理也是使泛函取最小值得充分条件。最小值原理也是使泛函取最小值得充分条件。2022-12-11例例 3.2 3.2 重解例重解例 3.1 3.1,哈密顿函数哈
32、密顿函数 ()()()()(1)()()Hx ttx tu tx tu t伴随方程伴随方程 1)()(txHt0)1(由极值必要条件,知由极值必要条件,知 1sign1u 00 ,01)(1tet01t 又又于是有于是有1)(tu2022-12-111)()(txtx,1)0(x 12)(tetx110d21Jxte)(tu协态变量与控制变量的关系图协态变量与控制变量的关系图 2022-12-11,,例例 3.3 3.3)()()(tutxtx1)0(x1)(tu101()d2Jxut性能指标泛函性能指标泛函 哈密顿函数哈密顿函数 11()(1)()22Hxuxuxu 伴随方程伴随方程 1)(
33、xHt,0)1(1()(1)tte 1sign()2u 10ln2()1ln12etu tet 2022-12-1110ln21ln12extxxuext 2ln,0e上有上有 12)(tetx1xx 14)2(ln1eex 1)2()(teetx2022-12-11210ln2()(2)1ln12tteetx tee et 协态变量与控制变量的关系图协态变量与控制变量的关系图 整个最优轨线整个最优轨线 2022-12-11例例 3.4 3.4 12122,(0)0,(0)0 xxxxux1u把系统状态在终点时刻转移到把系统状态在终点时刻转移到 (121)()4x Tx T性能指标泛函性能指标
34、泛函 20dTJut终点时刻是不固定的终点时刻是不固定的 哈米顿函数哈米顿函数 2122Huxu伴随方程伴随方程 112120HxHx 1a,2bat,2022-12-11H H是是u u的二次抛物线函数,的二次抛物线函数,u u在在 上一定使上一定使H H有最小值,可能在内部,也可能在边界上。有最小值,可能在内部,也可能在边界上。11u最优控制可能且只能取三个值最优控制可能且只能取三个值 220Huu211()22ubat 1u1u 此二者都不能使状态变量同此二者都不能使状态变量同时满足初始条件和终点条件时满足初始条件和终点条件 231221 11()()2 2611()()22x tbta
35、tx tbtat 231221 111()()2 264111()()224x TbTaTx TbTaT 2022-12-112122T2()()|11 ()()()0442H TuxuabaTbaTbaT0b91a3T 18)(ttu108)(1ttx,36)(22ttx,361J最优控制最优控制 最优轨线最优轨线 最优性能指标最优性能指标 2022-12-11例例 3.5 3.5 12xx2xu1(0)0 x2(0)2x1)(tu使系统以最短时间从给定初态转移到零态使系统以最短时间从给定初态转移到零态 1()0 x T 2()0 x T 01dTJTtuxH2211哈米顿函数哈米顿函数 伴
36、随方程伴随方程 110Hx 212Hx 1()ta2()tbat 2signsign()ubat 2022-12-11最优控制切换及最优轨线示意图最优控制切换及最优轨线示意图 2022-12-11 3.3 3.3 古典变分法与最小值原理古典变分法与最小值原理古典变分法适用的范围是对古典变分法适用的范围是对u u无约束,而最小值原无约束,而最小值原理一般都适用。特别当理一般都适用。特别当u u不受约束时,条件不受约束时,条件min(,)u UH xu t就等价于条件就等价于条件0uH2022-12-11在实际问题中,经常发生以时间为性能指标的在实际问题中,经常发生以时间为性能指标的控制问题。控制
37、问题。如,当被控对象受干扰后,偏离了平衡状态,如,当被控对象受干扰后,偏离了平衡状态,希望施加控制能以最短时间恢复到平衡状态。希望施加控制能以最短时间恢复到平衡状态。凡是以运动时间为性能指标的最优控制问题称凡是以运动时间为性能指标的最优控制问题称为最小时间控制。为最小时间控制。2022-12-11 3.4.1 3.4.1 快速控制问题快速控制问题00()()(),()x tAx tBu tx tx()1,1,2,iu tir01dTtJt性能指标性能指标 时间上限时间上限T是可变的是可变的 从状态从状态0 x转移平衡状态转移平衡状态0)(Tx所需时间最短所需时间最短 构造哈密顿函数构造哈密顿函
38、数 TT1HAxBu TT11riiiHAxbu 12,Bb bb*T1sign,1,2,ubir 最小值原理最小值原理*TsignuB 分段常值函数分段常值函数 2022-12-11例例 3.4.1 3.4.1 有一单位质点,在有一单位质点,在 处以初速处以初速度度2 2沿直线运动。现施加一力沿直线运动。现施加一力 ,使,使质点尽快返回原点,并停留在原点上。力质点尽快返回原点,并停留在原点上。力 简简称为控制。若其它阻力不计,试求此控制力。称为控制。若其它阻力不计,试求此控制力。1)0(x()u t()1u t()u t质点运动方程质点运动方程 状态方程状态方程 xu12122()(),(0
39、)1,()(),(0)2.x tx txx tu txuxH2211哈密顿函数哈密顿函数 121()0,()()ttt 伴随方程伴随方程 2121)(,)(CtCtCt2022-12-11*2sign()ut 最优控制最优控制 协态变量与控制函数协态变量与控制函数4种情况示意图种情况示意图 2022-12-11相轨线族示意图相轨线族示意图 021221xxx开开关曲线关曲线 2022-12-11开关曲线开关曲线 322T总时间总时间 *1023()12322 3tu tt (0)1,2TxR初始状态初始状态 最优控制最优控制 1u 状态方程状态方程 12122()(),(0)1,()1,(0)
40、2,x tx txx tx3)2(21)(21ttx2)(2 ttx321221xx相轨线相轨线 最优控制最优控制 2022-12-11 3.4.2 3.4.2 综合问题综合问题 综合是将最优控制函数表示为状态和时间的函数综合是将最优控制函数表示为状态和时间的函数即即),(*txu*12211(,)sign()21xux txx xxx 上例之最优综合控制函数上例之最优综合控制函数 2022-12-11例例 3.4.2 3.4.2 1122010101xxuxx 1u求快速返回原点的开关曲线和最优综合控制函数求快速返回原点的开关曲线和最优综合控制函数 构造哈密顿函数构造哈密顿函数)(12221
41、uxxH伴随方程伴随方程 122112()(),()()HHttttxx )sin()(2tAt*2sign()sign sin()utAt 最优控制最优控制 2022-12-11最优控制与协态变量的变化情况最优控制与协态变量的变化情况 控制是控制是“砰砰控制砰砰控制”,除了首尾之外,在和,除了首尾之外,在和上的停留时间均为上的停留时间均为 112022-12-11备备选选最最优优轨轨线线族族 两族同心圆方程两族同心圆方程 12211dxxdxx22221)1(Cxx2022-12-11Cxxxxdtdsv22212221)1(相点沿轨线顺时针方向运动,其速度为相点沿轨线顺时针方向运动,其速度
42、为开关曲线开关曲线 2022-12-11第二段开关曲线第二段开关曲线 2022-12-11整个开关曲线整个开关曲线 2022-12-11*12121(,)1(,)TTx xRux xR最优综合控制函数最优综合控制函数 2022-12-11 用最大值原理求最优控制,求出的最优控制用最大值原理求最优控制,求出的最优控制 通常是时间的函数,这样的控制为开环控制通常是时间的函数,这样的控制为开环控制 当用开环控制时,在控制过程中不允许有任当用开环控制时,在控制过程中不允许有任何干扰,这样才能使系统以最优状态运行。何干扰,这样才能使系统以最优状态运行。在实际问题中,干扰不可能没有,因此工程在实际问题中,
43、干扰不可能没有,因此工程上总希望应用闭环控制,即控制函数表示成时间上总希望应用闭环控制,即控制函数表示成时间和状态的函数。和状态的函数。求解这样的问题一般来说是很困难的。求解这样的问题一般来说是很困难的。2022-12-11 但对一类线性的且指标是二次型的动态系统,但对一类线性的且指标是二次型的动态系统,却得了完全的解决。不但理论比较完善,数学处理却得了完全的解决。不但理论比较完善,数学处理简单,而且在工际中又容易实现,因而在工程中有简单,而且在工际中又容易实现,因而在工程中有着广泛的应用。着广泛的应用。2022-12-11 4.1 4.1 问题提法问题提法动态方程动态方程()()()()()
44、x tA t x tB t u t()()()y tC t x t指标泛函指标泛函 0TTT11()()()()()()()()d22TtJxT Sx Txt Q t x tut R t u tt使使求求(,)u x tJ有最小值有最小值此问题称线性二次型性能指标的最优控制问题此问题称线性二次型性能指标的最优控制问题(,)u x t通常称通常称为综合控制函数为综合控制函数2022-12-11指标泛函的物理意义指标泛函的物理意义积分项,被积函数由两项组成,都是二次型。积分项,被积函数由两项组成,都是二次型。第一项过程在控制过程中,实际上是要求每个第一项过程在控制过程中,实际上是要求每个分量越小越
45、好,但每一个分量不一定同等重要,所分量越小越好,但每一个分量不一定同等重要,所以用加权来调整,当权为零时,对该项无要求。以用加权来调整,当权为零时,对该项无要求。第二项控制能力能量消耗最小。对每个分量要第二项控制能力能量消耗最小。对每个分量要求不一样,因而进行加权。要求正定,一方面对每求不一样,因而进行加权。要求正定,一方面对每个分量都应有要求,否则会出现很大幅值,在实际个分量都应有要求,否则会出现很大幅值,在实际工程中实现不了;另一方面,在计算中需要有逆存工程中实现不了;另一方面,在计算中需要有逆存在。在。指标中的第一项是对点状态的要求,由于对每个指标中的第一项是对点状态的要求,由于对每个分
46、量要求不同,用加权阵来调整。分量要求不同,用加权阵来调整。2022-12-11 4.2.1 4.2.1 末端自由问题末端自由问题构造哈密顿函数构造哈密顿函数 TTTT1122()()()()Hx Q t xu R t uA t xB t u伴随方程及边界条件伴随方程及边界条件 T()()()()HtAtQ t x tx ()()TSx T最优控制应满足最优控制应满足 TT()()()0HRt u tBtu*1T()()()()u tRt Btt 4.2 4.2 状态调节器状态调节器2022-12-111T00()()()()()()(),()x tA t x tB t Rt Bttx txT(
47、)()()()(),()()tA ttQ t x tTSx T()()()tP t x t1T1T()()()()()()()()()()()()()()()()()()()()()()()tP t x tP t x tP t x tP t A t x tB t Rt B ttP tP t A tP t B t Rt B t P t x t求导 TT()()()()()()()()()tQ t x tA ttQ tA t P t x t T1T()()()()()()()()()()()()()Q tA t P t x tP tP t A tP t B t Rt B t P t x t2022
48、-12-11T1T()()()()()()()()()()()0P tP t A tAt P tP t B t Rt Bt P tQ t(矩阵黎卡提微分方程)(矩阵黎卡提微分方程)边界条件边界条件()P TS1T()()()()K tRt Bt P t令令最优控制是状态变量的线性函数最优控制是状态变量的线性函数借助状态变量的线性反馈可实现闭环最优控制借助状态变量的线性反馈可实现闭环最优控制 最优控制最优控制*1T(,)()()()ux tRt Bt P t x*(,)()ux tK t x()P t对称半正定阵对称半正定阵 2022-12-11例例 4.1 4.1,(0)1xaxux02221
49、122()()()dTtJsx Tqx trutt性能指标泛函性能指标泛函*1()up t xr 最优控制最优控制 黎卡提微分方程黎卡提微分方程 21()2()(),()p tap tp tqp Tsr()()2dd12p TTp ttppapqr2()2()/()()/()/1/b t Tb t Ts res rp trs res r2qar2022-12-11最优轨线最优轨线 最优控制最优控制 最优轨线的微分方程最优轨线的微分方程 1()()(),(0)1x tap tx txr0()/)d()ta p trx te解解 1a 0s 1T 1q 2022-12-11黎卡提方程的解黎卡提方程
50、的解 随终点时间变化的随终点时间变化的黎卡提方程的解黎卡提方程的解 2lim(,)Tqp t Tarrar2022-12-11()0 x T 4.2.2 4.2.2 固定端问题固定端问题(设)(设)0TT()()()()()()dTtJxt Q t x tut R t u tt指标泛函指标泛函 采用采用“补偿函数补偿函数”法法 0TTT11()()()()()()()()d22TtJxT Sx Txt Q t x tut R t u tt补偿函数补偿函数 惩罚函数惩罚函数()P TS 边界条件边界条件 黎卡提方程黎卡提方程 逆黎卡提方程逆黎卡提方程 2022-12-111()()P t PtI
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。