1、第六章第六章最优控制最优控制2022年7月23日本章内容本章内容6.1 概述6.2 研究最优控制的前提条件6.3 静态最优化问题的解6.4 泛函及其极值变分法6.5 用变分法求解连续系统的最优控制问题 6.6 极小值原理6.7 线性二次型最优控制问题 6.1 概述概述甲仓甲仓1500包包乙仓乙仓1800包包1元元工地工地B600包包工地工地C1200包包2元元4元元4元元5元元9元元如何发送水泥最省运费如何发送水泥最省运费?工地工地A900包包65432195442)(xxxxxxfx假设从甲仓运往A,B,C三个工地的水泥包数分别为x1,x2,x3;从乙仓运往A,B,C三个工地的水泥包数分别为
2、x4,x5,x6总运费为:x的约束条件1500321xxx1800654xxx90041 xx60052 xx120063 xx目标函数约束条件最优化问题最优化问题的数学描述最优化问题的数学描述)()(minxxfJmigi,2,10)(xljhj,2,10)(x目标函数等式约束条件不等式约束条件静态最优化问题最优化问题的数学描述最优化问题的数学描述fttttttLJ0d),(),()(minuxx),(),()(ttttuxfx目标函数约束条件受控对象的状态方程动态最优化问题6.2 最优控制的前提条件最优控制的前提条件1.状态方程),(),()(ttttuxfx2.控制作用域控制集控制集0)
3、,(|)(uxujtU容许控制容许控制Ut)(u3.初始条件初始集初始集0)(|)(000ttjxx可变始端可变始端00)(tx4.终端条件目标集目标集0)(|)(fjffttxx可变终端可变终端fft)(x5.目标泛函性能指标fttfttttLtJ0d),(),()()(uxxx综合型、鲍尔扎型fttttttLJ0d),(),()(uxx积分型、拉格朗日型)()(ftJxx终端型、梅耶型)(minxJ满足 的控制,称为最优控制;最优控制;)(*tu在最优控制 下,状态方程的解,称为最优轨线最优轨线)(*tx使性能指标能够达到的最优值,称为最优指标最优指标*J线性二次型性能指标fttffttt
4、ttttJ0d)()()()(21)()(21)(2T1T0TuQuxQxxQxx6.3 静态最优化问题的解静态最优化问题的解静态最优化问题 动态最优化问题目标函数 多元普通函数泛函数解法古典微分法古典变分法6.3.1 一元函数的极值一元函数的极值设J=f(x)为定义在闭区间a,b上的实数连续可微函数,则存在极值u*点的必要条件是:0|)(*uuufu*极小值点的充要条件是0|)(,0|)(*uuuuufufu*极大值点的充要条件是0|)(,0|)(*uuuuufuf6.3.2 多元函数的极值多元函数的极值设n元函数 f=f(u),u=u1,u2,un,存在极值点的必要条件是:0)(uuf或者
5、函数的梯度为零矢量0T21nufufuffu取极小值点的充要条件是0)(22uuf222212222221221221221222)(nnnnnufuufuufuufufuufuufuufuffuu海赛矩阵海赛矩阵例6-1 求函数 f(x)的极值点及极小值。362252)(21332232221xxxxxxxxf x解:解:根据极值必要条件 ,得:0 xf024311xxxf06210322xxxf02221233xxxxf解得:2,1,1321xxxT*2,1,1x2222100204)(22xxf海赛矩阵:正定,x*为极小值点6.3.3 具有等式约束条件的极值具有等式约束条件的极值)()(
6、minxxfJmigi,2,10)(x目标函数等式约束条件解法(1)嵌入法(2)拉个朗日乘子法拉个朗日乘子法拉个朗日乘子法),(minuxfJ migi,2,10),(ux等式约束条件核心思想:核心思想:构造与原目标函数具有相同最优解的拉个朗日函数,构造与原目标函数具有相同最优解的拉个朗日函数,作为新得目标函数,同时消去等式约束。作为新得目标函数,同时消去等式约束。拉格朗日函数构造:拉格朗日函数构造:),(),(Tuxgux fHHmin将拉格朗日函数最为优化目标函数:将拉格朗日函数最为优化目标函数:则目标函数存在最优解的条件是:则目标函数存在最优解的条件是:0,0,0uxHHH目标函数),(
7、),(Tuxgux fH0TxxxgfH0TuuugfH0),(uxg则目标函数存在最优解的条件是:则目标函数存在最优解的条件是:),(0),(TuxuxffH例例6-2 求使uQuxQxux2T1T2121),(fJ取极值的x*和u*,并满足约束条件0),(dFuxuxg其中,Q1,Q2均为正定矩阵,F为任意矩阵。解解:构造拉格朗日函数:),(),(Tuxgux fHdFuxuQuxQxT2T1T2121则目标函数存在最优解的条件是:01xQxH0T2FxQuH0dFuxH解得极值点为:dQFFQFQu1T11T2*)(dQFFQFQFIx)(1T11T2*dQFFQFQFQQ)(1T11T
8、211*由于Q1,Q2均为正定矩阵,满足极小值的充分条件。6.4 泛函及其极值泛函及其极值变分法变分法1.什么是泛函?泛函就是函数的函数 函数:对于x定义域中的每一个x值,y又有一个(或者一组)确定的值与之对应,则称y是x的函数,记做y(x)。泛函:对应于某一类函数中的每一个确定的函数y(x),因变量J都有一个确定的值(注意、不是函数)与之对应,则称因变量J为宗量函数y(x)的泛函数,简称泛函,记做J=Jy(x)求弧长的泛函求弧长的泛函22)d()(ddyxl22)(1)dd(1ddyxyxlxylbaxxd)(12xyLxyxyJbabaxxxxd)(d)(1)(22)(1)(yyL一般的L
9、也是x,y的函数,xxyyLJbaxxd),(2泛函的极值泛函的极值求泛函极值的问题称为变分问题。求泛函极值的方法称为变分法。如果泛函 在任何一条与y0(x)接近的曲线上所取的值不小于Jy0(x),即 ,则称泛函 在曲线 上达到了极小值。反之,达到了极大值。)(xyJ0)()(0 xyJxyJJ)(xyJ)(0 xy泛函的变分的另一定义泛函的变分的另一定义)(),()()(0 xyxyLxyxyJJ)()()(xyJxyaxyJJ)(),()(),(xyaxyRxyaxyL)(),(xyaxyL)(xya为关于 的线性泛函)(),()(),(xyxyaLxyaxyL)(),(xyaxyR是关于
10、 的髙阶无穷小量,)(xya0)()()(),(lim)(),(lim00 xyxyaxyaxyRaxyaxyRaaaJxyxya00lim)(),(axyJxyaxyJa)()(),(lim0)(),(1lim)(),(1lim00 xyxyaLaxyaxyLaaa)(),(xyxyL例例6-3 求下列泛函的变分求下列泛函的变分fttdttxJ0)(2解:方法一ffttttdttxdttxtxJ00)()()(22ffttttdttxdttxtx002)()()(2fttdttxtx0)()(2fttdttxtxJ0)()(2的线性主部为,则J方法二0200)()()()(fttdttxtx
11、xyxyJJ020)()(fttdttxtx00)()()(2fttdttxtxtxfttdttxtx0)()(24泛函极值定理泛函极值定理0J0)()(0 xyxyJ6.泛函极值的必要条件泛函极值的必要条件欧拉方程欧拉方程 欧拉方程欧拉方程证明:设极值曲线为 ,泛函极值为)(*tx)(*tJ在极值曲线附近有一容许曲线 ,则 代表了 与 之间所有可能的曲线。)()(*ttx10),()(*ttx)(*tx)()(*ttx当 时,就是极值曲线 。0)(tx)(*txfttttxxLxJ0d),()(根据泛函极值条件0)(0txJJ000d),()(fttttxxLtxJ00d)(),()(),(
12、ftttxtxxLxtxxLftttxtxxLxtxxL0d),(),(fftttttxLtxL00dd对第二部分分部积分ffftttttttxLtxLtxL000dddd0ddd)(000ffttttxLtxLtxLtxJ0ddd0ftttxLtxL0ddxLtxL欧拉方程 展开后得00 xLxLLLxxxxt xx 欧拉方程是一个二阶方程,需要两个边界条件如果有两个固定端点,边界条件为:00)(xtxffxtx)(如有自由端点,则自由端满足 00fttxL确定的边界条件为 00txL0ftxL例6-5 设受控对象的微分方程为ux 以 和 为边界条件,求 使下列性能泛函极值取最小值。0 xf
13、x*ufttuxJ022d)(解解:将微分方程带入性能泛函fftttxxtuxJ022022d)(d)(22),(xxxxL欧拉方程为 022ddxxxLtxL 解得 tteCeCtx21)(带入边界条件021)0(xCCxfttfxeCeCtxff21)(解上面方程得到C1和C2,即获得)(*tx根据 ,可得最优控制 ux*u6.5用变分法求解连续系统的最优控制问题用变分法求解连续系统的最优控制问题系统状态方程为),(),()(ttttuxfx性能泛函为fttttttLJ0d),(),(ux寻求最优控制u(t),将系统从初始状态x(t0)转移到终端状态x(tf),并使性能泛函J取极值 解解状
14、态方程写成约束方程形式 0)(),(),(ttttxuxf应用拉格朗日乘子法,构造增广泛函:fttTtttttttttLJ0d)(),(),()(),(),(xuxfuxfttTTttttttttttLJ0d)()(),(),()(),(),(xuxfuxtttttttLHT),(),()(),(),(uxfux)()(ttHHTxffttTtttttHtHJ00d)()(dx0ddxxHtH0 xH0ddHtHxH0dduuHtH0uH0 x H00ftt伴随方程 系统的状态方程 控制方程 哈密尔顿正则方程 6.7 线性二次型最优控制问题线性二次型最优控制问题 状态调节器状态调节器的任务在于
15、,当系统状态由于任何原因偏离了平衡状态时,能在不消耗过多能量的情况下,保持系统状保持系统状态各分量仍接近平衡状态态各分量仍接近平衡状态。在研究这类问题时,通常把初始状态矢量看作扰动,而把零状态取做平衡状态。于是调节器问题就变为寻求最优控调节器问题就变为寻求最优控制规律制规律u,在有限的时间区间,在有限的时间区间t0,tf内,将系统从初始状态内,将系统从初始状态转移到零点附近,并使给定的性能泛函取极值转移到零点附近,并使给定的性能泛函取极值。设线性时变系统的状态空间表达式为)()()()()(tttttuBxAx)()()(tttxCy00)(xxt)()(21d)()(210210ffTttT
16、TtttttJfxQxuQuxQx 为nn维半正定的状态加权矩阵,为rr维半正定的状态加权矩阵,为nn维半正定的终端加权矩阵。)(1tQ)(2tQ0Q设设u取值不受限制,寻求最优控制,使取值不受限制,寻求最优控制,使J取极值。取极值。解:解:(1)构造哈密尔顿函数)()()()()()(21ttttttHTTTuBxAuQuxQx(2)控制方程0)()()(2tttHTBuQu)()()(12tttTBQu(3)正则方程0 xHAxQx)()(1ttHTxH)()()()(ttttHuBxAx)()()()()()(12ttttttHTBQBxA(4)边界条件00)(xxt)()()(21)(
17、)(00fffTfftttttxQxQxx(5)根据控制方程,控制最优控制u*(t)是线性函数,为了使用状态反馈,我们希望u*(t)是x的函数,为此,假设)()(tt xP)()()()(12ttttTxPBQu)()()()(12ttttTPBQK则K(t)就是最优反馈控制矩阵。(6)将 带入正则方程,消去 ,得)()(tt xP)()()()(1ttttHTxPAQx)()()()()()()(12ttttttHtTxPBQBAx(7)将 求导得)()(tt xP)()()()(ttttxPxP)()()()()()()()()()(121ttttttttttTTPBQBAPPPAQ)()
18、()()()()()()()()()(112tttttttttttTTQPBQBPPAAPP边界条件0)(QPft设线性定常系统的状态空间表达式为 BuAxx00)(xxtfttTTtJ0d 2121uQuxQx为nn维半正定的状态加权矩阵,为rr维半正定的状态加权矩阵。1Q2Q设u取值不受限制,寻求最优控制u*,使J取极值。解:最优控制为)()(12*ttTPxBQu其中P为为nn维正定常数矩阵,且满足下面得黎卡提矩阵代数方程0112QPBPBQPAPATT最优轨线是下列线性定常齐次方程得解xBKAPxBBQAxx)(12TPBBQKT12例例6-22 已知系统的状态方程u100010 xx
19、 性能泛函为 02222121d)2(21xuaxxbxxJ求使 的最优控制 minJ)(*tu解:已知0010A10Babb11Q12Q 为使 正定,假设 1Q02ba经检验受控系统完全能能控。和 正定,因此存在最优控制 1Q2Q)()(101)()(212221121112*txtxppppttTPxBQuP是如下黎卡提代数方程的解0112QPBPBQPAPATT00001101100100001022211211222112112221121122211211abbpppppppppppppppp整理得三个代数方程020122212221211212appbppppbppppapp221
20、21112221221在保证 和P为正定条件下,可得1Qbapapp221112212则系统最优控制为)(2)()()(2112101)()(212112*txatxtxtxabattuTPxBQ闭环系统框图闭环系统的状态方程为xx2110a闭环系统的传递函数为121)()(21assssWBBKAIC闭环极点)2(22222,1aajas参数根轨迹图为课堂练习课堂练习给定线性定常系统状态方程 ,系统初值为 ,设性能指标为21xx uxx2201)0(xx0)0(2x02222211)(21dtuxqxqJ设计最优状态反馈,使性能指标最小。解解1010A10B21100qqQ12Q 22211211ppppP将上述矩阵带入黎卡提代数方程0112QPBPBQPAPATT00000010110110010102122211211222112112221121122211211qqpppppppppppppppp将上式展开0)(20022222212221212112121pqpppppppq由上述第一个方程得 ,取 带入后两个方程112qp112qp211112112121qqqqqqqqP状态反馈矩阵21112211qqqTPBQK