1、 第第5 5章章 计算机控制系统的计算机控制系统的 离散状态空间设计离散状态空间设计1 1 状态空间描述的基本概念状态空间描述的基本概念 2 2 采用状态空间模型的极点配置设计采用状态空间模型的极点配置设计3 3 采用状态空间模型的最优化设计采用状态空间模型的最优化设计2022-8-61 状态空间设计法是建立在矩阵理论基础上、采状态空间设计法是建立在矩阵理论基础上、采用状态空间模型对多输入多输出系统进行描述、分用状态空间模型对多输入多输出系统进行描述、分析和设计的方法。析和设计的方法。用状态空间模型能够分析和设计多输入多输出用状态空间模型能够分析和设计多输入多输出系统、非线性、时变和随机系统等
2、复杂系统,可以系统、非线性、时变和随机系统等复杂系统,可以了解到系统内部的变化情况。并且这种分析方法便了解到系统内部的变化情况。并且这种分析方法便于计算机求解。于计算机求解。2022-8-625 51 1 状态空间描述的状态空间描述的基本概念基本概念1.1.离散时间系统的状态空间描述离散时间系统的状态空间描述 设连续的被控对象的状态空间表达式设连续的被控对象的状态空间表达式 )()()(|)()()()(00tCxtytxtx tButAxtxtt在在 作用下,系统的状态响应为作用下,系统的状态响应为)(tu tttAttABuetxetx00d)()()()(0)(其中其中 为系统的状态转移
3、矩阵。为系统的状态转移矩阵。取取 ,考虑到零阶保持器的作用,有,考虑到零阶保持器的作用,有)(0ttAe kTt 0Tkt)1()()(kTutx TktkT)1(TkkTTkTATAkTuBekTxeTkTx)1()()(d)()(则则(5 51 11 1)(5 51 1)(5 51 13 3)(5 51 1)2022-8-63 TkTt TtATAkTutBekTxeTkTx0)(d)()(作变量置换,令:作变量置换,令:由此可得系统连续部分的离散化状态空间表达式由此可得系统连续部分的离散化状态空间表达式 )()()()()1(kCxkykGukFxkx d ,0 TtATAtBeGeF其
4、中:其中:式中:式中:为为 维状态向量,维状态向量,为为 维控制向量,维控制向量,为为 维输出向量,维输出向量,为为 维状态转移矩阵,维状态转移矩阵,为为 维输入矩阵,维输入矩阵,为为 维输出矩阵。维输出矩阵。)(kxn)(kum)(kyrFnn Gmn nr C(5 51 1)(5 51 1)(5 51 1)2022-8-64可用迭代法求得,可用迭代法求得,)1()2()1()0()1()1()()2()1()0()0()2()2()3()1()0()0()1()1()2()0()0()1(kkkkkxxGuFGuGuFxFGuFxxGuFGuGuFFGuFxxGuFGuFGuFxxGuFx
5、x1kk23210)()0()(kjjkGuFxFx1jkk即:即:以以k k0 0,1 1,代入式(代入式(5 51 16 6)离散时间系统状态方程的解离散时间系统状态方程的解2022-8-65离散时间系统的能控性离散时间系统的能控性 描述的系统,描述的系统,如果存在有限个控制信号,如果存在有限个控制信号,能使系统从任意初始状态转移,能使系统从任意初始状态转移到终态,则系统是状态完全能控的。到终态,则系统是状态完全能控的。)()()()()1(kCxkykGukFxkx)0(u、)1(u)1(Nu)0(x)(Nx)1()2()0()0()0()(21NNNNNNGuFGuGuFGuFxFx写
6、成矩阵形式写成矩阵形式)1()1()0()0()(21NNNNNuuuGGFGFxFx能控性定义:能控性定义:对于式对于式根据状态方程的解,有根据状态方程的解,有2022-8-66则则 、有解的充分必要条件:有解的充分必要条件:系统的能控性判据系统的能控性判据)0(u)1(u)1(Nu G GF FFGFGG G1 1N Nnrank式中式中:n n为系统状态向量的维数。为系统状态向量的维数。输出的能控性条件为输出的能控性条件为 rank1r NGCFCFGGC式中式中:r r 为输出向量的维数。为输出向量的维数。2022-8-67描述的系统,描述的系统,如果如果能根据有限个采样信号能根据有限
7、个采样信号,确定出系统的初始状态确定出系统的初始状态 ,则系统,则系统是状态完全能观的是状态完全能观的。离散时间系统的能观性离散时间系统的能观性 )()()()()1(kCxkykGukFxkx)0(Y、)(NY)0(x能观性定义:能观性定义:对于式对于式)1(Y根据状态方程的解,从根据状态方程的解,从0到到 时刻,各采样时刻,各采样瞬时的观测值为:瞬时的观测值为:)0()1()1()0)1()1()0()0(1xCFCxyCFxCxyCxyNNNTN)1(2022-8-68写成矩阵形式写成矩阵形式)0()1()1()0(1xCFCFCyyyNN则则 有解的充分必要条件,即系统的能观性判据为有
8、解的充分必要条件,即系统的能观性判据为 )0(xn 1NCFCFCrank式中式中n n为系统状态向量的维数为系统状态向量的维数。2022-8-695 52 2 采用状态空间模型的极点配置设计采用状态空间模型的极点配置设计 图图5 52 2 按极点配置设计的控制器按极点配置设计的控制器状态空间模型按极点配置状态空间模型按极点配置设计的控制器由两部分组设计的控制器由两部分组成:一部分是状态观测器,成:一部分是状态观测器,它根据所量测到的输出它根据所量测到的输出 重构出状态重构出状态 ;另一部;另一部分是控制规律,它直接反分是控制规律,它直接反馈重构的状态馈重构的状态 ,构成,构成状态反馈控制。状
9、态反馈控制。)(ky)(kx根据分离性原理,控制器的设根据分离性原理,控制器的设计可以分为两个独立的部分:计可以分为两个独立的部分:一是假设全部状态可用于反馈,一是假设全部状态可用于反馈,按极点配置设计控制规律;二按极点配置设计控制规律;二是按极点配置设计观测器。是按极点配置设计观测器。)(kx2022-8-6101 1 按极点配置设计控制规律按极点配置设计控制规律 设被控对象的离散状态空间表达式为设被控对象的离散状态空间表达式为 )()()()()1(kkkkkCxyGuFxx控制规律为线性状态反馈控制规律为线性状态反馈 )()(kkLxu假设反馈的是假设反馈的是被控对象实际的全部状态被控对
10、象实际的全部状态x x(k k)得闭环系统的状态方程为得闭环系统的状态方程为 )()()1(kkxGLFx)()()(zzzxGLFX作作Z Z变换变换 显然,闭环系统的特征方程为显然,闭环系统的特征方程为 0GLFI z图图5-3 5-3 状态反馈系统结构图状态反馈系统结构图 2022-8-611如何设计反馈控制规律,如何设计反馈控制规律,以使闭环系统具有所期望的极点配置以使闭环系统具有所期望的极点配置?首先根据对系统的性能要求,找出所期望的闭环系统控制首先根据对系统的性能要求,找出所期望的闭环系统控制极点极点 ,再根据极点的期望值,再根据极点的期望值 ,求得闭环,求得闭环系统的特征方程为系
11、统的特征方程为 ),2,1(nizi iz 0)()()(1121 nnnnczzzzzzzzz 反馈控制规律应满足如下的方程反馈控制规律应满足如下的方程 )(|zzcGLFI 如果被控对象的状态为如果被控对象的状态为 维,控制作用为维,控制作用为 维,则反馈维,则反馈控制规律为控制规律为 维,即维,即 中包含中包含 个元素。个元素。nmnm Lnm 2022-8-612例例5-15-1 对于单输入系统,给定二阶系统的状态方程对于单输入系统,给定二阶系统的状态方程)(1.0005.0)()(101.00)1()1(2121tutxtxkxkx 设计状态反馈控制规律设计状态反馈控制规律 ,使闭环
12、极点为,使闭环极点为L25.08.02,1jz 解解 根据能控性判据,因根据能控性判据,因 21.01.0015.0005.0rankrankFGG所以系统是能控的。期望的闭环特征方程为所以系统是能控的。期望的闭环特征方程为 07.06.1)()(221 zzzzzzzc 设状态反馈控制规律设状态反馈控制规律21llL 2022-8-613取取 ,比较两边同次幂的系数,有,比较两边同次幂的系数,有)()(zzc 7.01.0005.016.11.0005.022121llll101 l5.32 l可得可得:即状态反馈控制规律即状态反馈控制规律为为 5.310L01.0005.01)1.0005
13、.02(1005.0101.011001|)(2121221llzllzllzzzGLFI闭环系统的特征方程为闭环系统的特征方程为 2022-8-6142 2 按极点配置设计状态观测器按极点配置设计状态观测器 在实际工程中,采用全状态反馈通常是不现实在实际工程中,采用全状态反馈通常是不现实的。常用的方法是设计状态观测器,由测量的输出的。常用的方法是设计状态观测器,由测量的输出值值 重构全部状态,实际反馈的只是重构状重构全部状态,实际反馈的只是重构状态态 。即。即 )(ky)(kx)()(kkxLu常用的状态观测器有三种。常用的状态观测器有三种。图图5-4 5-4 状态观测器结构图状态观测器结构
14、图2022-8-615状态重构误差的动态性能取决于特征方程根的分布。若状态重构误差的动态性能取决于特征方程根的分布。若状态重构误差为:状态重构误差为:)1()1()1(kkkxxx得状态重构误差方程为:得状态重构误差方程为:)()()()()()()1(kkCxkkkkkxCKGuxFGuFxx)()(kxKCF 预报观测器的特征方程:预报观测器的特征方程:0KCFI z的特性是快速收敛的,则对于任何初始误差的特性是快速收敛的,则对于任何初始误差 ,都将快都将快速收敛到零。因此,只要适当地选择增益矩阵速收敛到零。因此,只要适当地选择增益矩阵 ,便可获得要,便可获得要求的状态重构性能。求的状态重
15、构性能。KCF)0(x)(kxK预报观测器预报观测器观测器方程观测器方程 )()()()()1(kkykkkxCKGuxFx2022-8-616如果给出观测器的极点,可求得观测器的特征方程如果给出观测器的极点,可求得观测器的特征方程 0)()()(1121 nnnnbzzzzzzzzz 为了获得所需要的状态重构性能,应有为了获得所需要的状态重构性能,应有 )(bzKCFFzI 通过比较两边通过比较两边z z的同次幂的系数,可求得的同次幂的系数,可求得 中的中的n n个未知数。个未知数。对于任意的极点配置,对于任意的极点配置,具有唯一解的充分必要条具有唯一解的充分必要条件是对象是完全能观的。件是
16、对象是完全能观的。KK2022-8-617现时观测器现时观测器观测器方程观测器方程 )1()1()1()1()()()1(kkkkkkkxCyKxxGuxFx状态重构误差为状态重构误差为 )1()1()1(kkkxxx状态重构误差方程:状态重构误差方程:)1()1()1(kkkxxx )1()1()1()()(kxCkyKkxkGukFx)()(kkxxKFCF)(kxKCFF 2022-8-618现时观测器特征方程:现时观测器特征方程:0|KCFFI z为使现时观测器具有期望的极点配置,应有为使现时观测器具有期望的极点配置,应有)(|zzbKCFFI 同理,通过比较两边同理,通过比较两边z
17、z的同次幂的系数,可的同次幂的系数,可求得求得K K 中的中的n n个未知数。个未知数。降阶观测器降阶观测器 将原状态向量分成两部分,一部分是可以直将原状态向量分成两部分,一部分是可以直接测量的接测量的 ,一部分是需要重构的,一部分是需要重构的 。)(kxa)(kxb2022-8-619被控对象的离散状态方程可以分块表示为被控对象的离散状态方程可以分块表示为 )()()()1()1()1(bababbbaabaabakuGGkxkxFFFFkxkxkx )()()()1()()()()1(babaaaaabababbbbkkkkkkkkxFuGxFxuGxFxFx即即 )()()()()1(k
18、kkkkCxyGuFxx比较比较abaaaaabababbb )()()1()()()()()()(FCkuGkxFkxkykuGkxFkGuFFkxkx 得:得:2022-8-620观测器方程观测器方程:)()()()1(bababbbbkkkkuGxFxFx )()()()1(babaaaaakkkkxFuGxFxK)1()1()1(bbb kkkxxx )()()(bbabbbkkxxKFF 状态重构误差方程:状态重构误差方程:0|abbb KFFI z降阶观测器特征方程:降阶观测器特征方程:同理,使同理,使 ,通过比较两,通过比较两边边z z的同次幂的系数,可求得的同次幂的系数,可求得
19、K K 中的中的n n个未知数。个未知数。(z)zbabbb|KFFI2022-8-6213 3 按极点配置设计控制器按极点配置设计控制器 1 1)控制器组成)控制器组成 设被控对象的离散状态空间描述为设被控对象的离散状态空间描述为 kkkkk)()()()()1(CxyGuFxx控制器由预报观测器和状态反馈控制律组成,即控制器由预报观测器和状态反馈控制律组成,即 kk kkkkk)()()()()()()1(xLuxCyKGuxFx2 2)分离性原理)分离性原理闭环系统的状态方程为闭环系统的状态方程为 kkkkkk)()()()1()()()1(xKCGLFKCxxxGLFxx kkkk)(
20、)()1()1(xxKCGLFKCGLFxx矩阵形式:矩阵形式:2022-8-622闭环系统的特征方程为闭环系统的特征方程为 KCGLFKCGLFI zz)()(第二列加到第一列KCGLFIKCGLFI zz )(第二行减去第一行KCGLFIGLFIGLGLFI zzz 0KCFIGLGLFI zz 0)()(zzbc可见,闭环系统的可见,闭环系统的2 2n n个极点由两部分组成,一部分是按极个极点由两部分组成,一部分是按极点配置设计的控制规律给定的点配置设计的控制规律给定的n n个极点,称为控制极点,另个极点,称为控制极点,另一部分是按极点配置设计的状态观测器给定的一部分是按极点配置设计的状
21、态观测器给定的n n个极点,称个极点,称为观测器极点。两部分相互独立,可分别设计为观测器极点。两部分相互独立,可分别设计 。2022-8-6233 3)数字控制器实现)数字控制器实现设状态反馈控制规律为设状态反馈控制规律为 )()(kkxLu代入预报观测器方程代入预报观测器方程 kkkkk)()()()()1(xCyKGuxFx观测器与控制规律的关系观测器与控制规律的关系 )()()()1(kkkKyxKCGLFx zzzzKKCGLFILYUD1)()()()(得控制器的脉冲传递函数为得控制器的脉冲传递函数为)()()(1zzzKYKCGLFILU将脉冲传递函数转将脉冲传递函数转换为差分方程
22、,就换为差分方程,就可以在计算机上实可以在计算机上实现数字控制器。现数字控制器。2022-8-624 ,无阻尼自然频率,无阻尼自然频率 ;观测器极点所对应的衰减速度比控制极点所对应的观测器极点所对应的衰减速度比控制极点所对应的衰减速度快约衰减速度快约3 3倍。倍。例例5 53 3 设被控对象的传递函数为设被控对象的传递函数为 ,采样,采样周期周期 ,采用零阶保持器,试设计状态反馈控制器,采用零阶保持器,试设计状态反馈控制器,要求:要求:sT1.0)10(10)(sssG6.0 4 n 闭环系统的性能相应于二阶连续系统的阻尼比闭环系统的性能相应于二阶连续系统的阻尼比解解 被控对象的等效微分方程为
23、被控对象的等效微分方程为)(10)(10)(tutyty 定义两个状态变量定义两个状态变量)()()()(121txtxtytx 2022-8-625则被控对象的连续状态空间表达式则被控对象的连续状态空间表达式)(100)()(10010)()()()(2121tutxtxtutxtxtxBA)()(01)()(21txtxttCxy离散状态空间表达式离散状态空间表达式)()()()()1(kkkkkCxyGuFxx368.00063.010)1(1.011010TTTeeeAF其中:其中:632.0037.011.01.0d10100TTTeeTteBGTA01C2022-8-626判断被控
24、对象的能控性和能观性判断被控对象的能控性和能观性 2233.0632.0077.0037.0rankrankFGG2063.0101rankrankCFC因此,被控对象是能控且能观的。因此,被控对象是能控且能观的。根据能控性判据和能观性判据根据能控性判据和能观性判据 设计状态反馈控制规律设计状态反馈控制规律L 设状态反馈控制规律为设状态反馈控制规律为 ,对应的特征方程为,对应的特征方程为 21llL 21632.0037.0368.00063.0100llzzzGLFI)632.0026.0368.0()632.0037.0368.1(21212llzllz 0 2022-8-627根据对闭环
25、极点的要求,对应的极点和特征方程为根据对闭环极点的要求,对应的极点和特征方程为2.34.2122,1jsnn 248.0747.032.024.02,1jeezjsT )248.0747.0()248.0747.0()(jzjzzc 0620.0494.12 zz由由 ,可得,可得)(zGLFI zc 620.0632.0026.0368.0494.1632.0037.0368.12121llll解得解得L L1 12 2,L L2 20.3170.317,即,即 317.02 L2022-8-628 设计状态观测器设计状态观测器 选用现时观测器,设观测器增益矩阵为选用现时观测器,设观测器增益
26、矩阵为 TkkK 21 现时观测器的特征方程为现时观测器的特征方程为 368.00063.0101368.00063.010021kkzzKCFFI z2211063.0368.0063.0063.01kzkkkz 0)368.0368.0()063.0368.1(1212 kzkkz487.03)24.0(2,1 ez依题意:依题意:对应的特征方程为对应的特征方程为0237.0974.0)487.0()487.0()(2 zzzzzb 2022-8-629解得解得 ,即,即 由由 ,可得,可得)(zzbKCFFI 237.0368.0368.0974.0063.0368.1121kkk356
27、.01 k603.02 k T 603.0356.0 K 组成控制器组成控制器)()()()()()()1(kk kkkkkxLuxCyKGuxFx317.02L T 603.0356.0 K其中其中。2022-8-6305 53 3 采用状态空间模型的最优化设计采用状态空间模型的最优化设计针对随机系统按最优化方法设计控制器。针对随机系统按最优化方法设计控制器。假定被控对象是线性的,系统性能指标是状态假定被控对象是线性的,系统性能指标是状态和控制的二次型函数,则系统的综合问题就是寻求和控制的二次型函数,则系统的综合问题就是寻求允许的控制信号序列,使性能指标函数最小,这类允许的控制信号序列,使性
28、能指标函数最小,这类问题称为线性二次型(问题称为线性二次型(Linear QuadraticLinear Quadratic)控制问)控制问题。如果考虑系统中随机的过程干扰和量测噪声,题。如果考虑系统中随机的过程干扰和量测噪声,且过程干扰和量测噪声均是具有正态分布的白噪声,且过程干扰和量测噪声均是具有正态分布的白噪声,这类问题称为线性二次型高斯(这类问题称为线性二次型高斯(Linear Quadratic Linear Quadratic GaussianGaussian)控制问题。)控制问题。2022-8-631 最优控制器也是由两部分组成,一部分是最优控制器也是由两部分组成,一部分是状态最
29、优估计器;另一部分是最优控制规律。状态最优估计器;另一部分是最优控制规律。图图55 最优调节器结构图最优调节器结构图LQGLQG 其设计也可分为两个独立的部分:一是将系统看其设计也可分为两个独立的部分:一是将系统看作确定性系统;二是考虑随机的过程干扰作确定性系统;二是考虑随机的过程干扰 v 和量测和量测噪声噪声w,设计状态最优估计器。,设计状态最优估计器。2022-8-6321 1 最优控制规律设计最优控制规律设计 有限时间最优调节器设计有限时间最优调节器设计 )()()1(kGukFxkx )0(0 xx )()()()()()(100 Nk2T1TTkuQkukxQkxNxQNxJ设连续被
30、控对象的离散化状态方程为设连续被控对象的离散化状态方程为 初始条件初始条件给定二次型性能指标函数给定二次型性能指标函数 线性二次型最优控制的任务是寻求最优控制序列线性二次型最优控制的任务是寻求最优控制序列 (k0,1,N1),在把初始状态),在把初始状态x(0)转移到转移到x(N)的过程中,使性能指标函数最小。的过程中,使性能指标函数最小。)(ku2022-8-633 求解二次型最优控制问题可采用变分法、动态规划法等求解二次型最优控制问题可采用变分法、动态规划法等方法。这里采用离散动态规划法来进行求解。方法。这里采用离散动态规划法来进行求解。动态规划法的基本思想是:将一个多级决策过程转变动态规
31、划法的基本思想是:将一个多级决策过程转变为求解多个单级决策优化问题,这里需要决策的是控制变为求解多个单级决策优化问题,这里需要决策的是控制变量量 (k0,1,N1)。)。令二次型性能指标函数令二次型性能指标函数 )(ku )()()()()()(1210NikTTTikkkkNNJuQuxQxxQx )()()()()()()()()()(1121210 kkkkiiiiNNNikTTTTTuQuxQxuQuxQxxQx iiiiJTTi)()()()(211uQuxQx其中:其中:iN1、N2、0。2022-8-634 NxQNxTN)()(0 J NuQNuNxQNxJJTTNN)1()1
32、()1()1(211 NuQNuNxQNxNxQNxTTT )1()1()1()1()()(210 )1()1()1()1(0 NGuNFxQNGuNFxT NuQNuNxQNxTT)1()1()1()1(00 首先求解首先求解 ,以使,以使 最小。求最小。求 对对u(N1)的的一阶导数并令其等于零:一阶导数并令其等于零:)1(Nu NuQNuFQGNxFQGNuddJTTTTN)1(2)1(2)1(2)1(2001 1 NJ由上式和连续被控对象的离散化状态方程,有由上式和连续被控对象的离散化状态方程,有1 NJ2022-8-635 )1()1(0102 NNTT FxQGGQGQu NN)1
33、()1(xL进一步求得最优的控制决策为进一步求得最优的控制决策为 )()()1(12FNSGGNSGQNLTT )(0QS N其中其中得得 )1()1()1(1 NxNSNxJTN )1()()1()1(NGLFNSNGLFNST )1()1(21 NLQNLQT依次,可求的依次,可求的 、。)2(Nu)3(Nu)0(u、其中其中2022-8-636计算计算 公式归纳:公式归纳:kkk)()()(xLu )1()1()(12FSGGSGQL kkkTT )()()()1()()(21 kkkkkkTTLQLQGLFSGLFS )(0 NQS 0,2,1NNk最优性能指标为最优性能指标为 )0(
34、)0()0(minxSxJT 满足上式的最优控制一定存在且是唯一的。满足上式的最优控制一定存在且是唯一的。其中其中)(ku利用以上公式可以逆向递推计算出利用以上公式可以逆向递推计算出S S(k k)和和L L(k k)。2022-8-637无限时间最优调节器设计无限时间最优调节器设计设被控对象的状态方程为设被控对象的状态方程为 )()()1(kkkGuFxx 当当NN时,其性能指标函数简化为时,其性能指标函数简化为 )()()()(021kTTkkkkJuQuxQx其中其中 是非负定对称阵,是非负定对称阵,是正定对称阵。是正定对称阵。假定假定F,G是是能控的,且能控的,且F,D是能观的,其中是
35、能观的,其中D为能使为能使DTDQ1成立成立的任何矩阵。的任何矩阵。计算机控制系统的最优设计,计算机控制系统的最优设计,最经常碰到的是离散定常系统最经常碰到的是离散定常系统终端时间无限的最优调节器问终端时间无限的最优调节器问题。当终端时间题。当终端时间N时,矩时,矩阵阵S(k)将趋于某个常数,因此将趋于某个常数,因此可得到定常的最优反馈增益矩可得到定常的最优反馈增益矩阵阵L,便于工程实现。,便于工程实现。0 xx(0)1Q2Q2022-8-638存在,且是与存在,且是与 无关的常数阵。无关的常数阵。)()1()1()1()1()(0112 QSQFSGGSGQGSSFSNkkkkkTTT或或:
36、的解,那么对于任何非负定对称阵的解,那么对于任何非负定对称阵 ,有,有0Q0Q设设S S(k k)是如下的黎卡堤(是如下的黎卡堤(RiccatiRiccati)方程)方程 )()()()()1()()()1()1()(02112 QSLQLQGLFSGLFSFSGGSGQLNkkkkkkkkkTTTT可以证明有以下几点结论:可以证明有以下几点结论:),(lim),(lim NkNkNNSSS2022-8-639 稳态控制规律稳态控制规律 kkTTSFGSGGQLLxu12)()()(是使上面性能指标函数是使上面性能指标函数J极小的最优反馈控制规律。极小的最优反馈控制规律。最优性能指标函数为最优
37、性能指标函数为 JT)0()0(minSxx 所求得的最优控制规律使得闭环系统是渐近稳定。所求得的最优控制规律使得闭环系统是渐近稳定。S S是如下的黎卡堤代数方程是如下的黎卡堤代数方程 kTTTT1212)()()(QLQLGLFSGLFSSFGSGGQL TTT112)(QFSGSGGQSGSFS或:或:的唯一正定对称解的唯一正定对称解 。2022-8-640 该结论说明了:当满足上述结论中所给条件该结论说明了:当满足上述结论中所给条件时,最优的反馈控制规律是常数阵;并且使得闭时,最优的反馈控制规律是常数阵;并且使得闭环系统是渐近稳定的。同时该结论也指出了计算环系统是渐近稳定的。同时该结论也
38、指出了计算最优反馈控制规律的途径,它既可以通过直接黎最优反馈控制规律的途径,它既可以通过直接黎卡堤代数方程求解,也可以通过迭代法解黎卡堤卡堤代数方程求解,也可以通过迭代法解黎卡堤差分方程求得。同时也可以看出,结论条件差分方程求得。同时也可以看出,结论条件“是是正定对称阵正定对称阵”可以放宽到可以放宽到“是半正定对称阵是半正定对称阵”。2022-8-641例例54 考虑离散系统:考虑离散系统:)()()1(kukxkGFx)()()(kkkDuCxy其中:3333.991;13600;0.0 ;0.0 ;0.0 5833.3502132.0 0.0 0843.0 0.0 0.0 3581.021
39、11.01415.00.0 0.0 4635.4050.0 4193.156667.9741360049.00.0 1937.0F6667.97413600000G00001C 0D设计最优控制器,使性能指标:设计最优控制器,使性能指标:021)()()()(21kkkkkuQxQxJTT Tu u最小。最小。2022-8-642解解 选选 和和 ,。通过通过MATLABMATLAB仿真,可解得两种情况下的最优反馈增益矩阵为:仿真,可解得两种情况下的最优反馈增益矩阵为:1111101diagQ11111001diagQ12Q9197.09961.03575.08045.17398.01L922
40、4.09963.06208.05601.80123.72L0510152000.20.40.60.81Output value y=x1Time(sec)0510152000.20.40.60.811.21.4Output value y=x1Time(sec)(a)(a)权矩阵权矩阵 较小的情况较小的情况 (b)(b)权矩阵权矩阵 较大的情况较大的情况 1Q1Q2022-8-643解解 选选 ,和和 。通过通过MATLABMATLAB仿真,可解得两种情况下的最优反馈增益矩阵为:仿真,可解得两种情况下的最优反馈增益矩阵为:1111101diagQ102Q12Q8493.03116.01252.
41、06430.01292.01L9197.09961.03575.08045.17398.02L05101520012345control input uTime(sec)0510152000.511.52control input uTime(sec)(a)(a)权矩阵权矩阵 较小的情况较小的情况 (b)(b)权矩阵权矩阵 较大的情况较大的情况 2Q2Q2022-8-6442 2 状态最优估计器设计状态最优估计器设计 目前有许多状态估计方法,这里介绍目前有许多状态估计方法,这里介绍KalmanKalman滤波器。滤波器。设被控对象的离散状态空间表达式为设被控对象的离散状态空间表达式为 )()(
42、)()()()()1(kkkkkkkwCxyvGuFxx其中:其中:x(k)为为n维状态向量,维状态向量,u(k)为为m维控制向量,维控制向量,y(k)为为r维输出向量,维输出向量,v(k)为为n维过程干扰向量,维过程干扰向量,w(k)为为r维测量噪声维测量噪声向量。假设向量。假设v(k)和和w(k)均为离散化处理后的高斯白噪声序均为离散化处理后的高斯白噪声序列,且有列,且有 )()(,0)(kjTjkEkEVvvv )()(,0)(kjTjkEkEWwww 0 1jkjkkj设设V为非负定对称阵,为非负定对称阵,W为正定对称阵,并设为正定对称阵,并设v(k)和和w(k)不相关。不相关。1 1
43、)KalmanKalman滤波公式的推导滤波公式的推导2022-8-645 由于系统中存在随机的干扰由于系统中存在随机的干扰v(k)和随机的量测噪声和随机的量测噪声w(k),因此系统的状态向量因此系统的状态向量x(k)也是随机向量,也是随机向量,y(k)是能够量测的输是能够量测的输出量。若记出量。若记x(k)的估计量为的估计量为问题:如何根据输出量问题:如何根据输出量y(k)估计出估计出x(k)()()(kkkxxx)(kx则:则:为状态的估计误差,因而为状态的估计误差,因而 )()()(kkkTxxEP为状态估计的协方差阵。为状态估计的协方差阵。显然显然P P(k k)为非负定对称阵。这里估
44、计的准则为:根据为非负定对称阵。这里估计的准则为:根据量测量量测量y y(k k),y y(k k1)1),最优地估计出,以使,最优地估计出,以使P P(k k)极极小(因小(因P P(k k)是非负定对称阵,因此可比较其大小)。这样是非负定对称阵,因此可比较其大小)。这样的估计称为的估计称为最小方差估计。最小方差估计。2022-8-646根据最优估计理论,最小方差估计为根据最优估计理论,最小方差估计为 kkkk),1(),(|)()(yyxEx 即即x(k)最小方差估计等于在直到最小方差估计等于在直到k时刻的所有量测量时刻的所有量测量y的情的情况下况下x(k)的条件期望。的条件期望。引入更一
45、般的记号引入更一般的记号 ),1(),(|)()|(kkjkjyyxEx若若 ,表示根据直到现时刻的量测量来估计过去时刻的状,表示根据直到现时刻的量测量来估计过去时刻的状 态,称为内插或平滑;态,称为内插或平滑;,表示根据直到现时刻的量测量来估计将来时刻的状,表示根据直到现时刻的量测量来估计将来时刻的状态,称为预报或外推;态,称为预报或外推;,表示根据直到现时刻的量测量来估计现时刻的状态,表示根据直到现时刻的量测量来估计现时刻的状态,称为滤波。称为滤波。这里所讨论的状态最优估计问题即是指这里所讨论的状态最优估计问题即是指滤波问题滤波问题。jk jk jk 2022-8-647引入如下记号:引入
46、如下记号:)1|1()1(kkkxx;k k1 1时刻的状态估计时刻的状态估计 )1()1()1(kkkxxx;k k1 1时刻的状态估计误差时刻的状态估计误差 )1()1()1(kkkTxxEP;k k1 1时刻的状态估计误差协方差阵时刻的状态估计误差协方差阵)1|(kkx;一步预报估计一步预报估计)1|()()1|(kkkkkxxx;一步预报估计误差一步预报估计误差)1|()1|()1|(kkkkkkTxxEP;一步预报估计误差误差协方差阵;一步预报估计误差误差协方差阵)|()(kkkxx同样,如:同样,如:;k k时刻的状态估计时刻的状态估计 2022-8-648求一步预报误差求一步预报
47、误差 ),1(),(|)()1|(kkkkkyyxEx ),1(),(|)1()1()1(kkkkkyyvGuFxE ),1(),(|)1(),1(),(|)1(kkkkkkyyGuEyyFxE ),1(),(|)1(kkkyyvE根据前面的定义,上式中第一项为根据前面的定义,上式中第一项为 ,是输入到是输入到控制对象的确定量控制对象的确定量,因此上式中的第二项为,因此上式中的第二项为 。第三。第三项中项中 、均与均与 不相关,则第三项为零。不相关,则第三项为零。)1(kxF)1(ku)1(kGu)(ky)1(ky)1(ku求得一步预报方程为求得一步预报方程为 )1()1()1|(kkkkGu
48、xFx2022-8-649可求得可求得一步预报估计误差一步预报估计误差为为)1|()1()1|(kkkkkxxx )1()1()1()1()1(kkkkkGuxFvGuFx )1()1(kkvxF可进一步求得可进一步求得一步预报误差的协方差阵一步预报误差的协方差阵为为 )1|()1|()1|(kkkkkkTxxEP )1()1()1()1(kkkkvxFvxFE )1()1()1()1(kkkkTTTvxEFFxxEF )1()1()1()1(kkkkTTTvEvFxEvF简化为简化为 VFFPPTkkk)1()1|(2022-8-650 该估计器方程具有明显的物理意义。式中第一项该估计器方程
49、具有明显的物理意义。式中第一项 是是 的一步最优预报估计,它是根据直到的一步最优预报估计,它是根据直到 时刻的所时刻的所有量测量的信息而得到的关于有量测量的信息而得到的关于 的最优估计。式中第二项的最优估计。式中第二项是修正项,它是根据最新的量测信息是修正项,它是根据最新的量测信息 对最优预报估计进对最优预报估计进行修正。在第二项中行修正。在第二项中 其中其中 称为状态估计器增益,或称为状态估计器增益,或KalmanKalman滤波器增益。滤波器增益。设设x(k)的最小方差估计具有如下形式:的最小方差估计具有如下形式:)1|()()()1|()(kkkkkkkxCyKxx)(kK)1|(kkx
50、)(kx1 k)(kx)(ky )1|()()(kkkkxCyy是关于量测量是关于量测量 的一步预报估计。的一步预报估计。)(ky2022-8-651 )1|()()1|()()1|(kkkkkkkkxCyyyy是关于量测量的一步预报误差,它包含了最新量测量的信息。是关于量测量的一步预报误差,它包含了最新量测量的信息。因此因此x(kx(k)的最小方差估计所表示的最优状态估计可以看成的最小方差估计所表示的最优状态估计可以看成是一步最优预报与最新量测量信息的加权平均,其中增益矩阵是一步最优预报与最新量测量信息的加权平均,其中增益矩阵 可认为是加权矩阵。从而可认为是加权矩阵。从而问题变为如何合适地选