1、绪论三种重要的先进控制理论概述估计理论:估计理论:估计理论所要解决的基本问题是如何从被噪声污染的观测信号(观测数据)估计理论所要解决的基本问题是如何从被噪声污染的观测信号(观测数据)中尽可能充分地滤除干扰噪声的影响,在某种意义下求得被估信号的最优估中尽可能充分地滤除干扰噪声的影响,在某种意义下求得被估信号的最优估计。计。19世纪初世纪初 高斯高斯最小二乘法;最小二乘法;20世纪世纪20-30年代年代 费歇尔费歇尔经典估计理论;经典估计理论;1941年年 柯尔莫戈洛夫柯尔莫戈洛夫离散时间情况下的预测问题;离散时间情况下的预测问题;1942年年 维纳维纳连续时间滤波;连续时间滤波;20世纪世纪60
2、年代初年代初 卡尔曼卡尔曼卡尔曼滤波理论;卡尔曼滤波理论;20世纪世纪70年代以来年代以来 多传感器信息融合多传感器信息融合绪论三种重要的先进控制理论概述卡尔曼滤波理论:卡尔曼滤波理论:相对于其他估计方法(如最小二乘估计、最小方差估计、极大后验估计、贝相对于其他估计方法(如最小二乘估计、最小方差估计、极大后验估计、贝叶斯估计、极大似然估计),卡尔曼滤波从与被估计信号有关的量测值中通叶斯估计、极大似然估计),卡尔曼滤波从与被估计信号有关的量测值中通过算法提取出所需信号,它实际上是对随时间改变的参数估计的一种顺序最过算法提取出所需信号,它实际上是对随时间改变的参数估计的一种顺序最小二乘逼近。小二乘
3、逼近。特点:特点:l算法是递推的,且使用状态空间法在时域内设计滤波器,所以适用于对算法是递推的,且使用状态空间法在时域内设计滤波器,所以适用于对多维随机过程的估计。多维随机过程的估计。l采用动力学方程即状态方程描述被估计量的动态变化规律,被估计量的采用动力学方程即状态方程描述被估计量的动态变化规律,被估计量的动态统计信息由过程白噪声的统计信息和动力学方程确定。动态统计信息由过程白噪声的统计信息和动力学方程确定。l离散型算法可直接在数字计算机上实现。离散型算法可直接在数字计算机上实现。第五章 估计问题基础l当今时代是信息时代,是知识飞速增长的时代。一方面,各门学科不断分化,分支学科越来越多,各种
4、新兴学科和新领域不断出现 各学科和领域之间又不断相互渗透、相互交叉,不 断产生许多新的边缘学科和领域 5.1 估计问题的发展过程和估计问题分类u 估计理论涉及系统辨识(System Identification)状态估计(State Estimation)时间序列分析(time series analysis)多传感器信息融合(Multisensor Information Fusion)四门学科及它们相互交叉、相互渗透的边缘学科和领域。模型(Model)是对事物、现象、过程或系统的简化描述或模仿,有物理模型、数学模型、仿真模型等。建立一个数学模型通常包括两方面工作:是模型结构的确定(包括模型
5、的类型和阶次等)模型的参数估计 估计问题可分为五类 模型参数估计 时间序列、信号或状态估计 多传感器信息融合估计 自校正信号或状态估计 I.自校正信息融合信号或状态估计 从估计的精度或性能来看,估计可分为 最优估计 次优估计 自校正估计。最优估计是相对的,是针对一定的性能指标而言的 例如,“最小二乘法”估计、线性最小方差估计、加 权最优融合估计等。在一种性能指标下的最优估计可能是在另一种性能指标下的次优估计 5.2.1 参数估计 第一类最优估计问题是模型参数估计问题。建立数 学模型是对时间序列、信号或系统状态进行估计的 基础。模型参数估计的最基本的方法是最小二乘法(Least Square M
6、ethod)。最小二乘法的基本原理是实际观测值与模型计算值的误差的平方和最小原理,由此得名“最小二乘”法。5.2 模型参数估计问题 例1:快速动态椭圆检测 (,)ccxyab,和旋转角 ,如图1所示。在图像处理、机器人等领域,需要对运动图像中的椭圆曲线进行快速检测,这个问题类似于当年高斯提出用最小二乘法确定天体运动轨道。几何上这个问题归结为确定其标准型的五个参数,即椭圆中心位置 ,长短轴图1 椭圆曲线和检测点(,)ccxy 椭圆和其他二次曲线方程的一般形式为 220(5.2.1)xgxycydxeyf通常检测椭圆上的点的坐标是带有测量误差的,为此利用椭圆曲线上更多的点的坐标的检测得到较精确的椭
7、圆参数估计 将已知椭圆上 个点的坐标的检测值 (含有检测误差),代入5.2.1,则有方程误差 ,即 N(,)iix y1,2,iNi22iiiiiiixgx ycydxeyf1,2,iNu 最小二乘法原理就是用极小化方程误差的平方和 来确定未知椭圆模型参数,即它们极 小化性能指标(,)g c d e f222211()NNiiiiiiiiiJxgx ycydxeyfu 由极值原理,置 关于各参数的偏导数为零,即J0,0,0,0,0JJJJJgcdef从而可以解出 ,进而由有关公式可立刻求出标准型椭圆参数 (,)g c d e f(,)cca b xyl 例例2:,1,iiNl iN对一个未知长
8、度为 的物体进行 次测量,设每次测量物体长度为。求真实物体长度 的估值。设每次测量误差为,则有关系,1,iiliN最小二乘法是选择 的估值极小化测量误差平方和,即2211min()NNiiiiJlJ置 关于 的偏导数为零,即212()0NiiJl 则有 的最小二乘法估值为11NiilNN这是 次测量结果的算术平均值,与常识是一致的。5.2.2 线性参数模型最小二乘估计线性参数模型最小二乘估计 最小二乘估计是一种经典的数据处理方法,最早 的应用可以追溯到18世纪。最小二乘法原理简单,可以离线计算,又可在线递推计算,并可在非线性系统中扩展为迭代计算 由最小二乘法获得的估计在一定条件下有最佳的统计特
9、性,即估 计的结果是无偏的、一致的和有效的。设时不变单输入单输出线性定常系统的数学模型为1111kknk nknk nkya ya ybub ueTT12121111,kkknnnkkknk nknyueaaa aa b bbyyubnub其中,为实测的输出、输入序列,为不可测随机干扰序列,即过程噪声(广义回归模型噪声)。假定模型结构参数阶数 已知,需要辨识的、参数为。令参数向量,数据向量,则Tyekkk 1,2,NkN当进行了 次采样,即时,引入记号101101112121YeNTnnTNNN nNN nNNnNyyyyyuuyyyuuee 用矩阵方程式表示为 Ye残差估计准则()Yee残差
10、包含两方面的误差因素:参数拟合误差随机干扰带来的误差(过程噪声)。最小二乘的估计准则就是使得残差平方和21 nTiiJ最小。最小二乘参数估计最小二乘参数估计 正则方程 2()()TTJYYY化简()()TTTTTTTJYYY YYY根据数学分析中的求极值原理可知,因为 是 的二次函数,它的极小值是存在的。取 J220 TTJY得正则方程 TTY估计量 持续激励条件 T要求出参数 值,就必须解正则方程式,当矩阵为非奇异时,则可由正则方程式求出 的表达式-1()TTY1111111111,TNTTNiiiTNNNNTiiiiiiiiiNTTiiiyPyPP矩阵 存在,即可逆的条件称为激励条件。极小
11、值 对准则函数 求二阶导数并化简,有J2 TTJJ那么,极小化的充分条件是20 TTJ 表明了最小二乘法的一个重要性质,即它只有一个局部极小值存在。因此,这个极小值也是全部极小值 矩阵求逆引理 11()()ACABCDCDA B设、和或都是非奇异方阵,则2.递推最小二乘估计(RLS)1111111()()ABCDAA B CDA BDATDB当时,有1111111()()TTTABCBAA B CB A BB A11TNNTNNyYy 递推最小二乘估计原理11,NNNNyyuu根据最小二乘原理,当已取得 组观测数据,则参数向量 的最小二乘估计为1()TTNNNNNYl 令 11112.1NNN
12、NNyYYyyy(5.)011011112111111(5.2.2)TnnNNTTNNN nNN nNNTNNN nNN nNyyyuuyyyuuyyyuu11NN则有个观测数据获得的最小二乘估计为:111111()TTNNNNNY 定义 ,这是一个方阵,它的维数取决于未知数的个数,而与观测次数无关,则1()TNNNP11111111111111()()()TNNNNTTTNNNNNNTNTNNNPP1111(5.2.3)TNNNNPY 式(5.2.3)可化为:将式(5.2.1)、(5.2.2)、(5.2.4)代入(5.2.3)111111111()1TTNNNNNNNNNTNNNPPPPPP
13、(5.2.4)11111111111TNNNNTNTNNNNNNNTNNNNPYYPPPyP(5.2.5)令 则(5.2.5)可改写为 11111NNNTNNNPKP1111111111111()()TTNNNNNNNNNTTTTNNNNNNNNNNNNNNNNPKPYyPYPyKPYKPyTNNNNPY将代入,得1111111111111111111()()()()TTNNNNNNNNNTTNNNNNNNNNNNTNNNNNNTNNNNNPKPYyKPKPyKKyKy 递推最小二乘估计递推算法:111111111111111()1()1TNNNNNNNNNTNNNTTNNNNNNNNNTNN
14、NKyPKPPPPPIKPP0011111PKyuP利用最小二乘估计递推算法,可以进行在线实时估计,计算顺序:由、得到;采样、,计算、;依次递推下去,直到误差满足要求停止递推。3.初值的确定 人为地给定初值。00100,()1 NNTNNNNyyuuPPNN先取一批观测值,用最小二乘法的一次完成算法估计出,并计算,分别取作、,然后再从个数据后开始采用递推算法。要注意观测量的个数 必须大于未知参数的个数。2261000010 10 PI取,其中 为充分大的正数(一般取)整个参数估计过程就是在此初始值的基础上采用递推算法进行。当时采用上述初值,递推最小二乘法的解接近于真实值。第二类最优估计问题是信
15、号或状态的最优估计问题,也称最优滤波。从被噪声污染的观测信号中过滤噪声,求未知真实信号或状态最优估值叫滤波。“滤波”这一术语最初来自无线电领域。1941年,控制论创始人Wiener提出了信号Wiener滤波理论。经典Wiener滤波方法是一种频域方法,在处理多变量、时变、非平稳时间序列时往往不能达到预期要求,且算法是非递推的,要求存储全部历史数据,不便于工程应用。5.3 信号,状态估计问题 例例3 Wiener滤波问题 ()()()s kv ky k其中未知真实信号被观测噪声污染,观测信号已知,即()()()y ks kv k2()()()()()Wiener(|)(),(1),(1)()()
16、()(|)s kv ky ky kv ks k ky ky kyJE e kEe ks ks k k其中未知真实信号被观测噪声污染,观测信号已知,即如何从观测信号中过滤噪声?在线性最小均方误差准则下,设计滤波器,它是的线性函数,且极小化均方误差,其中 表示均值号,为滤波误差。l 图1 信号Wiener滤波问题 典型的Wiener信号滤波问题如图1所示。1()Wiener()()()()Wiener(|)()s ks kv ky ks ks k ks k图 为信号的滤波。为原始信号,为观测噪声,为观测信号,信号的滤波器为,它是估计信号,它能有效地过滤观测噪声,还信号的本来面目。Kalman滤波
17、1960年,美国数学家和控制论学者Kalman针对Wiener滤波理论的缺点和局限性,以及电子技术和计算机应用技术发展的需要,提出了Kalman滤波理论(状态估计理论)Kalman滤波方法是一种时域方法,它基于状态空间模型和射影理论解决状态估计问题。Kalman滤波算法是递推算法,便于在计算机上实现,且可处理多变量、时变、非平稳时间序列滤波问题 Kalman滤波也可解决信号滤波问题 非递推算法 u u 111()1(11)1NiiNiiNNNlNNlN记基于 个测量值对 的估值为 个测量值对 的估值为()(1)NN这种计算是非递推的,即彼此独立地计算估值和。()(1)NN为了减小计算负担,是否
18、能在基础上计算?这就是递推算法的思想。递推算法 实际上,有 1111111(1)()(1)()1111(1)()(3.1).1NiNNiNNNllNlNNNNNNlNN即式(5有递推公)()(1)NN因而在估值的基础上,只需计算上式的第二项就可立刻得到估值,避免了非递推算法式的重复加法运算,大大减小了计算量和存储量。式(5.3.1)中的第二项为校正量,它是根据误差11()()1“”InnovationNNNlNNN的大小来进行校正估值的。估值误差包含了从第次测量中去掉了前 次测量的信息剩下的新的信息,故称为 新息()。于是最终得到新息校正形式的递推估值公式11()NNlN1(1)()(1)(5
19、.3.2)NNNK N(1)1(1)5.3.2)KalmanK NN其中叫做新息校正系数或波滤增益。式(是递推滤波算法的基本思想。例4 动态测量系统Kalman滤波问题。21,2,1kkN N考虑例,对未知长度为 的物体进行动态测量,即测量次数 是变化的,。因长度 为未故有 的动知常数,态方程为(1)()(5.3.3)kk()()()(5.3.4)()kl kkkkl k故 有 对的而 第次 对的 测 量 值含 有 随 机 误 差,观 测 方 程 为 (5.3.3)5.3.3kk可将未知长度 定义为系统的状态,则式称为,它描写 随 变化的规律,式说明长度 不随 变化,状方程即态为常数。25.3
20、.4()k而式则是对状态 的,观测误差通常为零均值、方差为的正态观测方程白噪声。5.3.35.3.4式和式构成最简单的状态空间模型。Kalman(1),()()kll kk滤波问题:基于 次观测求 的线性最小方差估值。第三类最优估计问题是最优信息融合估计问题。满足现代电子与信息战争及国防军事的需要 为了提高对运动目标(导弹、飞机、卫星、坦克、车辆、船舰等)的跟踪精度 提高对动态系统状态的估计精度 涌现了大量具有不同应用背景的多传感器系统 5.4 信息融合估计问题信息融合估计问题 20世纪70年代后 由于高技术武器的出现,尤其是由于精确制导武器、远程打击和导弹拦截武器的出现使得依靠单传感器提供的
21、信息很难满足目标跟踪或状态估计精度的要求 因此必须对每个传感器提供的信息按某种最优融合准则进行最优融合,才能提高对目标跟踪或状态估计的精度。多传感器信息融合有两种方法:状态融合方法 观测融合方法。分布式状态融合估计原理如图所示 分布式状态融合估计原理 分布式观测融合估计原理如图所示。分布式观测融合估计原理 多传感器分布式状态融合Kalman滤波器原理l 对于状态估计而言,如何利用基于每个观测方程得到的局部Kalman滤波器进行加权融合得到在某种性能指标下的最优融合Kalman滤波器?它的精度应当比每个局部Kalman滤波器的精度高。多传感器分布式状态融合Kalman滤波器原理如图所示。多传感器
22、分布式状态融合Kalman滤波器原理多传感器观测融合Kalman滤波器原理 多传感器观测融合估计原理是先将各局部传感器的观测加权融合得到一个融合的观测方程,然后与状态方程联立得到观测融合状态估计。由此得到如图所示的观测融合Kalman滤波器框图观测融合Kalman滤波器框图u第四类最优估计问题是自校正估计,即渐近最优估计。自校正估计是最优滤波与系统辨识相交叉的边缘领域。u自校正Kalman滤波器原理如图所示。5.5 自校正状态与信号估计问题自校正状态与信号估计问题自校正Kalman滤波器原理u第五类估计问题是自校正信息融合估计。它是多传感器信息融合与系织辨识相交叉的领域u自校正分布式状态融合Kalman滤波器原理如图所示5.6 自校正状态与信号信息融合估计问题自校正状态与信号信息融合估计问题自校正分布式状态融合Kalman滤波器原理 自校正观测融合Kalman滤波器原理如图所示。自校正观测融合Kalman滤波器原理