1、现代控制理论在战术导弹上的应用1 自动导引(寻的制导)导弹的最佳导引规律2 卡尔曼滤波器在寻的制导系统中的应用1 自动导引(寻的制导)导弹的最佳导引规律1.1 建立导弹和目标运动的数学模型建立导弹和目标运动的数学模型1.2 导弹运动状态方程的建立导弹运动状态方程的建立1.3 线性二次型问题的解法线性二次型问题的解法1.4 不考虑弹体惯性的最佳导引规律不考虑弹体惯性的最佳导引规律1.5 完全考虑弹体动态特性的最佳导引规律完全考虑弹体动态特性的最佳导引规律 在这一节应用最佳控制理论来研究自动导引的空-空或地-空导弹的最佳导引规律问题,首先建立导弹和目标运动的数学模型 在现有的自动导引(寻的制导)的
2、空-空或地-空导弹中,大都采用比例导引法。1.1 建立导弹和目标运动的数学模型建立导弹和目标运动的数学模型美“麻雀”远距空空导弹 地|空导弹 比例导引法:比例导引法:导弹和目标在同一平面内运动,如图11-1。D为导弹,M为目标,为导弹运动速度,为目标运动速度,R为导弹至目标的距离,DH为一基准方向。DT为目求视线,q为DM与DH之间的夹角,称为目标视线角。DVMV 按比例导引法导引时,在弹上装有红外线或无线电导引头,用来测量目标视线角q的角速度 。q无线电导引头红外线导引头 导引头的输出信号与 成比例,将此信号输给导弹自动驾驶仪,经过放大变换后,控制舵面偏转,导弹产生横向控制力,改变导弹速度向
3、量 的方向。qDV导弹自动驾驶仪自动驾驶仪比例导引:比例导引:就是使导弹的速度向量 的旋转角速度 正比于目标视线DM的旋转角速度 ,即N为比例系数,称为导航比。对一般的导弹来说N=36。比例导引的实质比例导引的实质是使导弹向这减少 的方向运动,抑制视线DM旋转,也就是导弹的相对速度 对准目标,保证导弹向着前置碰撞点飞行。比例导引的优点:比例导引的优点:1.实现起来方便2.弹道比较平直,导弹的过载比较小q()cDMVVVqN qDV1.2 导弹运动状态方程的建立导弹运动状态方程的建立 导弹与目标的运动关系是非线性的,应把导弹与目标的运动方程相对于理想弹道线性化,得出导弹运动的状态方程。设导弹和目
4、标在同一平面内运动,如图11-2。在平面内任选oxy固定坐标,导弹的速度向量 与oy轴成角,目标速度向量 与oy轴成 ,导弹与目标的连线DM与oy轴成q角,设 ,q都 比较小。并且假定导弹和目标都是等速飞行,即 都是不变值。用相对坐标变量比较方便。DVMVMMMVDV 和 设x为导弹与目标在ox轴方向上的距离偏差,y为导弹与目标在oy轴方向上的距离偏差,即:(11-2)(11-3)(11-4)(11-5)由于设 和 很小,因此 ,则 (11-6)(11-7)MDxxxMDyyysinsinMDMMDxxxVVcoscosDMMDMyyyVVMsin,sin,cos1,cos1MMMMMDxVV
5、MDyVV 以 表示x,则1x2x表示x12xx2MMDxxVV式中表示目标的横向加速度,表示导弹的横向加速度,分别以表示,则MMVDVMDaa和2MDxaa导弹的横向加速度 为一控制量。控制信号加给舵机,舵面偏转后弹体产生攻角,而后产生横向过载。Da如果忽略舵机及弹体的惯性,设控制量的单位与加速度的单位相同,则可用控制量来表示即令DaDua 与是式(11-10)变成2Mxau可得导弹运动的状态方程12xx2Mxua写成矩阵形式,可得MXAxBuDa式中120100,0011xXABDx 给出 时刻,的初值 可把导弹的运动状态方程用图来表示,如图11-3。0tt12xx和120()xx t0(
6、t)和2x1x导弹运动学方框图1s1sU如果不考虑目标机动,则为零,式(11-4)变少()DMyVV XAXBUMa考虑式(11-7),该式可写成DMCVVV 为导弹对目标的接近速度,设 为导弹与目标的遭遇时刻,则在某一瞬间t导弹与目标的距离y可用下式表示ft()()CfDMfyVttVVtt 对导弹控制来说,最根本的要求是脱靶量越小越好,因此应选择最佳的控制u,使得下列指标函数 22MfDfMfDfJxtxtytyt 01122ftTTTfftJXtCX tX QXU RU dt 为最小。然而,当要求一个反馈形式的控制时,按上式列出的问题往往很难解。所以我们以 时的 值作为脱靶量,要求 时刻
7、x值越小越好。另外舵偏角受到限制,导弹结构能承受的最大过载也受到限制,所以控制信号u应该受到限制,因此,选择下列形式的二次型指标函数0cffyVtt1()x xftt即 021122ftTfftJXtCX tRu dt 应有最佳控制理论,可求出使J为最小的U12000,000cCQc式中 不考虑舵机惯性,但考虑导弹二次振荡环节时,导弹运动转台方程的列写问题,如以 舵偏角 作为导弹的输入,作弹体的输出,则弹体的传递函数为22222222112122DDDDDDDDKKTKT ST SSSSSTT式中1DT 如把式(11-10)中 前的负号移至控制信号u中,假定舵偏角 等于控制信号u,则考虑了弹体
8、环节之后的导弹运动方框图可用图11-4来表示Ta其方程为122334243412DMxxxV xaxxxxxKu 式中 ,如写成矩阵形式2DKKMXAXBUDa则01000000001,0001000020DVABDK 给出 时刻,的初值 ,的初值可取零值。如不考虑目标机动,则指标函数与前面一样,即 021122ftTfftJXtCX tRu dt0tt12xx和120()xx t0(t)和34xx和0Ma123400000000000000,00000000000000ccCQcc式中 下面将要讨论不考虑弹体惯性和考虑弹体惯性的最佳导引规律。由于系统是线性的,指数函数是二次型的,因此球最佳控
9、制规律是一个求解线性二次型的问题。下一节将介绍线性二次型问题的解法。1.3 线性二次型问题的解法线性二次型问题的解法设线性系统状态方程为XAXBU 式中X-n维状态向量,u-m维控制向量没,A-矩阵,B-矩阵,指标函数为n mn n 01122ftTTTfftJXtCX tX QXu Ru dt C和Q为非负矩阵,R为正定矩阵。给定初始条件 ,求最佳控制u,使J为最小。对于线性二次型问题,可用变分法、极大值原理、动态规划或其它方法求得最佳控制 0X t*1TutR B PX 式中P满足下列黎卡提矩阵微分方程1TTPPAA PPBR B PQ P的终端条件为fP tC 因此求解线性二次型问题的关
10、键是求黎卡提矩阵微分方程,黎卡提矩阵微分方程使一个非线性微分方程,但它是一个很特殊的非线性矩阵微分方程,可以把它分解成两个线性矩阵微分方程。如果设1TTWAWBR B YYQwA Y W和Y的终端条件为 fnfW tIY tCnI为n阶单位矩阵,C如(11-2)式所示。则黎卡提矩阵微分方程的解为 1P tY t Wt可以证明 确实满足方程(11-27)1P tY t Wt以 乘(11-30)式等号两边,可得 W t Y tP t W t对上式求t的导数得 Y tP t W tP t W t 把(11-28)和(11-29)式代入(11-31)式得 111()0TTTTTTA YQWPWP AW
11、BR B YA PWQWPWPAWPBR B PWPPAA PPBR B PQ W 由于对所有 都是非奇异的,所以必须10TTPPAA PPBR B PQ 0,tt W t1TTPPAA PPBR B PQ 即 因此W和Y满足黎卡提方程(11-27)。下面再看看是否满足终端条件的问题。1fffnP tY tWtCI 因而终端条件也满足的 下面求W和Y。将(11-28)和(11-29)写成1TTWWABR BYQAY 1000,TTWWABR BFFYQAYW tW tt tY tY t则 ,ffffffW tW tttY tY tW tW tt tY tY t而 根据W和Y的终端条件,可得 ,
12、fnfW tICY t则 ,nfW tIt tY tC如果F为常数矩阵,则,fF ttF tft tee式中 的拉氏变换1,Ftfttt eSIF为,fF ttFtfttee11()FteSIFSIF 为 的拉氏反变换。将(11-35)式代入(11-33)式,可得W(t)和Y(t)。把W和Y代入(11-30)式代入(11-26)式,可得最佳控制*11ut()TR B YWX t 1.4、不考虑弹体惯性的最佳导引规律、不考虑弹体惯性的最佳导引规律 当不考虑弹体惯性,而且假定目标不机动,导弹运动的状态方程为1122010001xxuxx 指标函数 021122ftTfftJXtCX tRu dt1
13、2001000,000100cABCQc 式中 给出 时刻,的初值 ,用极大值原理来求最佳控制 。由于A、B和Q都为常数矩阵,故用拉氏变换法求 ,其中 。先算矩阵F:0tt12xx和120()xx t0(t)和*utF tefttt110001011100100100000000010TTTBR BRRABR BFRQA 11()FteSIFSIF 为 的拉氏反变换11211222100100000001SAASSIFRAASS式中11122122001000,100010SsAAAASSR因 ,则 210A 1111111112221220AA A ASIFA2111122243111112
14、2232111011101111SSSAASSSRSRSA A ARSRS 所以24332121111111010001100SSRSRSSRSSSIFSSS322111620120010001F ttttRRtteLSIFRRt 的拉氏反变换1F teSIF为下面计算W和Y2FtWIeYC3232122212112121110626201101022000100001ctc tttttRRRRWcttttccYRRRRccctct 因此3212212112162120ctc ttRRWcttcRRcYctc 下面求1W321213421211 2221162113122ctc ttRRWtt
15、tcttccc ccRRRRR把 和 代入 的式子中,可得最佳控制1W*u1,TRBY231 21 2211212*34211 22()()()()23()()()1312fffffffc c ttc c ttc ttxcc ttxRRuc ttc ttc c ttRRRR 如在指标函数中,不考虑导弹的相对运动速度 项,则可令 变成1x*20.cut21112*31()()()13fffc tt xc ttxuc ttRR 212*313()3()3()ffftt xttxutRttc 以 除上式得分子和分母1c为了使脱靶量为最小,应选取 ,则1c *1223()()ffxxuttttt 根据
16、图11-2可得11()cfxxtgqyV tt当q比较小时,则,tgqq1111222()()1()()()cffcfcffxqV ttxtt xxxqV ttVtttt将上式代入(11-48),可得 *122*13()()3ccffcxxutVVttttutV q 在(11-51)中,u的单位是加速度的单位米/秒平方,把u与导弹速度向量 的旋转角速度 联系起来,则3DDcDuVuVVqV DV 从(11-51)和(11-52)式可看出,不考虑弹体惯性时,最佳导引规律是比例导引,其导航比为 ,这也证明比例导引是一钟很好的导引方法,最佳导引规律的形成可用图(11-5)来表示。3/cDVV1x3c
17、V*u2x1()cfV tt21()cfV tt1s1sq图(11-5)最佳导引规律方框图1.5 完全考虑弹体动态特性的最佳导引规律完全考虑弹体动态特性的最佳导引规律 完全考虑弹体二阶振荡环节时,假定目标不机动师,导弹运动的状态方程为XAXBu式中2010000000,00010002DVABKU为舵偏角2,DKK给出 时刻,的初值 。一般导弹在发射后很短时间内是不控制的,因此可假定 的初值为零,即 的初值为零指标函数为0tt12xx和120()xx t0(t)和和34xx和 021122ftTfftJXtCX tRu dt在指标函数中不考虑导弹的相对速度项 ,也不考虑 项,则1c000000
18、0C=000000002x34xx和同时00000000Q=00000000用极大值原理来求最佳控制,由于A、B和Q都为常数矩阵,故用拉氏变换法计算 其中 ,先计算矩阵F,Ftefttt122100000000001000000000000000000000001000,00000000000012TTDTTBR BKRKKRQAVABR BFQA 22201000000000000000010000002000000000000000100000000000000012DDVKFRV2221000000000000001000000200000000000000100000000000001
19、2DDSSVSKSSIFRSSVSS求 的拉氏反变换是很麻烦的,在此略去推导过程。在推导过程中,假定导弹的阻尼系数1SIF20.7072这样使推导工作得到一些简化,一般弹体的自然阻尼系数小于0.1,这样的弹体是很难控制的,所以比较合理的方案是在弹上设置人工阻尼装置。因此,一般导弹上都有阻尼回路,以增大导弹的有效阻尼系数,弹体是二阶振荡环节,最好的阻尼系数应等于 ,所以弹上加了阻尼回路后,应尽量设法使其有效阻尼系数等于 或接近该值。据推导结果,可得最佳控制2/22/21234223*32232()()212()()()2()2()5 23fffffffDDttttttxtt xxxutttttt
20、K V 把上式得分子乘以 ,除以 ,分子和分母同乘以3,则可得 2()cfV tt2()cfV tt212342222*223211123()()2()()()()()()3 2()6()15 2()4cffffcfcfcfcfffDDfxxV ttttttxttxV ttV ttV ttV ttuttttK Vtt 在上式中122()()cfcfxxqV ttV tt34,xx同时考虑到 则32222*2323211123()()2()()()()3 2()6()15 2()4cffffcfcfffDDfVttttqttttV ttV ttuttttK Vtt 从上式可看出,考虑到弹体的二阶
21、振荡环节 动态特性后,最佳导引规律的主项是变系数比例导引,另外加上航迹角角速度 和角加速度 的反馈。一般导引头都有盲区距离,当导引头接近目标100200米时,导引头停止工作。没有信号输出,导弹按无控飞行。导引头也不是一下子就停止工作,使逐步地从正常工作过度到完全停止工作,导引头从逐步开始停止工作到遭遇目标的时间大约为0.5秒左右,所以在导弹整个控制飞行阶段,可按(11-57)式计算最佳控制信号 ,把(11-57)改写成下列形式*ut *1233212323223232232323()()3 2()6()15 2()4321()2()3 2()6()15 2()433()3 2()6()cfff
22、fDDfffffDDfffDDfuKt q KtKtVttttKtttttK VttttttKtttttK VttttKtttK Vtt 23)15 24ftt在前面我们列写状态方程时,规定 是舵偏角 ,因此 u t t 123tKt q KtKt 图11-6表示考虑导弹动态特性后的最佳导引方框图 下面以例说明反馈系数 的变化趋势。设 米/秒,米/秒,。这些系数的计算结果如图11-7所示,越来越大。123,K KK630DV 0.317,DK400cV 10 因此在最佳控制从图中可以看出,当导弹离目标较远时,这些系数的变化比较缓慢,当导弹接近目标 时,这些系数中,虽然导弹的运动方程是常系数方程
23、,但最佳控制 中的状态反馈系数都是 的函数。是导弹从t时刻开始遭遇目标时还需要继续飞行的时间,也可叫剩余飞行时间,因此弹上应有雷达和计算机,用雷达测出导弹至目标的相对距离R和接近速度 。计算机根据R和 算出剩余飞行时间 并进一步算出 所以实现最佳控制的设备比较复杂。*utfttfttcVcVftt123,K KK 在不考虑弹体惯性时,得到的最佳导引规律与目前采用的比例导引法一致,因此,从现代控制理论的观点来看,比例导引是一种比较好的导引方法。考虑到导弹的二节振荡环节的特性后,最佳导引规律的主要项是 ,这是变系数比例导引。当导弹距离目标较远时,基本上不随时间而变,因此这一段看作常系数比例导引。当
24、导弹接近目标时,随时间变化比较剧烈,因此这一段完全是变系数比例导引。在导引规律中,另外二项是 和 和 随时间变化的趋势与 相似。前面已提过,导弹和目标的运动关系是非线性的,导弹上还有许多非线性元件,导弹的速度是随时间而变的,因此在设计导弹控制系统时还应当考虑到上述各因素。1Kt q 1Kt 1Kt 2Kt 3Kt 2Kt 3Kt2 卡尔曼滤波器在寻的制导系统中的应用2.1 卡尔曼滤波器的功能2.2 在寻的制导系统中引入卡尔曼滤波器的方法2.3 广义卡尔曼滤波器方程的推导2.4 卡尔曼滤波器初始条件的选取2.5 应用实例2.6 观测噪声数学模型的健模方法2.1 卡尔曼滤波器的功能 自卡尔曼滤波器
25、问世以来,在科学和工程上的到了广泛应用,它的本质优点在于:1.可以用少数几个观测量来获得所有状态变量的最佳估计值及它们的估值方差;2.在采用自适应滤波器后,可以根据战术导弹的不同工作条件自动改变滤波器参数,使其性能最佳。古典的维纳滤波器本质上只适用于定常线性系统;3.卡尔曼滤波器以明确形式把系统的动力学特性引入了滤波器的数学模型,因而充分利用了所论对象的验前知识,从而提高了估值准确度;4.采用递推算法,减少了对计算机存储量的要求,便于实现在线实时滤波。70年代以来,随着电子计算机的发展,特别是微处理和微计算机技术的发展,卡尔曼滤波器已在控制工程、生产过程自动化、通讯、导航以及航空、航天技术等方
26、面得到了广泛的应用,成为一种较为满意的估值方法。2.2 在寻的制导系统中引入卡尔曼滤波器的方法 就战术导弹的设计而言,卡尔曼滤波器主要应用在以下三方面:1.导引头信号处理和参数估计;2.制导指令的形成;3.适应式自动驾驶仪中弹体气动力特性的估计与回路增益的计算;以雷达半主动寻的制导系统而论,由于雷达目标的运动具有随机性,雷达半主动导引头输出的,代表导弹目标视线角速度的电信号上,一般都混杂有测量噪声。这是,制导系统设计者的任务是:一、设法测取和分析这些噪声的统计特性,并且用适当的数学方法描述它;二、设法抑制这些噪声,求取有用信号的最佳估计(最佳滤波估值),以消弱它对导弹精度的影响;三、对最佳控制
27、问题和最佳估值问题加以综合考虑,分析主要的非线性因素对滤波和控制的影响。2.3 广义卡尔曼滤波器方程的推导 推导卡尔曼滤波器方程的原始依据是被滤波系统的状态方程和观测方程。所谓系统的状态方程,是由描写被滤波系统状态变量演化过程的一组微分方程和差分方程构成。系统的观测方程,则表示系统中的观测量和系统状态变量间的关系。战术导弹制导系统方程,一般都是高阶的变系数方程。在制导装置的部件中,在弹体动力学方程中,在相对运动学方程中,都含有非线性环节。因此系统的状态方程都是复杂的非线性方程,用它们来导出卡尔曼滤波器方程是很困难的。对于制导系统的设计者而言,如果要解决的问题是简单的信号过滤问题,则可用一种较简
28、单的办法,即多项式动力学的方法。多项式动力学这一术语,意思是说,若忽略模型(即 系统的动力学模型)的不准确性,则制导系统中每个信号 ,都可用泰勒级数展开的方法写成t的(m-1)次多项式 ix1011mimxbbtbt每个 的所需的微分阶数,可以通过对该量的变化规律的分析得到。一般而言,m应该尽可能低一些,以使卡尔曼滤波器简单一些;同时,又必须足够高,以便能跟踪该两的主要变化规律。例如,对雷达半主动导引头构成的寻的制导系统,一般都采用比例导引律,用导弹目标视线角速度信号,形成制导指令,理论和实验都表明,在绝大部分攻击飞行时间内,此信号为一缓变信号,故可用足够的精确度假设ix220d qdt式中,
29、代表导弹目标视线旋转角速度。为了将(64)改写为状态方程的形式,假设 ,这样,有:q12,xq xq122,0 xxx12xXx令状态矢量为则上述方程组可写为XAX(64)(65)式中0100A和方程(65)相对应的状态转移矩阵为2212AteIA tAt由于0nA 当 时2n 故得101t所以,我们可以把方程(65)离散化,得到状态差分方程1kkXX考虑到原设(64)的不准确性,可在方程(65)的右端加上一个误差修正项,用 表示,一般称 为模型噪声,此时,可将状态方程写成为:kk1kkkXXB式中(0 1)IB 状态变量中仅有 ,即 可观测,故观测方程为:1xqkkkYHXV式中 ,而 表示
30、观测量 中的噪声分量,可用一阶或二阶差分方程表示,方程(66)及(67)即构成了被滤波系统的状态方程组。(0 1)TH kVq(66)(67)对跟踪空中目标的战术导弹而言,正如我们后面将要讨论的那样,可用下述非常来表示导引头的输出噪声:1kkkVVa1122kkkkVVVa或式中下标“k”活“k-1”表示时间序号,为常系数,而 则表示零均值高斯白噪声在k时刻的取值,还假设:12,ka2200()0,()0,()()()0,()0,1,2,karkkarkaTTTkkkTkiEVE aVE a VE a XE XE ak 式中E(.)代表对某量求数学期望运算.而 则代表对某量求方差的运算(下同)
31、,上标“T”代表对矩阵或矢量求转置的运算,利用以上假设条件,我们即可导出所需的卡尔曼滤波器方程,以后我们将会看到,和方程(11-68a)对应的卡尔曼滤波器方程,只是我们所导出的方程在 时的一个特殊情况。在一般文献中,卡尔曼滤波器方程都是针对观测噪声为白噪声的情况导出的。对与观测噪声为有色噪声的情况,推导卡尔曼滤波器方程的方法有两种:1.扩大状态变量的维数;此时,将有色噪声的表达式也写入到状态变量方程组中去,从而使观测方程中除状态变量之外的观测噪声等效为白噪声,这样就可利用观测噪声为白噪声时的推导方法。arV202.量测求差法量测求差法 即改变观测矢量,此时,引入一个新的观测量,使得对此新观测量
32、列写的新的观测方程中,等效的观测早声仍未白噪声。由于扩大状态变量维数的结果,将会使状态转移矩阵的阶数增大,这不仅会增大计算量,而且会使计算卡尔曼滤波器增益矩阵遇到求异成为不可能,所以是不希望的。工程上应用量测求差法较为方便。对噪声模型为(11-68b)的情况,引入新观测量如下:1121kkkkZYYY式中 即为方程(11-68b)中之系数,利用方程(11-66)可以求得 11()kkkXXB12,将此式和方程(11-68b)一起代入新观测量的表达式,整理可得kkkkZM X其中112121kkkkMHHHHBa方程(11-69)即为新的观测方程,而 为等效的观测噪声,它的方差为k*2112()
33、()TTkkRERHQ H 其中22,TaQBBR此时观测噪声 和模型噪声 是相关的,其相关局矩阵为 kk12()()TTkkCE BQ H 参照观测噪声为白噪声时导出的卡尔曼滤波器方程,可以假设最佳估计值 由下述方程给出:kX|11|2111|2()k kkkkkkkkXXKZM X式中上标”表示取得最佳估值,而“”则表示用 时刻及其以前的观测值对 时刻所作的预报估值。上式在形式上是用序列 对 所作的预报估值,但实际上是用序列 对 所作的滤波估值,因而可将 视为 12|tt2t1t121,kz zzkX0,12,ky y yykX|1k kXkX为了求出估值方差,需先求出|1111|211(
34、)()kk kkkkkkkkXXKMXXBK因而,由定义可得|1|1|1*1|211|211|2111|2()()()()()Tk kkk kkk kTTTTTkkkkkkkkkkTTTTTkkkkkkkkPE XXXXPQKM PMRM CC MKPMC KKM PC若设111|21|2()()TTTTkkkkkkkkkkKPMC M PMM CC M则得记|11|211|2()TTTTk kkkkkkkPPQKM PC|1|1k kkk kkXXPP并将增益矩阵 之下标“k-1”改为“k”,则有1kK1112211|2()()kkkkkkkkTTTkkkkkkXXK YYYM XPPQKP
35、 MC111()()TTTTkkkkkkkKP MC M PM CC M这便是观测噪声为二阶模型(11-68b)时的卡尔曼滤波器方程组,将三个方程联立求解,即可由观测序列 求出状态矢量的最佳估计值 。式(11-70)表示,最佳估值由预报估值 加上新息修正项组成,其中 kykX1kX112211kkkkkkkkYYYM XZM X代表新息序列。即为卡尔曼滤波器的增益矩阵,由(11-70)式算出。kK(11-71)代表估值误差协方差矩阵 的算法,其中第一项 表示上一时刻的协方差矩阵至当前时刻的传播,第二项则为模型噪声所附加上的方差分量,它在求取最佳估值的过程中始终是存在的。第三项则表示由于对估值实
36、行最佳化处理使估值误差协方差阵减小的部分,它代表了最佳化处理带来的好处.在观测噪声为(11-68a)时,即 ,则有kP1TkP2011111()()kkkkkkkTkkkkXXK YYM XPK MPQ111()TTkkkkkKP MM P MR式中1*,0kMHQHRR C它和文献中给出的观测噪声为一阶马尔柯夫过程时的滤波器方程是一致的,对于定常线性系统而言,在这组方程中的参数称为信噪比,它对滤波器性能有重要影响,因而在设计滤波器时应仔细加以考虑。2QhR2.4 卡尔曼滤波器初始条件的选取为了保证最佳估值的无偏性,要求初始条件用下式选取:000000()()()kTXE XPE XXXX并应
37、给出所需的观测量的验前估计值。在观测噪声取为一阶模型(11-68b)时,应给出 ;而在使用二阶模型(11-68b)时,则应给出 及 两者。卡尔曼滤波器接入制导系统时,它的初始条件的计算和制导系统开始工作时,载机和目标的相对运动状态有关。对于我们的问题,因为0 y0 y1 y000qXq而 及 皆和导弹捕获并且开始跟踪目标之后,载机相对于目标的相对运动状态有关,即和此时目标的机动情况,载机对目标瞄准的误差有关。目标的初始机动和载机的初始瞄准误差都是随机量(离散的或连续的),因而一般来说,将和这些随机量的数学期望有关,而 则和它们的 方差或协方差有关。0()E X0P0q0q对飞行目标而言,目标初
38、始机动的分布率一般都取图(11-8)的形状,图中纵坐标为目标机动出现的概率,横坐标为该概率所对应的目标初始机动加速度,此曲线可用数学函数形式表示如下:图11-8 空中目标初始机动的典型概率0PmaxPmaxTamaxTa00maxmax0maxmaxmaxmax0()1(2)2TTTTTTTPaP aPaaPPaaaa 当=时 当时 当-时 一般来说,对定常线性系统而言,初始条件的选取对滤波的稳态状况没有影响,只影响滤波的过渡过程,但在空对空导弹的制导系统中,由于飞行时间不长(1025秒),因而滤波过渡过程可能要占整个制导飞行时间的相当大的一部分,对飞行的初始阶段将有直接影响,也将会影响飞行中
39、段的制导过程。这样,就有必要对它加适当考虑,具体的设置方法,可通过载机的火力控制系统来对导弹设置适当的初始条件。2.5 应用实例(一)空对空导弹寻的制导系统的方框图寻的制导的空对空导弹的制导系统的一般方框图如(11-9)所示。对寻的制导系统而言,一般都采用比例导引规律形成制导指令,所以,寻的导引头主要用于测量导弹目标视线角速度信号,信号处理电路可以是相敏检波器、比较器、乘法器或其他低频电路,用以形成制导指令。执行机构可以使液压或气压舵机,亦可用电动伺服机构。弹体环节由导弹空气动力学方程构成,它是系统的控制对象,在用铰链力矩反馈的舵机中,应有 角反馈。角反馈信号代表了导引头的位标器部分和弹体运动
40、的耦合,而导弹轨迹角 则是导弹目标相对运动学方程的输入量。D 对于雷达半主动寻的制导系统而言,其导引头输出的、代表导弹目标视线角速度的电信号上,一般都混有噪声。这种噪声来源有:1.来自外部的噪声 主要是由目标反射回来的雷达回波中,由于目标的随机角运动,使此回波信号在幅度上随机起伏,并引起等效的目标反射中心的随机飘移,因而使导引头测得的角信号产生闪烁2.来自制导装置内部的噪声 主要是电子器件的热噪声,伺服机构噪声等。由于这些噪声的存在,使雷达型导引头测得的视线角速度信号上带有随机误差,并最终影响导引准确度。因此,必须抑制这些噪声,提高导引准确度,减少终点脱靶量。(二)卡尔曼滤波器的设计方法设计卡
41、尔曼滤波器的大致步骤如下:1.建立观测噪声的数学模型,即用方程来表示雷达导引头输出信号中的噪声成分;2.导出卡尔曼滤波器方程,并给出相应的初始条件算法;3.进行卡尔曼滤波计算,选取最佳参数;4.将卡尔曼滤波器接入制导系统,通过全系统联试来修改卡尔曼滤波器及制导系统两者的参数,使整个系统的导引准确度最高。在雷达导引头已初步研制完成的情况下,获得雷达导引头输出噪声模型的直接方法,就是利用此雷达导引头,对真实的空中目标进行空中或地面跟踪试验。在试验过程中记录雷达导引头输出的视线角速度信号,此信号为有用信号和噪声信号的迭加,即实验信号Y(t)为 为了建立V(t)的数学模型,首先要设法剔除其中的非随机成
42、分 ,这可以根据具体情况,选择适当的方法去做。譬如,在试验中若 基本保持常值,则易于导出 此式之左端正好是我们建立卡尔曼滤波器观测噪声数学模型时所需的零均值噪声。()()()Y tq tV t()q t()q t()()()()V tE V tY tE Y t 试验与计算表明,雷达导引头输出的噪声信号,一般为一阶或二阶平稳自回归模型,典型的自相关函数 和偏自相关函数 随k的变化规律,分别如图(11-10)及(11-11)所示。kkk 由曲线可看出 随k的增大而减少,但呈振荡状,总不会恒保持在某一数值范围内,我们称这种曲线“呈拖尾状”。相反,对偏自相关函数而言,在k=3时,某值骤减到极小的数值,
43、而且此后各 值总保持在某一个很小的数值范围内,我们称此 曲线在k=3处“截尾”。根据下段所述准则,可判定它为二阶平稳自回归模型AR(2)。对于这种噪声模型,所导出的卡尔曼滤波器方程和方程(11-70)、(11-71)及(11-72)相同。在一个实例中,用实测的导引头噪声作为卡尔曼滤波器的输入信号,对滤波器的滤波效果进行了计算。k计算所使用的程序框图如图11-12所示。在信噪比为0.1时,典型的滤波曲线如图11-13所示,计算表明,滤波器输出信号的方差和观测信号的方差相比,减少了71.2%将这个滤波器接入图(11-10)所示的制导系统时,需将原有的RC滤波器去掉。但是,由于最佳估值问题和最佳控制
44、问题是相互关联的,因而必须从最佳随机控制的观点,重新考虑整个寻的制导系统的结构和参数的选取。按照随机最佳控制理论,在下述条件下,最佳估值器和最佳控制器的设计(即卡尔曼滤波器和最佳导引规律的设计)无相互关联,可独立进行设计:1.所考虑的系统是线性系统;2.作用于系统上的随机输入量符合正态的或高斯的分布滤;3.最佳指标选为二次型性能指标,形如011()()22fftTTTttJX SXX QXU RU dt式中 系统工作开始计终结时刻;X状态矢量;U作用于系统控制对象上的控制信号或控制函数:S,Q非负定矩阵;R正定矩阵;所求得的最佳控制函数U,应能使J达到最小。除了有时第二个条件可放宽以外,这些条
45、件都是必备的。0,ft t 对于我们所考虑的系统,显然不是线性系统,因为在放大器和舵机中存在着饱和非线性特性,在相对运动学环节中 存在着正弦和余弦函数等。另外,作用在系统上的有些随机输入量,也不符合正态分布规律。例如,雷达目标回波信号中的振幅噪声已知为瑞利分布,而目标机动的典型概率分布为图11-8 所示的曲线,也不是高斯分布。因而,原则上不能将最佳估值问题和最佳控制问题分割开。这样,我们单独设计的卡尔曼滤波器,就不能原封不动地搬到制导系统中去,必须对滤波器本身及导引规律两者都作适当的协调和改动,否则将不能有效地提高制导系统的导引准确度。但是从纯理论的角度去处理这一问题的话,将会遇到很大的困难。
46、因为我们面临的是一个高阶的非线性协调。工程上较实用的方法是试验方法,即用制导系统的仿真试验来对最佳估值器和最佳控制规律进行试验设计。由于原有的系统是模拟式制导系统,而卡尔曼滤波器是一个数学部件,故在将卡尔曼滤波器接入制导系统之后,即形成一个数字模拟混合系统。在进行仿真试验时,现有的模拟式部件都在模拟式电子计算机上用排题的方法实现,而卡尔曼滤波器本身则在数字计算机上用软件实现。在模拟式计算机和数字计算机之间还要加上适当的数字/模拟及模拟/数字转换装置及相应的接口程序,以实现模拟式计算机和数字计算机之间的信息交换和运行控制。对于此混合式制导系统进行统计模拟,也使用蒙特-卡罗(Monte-Carlo
47、)方法,即使用足够多的随机输入量样本,在某些初始条件和参数下进行足够多次的运算,求取状态变量的统计平均值。这样一来,如果原来测取的噪声样本不够长,就应根据已建立起来的噪声的数学模型,产生足够长的噪声样本。其具体方法如下:1.用某种方法,例如乘同余法。产生在区间0,1上均匀分布的随机数R(i);2.用下述方法,利用已得的均匀分布随机数,产生 的正态分布随机数样本 :式中S为和 有关的常系数。3.用 代入已建立的噪声的数学模型中,产生所需的AR(2)时间序列 :这即是方程(11-68b)的代换式。2(0,)aN0()u i0()2ln(1)cos 2()u iR iR iS2a0()u iiW11
48、220()iiiWWWu i 对于我们的例子,用上述方法进行了混合仿真试验。在适当地选取系统的结构和参数之后,得到了较满意的结果。由噪声分量产生的脱靶距离,和具有RC滤波器的模拟式制导系统的蒙特-卡罗模拟结果相比,大约可减少一半,典型的制导系统混合仿真试验曲线如图11-14所示。由图可以看出,用卡尔曼滤波器所得到的视线角速度 的最佳估值,比采用RC滤波器的模拟器的模拟式系统得到的视线角速度的变化规律 ,更靠近于确定性制导系统,即只有初始条件作为唯一输入量的原模拟式制导系统,而确定性系统的动态仿真结果说明,它的终点脱靶量近视为零。为了进一步改善滤波器的性能,一般可采用适应式卡尔曼滤波器。在这种滤
49、波器中,要用某种方法在线、实时地对噪声的统计特性的变化加以预测和估计,据此修改噪声模型,并相应地改变滤波器及导引规律诸参数。2.6 观测噪声数学模型的建模方法 建立观测噪声数学模型所用的方法,即是一般的线性随机 时间序列的分析方法,亦即近年来出现的建立ARMA模型的方法。它的基本思想和基本方法如下。对于很广泛一类平稳随机时间序列 若其数学期望或统计平均值为零(在它不为零时,可取原序列与它的数学期望之差作为 序列),总可以用下述三个差分方程之一来描述:0,(1,2,),tWtntW1111,(),ttttttzWaWzazWza其中 及 为 的算子多项式。称为后移算子,即1()z1z1z1znt
50、t nz WWn为正整数。这样,上述算子多项式可写为 112112111211211()1ppppqqqqzzzzzzzzzz 其中p和q为正整数,称为模型的阶数。规定 为零均值高斯白噪声。方程(11-79)称为自回归模型。若 的最高幂次为p,则称为p阶自回归模型。ta1z 若方程 的全部根都位于复平面z上的单位圆内,则由方程(11-79)所得到的随机序列,一定是平稳随机序列。这时,我们称方程(11-79)所代表的模型为p阶平稳自回归模型,简记为AR(P)模型。方程(11-80)称为滑动平均模型。若 中 的最高幂次为q,则称它为q阶滑动平均模型。若在方程 中,其全部根都的全部根都在复平面z上的