1、控制理论的其它分支:最优控制与自适应控制最优控制Optimal Control 最优控制是从大量实际问题中提炼出来的,它尤其与最优控制是从大量实际问题中提炼出来的,它尤其与航空航天的制导、导航和控制技术密不可分。航空航天的制导、导航和控制技术密不可分。我国的探月计划:我国的探月计划:绕月工程:绕月工程:2007年以前发射人造月球卫星年以前发射人造月球卫星“嫦娥一号嫦娥一号”;落月工程:落月工程:2012年发射携带月球车的登月软着陆器;年发射携带月球车的登月软着陆器;回月工程:回月工程:2020年前完成采集月球样品工作。年前完成采集月球样品工作。最优控制问题研究的主要内容是:怎样选择控制规律最优
2、控制问题研究的主要内容是:怎样选择控制规律才能使控制系统的性能和品质在某种意义下为最优才能使控制系统的性能和品质在某种意义下为最优。例例1 1:飞船的月球软着陆问题:飞船的月球软着陆问题 飞船靠其发动机产生一与月球重力飞船靠其发动机产生一与月球重力方向相反的推力方向相反的推力f,赖以控制飞船实现,赖以控制飞船实现软着陆软着陆(落到月球表面上时速度为零落到月球表面上时速度为零)。要求选择一最好发动机推力程序要求选择一最好发动机推力程序f(t),使燃料消耗最少。使燃料消耗最少。实际应用背景实际应用背景 设飞船质量为设飞船质量为m,它的高度和垂直速度分别为,它的高度和垂直速度分别为h和和v。月球的重
3、力加速度可视为常数月球的重力加速度可视为常数g,飞船的自身质量及所带燃,飞船的自身质量及所带燃料分别为料分别为M和和F。hgv月球月球要求控制飞船从初始状态要求控制飞船从初始状态 FMmvvhh)0(,)0(,)0(00出发,于某一时刻出发,于某一时刻tf实现软着陆,即实现软着陆,即0)(,0)(fftvthkfmgmfvvh自某自某t=0时刻开始飞船进入着陆过程。其运动方程为时刻开始飞船进入着陆过程。其运动方程为其中其中k为一常数。为一常数。满足上述限制,使飞船实现软着陆的推力程序满足上述限制,使飞船实现软着陆的推力程序f(t)不止一不止一种,其中消耗燃料最少者才是最佳推力程序,易见,问题可
4、种,其中消耗燃料最少者才是最佳推力程序,易见,问题可归结为求归结为求为最大的数学问题。为最大的数学问题。)(ftmJ 控制过程中推力控制过程中推力f(t)不能超过发动机所能提供的最大推力不能超过发动机所能提供的最大推力fmax,即,即max)(0ftf例例2:防天拦截问题:防天拦截问题所谓防天拦截是指发射火箭拦击对方洲际导弹或其它所谓防天拦截是指发射火箭拦击对方洲际导弹或其它航天武器。航天武器。设设x(t)、v(t)分别表示拦截器分别表示拦截器L与目标与目标M的相对位置和的相对位置和相对速度向量。相对速度向量。a(t)是包括空气动力与地心引力所引起的是包括空气动力与地心引力所引起的加速度在内的
5、相对加速度向量,它是加速度在内的相对加速度向量,它是x、v的函数,既然位的函数,既然位置和速度向量是由运动微分方程所确定的时间函数,因此置和速度向量是由运动微分方程所确定的时间函数,因此相对加速度也可以看成时间的函数。设相对加速度也可以看成时间的函数。设m(t)是拦截器的质是拦截器的质量,量,f(t)是其推力的大小。用是其推力的大小。用u表示拦截器推力方向的单位表示拦截器推力方向的单位向量。向量。C是有效喷气速度,可视为常数。是有效喷气速度,可视为常数。于是,拦截器与目标的相对运动方程可写为于是,拦截器与目标的相对运动方程可写为Ctfmutmtftavvx)()()()(初始条件为初始条件为0
6、00000)(,)(,)(mtmvtvxtx为实现拦截,既要控制拦截器的推力大小,又要改变推力方为实现拦截,既要控制拦截器的推力大小,又要改变推力方向。拦截火箭的最大推力是一有限值向。拦截火箭的最大推力是一有限值fmax,瞬时推力,瞬时推力f(t)应满应满足足max)(0ftf至于单位向量至于单位向量u,它可以表示为,它可以表示为12uuuT其中其中|u|表示向量表示向量u的长度,有的长度,有232221uuuu也就是说,也就是说,u的幅值为的幅值为1,其方向不受限制。,其方向不受限制。要求控制拦截器从相对于目标的初始状态出发,于某末态要求控制拦截器从相对于目标的初始状态出发,于某末态时刻时刻
7、tf与目标相遇(实现拦截),即与目标相遇(实现拦截),即且应满足且应满足这里,这里,me是燃料耗尽后拦截火箭的质量。是燃料耗尽后拦截火箭的质量。一般说来,达到上述控制目标的一般说来,达到上述控制目标的f(t)、u(t)和和tf并非唯一。并非唯一。为了实现快速拦截,并尽可能地节省燃料,可综合考虑为了实现快速拦截,并尽可能地节省燃料,可综合考虑这两种要求,取性能指标为这两种要求,取性能指标为(a)(01dttfCJftt问题归结为选择问题归结为选择f(t)、u(t)和和tf,除实现拦截外还要使规定的,除实现拦截外还要使规定的性能指标为最小,此即在性能指标性能指标为最小,此即在性能指标(a)意义下的
8、最优拦截问意义下的最优拦截问题。题。0)(ftxefmtm)(上面的具体实例可抽象为共同的数学模型,其中受控系统上面的具体实例可抽象为共同的数学模型,其中受控系统数学模型一般可以表示为:数学模型一般可以表示为:如果是线性时不变系统,则可以表示为如果是线性时不变系统,则可以表示为性能指标:尽管我们不能为各种各样的最优控制问题规定性能指标:尽管我们不能为各种各样的最优控制问题规定一个性能指标的统一格式,但是通常情况下如下形式的性能指一个性能指标的统一格式,但是通常情况下如下形式的性能指标可以概括一般:标可以概括一般:),(),(ttutxfx)()(tButAxxfttffdtttutxLttxJ
9、0),(),(),(针对不同的具体问题,针对不同的具体问题,J一般可以取为不同的具体形式,如:一般可以取为不同的具体形式,如:最短时间问题最短时间问题线性二次最优控制问题线性二次最优控制问题线性伺服器问题线性伺服器问题 如果要求给定的系统状态如果要求给定的系统状态x跟踪或者尽可能地接近目标轨跟踪或者尽可能地接近目标轨迹迹xd,则,则J可以取为可以取为 除了特殊情况外,最优控制问题的解析解是比较复杂的,除了特殊情况外,最优控制问题的解析解是比较复杂的,以至必须求其数值解。当指标为二次性能指标时,可以给出以至必须求其数值解。当指标为二次性能指标时,可以给出整齐的解析解。整齐的解析解。fttfttd
10、tJ00dtRuuQxxJTttTf)(210fttdTddtxxxxJ0)()(21最优控制问题有四个关键点:最优控制问题有四个关键点:(1 1)受控对象为动态系统;受控对象为动态系统;(2 2)初始与终端条件(时间和状态);初始与终端条件(时间和状态);(3 3)性能指标;性能指标;(4 4)容许控制。容许控制。而最优控制问题的实质就是要找出容许的控制作用或控而最优控制问题的实质就是要找出容许的控制作用或控制规律,使动态系统(受控对象)从初始状态转移到某制规律,使动态系统(受控对象)从初始状态转移到某种要求的终端状态,并且保证某种要求的性能指标达到种要求的终端状态,并且保证某种要求的性能指
11、标达到最小值或者是最大值。最小值或者是最大值。自适应控制Adaptive Control “自适应自适应”(Adaptive)最初来源于生物系统,指生物变更最初来源于生物系统,指生物变更自自 己的习性以适应新的环境的一种特征。人体的体温、血己的习性以适应新的环境的一种特征。人体的体温、血压等系统都是典型的自适应系统;压等系统都是典型的自适应系统;前苏联学者前苏联学者Tsypkin在在学习系统的理论基础学习系统的理论基础一书中引一书中引用了马克用了马克.吐温的一段话来说明自适应:吐温的一段话来说明自适应:“一只猫在烧热的灶一只猫在烧热的灶上烫了一次,这只猫再也不敢在灶上坐了,即使这只灶是冷上烫了
12、一次,这只猫再也不敢在灶上坐了,即使这只灶是冷的。的。”说明了自适应过程的机械性;说明了自适应过程的机械性;“自适应控制自适应控制”这个名词出现在这个名词出现在20世纪世纪50年代。年代。“大百科大百科”中定义:能在系统和环境的信息不完备的情况下改变自身特中定义:能在系统和环境的信息不完备的情况下改变自身特性来保持良好工作品质的控制系统,称为自适应控制系统。性来保持良好工作品质的控制系统,称为自适应控制系统。什么是自适应控制?在反馈控制和最优控制中,都假定被控对象或过程的在反馈控制和最优控制中,都假定被控对象或过程的数学模型是已知的,并且具有线性定常的特性。实际上在数学模型是已知的,并且具有线
13、性定常的特性。实际上在许多工程中,被控对象或过程的数学模型事先是难以确定许多工程中,被控对象或过程的数学模型事先是难以确定的,即使在某一条件下被确定了的数学模型,在工况和条的,即使在某一条件下被确定了的数学模型,在工况和条件改变了以后,其动态参数乃至于模型的结构仍然经常发件改变了以后,其动态参数乃至于模型的结构仍然经常发生变化。生变化。背景例如:例如:飞机控制飞机控制 近地点和高空的空气密度不同,飞机控制特性随高度、近地点和高空的空气密度不同,飞机控制特性随高度、飞行速度的不同而有很大的变化飞行速度的不同而有很大的变化 导弹控制导弹控制 导弹的质量和重心随燃料的消耗迅速变化导弹的质量和重心随燃
14、料的消耗迅速变化 过程控制过程控制 连续生产化工设备参数随着环境温度和输入输出流量而改连续生产化工设备参数随着环境温度和输入输出流量而改变;锅炉机组过热蒸气温度的动态参数随着负荷变化而变变;锅炉机组过热蒸气温度的动态参数随着负荷变化而变化化 电力拖动电力拖动 造纸:卷纸筒惯性变化,为保持纸张力不变,马达的转矩造纸:卷纸筒惯性变化,为保持纸张力不变,马达的转矩需改变需改变船舶的航线控制船舶的航线控制传递函数的动态参数随着船载、速度、吃水深度和环境传递函数的动态参数随着船载、速度、吃水深度和环境(即波浪、风速、海潮等)的变化而变化(即波浪、风速、海潮等)的变化而变化 在发生这些问题时,常规控制器不
15、可能得到很好的控在发生这些问题时,常规控制器不可能得到很好的控制品质。为此,需要设计一种特殊的控制系统,它能够自制品质。为此,需要设计一种特殊的控制系统,它能够自动地补偿在模型阶次、参数和输入信号方面非预知的变化,动地补偿在模型阶次、参数和输入信号方面非预知的变化,这就是自适应控制。而自适应控制器的特点就是它能修正这就是自适应控制。而自适应控制器的特点就是它能修正自己的特性以响应过程和扰动的动力学特性变化。自己的特性以响应过程和扰动的动力学特性变化。自适应控制的研究对象是具有一定程度不确定性的系自适应控制的研究对象是具有一定程度不确定性的系统,这里所谓的统,这里所谓的“不确定性不确定性”是指描
16、述被控对象及其环境是指描述被控对象及其环境的数学模型不是完全确定的,其中包含一些未知因素和随的数学模型不是完全确定的,其中包含一些未知因素和随机因素。机因素。自适应控制自适应控制和系统辨识是分不开的。和系统辨识是分不开的。自适应系统的原理框图 自适应系统主要由控制器、被控对象、自适应器及反馈自适应系统主要由控制器、被控对象、自适应器及反馈控制回路和自适应回路组成。控制回路和自适应回路组成。控制器控制器被控对象被控对象自适应器自适应器参考输入参考输入r(t)控制量控制量u(t)干扰干扰v(t)输出量输出量y(t)与常规反馈控制系统比较,自适应控制系统有三个显著特点:与常规反馈控制系统比较,自适应
17、控制系统有三个显著特点:控制器可调控制器可调 相对于常规反馈控制器固定的结构和参数,自适应控制相对于常规反馈控制器固定的结构和参数,自适应控制系统的控制器在控制的过程中一般是根据一定的自适应规则,系统的控制器在控制的过程中一般是根据一定的自适应规则,不断更改或变动的;不断更改或变动的;增加了自适应回路增加了自适应回路 自适应控制系统在常规反馈控制系统基础上增加了自适自适应控制系统在常规反馈控制系统基础上增加了自适应回路(或称自适应外环),它的主要作用就是根据系统运应回路(或称自适应外环),它的主要作用就是根据系统运行情况,自动调整控制器,以适应被控对象特性的变化;行情况,自动调整控制器,以适应
18、被控对象特性的变化;适用对象适用对象 自适应控制适用于被控对象特性未知或自适应控制适用于被控对象特性未知或扰动特性变化范扰动特性变化范围很大,同时又要求经常保持高性能指标的一类系统,围很大,同时又要求经常保持高性能指标的一类系统,设计设计时不需要完全知道被控对象的数学模型。时不需要完全知道被控对象的数学模型。例:加热炉温度控制系统设计例:加热炉温度控制系统设计 1)常规控制器设计方法:常规控制器设计方法:被控对象:被控对象:其物理意义为:单位时间炉温升高所用的热量等于单位时间其物理意义为:单位时间炉温升高所用的热量等于单位时间内流入炉子热量与流出炉子热量之差。其中:内流入炉子热量与流出炉子热量
19、之差。其中:sqqdtdyC系系数数热热功功率率)控控制制量量(如如电电热热炉炉的的加加热热量量,单单位位时时间间内内流流入入炉炉子子的的散散热热系系数数;热热量量;单单位位时时间间内内流流出出炉炉子子的的炉炉温温;炉炉子子热热容容量量;11KuuKqqaqyCs加热炉传递函数:加热炉传递函数:如果对加热炉温度控制的设计目标是使理想的闭环传函为如果对加热炉温度控制的设计目标是使理想的闭环传函为选择选择PI(比例积分)控制器(比例积分)控制器sTKsUsYsGppp1)()()(0,11)()()(mmmTsTsUsYsGsTKsGic11)(于是有:于是有:令令 则则,1ayuKdtdyC,1
20、aKKaCTppuKydtdyTppsKKTsGsGsGsGppooo11)(111)(1)()(,有,有与与比较比较)()(sGsGmmppTKTK 则闭环传函为则闭环传函为则要设计的控制器为则要设计的控制器为sTTKTsGpmppc11)(sTKKsGTTsTsTsTKKsGsGsGipopipiipcpo)(11)()()(,则,则,取,取于是控制系统的开环传函为于是控制系统的开环传函为2121)()()()(21ttpttpdttuKdttytytyT 要得到被控对象数学模型参数要得到被控对象数学模型参数Tp和和Kp是困难的。同时,是困难的。同时,Tp和和Kp也不可能完全不变,如热容量
21、也不可能完全不变,如热容量C与炉内工件的多少有与炉内工件的多少有关,散热系数关,散热系数a与环境温度有关,所以与环境温度有关,所以Tp和和Kp也是随环境、也是随环境、工况和炉温的变化而变化的。在工况和炉温的变化而变化的。在Tp和和Kp变化后,上例中根据变化后,上例中根据固定的固定的Tp和和Kp设计的控制器显然会使控制系统性能下降。于设计的控制器显然会使控制系统性能下降。于是可以考虑通过控制量是可以考虑通过控制量u(t)和被控量和被控量y(t)来估计来估计Tp和和Kp。对模。对模型型uKydtdyTpp2)自适应控制器设计方法:自适应控制器设计方法:两边从两边从t1到到t2积分,可得积分,可得以
22、采样周期以采样周期h对对u(t),y(t)采样,当采样,当h相对于相对于Tp足够小时:足够小时:(1)()()()(212121ttipttipihuhKihyhtytyT式中式中;所所有有输输出出采采样样数数据据之之和和至至时时刻刻时时刻刻2121)(ttihytti和和;所所有有控控制制量量采采样样数数据据之之至至时时刻刻时时刻刻2121)(ttihutti同理,用时刻同理,用时刻t2至时刻至时刻t3区间的采样数据有区间的采样数据有(2)()()()(323223ttipttipihuhKihyhtytyTpippiKTTKTT ,ppKT和和从而构成了炉温控制系统的从而构成了炉温控制系统
23、的“自适应控制器自适应控制器”。计算机控制的过程:计算机控制的过程:(a)开机,施加一定的控制开机,施加一定的控制(恒值恒值PI,或手动控制,或手动控制),检测,检测u(ih)和和y(ih),以构造,以构造(1)、(2);(b)解解(1)、(2)式,得式,得 ,从而获得控制器参数,从而获得控制器参数 ;(c)将控制器参数调整为将控制器参数调整为 ,并投入运行;,并投入运行;(d)继续用新的采样数据构造继续用新的采样数据构造(1)、(2)式,求出新的控制器参式,求出新的控制器参 数。数。(1)、(2)联立可解出联立可解出Tp和和Kp的估计值的估计值 ,于是可取控制,于是可取控制器参数器参数ppK
24、T和和KTi和和KTi和和鲁棒控制鲁棒控制 以静制动以静制动最优控制最优控制 “没有更好只有最好没有更好只有最好”自适应控制自适应控制 以变制变以变制变1.本课程设立的目的是为了培养学生对具体问题的分析研究能力。希本课程设立的目的是为了培养学生对具体问题的分析研究能力。希望各位同学深入分析研究问题的本质,灵活运用系统与控制课程中介望各位同学深入分析研究问题的本质,灵活运用系统与控制课程中介绍的概念、思想和方法,以及其它任何相关的方法,提出解决方案和绍的概念、思想和方法,以及其它任何相关的方法,提出解决方案和结果。结果。2鼓励同学结合自己的专业或兴趣,自己寻找题目。所报告内容请提鼓励同学结合自己
25、的专业或兴趣,自己寻找题目。所报告内容请提前发至前发至。3.11/29,第一次报告。每人限制在,第一次报告。每人限制在15 分钟内,允许提问。采用分钟内,允许提问。采用PowerPoint 形式。全面介绍问题分析、解决方案、仿真结果和结论。形式。全面介绍问题分析、解决方案、仿真结果和结论。12/6,12/13,第二、三次报告;,第二、三次报告;4.每位同学可根据情况,提出在课程期间做补充进展报告,展示某方每位同学可根据情况,提出在课程期间做补充进展报告,展示某方面的具体结果。面的具体结果。5报告分数占总分数的报告分数占总分数的40%。6请各位同学认真对待,这是一次难得的锻炼自己展示自己研究能力请各位同学认真对待,这是一次难得的锻炼自己展示自己研究能力的机会。的机会。大作业大作业: