1、第9章 9.1 概述概述 神经网络是一种具有高度非线性的连续时间动力神经网络是一种具有高度非线性的连续时间动力系统,它有着很强的自学习功能和对非线性系统的强系统,它有着很强的自学习功能和对非线性系统的强大映射能力,已广泛应用于复杂对象的控制中。神经大映射能力,已广泛应用于复杂对象的控制中。神经网络所具有的大规模并行性、冗余性、容错性、本质网络所具有的大规模并行性、冗余性、容错性、本质的非线性及自组织、自学习、自适应能力,给不断面的非线性及自组织、自学习、自适应能力,给不断面临挑战的控制理论带来生机。临挑战的控制理论带来生机。从控制角度来看,神经网络用于控制的优越性主要从控制角度来看,神经网络用
2、于控制的优越性主要表现为:表现为:(1 1)神经网络可是处理那些难以用模型或规则描述的)神经网络可是处理那些难以用模型或规则描述的对象;对象;(2)神经网络采用并行分布式信息处理方式,具有很)神经网络采用并行分布式信息处理方式,具有很强的容错性;强的容错性;(3 3)神经网络在本质上是非线性系统,可以实现任意)神经网络在本质上是非线性系统,可以实现任意非线性映射。神经网络在非线性控制系统中具有很大的非线性映射。神经网络在非线性控制系统中具有很大的发展前途;发展前途;(4 4)神经网络具有很强的信息综合能力,它能够同时)神经网络具有很强的信息综合能力,它能够同时处理大量不同类型的输入,能够很好地
3、解决输入信息处理大量不同类型的输入,能够很好地解决输入信息之间的互补性和冗余性问题;之间的互补性和冗余性问题;(5 5)神经网络的硬件实现愈趋方便。大规模集成电路)神经网络的硬件实现愈趋方便。大规模集成电路技术的发展为神经网络的硬件实现提供了技术手段,技术的发展为神经网络的硬件实现提供了技术手段,为神经网络在控制中的应用开辟了广阔的前景。为神经网络在控制中的应用开辟了广阔的前景。神经网络控制所取得的进展为:神经网络控制所取得的进展为:(1)基于神经网络的系统辨识:可在已知常规模型结构基于神经网络的系统辨识:可在已知常规模型结构的情况下,估计模型的参数;或利用神经网络的线性、的情况下,估计模型的
4、参数;或利用神经网络的线性、非线性特性,建立线性、非线性系统的静态、动态、非线性特性,建立线性、非线性系统的静态、动态、逆动态及预测模型;逆动态及预测模型;(2)神经网络控制器:神经网络作为控制器,可实现对神经网络控制器:神经网络作为控制器,可实现对不确定系统或未知系统进行有效的控制,使控制系统不确定系统或未知系统进行有效的控制,使控制系统达到所要求的动态、静态特性;达到所要求的动态、静态特性;(3)神经网络与其他算法相结合:神经网络与专家系统、神经网络与其他算法相结合:神经网络与专家系统、模糊逻辑、遗传算法等相结合可构成新型控制器;模糊逻辑、遗传算法等相结合可构成新型控制器;(4)优化计算:
5、在常规控制系统的设计中,常遇到求解优化计算:在常规控制系统的设计中,常遇到求解约束优化问题,神经网络为这类问题提供了有效的途约束优化问题,神经网络为这类问题提供了有效的途径;径;(5)控制系统的故障诊断:利用神经网络的逼近特性,控制系统的故障诊断:利用神经网络的逼近特性,可对控制系统的各种故障进行模式识别,从而实现控可对控制系统的各种故障进行模式识别,从而实现控制系统的故障诊断。制系统的故障诊断。神经网络控制在理论和实践上,以下问题是研究神经网络控制在理论和实践上,以下问题是研究的重点:的重点:(1)神经网络的稳定性与收敛性问题;神经网络的稳定性与收敛性问题;(2)神经网络控制系统的稳定性与收
6、敛性问题;神经网络控制系统的稳定性与收敛性问题;(3)神经网络学习算法的实时性;神经网络学习算法的实时性;(4)神经网络控制器和辨识器的模型和结构。神经网络控制器和辨识器的模型和结构。根据神经网络在控制器中的作用不同,神经网络控制根据神经网络在控制器中的作用不同,神经网络控制器可分为两类,一类为神经控制,它是以神经网络为基器可分为两类,一类为神经控制,它是以神经网络为基础而形成的独立智能控制系统;另一类为混合神经网络础而形成的独立智能控制系统;另一类为混合神经网络控制,它是指利用神经网络学习和优化能力来改善传统控制,它是指利用神经网络学习和优化能力来改善传统控制的智能控制方法,如自适应神经网络
7、控制等。控制的智能控制方法,如自适应神经网络控制等。综合目前的各种分类方法,可将神经网络控制的结构综合目前的各种分类方法,可将神经网络控制的结构归结为以下七类。归结为以下七类。9.2 神经网络控制结构神经网络控制结构 9.2.1 9.2.1 神经网络监督控制神经网络监督控制 通过对传统控制器进行学习,然后用神经网络控制器逐渐通过对传统控制器进行学习,然后用神经网络控制器逐渐取代传统控制器的方法,称为神经网络监督控制。神经网络监取代传统控制器的方法,称为神经网络监督控制。神经网络监督控制的结构如图督控制的结构如图9-19-1所示。所示。神经网络控制器实际上是一个前馈控制器,它建立的是被神经网络控
8、制器实际上是一个前馈控制器,它建立的是被控对象的逆模型。神经网络控制器通过对传统控制器的输出进控对象的逆模型。神经网络控制器通过对传统控制器的输出进行学习,在线调整网络的权值,使反馈控制输入趋近于零,从行学习,在线调整网络的权值,使反馈控制输入趋近于零,从而使神经网络控制器逐渐在控制作用中占据主导地位,最终取而使神经网络控制器逐渐在控制作用中占据主导地位,最终取消反馈控制器的作用。一旦系统出现干扰,反馈控制器重新起消反馈控制器的作用。一旦系统出现干扰,反馈控制器重新起作用。这种前馈加反馈的监督控制方法,不仅可以确保控制系作用。这种前馈加反馈的监督控制方法,不仅可以确保控制系统的稳定性和鲁棒性,
9、而且可有效地提高系统的精度和自适应统的稳定性和鲁棒性,而且可有效地提高系统的精度和自适应能力。能力。NNC控制器对象+-+tyd te ty tun tup tu图9-1 神经网络监督控制 图图9-2为神经网络直接逆控制的两种结构方案。为神经网络直接逆控制的两种结构方案。在图在图9-2(a)中,中,NN1和和NN2为具有完全相同的网络结为具有完全相同的网络结构,并采用相同的学习算法,分别实现对象的逆。构,并采用相同的学习算法,分别实现对象的逆。在图在图9-2(b)中,神经网络中,神经网络NN通过评价函数进行学习,通过评价函数进行学习,实现对象的逆控制。实现对象的逆控制。对象 tyd te ty
10、 tun tuNN1NN2+-对象 tyd tE ty tuNN评价函数(b)9.2.3 神经网络自适应控制 与传统自适应控制相同,神经网络自适应控制也与传统自适应控制相同,神经网络自适应控制也分为神经网络自校正控制和神经网络模型参考自适应分为神经网络自校正控制和神经网络模型参考自适应控制两种。自校正控制根据对系统正向或逆模型的结控制两种。自校正控制根据对系统正向或逆模型的结果调节控制器内部参数,使系统满足给定的指标,而果调节控制器内部参数,使系统满足给定的指标,而在模型参考自适应控制中,闭环控制系统的期望性能在模型参考自适应控制中,闭环控制系统的期望性能由一个稳定的参考模型来描述。由一个稳定
11、的参考模型来描述。(2 2)神经网络间接自校正控制)神经网络间接自校正控制 其结构如图其结构如图9-39-3所示。假设被控对象为如所示。假设被控对象为如下单变量仿射非线性系统:下单变量仿射非线性系统:若利用神经网络对非线性函数若利用神经网络对非线性函数 和和 进进行逼近,得到行逼近,得到 和和 ,则控制器为:,则控制器为:其中其中 为为t t时刻的期望输出值。时刻的期望输出值。()()tty tfyg y u ttfytg ytfytg y(t)/ttu trfyg y r t神经网络估计器常规控制器对象 tyd te tu ty+-g,f图图9-3 9-3 神经网络间接自校正控制神经网络间接
12、自校正控制2.2.神经网络模型参考自适应控制神经网络模型参考自适应控制 分为直接模型参考自适应控制和间接模型分为直接模型参考自适应控制和间接模型参考自适应控制两种。参考自适应控制两种。(1 1)直接模型参考自适应控制)直接模型参考自适应控制 如图如图9-4所示。神经网络控制器的作用是使所示。神经网络控制器的作用是使被控对象与参考模型输出之差为最小。但该方被控对象与参考模型输出之差为最小。但该方法需要知道对象的法需要知道对象的 信息信息 。Jacobianuy参考模型NNC对象 tr te tu ty+-tym tec+-图图9-4 9-4 神经网络直接模型参考自适应控制神经网络直接模型参考自适
13、应控制(2 2)间接模型参考自适应控制)间接模型参考自适应控制 如图如图9-59-5所示。神经网络辨识器所示。神经网络辨识器NNINNI向神经向神经网络控制器网络控制器NNCNNC提供对象的信息,用于控制器提供对象的信息,用于控制器NNCNNC的学习。的学习。参考模型NNC对象 tr te tu ty+-tym tec+-NNC+-tei tyn图图9-5 神经网络间接模型参考自适应控制神经网络间接模型参考自适应控制 9.2.4 9.2.4 神经网络内模控制神经网络内模控制 经典的内模控制将被控系统的正向模型和逆模型直经典的内模控制将被控系统的正向模型和逆模型直接加入反馈回路,系统的正向模型作
14、为被控对象的近接加入反馈回路,系统的正向模型作为被控对象的近似模型与实际对象并联,两者输出之差被用作反馈信似模型与实际对象并联,两者输出之差被用作反馈信号,该反馈信号又经过前向通道的滤波器及控制器进号,该反馈信号又经过前向通道的滤波器及控制器进行处理。控制器直接与系统的逆有关,通过引入滤波行处理。控制器直接与系统的逆有关,通过引入滤波器来提高系统的鲁棒性。器来提高系统的鲁棒性。图图9-69-6为神经网络内模控制,被控对象的正向模型及为神经网络内模控制,被控对象的正向模型及控制器均由神经网络来实现。控制器均由神经网络来实现。滤波器对象+-tyd te ty tu神经网络控制器神经网络正向模型NN
15、1NN2 tym+-d图图9-6 神经网络内模控制神经网络内模控制 9.2.5 9.2.5 神经网络预测控制神经网络预测控制 预测控制又称为基于模型的控制,是预测控制又称为基于模型的控制,是7070年代后期发年代后期发展起来的新型计算机控制方法,该方法的特征是预测展起来的新型计算机控制方法,该方法的特征是预测模型、滚动优化和反馈校正。模型、滚动优化和反馈校正。神经网络预测控制的结构如图神经网络预测控制的结构如图9-79-7所示,神经网络预所示,神经网络预测器建立了非线性被控对象的预测模型,并可在线进测器建立了非线性被控对象的预测模型,并可在线进行学习修正。行学习修正。利用此预测模型,通过设计优
16、化性能指标,利用非利用此预测模型,通过设计优化性能指标,利用非线性优化器可求出优化的控制作用线性优化器可求出优化的控制作用 。tu非线性优化器对象+-tyd te ty tu+d神经网络预测器滤波器 ty+-kty 图9-7 神经网络预测控制9.2.6 9.2.6 神经网络自适应评判控制神经网络自适应评判控制 神经网络自适应评判控制通常由两个网络组成,如图神经网络自适应评判控制通常由两个网络组成,如图9-89-8所示。自适应评判网络通过不断的奖励、惩罚等再所示。自适应评判网络通过不断的奖励、惩罚等再励学习,使自己逐渐成为一个合格的励学习,使自己逐渐成为一个合格的“教师教师”,学习完,学习完成后
17、,根据系统目前的状态和外部激励反馈信号成后,根据系统目前的状态和外部激励反馈信号r(t)r(t)产生一个内部再励信号产生一个内部再励信号 ,以对目前的控制效果作出,以对目前的控制效果作出评价。控制选择网络相当于一个在内部再励信号评价。控制选择网络相当于一个在内部再励信号 指指导下进行学习的多层前馈神经网络控制器,该网络在进导下进行学习的多层前馈神经网络控制器,该网络在进行学习后,根据编码后的系统状态,在允许控制集中选行学习后,根据编码后的系统状态,在允许控制集中选择下一步的控制作用。择下一步的控制作用。()r t()r t自适应评价网络控制选择网络对象 tu ty编码器 tr tr 内部再励外
18、部再励反馈图图9-8 神经网络自适应评判控制神经网络自适应评判控制 9.2.7 9.2.7 神经网络混合控制神经网络混合控制 该控制方法是集成人工智能各分支的优点,由神该控制方法是集成人工智能各分支的优点,由神经网络技术与模糊控制、专家系统等相结合而形成的经网络技术与模糊控制、专家系统等相结合而形成的一种具有很强学习能力的智能控制系统。一种具有很强学习能力的智能控制系统。由神经网络和模糊控制相结合构成模糊神经网络,由神经网络和模糊控制相结合构成模糊神经网络,由神经网络和专家系统相结合构成神经网络专家系统。由神经网络和专家系统相结合构成神经网络专家系统。神经网络混合控制可使控制系统同时具有学习、
19、推理神经网络混合控制可使控制系统同时具有学习、推理和决策能力。和决策能力。9.3 单单9.3.1 单神经元自适应控制算法单神经元自适应控制算法 单神经元自适应控制的结构如图单神经元自适应控制的结构如图9-9所示。所示。图图9-9 单神经元自适应单神经元自适应PID控制结构控制结构 单神经元自适应控制器是通过对加权系数的调单神经元自适应控制器是通过对加权系数的调整来实现自适应、自组织功能,控制算法为整来实现自适应、自组织功能,控制算法为 如果权系数的调整按有监督的如果权系数的调整按有监督的Hebb学习规则实学习规则实现,即在学习算法中加入监督项现,即在学习算法中加入监督项 ,则神经网络权,则神经
20、网络权值学习算法为:值学习算法为:31)()()1()(iiikxkwKkuku kz)()()()1()()()()()1()()()()()1()(333222111kxkukzkwkwkxkukzkwkwkxkukzkwkw式中,式中,为 学 习 速 率,为 学 习 速 率,为 神 经 元 的 比 例 系为 神 经 元 的 比 例 系数,数,。kekz)()(1kekx)1()()(2kekekx)2()1(2)()()(23kekekekekxK0K 值的选择非常重要。值的选择非常重要。越大,则快速性越好,越大,则快速性越好,但超调量大,甚至可能使系统不稳定。当被控对象但超调量大,甚至
21、可能使系统不稳定。当被控对象时延增大时,时延增大时,值必须减少,以保证系统稳定。值必须减少,以保证系统稳定。值选择过小,会使系统的快速性变差。值选择过小,会使系统的快速性变差。KKKK()0.5sgn(sin(4)r kt9.3.2 9.3.2 仿真实例仿真实例 2)-(0.6321)-(0.102)-(0.261)-(0.368)(kukukykyky9.4 RBF9.4 RBF网络监督控制网络监督控制9.4.1 RBF9.4.1 RBF网络监督控制算法网络监督控制算法 基于RBF网络的监督控制系统结构如图9-14所示。RBFPD控制对象+-+kr ke ky kun kup ku图图9-1
22、4 9-14 神经网络监督控制神经网络监督控制 在在RBFRBF网络结构中,取网络的输入为网络结构中,取网络的输入为 ,网络,网络的径向基向量为的径向基向量为 ,为高斯基函数:为高斯基函数:krTmhh,1Hjh)2-exp(-22jjjbkrhC网络的权向量为:网络的权向量为:RBFRBF网络的输出为:网络的输出为:其中其中 为为RBFRBF网络隐层神经元的个数。网络隐层神经元的个数。T1,mwwW mmjjnwhwhwhku11m控制律为:控制律为:kukukunp设神经网络调整的性能指标为:设神经网络调整的性能指标为:221kukukEn kwkukwkujnjp近似地取近似地取由此所产
23、生的不精确通过权值调节来补偿。由此所产生的不精确通过权值调节来补偿。神经网络权值的调整过程为:神经网络权值的调整过程为:其中其中 为学习速率,为学习速率,为动量因子。为动量因子。211kkkkkWWWWW khkukukwkukukukwkEkwjnjpnjj采用梯度下降法调整网络的权值:采用梯度下降法调整网络的权值:9.4.2 9.4.2 仿真实例仿真实例 被控对象为:被控对象为:21000()s502000G ssRBF网络监督控制程序为网络监督控制程序为chap9_2.m 神经间接自校正控制结构如图神经间接自校正控制结构如图9-17所示,所示,它由两个回路组成:它由两个回路组成:(1)自
24、校正控制器与被控对象构成的反馈回)自校正控制器与被控对象构成的反馈回路。路。(2)神经网络辩识器与控制器设计,以得到)神经网络辩识器与控制器设计,以得到控制器的参数。控制器的参数。辩识器与自校正控制器的在线设计是自校辩识器与自校正控制器的在线设计是自校正控制实现的关键。正控制实现的关键。图图9-17 9-17 神经网络间接自校正控制框图神经网络间接自校正控制框图9.5.2 9.5.2 自校正控制算法自校正控制算法 考虑被控对象:考虑被控对象:其中其中 ,分别为对象的输入、输出,分别为对象的输入、输出,为非为非零函数。零函数。kukykygky1uy 1)(krgku g NkrNNgku1)(
25、g g Ng N9.5.3 RBF9.5.3 RBF网络自校正控制算法网络自校正控制算法 采用两个采用两个RBF网络分别实现未知项网络分别实现未知项 、的的辨识。辨识。RBF网络辨识器的结构如图网络辨识器的结构如图9-18所示,所示,和和 分别为两个神经网络的权值向量。分别为两个神经网络的权值向量。g WV图图9-18 9-18 神经网络辨识器神经网络辨识器 在在RBF网络结构中,取网络的输入为网络结构中,取网络的输入为 ,网络的径向基向量为网络的径向基向量为 ,为高斯为高斯基函数:基函数:其中其中 。为节点为节点 的基宽度参数,的基宽度参数,为网络第为网络第 个结点的中心矢量,个结点的中心矢
26、量,。kyTmhh,1Hjh)2-exp(-22jjjbkyhCmj,1jbj0jbjCjmjcc111,CTmbb,1B两个两个RBF网络的输出分别为:网络的输出分别为:mmjjwhwhwhkNg11 mmjjvhvhvhkN11m 1;1;1kukVkyNkWkyNgkym辨识后,对象的输出为:辨识后,对象的输出为:其中其中 为为RBF网络隐层神经元的个数。网络隐层神经元的个数。网络的权向量为:网络的权向量为:T1,mwwWT1,mvvV采用梯度下降法调整网络的权值:采用梯度下降法调整网络的权值:khkykykwkEkwjmwjwj khkykykvkEkvjmvjvj设神经网络调整的性能
27、指标为:设神经网络调整的性能指标为:221kykykEm 神经网络自校正控制系统的结构如图神经网络自校正控制系统的结构如图9-19所示。所示。神经网络权值的调整过程为:神经网络权值的调整过程为:211kkkkkWWWWW 211kkkkkVVVVV其中其中 和和 为学习速率,为学习速率,为动量因子。为动量因子。wv图图9-19 9-19 神经网络自校正控制框图神经网络自校正控制框图 9.5.4 仿真实例仿真实例 被控对象为:被控对象为:其中其中 ,。)1(15)1(sin(8.0)(kukyky 1sin8.0kykyg 15kyRBF网络自校正控制程序为网络自校正控制程序为chap9_3.m
28、。9.6 基于基于RBF网络直接模型参考自适应控制网络直接模型参考自适应控制9.6.1 基于基于RBF网络的控制器设计网络的控制器设计 控制系统的结构如图控制系统的结构如图9-23所示。所示。设参考模型输出为设参考模型输出为 ,控制系统要求对,控制系统要求对象的输出象的输出 能够跟踪参考模型的输出能够跟踪参考模型的输出 。kym ky kym则跟踪误差为:则跟踪误差为:kykykecm-参考模型RBF对象 kr ke ku ky+-kym kec+-图图9-23 基于基于RBF网络的直接模型参考网络的直接模型参考自适应控制自适应控制控制目标函数为:控制目标函数为:控制器为控制器为RBF网络的输
29、出:网络的输出:其中其中 为为RBF网络隐层神经元的个数,网络隐层神经元的个数,为第为第 个网络隐层神经元与输出层之间的连接权,个网络隐层神经元与输出层之间的连接权,为第个为第个 隐层神经元的输出。隐层神经元的输出。2k21eckE mmjjwhwhwhku11mjwjjhj在在RBF网络结构中,网络结构中,为网络的输入为网络的输入向量。向量。RBF网络的径向基向量为网络的径向基向量为 ,为,为高斯基函数:高斯基函数:其中其中 ,为节点为节点 的基宽度参数,的基宽度参数,为网络第为网络第 个结点的中心矢量,个结点的中心矢量,。Tnxx,1XTmhh,1Hjh)2-exp(-22jjjbhCXm
30、j,1jbj0jbjCjjnjijjccc,1CTmbb,1B网络的权向量为:网络的权向量为:按梯度下降法及链式法则,可得权值的学按梯度下降法及链式法则,可得权值的学习算法如下:习算法如下:其中其中 为学习速率,为学习速率,为动量因子。为动量因子。T1,mwwW jjhkukyecwkEwkk kwwwwjjjjk1-kk同理,可得同理,可得RBF网络隐层神经元的高斯函数网络隐层神经元的高斯函数的中心参数及基的中心参数及基宽的学习算法如下:宽的学习算法如下:32-kkkjijjjjjjbchwkuykecbukuykecbkEkbx 2)-(k-1)-(k(1)-(k(k)jjjjjbbkbb
31、b 2kkkjijijjijijijbcxhwkuykeccukuykecckEkc 2)-(kc-1)-(k(c1)-(k(k)ijijijijijkccc 在学习算法中,在学习算法中,称为称为 信息,表示信息,表示系统的输出对控制输入的敏感性,其值可由神系统的输出对控制输入的敏感性,其值可由神经网络辨识而得。在神经网络算法中,对经网络辨识而得。在神经网络算法中,对 值的精确度要求不是很高,不精确部分可通过值的精确度要求不是很高,不精确部分可通过网络参数及权值的调整来修正,关键是其符号,网络参数及权值的调整来修正,关键是其符号,因此可用因此可用 的正负号来代替,这样可使算法的正负号来代替,这
32、样可使算法更加简单。更加简单。kuykJacobian kuyk kuyk9.6.2 仿真实例仿真实例 被控对象为一非线性模型:被控对象为一非线性模型:21-ky1/1-ku1-k0.10y-ky 取采样周期为取采样周期为 ,参考模型为,参考模型为 ,其中,其中 为正弦信号,为正弦信号,。msts1 krkykymm16.0 krtskkr2sin50.0)(RBF网络直接模型参考自适应控制程序为网络直接模型参考自适应控制程序为chap9_4.m 9.7 一种简单的一种简单的RBF网络自适应控制网络自适应控制9.7.1 问题描述问题描述 考虑一种简单的动力学系统:(9.30)其中 为转动角度,
33、u 为控制输入。写成状态方程形式为:(9.31)其中 f(x)为未知。位置指令为 ,则误差及其导数为,fu 122xxxfxudx1dexx2dexx定义误差函数为 (9.32)则 由式(9.32)可见,如果 ,则 且 。see 0 2ddseeexxef xux 0s 0e 0e 9.7.2 RBF网络原理网络原理由于RBF网络具有万能逼近特性20,采用RBF神经网络逼近f(x),网络算法为:(9.33)(9.34)其中 x为网络的输入,j 为网络隐含层第 j个节点,为网络的高斯基函数输出,为网络的理想权值,为网络的逼近误差,。网络输入取 ,则网络输出为:(9.35)22exp2jjjhbx
34、c*TfWh xTjhh*WNT12xxx Tf xxW h9.7.3 控制算法设计与分析控制算法设计与分析由于定义Lyapunov函数为 (9.36)其中 ,。则设计控制律为 (9.37)*TTTf xf xx Wh xW hW h x2T1122VsW W*WWW0 TTd11VssW Ws cef xuxW W dsgnucef xxs 则取 ,自适应律为 (9.38)则 ,可见,控制律中的鲁棒项 的作用是克服神经网络的逼近误差,以保证系统稳定。TTTT1sgn1 sgn1 Vs f xf xsssssWWsW WW h xW Wh xmax sWh x sgn s0Vss000tsee
35、 则时,9.7.4 仿真实例仿真实例考虑如下被控对象式中,位置指令为 ,控制律采用式(9.37),自适应律采用式(9.38),取 ,。根据网络输入x1 和x2 的实际范围来设计高斯基函数的参数,参数 ci和 bi取值分别为-2-1 0 1 2 和3.0。网络权值中各个元素的初始值取0.10。仿真结果如图9.25和图9.26所示。122xxxfxu 1210f xx xdsinxt5000.5002468101214161820-2-101time(s)position tracking02468101214161820-2-1012time(s)speed tracking图9.25 位置和速
36、度跟踪02468101214161820-40-30-20-10010203040time(s)f approximation图9.26 f(x)及逼近9.8 基于不确定逼近的基于不确定逼近的RBF网络自适应控制网络自适应控制 9.8.1 问题的提出问题的提出其中其中 为为 阶正定惯性矩阵,阶正定惯性矩阵,为为 阶惯性矩阵,阶惯性矩阵,其中为其中为 阶惯性向量。阶惯性向量。如果模型建模精确,且如果模型建模精确,且 ,则控制律可设计为:则控制律可设计为:通过对文献通过对文献18的控制方法进行详细推导及仿真分析,研究基于的控制方法进行详细推导及仿真分析,研究基于模型不确定逼近的模型不确定逼近的RB
37、F网络机器人自适应控制的设计方法。网络机器人自适应控制的设计方法。设设n关节机械手的动力学方程为:关节机械手的动力学方程为:,D q qC q q qGqd(9.39)D qnn,C q q nn G q1n0d dvp,D qqk ek eC q q qG q(9.40)将控制律式(9.40)代入式(9.39)中,得到稳定的闭环系统为 (9.41)其中 为理想的角度,。在实际工程中,对象的实际模型很难得到,即无法得到精的 、只能建立理想的名义模型。将机器人名义模型表示为 ,针对名义模型的控制律设计为:(9.42)将控制律式(9.42)代入式(9.39)中,得 (9.43)取 ,则vp0ek
38、ek edqdeqqdeqq D q,C q q G q 0Dq0,Cq q 0Gq 0dvp00e,Dqqk ekCq q qGq 0dvp00,D q qC q q qG qDqqk ek eCq q qGqd 0DDD0CCC0GGG 由由式(式(9.449.44)可见,由于模型建模的不精确会导致控制性能的下)可见,由于模型建模的不精确会导致控制性能的下降。因此,需要对建模不精确部分进行逼近。降。因此,需要对建模不精确部分进行逼近。式(式(9.449.44)中,取建模不精确部分)中,取建模不精确部分 则则可将式(可将式(9.449.44)转化为如下误差状态方程)转化为如下误差状态方程 (
39、9.459.45)式中,式中,I I为单位阵。为单位阵。假设模型不确定项假设模型不确定项f为已知,则可设计修正的控制律为:为已知,则可设计修正的控制律为:(9.46)将控制律式(将控制律式(9.46)代入式()代入式(9.39)中,则可得到稳定的闭环系统式)中,则可得到稳定的闭环系统式(9.41)。)。在实际工程中,模型不确定项在实际工程中,模型不确定项 f 为未知,为此,需要对不确定为未知,为此,需要对不确定项项f进行逼近,从而在控制律中实现对不确定项进行逼近,从而在控制律中实现对不确定项 f的补偿。的补偿。10 f xDDqCqGdxAxBf0pvIAkk0BI 0dvp000,()Dq
40、fDqqk ek eCq q qGq9.8.2 模型不确定部分的模型不确定部分的RBF网络逼近网络逼近 采用采用RBF网络对不确定项网络对不确定项 进行自适应逼近。进行自适应逼近。RBF网络算法为:网络算法为:,其中其中X为网络的输入信号,为网络的输入信号,Y为网络的输出信号,为网络的输出信号,为高斯基函数的输出,为高斯基函数的输出,为神经网络权值。为神经网络权值。由已知证明可知由已知证明可知19,20,在下述假设条件下,在下述假设条件下,RBF网络针对连续函数在紧集范围内网络针对连续函数在紧集范围内具有任意精度的逼近能力。具有任意精度的逼近能力。假设:假设:(1)神经网络输出)神经网络输出
41、为连续;为连续;(2)存在理想逼近的神经网络输出)存在理想逼近的神经网络输出 ,针对一个非常小的正数,针对一个非常小的正数 ,有,有 f x22/xciiigbni,2,1 Ty x12,n(,)f x*(,)f x0*0max,f x f x误差状态方程式(误差状态方程式(9.45)可写为)可写为 (9.47)其中,其中,为为 阶矩阵,表示对阶矩阵,表示对 最佳逼最佳逼近的神经网络权值。近的神经网络权值。式式(9.47)可写为可写为 (9.48)取取 为理想神经网络的逼近误差,即为理想神经网络的逼近误差,即 (9.49)*arg minsup,xMxM f xf x*f x*,f xf x*
42、(,)(,)()xAxBff xxf xn n*(,)xAxB f x 0*sup,f xf x 0*T,f x x逼近误差逼近误差 为有界,假设其界为为有界,假设其界为 ,即,即 (9.50)神经网络输出神经网络输出 的最佳估计值为的最佳估计值为 (9.51)则式则式(9.48)可写为可写为 (9.52)()f*()TxAxBx 控制器设计为 (9.53)其中 (9.54)(9.55)其中 为 的估计值,。将控制律式(9.53)代入式(9.39)中,有9.8.3 控制器的设计及分析控制器的设计及分析12 10dvp00,Dqqk ek eCq q qGq 20,D q f x*T,f x x
43、0dvp000,D q qC q q qGqDqqk ek eCq q qGqDq fd采用采用 分别减去上式左右两边,得:分别减去上式左右两边,得:即000,Dq qCq q qGq00dvp0,D q qC q q qGqdDq qDqqk ek eDq fx 0vp,D q qC q q qG qdDqek ek ef x 1vp0,ek ek ef x DqD q qC q q qG qd vp,ek ek efx fx式中,式中,上式可写为:上式可写为:10 f xDDqCqGd,xAx B f xf x 其中其中 ,pv0IAkk0 BI 由于由于 则 (9.56)定义Lyapun
44、ov函数为 (9.57)其中 。存在正定矩P和Q,并满足如下Lyapunov方程 (9.58)*TTT,f xf x f xf x f x f x x x x其中其中 。*TxAxB x2T1122Vx Px0T PAA PQ 定义定义22TT,trtriji jrRRRR R 其中其中 为矩阵的迹,则为矩阵的迹,则 tr 2TtrF TTTTTTTTTTTTTTTTTTTTTTTTTTT11tr211tr211tr211tr2 x Pxx Px x P AxB xx A xBPx xPAA P xx PB xx PBx B Px B Px x Qxx B Px B Px V 其中其中 ,。T
45、TTTx PB xx B PxTTTx PB B PxTPP(9.59)(9.60)则 (9.61)可以采用以下两种自适应律设计方法。取自适应律为:即 由于由于 TTTTtr x B PxB Pxx TTTTTT11tr2V x QxB Pxx B Px TTTBP xxTxx P B(9.62)则 由已知 ,。设min(Q)为矩阵Q特征值的最小值,max(P)为矩阵P特征值的最大值,则 (9.63)要使 ,需要 ,由于当且仅当时,。即当 时,。TTT12V x Qx B PxT01B2m in0m axm in0m ax12122V QxPxxQxP0Vmaxmin02PQxmax0min2
46、PxQ0V 0V max0min2PxQ 可见,当可见,当Q的特征值越大、的特征值越大、P的特征值越小、神经网络的特征值越小、神经网络建模误差建模误差的上界的上界0越小时,越小时,x的收敛半径越小,跟踪效果的收敛半径越小,跟踪效果越好。越好。根据根据LaSalle不变性原理,闭环系统渐进稳定,即当不变性原理,闭环系统渐进稳定,即当t时,时,系统地收敛速度取决于,系统地收敛速度取决于min(Q)。max0min2PxQ 9.8.4 仿真实例仿真实例 选二关节机器人系统(不考虑摩擦力),其动力学模型为:选二关节机器人系统(不考虑摩擦力),其动力学模型为:,D q qC q q qG qd 0120
47、102201022012 coscoscosvqqqqqqqqqD q其中其中 其中 ,。误差扰动、位置指令和系统的初始状态分别为:位置指令为:被控对象的初值为 0222021220212sinsin,sin0q qqqqqqq qqC q q 1121215 cos8.75 cos8.75 cosgqgqqgqqG q33.13v018.98q028.75q8.9g6,32321ddd,123dddee 1d2d10.2sin 0.510.2 cos 0.5qtqtTT12340.60.30.50.5qqqq控制参数取:采用控制律式(9.53)和自适应律式(9.62),采用Simulink和
48、S函数进行控制系统的设计,仿真结果如图9-27至图9-30所示。50000050000050000050Q32200pk2002vk图图9-27 关节关节1的位置跟踪的位置跟踪 图图9-28 关节关节2的位置跟踪的位置跟踪图图9-29关节关节1的模型不确定项及其估计的模型不确定项及其估计图图9-30 关节关节2的模型不确定项及其估计的模型不确定项及其估计 通过对文献21的控制方法进行详细推导及仿真分析,研究基于模型整体逼近的机器人RBF网络自适应控制设计方法。9.9.1 问题的提出 设n关节机械手方程为:(9.64)其中 为 阶正定惯性矩阵,为 阶惯性矩阵,其中 为 阶惯性向量,为摩擦力,为未
49、知外加干扰,为控制输入。9.9 基于模型整体逼近的机器人基于模型整体逼近的机器人RBF网络自适应控制网络自适应控制 d,D q qC q q qG qF q D qnn,C q q nn G q1n F q d 跟踪误差为:定义误差函数为:(9.65)其中 ,则 (9.66)其中 。dttteqq reeT0d qrqedddddddd DrD qqeD qeDqD qeCqGFD qeCrC qeGFCrf ddf xD qeC qeGF 在实际工程中,模型不确定项f(x)为未知,为此,需要对不确定项f(x)进行逼近。采用RBF网络逼近f(x),根据f(x)的表达式,网络输入取 设计控制律为
50、:(9.67)其中 为针对f进行逼近的RBF网络输出值。将控制律式(9.69)代入式(9.68),得:(9.68)TTTTTdddxeeqqq vfK r f xvdvdv00d=,=DrCrfK rfKCrfKCrfff f其 中。如果定义Lyapunov函数则 这说明在 固定条件下,控制系统的稳定依赖于 ,即 对 的逼近精度及干扰 的大小。采用RBF网络对不确定项f进行逼近。理想的RBF网络算法为:其中x为网络的输入信号,。T12L r DrTTTTTv011222L r Drr Drr K rrDC rr TT0vL r r K rvK0ffd22/iiigxc1,2,in12 nf f
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。