1、 对象q神经网络控制神经网络控制 是将神经网络在相应的控制结构中做是将神经网络在相应的控制结构中做 控制器、辨识器控制器、辨识器q神经网络控制神经网络控制 主要是为解决复杂的非线性、不确定、不确知主要是为解决复杂的非线性、不确定、不确知系统,在不确定、不确知环境中的控制问题系统,在不确定、不确知环境中的控制问题q神经网络控制神经网络控制 使控制系统稳定、鲁棒性好,具有要求的动态、使控制系统稳定、鲁棒性好,具有要求的动态、静态性能静态性能 由于神经网络具有大规模并行性、冗余性、容错性、本由于神经网络具有大规模并行性、冗余性、容错性、本质的非线性及自组织、自学习、自适应能力,故已成功地应质的非线性
2、及自组织、自学习、自适应能力,故已成功地应用于许多不同的领域。如在最优化、模式识别、信号处理和用于许多不同的领域。如在最优化、模式识别、信号处理和图像处理等领域首先取得了成功。神经网络理论的诞生同样图像处理等领域首先取得了成功。神经网络理论的诞生同样给不断面临着挑战的控制理论带来生机。控制理论在经历了给不断面临着挑战的控制理论带来生机。控制理论在经历了经典控制论、状态空间论、动态规划、最优控制等阶段以后,经典控制论、状态空间论、动态规划、最优控制等阶段以后,随着被控对象变得越来越复杂、控制精度越来越高、对对象随着被控对象变得越来越复杂、控制精度越来越高、对对象和环境的知识知道甚少的情况下,智能
3、控制理论和技术迅速和环境的知识知道甚少的情况下,智能控制理论和技术迅速顺起。此外,在有众多不确定因素和难以确切描述的非线性顺起。此外,在有众多不确定因素和难以确切描述的非线性控制系统中,对控制的要求也越来越高,因此迫切希望新一控制系统中,对控制的要求也越来越高,因此迫切希望新一代的控制系统具有自适应自学习能力、良好的鲁棒性和实时代的控制系统具有自适应自学习能力、良好的鲁棒性和实时性、计算简单、柔性结构和自组织并行离散分布处理等智能性、计算简单、柔性结构和自组织并行离散分布处理等智能信息处理的能力。用神经网络构成的控制系统就是这样一代信息处理的能力。用神经网络构成的控制系统就是这样一代新颖控制系
4、统之一。新颖控制系统之一。可以处理那些难以用模型或规则描述的过程或系统。可以处理那些难以用模型或规则描述的过程或系统。采用并行分布式信息处理方式,具有很强的容错性。采用并行分布式信息处理方式,具有很强的容错性。神经网络是本质的非线性系统。神经网络是本质的非线性系统。目前研究最多的神经网络模型是多层前向传播网络,它是目前研究最多的神经网络模型是多层前向传播网络,它是由大量具有由大量具有S S形曲线的非线性神经元组成的。形曲线的非线性神经元组成的。它可以实现任何非线性映射。它可以实现任何非线性映射。具有很强的信息综合能力。具有很强的信息综合能力。它能够同时处理大量不同类型的输入,能解决输入信息它能
5、够同时处理大量不同类型的输入,能解决输入信息之间的互补性与冗余性问题,协调好互相矛盾的输入信息。之间的互补性与冗余性问题,协调好互相矛盾的输入信息。大规模集成电路技术的发展为神经网络的硬件实现提供了大规模集成电路技术的发展为神经网络的硬件实现提供了技术手段,这使处理速度进一步提高,为神经网络的应用开技术手段,这使处理速度进一步提高,为神经网络的应用开辟了广阔的前景。辟了广阔的前景。前向传播神经网络若含有两个隐含层,且神经元前向传播神经网络若含有两个隐含层,且神经元激励函数为单调的激励函数为单调的S型函数,则此神经网络能够得到型函数,则此神经网络能够得到合适的逼近精度。合适的逼近精度。1.确定性
6、系统与环境确定性系统与环境()已知对象特性及外加扰动是确定性的,时不变的;()已知对象特性及外加扰动是确定性的,时不变的;()已知系统期望输出()已知系统期望输出r,要求的性能指标。要求的性能指标。控制系统的设计:控制系统的设计:设计控制器,校正对象的特性,使控制系统达到要求的性设计控制器,校正对象的特性,使控制系统达到要求的性能指标,即,使控制系统在能指标,即,使控制系统在r作用下,由控制器给出的控制量作用下,由控制器给出的控制量u作用于对象,使其输出作用于对象,使其输出y跟踪跟踪r。对于确定性系统与环境,选择某种控制结构,可设计出确对于确定性系统与环境,选择某种控制结构,可设计出确定参数的
7、控制器。定参数的控制器。u 图 4-2-1 闭环控制系统框图 y er 控制器 对象 2不确定、不确知系统与环境不确定、不确知系统与环境 对处于对处于不确定、不确知环境中的不确定、不确知环境中的复杂的复杂的非线性不确定、不确知系统非线性不确定、不确知系统的设计问题,是控制领域研究的核心问题。神经控制是解决问题的一条的设计问题,是控制领域研究的核心问题。神经控制是解决问题的一条途径。途径。在已知被控对象的一些先验知识情况下:在已知被控对象的一些先验知识情况下:由神经网络做辨识器,在线识别对象模型,由于网络的学习能力,由神经网络做辨识器,在线识别对象模型,由于网络的学习能力,辨识器的参数可随着对象
8、、环境的变化而自适应的改变。辨识器的参数可随着对象、环境的变化而自适应的改变。由神经网络做控制器,其性能随着对象、环境的变化而自适应的由神经网络做控制器,其性能随着对象、环境的变化而自适应的改变(通过神经辨识器)。改变(通过神经辨识器)。神经控制是数字控制,用数字量实现对被控对象的控制,讨论连续对象神经控制是数字控制,用数字量实现对被控对象的控制,讨论连续对象用数字计算机实现的神经控制问题。用数字计算机实现的神经控制问题。)(te)(tr-)(tu )(ty 模拟输出通道 模拟输入通道 A/D 神经控制器 D/A 保持器 对象(过程)实时时钟 采样 开关 图 4-2-3 神经控制系统硬件框图
9、硬件硬件1.神经控制系统的组成神经控制系统的组成以单输入输出系统为例,见图:以单输入输出系统为例,见图:连续被控对象连续被控对象 神经控制器神经控制器 模拟输入通道模拟输入通道 模拟输出通道模拟输出通道 实时时钟实时时钟 321ttt 是 控 制 子 程 序 图 4-2-4 神经控制软件流程 采 样?起 始 主程序:初始化设置 控制量的输出和存储 控制算法 否 数据采集 主程序主程序:功能是进行系统初功能是进行系统初始化设置。始化设置。控制子程序控制子程序:实现神经控制实现神经控制算法,算法,若若既有辩识器又有控制器的控既有辩识器又有控制器的控制结构,则,制结构,则,神经控制算法包神经控制算法
10、包括这两部分。括这两部分。软件软件.实时控制实时控制神经控制是实时控制,即,控制器要在采样周期T内 完成一个控制步的操作(程序实现)。单输入单输出(SISO)系统,控制步的操作:(1)数据采集:需时 1t;(2)由设计的控制规律求控制量,需时 2t;(3)控制量的输出和存储,需时 3t。实时控制的条件为 321tttT n输入n输出(MIMO)系统,实时控制的条件为 niiiitttT1321)(321ttt 是 控 制 子 程 序 图 4-2-4 神经控制软件流程 采 样?起 始 主程序:初始化设置 控制量的输出和存储 控制算法 否 数据采集 根据神经网络在控制器中的作用不同,神经网络在根据
11、神经网络在控制器中的作用不同,神经网络在控制系统设计中的应用一般分为两类,控制系统设计中的应用一般分为两类,一类一类称神经控制,称神经控制,它是以神经网络为基础而形成的独立智能控制系统;另它是以神经网络为基础而形成的独立智能控制系统;另一类一类称为混合神经网络控制,它代表着那些利用神经网称为混合神经网络控制,它代表着那些利用神经网络学习和优化能力来改善传统控制的现代控制方法,如络学习和优化能力来改善传统控制的现代控制方法,如自适应神经控制等。目前神经控制器的分类还存在较大自适应神经控制等。目前神经控制器的分类还存在较大的争议,没有一个统一的分类法。综合目前各国专家的的争议,没有一个统一的分类法
12、。综合目前各国专家的分类法,我们将一些典型的神经网络的控制结构和学习分类法,我们将一些典型的神经网络的控制结构和学习方式归结为以下七类。方式归结为以下七类。这种神经网络控制结构这种神经网络控制结构的学习样本直接取自于专家的学习样本直接取自于专家的控制经验。神经网络的输的控制经验。神经网络的输入信号来自传感器的信息和入信号来自传感器的信息和命令信号。神经网络的输出命令信号。神经网络的输出就是系统的控制信号。就是系统的控制信号。一旦神经网络的训练达到了能够充分描述人的控制行为,则网络一旦神经网络的训练达到了能够充分描述人的控制行为,则网络训练结束。神经网络控制器就可以直接投入实际系统的控制。这种控
13、训练结束。神经网络控制器就可以直接投入实际系统的控制。这种控制结构简单,控制成功的把握大。在功能上它能模拟人类的控制技巧,制结构简单,控制成功的把握大。在功能上它能模拟人类的控制技巧,同专家控制具有相当的功能,从获取知识的角度来看,神经网络更胜同专家控制具有相当的功能,从获取知识的角度来看,神经网络更胜一筹。这种控制器的缺陷是其网络的训练只涉及静态过程,缺乏在线一筹。这种控制器的缺陷是其网络的训练只涉及静态过程,缺乏在线学习机制,且在网络训练时控制器不能投入实际运行。学习机制,且在网络训练时控制器不能投入实际运行。神经网络接受系统的被控状态信息,神经网络的输出与该被控制神经网络接受系统的被控状
14、态信息,神经网络的输出与该被控制系统的控制信号之差作为调整神经网络权系数的校正信号,并可利用系统的控制信号之差作为调整神经网络权系数的校正信号,并可利用常规的常规的BP学习算法及其改进的算法来进行控制网络的训练。一旦训学习算法及其改进的算法来进行控制网络的训练。一旦训练成功,从理论上来看只要直接把神经网络控制器接到动力学系统的练成功,从理论上来看只要直接把神经网络控制器接到动力学系统的控制端就可以实现无差跟踪控制,即要实现期望的控制输出只要将此控制端就可以实现无差跟踪控制,即要实现期望的控制输出只要将此信息加到神经网络的输入端就可以了。信息加到神经网络的输入端就可以了。神经网络的训练目的就是为
15、了神经网络的训练目的就是为了逼近此系统的逆动力学模型。逼近此系统的逆动力学模型。在结构上完全等同于在结构上完全等同于线性系统的自适应控线性系统的自适应控制器,只是利用了非制器,只是利用了非线性的神经网络代替线性的神经网络代替了线性系统中的线性了线性系统中的线性处理单元。处理单元。自适应控制系统要求控制器能够随着系统环境或参数的变化而对控自适应控制系统要求控制器能够随着系统环境或参数的变化而对控制器进行调节以便达到最优控制的特性。制器进行调节以便达到最优控制的特性。自适应网络控制器有两个控制结构:一是自适应网络控制器有两个控制结构:一是直接自适应网络控制结构直接自适应网络控制结构;二是间接自适应
16、网络控制结构。二是间接自适应网络控制结构。直接自适应网络控制结构是将系统误差直接自适应网络控制结构是将系统误差信号信号ec直接用于神经控制器的自适应调整。但目前还没有一种可行的方法直接用于神经控制器的自适应调整。但目前还没有一种可行的方法来解决未知动力学模型的控制问题。间接自适应网络控制结构利用神经来解决未知动力学模型的控制问题。间接自适应网络控制结构利用神经网络辨识器和神经网络控制器代替经典控制结构中的辨识模型和控制器,网络辨识器和神经网络控制器代替经典控制结构中的辨识模型和控制器,使得系统的学习和控制能够实现。控制器的设计准则仍然是依赖于系统使得系统的学习和控制能够实现。控制器的设计准则仍
17、然是依赖于系统的输出预报误差最小原则。的输出预报误差最小原则。-1e-y 2eMyr y-u 参考模型 对象 NNI NNC 神经间接模型参考自适应控制 神经模型参考自适应控制有两种结构:直接型与间接型。间接型见下图,对象特性非线性、不确定、不确知时采用。神经网络 NNI与 NNC 分别实现在线系统辨识与控制。原理:构造一个参考模型,使其输出为期望输出yM,控制的目的,是使 y 跟踪yM。神经辨识器 NNI用串并联结构的非线性 DTNN,神经控制器 NNC 用非线性 DTNN 实现。被控对象被控对象 u 神经网络辨识器神经网络辨识器 控制器设计 自校正控制器自校正控制器 r 由两个回路组成:由
18、两个回路组成:(1)自校正控制器与被控对象构成的反馈回路。)自校正控制器与被控对象构成的反馈回路。(2)神经网络辨识器与控制器设计,以得到控制器的参数。)神经网络辨识器与控制器设计,以得到控制器的参数。神经辨识器与自校正控制器的在线设计,是自校正控制实现的关键。神经辨识器与自校正控制器的在线设计,是自校正控制实现的关键。传统的自校正控制是被控对象用线性或线性化模型进行辨识,传统的自校正控制是被控对象用线性或线性化模型进行辨识,对于时对于时变线性、复杂的非线性系统的自校正控制,则难以实现有效的控制,因此,变线性、复杂的非线性系统的自校正控制,则难以实现有效的控制,因此,具有一定的局限性。具有一定
19、的局限性。神经自校正控制是被控对象用动态神经网络模型进行自适应辨识,神经自校正控制是被控对象用动态神经网络模型进行自适应辨识,对对于时变线性、复杂的非线性系统的自校正控制,可以实现有效的控制于时变线性、复杂的非线性系统的自校正控制,可以实现有效的控制内模控制以其较强的鲁内模控制以其较强的鲁棒性和易于进行稳定性棒性和易于进行稳定性分析的特点在过程控制分析的特点在过程控制中获得广泛的应用。在中获得广泛的应用。在这种控制结构中,在反这种控制结构中,在反馈回路中直接使用系统馈回路中直接使用系统的前向模型和逆模型。的前向模型和逆模型。在内模控制结构中,与实际系统并行的网络模型一并建立,系统在内模控制结构
20、中,与实际系统并行的网络模型一并建立,系统实际输出与模型实际输出与模型M的输出信号差用于反馈的目的。这个反馈信号通过的输出信号差用于反馈的目的。这个反馈信号通过前向通道上的控制子系统前向通道上的控制子系统G预处理,通常预处理,通常G是一个滤波器,用于提高系是一个滤波器,用于提高系统的鲁棒性。系统模型统的鲁棒性。系统模型M和控制器和控制器C由神经网络来实现。由神经网络来实现。1e内模 控制器 )(zD 内部模型)(zP y u r e y _ 对象)(zP 内模控制原理内模控制原理 由图得到误差、控制量、输出、反馈量的Z变换:)()()(1zEzRzE )()()(zEzDzU )()()()(
21、zUzPzzY )()()()()()()(1zUzPzPzvzYzYzE )(zR:输入信号r 的Z变换。可推导出反馈量、控制量、输出量间关系的Z变换式:)()()()()(1)()(zzRzPzPzDzDzU )()()()()()(1)()()(zzzRzPzPzDzPzDzY )()()()(1)()(1)()()()(1)()(zzPzPzDzPzDzRzPzPzDzPzD 1e内模 控制器 )(zD 内部模型)(zP y u r e y _ 对象)(zP r e g 1e内模 控制器 )(zD 内部模型)(zP y u y _ 对象)(zP 滤波器 )(zF 这种结构是基于鲁棒性问
22、题而提出来的。通常单纯的求逆控制结这种结构是基于鲁棒性问题而提出来的。通常单纯的求逆控制结构不能很好地起到抗干扰能力,因此结合反馈控制的思想组成前馈补构不能很好地起到抗干扰能力,因此结合反馈控制的思想组成前馈补偿器的网络控制结构偿器的网络控制结构(见图见图55)。反馈控制的目的在于提高抗随机扰。反馈控制的目的在于提高抗随机扰动的能力,而控制器的主要成分,特别是非线性成分将由网络控制器动的能力,而控制器的主要成分,特别是非线性成分将由网络控制器来完成。这种控制器设计的主要困难是如何找到一种有效的学习方法来完成。这种控制器设计的主要困难是如何找到一种有效的学习方法实现对系统模型未知条件下网络控制的
23、在线学习。实现对系统模型未知条件下网络控制的在线学习。)(kre)(kre)(ku 对象 控制 网络)(kx 图 4-9-3 动作评价学习神经控制 评价网络 P(x)再励学习用于神经控制的基本思想:再励学习用于神经控制的基本思想:不需已知对象模型,且没有足够知识的情不需已知对象模型,且没有足够知识的情况下,通过学习机制对环境的交互,评价控况下,通过学习机制对环境的交互,评价控制的优劣,用制的优劣,用奖或惩奖或惩算法训练控制器,算法训练控制器,使之对复杂的非线性、不确定、不确知系统,使之对复杂的非线性、不确定、不确知系统,达到有效的控制。达到有效的控制。它是由神经网络技术与模糊控制、专家系统等相
24、结合形成的一种它是由神经网络技术与模糊控制、专家系统等相结合形成的一种具有很强学习能力的智能控制系统。它集人工智能各分支的优点,具有很强学习能力的智能控制系统。它集人工智能各分支的优点,使系统同时具有学习、推理和决策能力,成为智能控制的最新发展使系统同时具有学习、推理和决策能力,成为智能控制的最新发展方向。方向。从以上分析可知,不管采用何种神经网络控制结构,要真正实从以上分析可知,不管采用何种神经网络控制结构,要真正实现神经网络智能控制的目的,必须具备一种有效的学习机制来保证现神经网络智能控制的目的,必须具备一种有效的学习机制来保证神经控制器的自学习、自适应功能,达到真实意义上的智能控制。神经
25、控制器的自学习、自适应功能,达到真实意义上的智能控制。此外,不难看出,神经网络模型对于未知动力学系统的控制是至关此外,不难看出,神经网络模型对于未知动力学系统的控制是至关重要的。因此,在讨论神经控制器的学习问题之前先来看一下非线重要的。因此,在讨论神经控制器的学习问题之前先来看一下非线性动力学系统的神经网络辨识问题。非线性系统的神经网络辨识基性动力学系统的神经网络辨识问题。非线性系统的神经网络辨识基础是神经网络的逼近能力。考虑到前向传播网络有成熟有效的学习础是神经网络的逼近能力。考虑到前向传播网络有成熟有效的学习方法,本章重点讨论前向传播网络的辨识和控制问题。方法,本章重点讨论前向传播网络的辨
26、识和控制问题。PID控制是控制是 工业过程控制中常用的控制方法,因工业过程控制中常用的控制方法,因PID控制器结构简单、实现简控制器结构简单、实现简易,且能对相当一些工业对象(或过程)进行有效的控制。易,且能对相当一些工业对象(或过程)进行有效的控制。常规常规PID控制局限性在于控制局限性在于 控制对象具有复杂的非线性特性,难以建立精确的数学模型,且控制对象具有复杂的非线性特性,难以建立精确的数学模型,且由于对象和环境的不确定性,往往难以达到满意的控制效果。由于对象和环境的不确定性,往往难以达到满意的控制效果。神经神经PID控制是控制是 针对上述问题而提出的一种控制策略。针对上述问题而提出的一
27、种控制策略。图 4-7-1 PID 神经网络单变量控制结构 xr uqxNNCWW21 I yv RP 神经神经PID控制结构见下图,有两个神经网络:控制结构见下图,有两个神经网络:NNI系统在线辨识器;系统在线辨识器;NNC自适应自适应PID控制器。控制器。工作原理是工作原理是 由由NNI对被控对象在线辨识的基础上,通过对对被控对象在线辨识的基础上,通过对NNC的权系进行实时的权系进行实时调整,使系统具有自适应性,达到有效控制。调整,使系统具有自适应性,达到有效控制。图 4-4-1 神经 PID 控制框图 PID 控制器 e-y u y -r 2e 1e-对象 学习算法 学习算法 NNC N
28、NI 神经网络控制在理论与实践上,有如下问题有待于进一步研究与探讨:神经网络控制在理论与实践上,有如下问题有待于进一步研究与探讨:神经网络的稳定性与收敛性问题。神经网络的稳定性与收敛性问题。在逼近非线性函数问题上,神经网络的现有理论只解决了存在性问在逼近非线性函数问题上,神经网络的现有理论只解决了存在性问题。题。神经网络的学习速度一般比较慢,为满足实时控制的需要,必须予神经网络的学习速度一般比较慢,为满足实时控制的需要,必须予以解决。以解决。对于控制器及辨识器,如何选择合适的神经网络模型及确定模型的对于控制器及辨识器,如何选择合适的神经网络模型及确定模型的结构,尚无理论指导。在非线性系统辨识方面,存在充分激励、过参结构,尚无理论指导。在非线性系统辨识方面,存在充分激励、过参数辨识、带噪声系统的辨识等问题。数辨识、带噪声系统的辨识等问题。引入神经网络的控制系统,在稳定性和收敛性的分析方面增加了难引入神经网络的控制系统,在稳定性和收敛性的分析方面增加了难度,研究成果较少,有待于进一步探讨。度,研究成果较少,有待于进一步探讨。对于上述问题,一方面,有待于神经网络研究的不断进展;另一方面,对于上述问题,一方面,有待于神经网络研究的不断进展;另一方面,随着非线性理论及优化方法的进一步发展,并与控制相结合予以解决。随着非线性理论及优化方法的进一步发展,并与控制相结合予以解决。