1、第第7章章 模糊神经网络控制模糊神经网络控制与自适应神经网络与自适应神经网络智能控制基础智能控制基础7.1 模糊神经网络控制7.2 基于神经元网络的自适应控制7.3*自适应神经网络结构学习目录目录7.1.1 神经网络与模糊控制系统7.1.2 模糊神经网络的学习算法7.1 模糊神经网络控制模糊神经网络理论的出发点模糊神经网络理论的出发点v模糊控制系统的隶属度函数或控制规则的设模糊控制系统的隶属度函数或控制规则的设计方法存在很大的主观性。计方法存在很大的主观性。v利用神经网络的学习功能来优化模糊控制规利用神经网络的学习功能来优化模糊控制规则和相应的隶属度函数、将一些专家知识预则和相应的隶属度函数、
2、将一些专家知识预先分布到神经网络中去是提出模糊神经网络先分布到神经网络中去是提出模糊神经网络理论的两个基本出发点。理论的两个基本出发点。模糊神经网络结构图模糊神经网络结构图 结构说明结构说明v第一层节点为输入节点,用来表示语言变量;第一层节点为输入节点,用来表示语言变量;v输出层的每个输出变量有两个语言节点,一输出层的每个输出变量有两个语言节点,一个用于训练时期望输出信号的馈入,另一个个用于训练时期望输出信号的馈入,另一个表示模糊神经网络推理控制的输出信号节点表示模糊神经网络推理控制的输出信号节点;v第二层和第四层的节点称为项节点,用来表第二层和第四层的节点称为项节点,用来表示相应语言变量语言
3、值的隶属度函数。示相应语言变量语言值的隶属度函数。v第三层节点称为规则节点,用来实现模糊逻第三层节点称为规则节点,用来实现模糊逻辑推理。其中第三、四层节点间的连接系数辑推理。其中第三、四层节点间的连接系数定义规则节点的结论部、第二、三层节点间定义规则节点的结论部、第二、三层节点间的连接系数定义规则节点的条件部。的连接系数定义规则节点的条件部。第一层第一层v这一层的节点只是将输入变量值直接传送到这一层的节点只是将输入变量值直接传送到下一层。所以,下一层。所以,v且输入变量与第一层节点之间的连接系数且输入变量与第一层节点之间的连接系数wji(1)=1。fuafjjjj()()()(),1111第二
4、层第二层 v实现语言值的隶属度函数变换实现语言值的隶属度函数变换,可选取钟型,可选取钟型函数函数 v其中:其中:mji和和ji分别表示第分别表示第i个输入语言变量个输入语言变量Xi的第的第j个语言值隶属度函数的中心值和宽度。个语言值隶属度函数的中心值和宽度。可抽象看作第一、二层神经元节点之间的连可抽象看作第一、二层神经元节点之间的连接系数接系数wji(2)。fMmumaejXjjijiijijijfij()()()()()()()(,)()(),()2222222222 第三层第三层 v完成模糊逻辑推理条件部的匹配工作完成模糊逻辑推理条件部的匹配工作。由最。由最大、最小推理规则可知,规则节点实
5、现的功大、最小推理规则可知,规则节点实现的功能是模糊能是模糊“与与”运算。运算。fj(3)=min(u1(3),u2(3),.,up(3),aj(3)=fj(3)且第二层节点与第三层节点之间的连接系数wji(3)=1 第四层第四层 有两种模式有两种模式v从上到下的传输模式从上到下的传输模式 时,与第二层相同,实时,与第二层相同,实现模糊化的功能。现模糊化的功能。v从下到上的传输模式中,实现的是模糊逻辑从下到上的传输模式中,实现的是模糊逻辑推理运算推理运算。根据最大、最小推理规则,是模。根据最大、最小推理规则,是模糊糊“或或”运算:运算:fj(4)=max(u1(4),u2(4),.,up(4)
6、,aj(4)=fj(4)且第三、四层节点之间的连接系数且第三、四层节点之间的连接系数wji(4)=1第五层第五层 v有两种模式有两种模式v从上到下的信号传输方式从上到下的信号传输方式,同第一层。,同第一层。v从下到上是精确化计算,如果采用重心法,从下到上是精确化计算,如果采用重心法,有有则第四层节点与第五层节点之间的连接系数则第四层节点与第五层节点之间的连接系数wji(5)可以看作是可以看作是mji(5)ji(5)。fw umuafujjiijijiiijjjiii()()()()()()()()()()(),55555555557.1.1 神经网络与模糊控制系统7.1.2 模糊神经网络的学习
7、算法7.1 模糊神经网络控制混合学习算法混合学习算法v第一阶段,使用自组织学习方法进行各语言第一阶段,使用自组织学习方法进行各语言变量语言值隶属度函数的初步定位以及尽量变量语言值隶属度函数的初步定位以及尽量发掘模糊控制规则的存在性(即可以通过自发掘模糊控制规则的存在性(即可以通过自组织学习删除部分不可能出现的规则)组织学习删除部分不可能出现的规则)v在第二阶段,利用有导学习方法来改进和优在第二阶段,利用有导学习方法来改进和优化期望输出的各语言值隶属度函数。化期望输出的各语言值隶属度函数。1.自组织学习阶段自组织学习阶段问题描述:问题描述:v给定一组输入样本数据给定一组输入样本数据xi(t),i
8、=1,2,.,n、期望、期望的输出值的输出值yi(t),i=1,2,.,m、模糊分区、模糊分区T(x)和和 T(y)以及期望的隶属度函数类型(即以及期望的隶属度函数类型(即三角型、钟型等)。三角型、钟型等)。v学习的目的是找到隶属度函数的参数和系统学习的目的是找到隶属度函数的参数和系统实际存在的模糊逻辑控制规则。实际存在的模糊逻辑控制规则。隶属度函数参数的获取隶属度函数参数的获取v中心值中心值mi的估计的估计:Kohonen自组织映射法自组织映射法v宽度值宽度值i是与重叠参数是与重叠参数r以及中心点以及中心点mi邻域内邻域内分布函数值相关。分布函数值相关。Kohonen自组织映射法自组织映射法
9、v一种自组织学习。经过一段时间的学习后,一种自组织学习。经过一段时间的学习后,其权值的分布可以近似地看作输入随机样本其权值的分布可以近似地看作输入随机样本的概率密度分布。学习过程是一个的概率密度分布。学习过程是一个Winner-take-all的过程,具体如下:的过程,具体如下:)()(min)()(1tmtxtmtxikiclosestmcloest(t+1)=mcloest(t)+(t)x(t)-mcloest(t)mi(t+1)=mi(t)当 mi(t)mcloest(t)k=T(x)表示语言变量x语言值的数目 宽度宽度i的计算的计算 v通过求下列目标函数的极小值来获取,即:通过求下列目
10、标函数的极小值来获取,即:其中其中 r为重叠参数为重叠参数。v也可以采用一阶最近邻域法近似:也可以采用一阶最近邻域法近似:22121rmmENiNjijinearest iicloestmmr推理规则的确定推理规则的确定v即确定第三层规则节点和第四层输出语言值即确定第三层规则节点和第四层输出语言值节点之间的连接关系。节点之间的连接关系。v采用竞争学习获得采用竞争学习获得v记记o(3)i(t)为规则节点的激励强度、为规则节点的激励强度、o(4)i(t)为第为第四层输出语言值节点输出四层输出语言值节点输出,则,则 w tow toijjiji()()()()43规则删除规则删除v仅保留规则节点与同
11、一输出语言变量的所有仅保留规则节点与同一输出语言变量的所有语言值节点的连接系数最大的那个连接关系,语言值节点的连接系数最大的那个连接关系,将其余的连接关系删除。将其余的连接关系删除。v当某一规则节点与某一输出语言变量所有语当某一规则节点与某一输出语言变量所有语言值节点之间的连接系数都非常小时,则所言值节点之间的连接系数都非常小时,则所有的连接关系都可以删除。有的连接关系都可以删除。v如果某一规则节点与第四层中的所有节点的如果某一规则节点与第四层中的所有节点的连接系数都很少而被删除的话,则该规则节连接系数都很少而被删除的话,则该规则节点对输出节点不产生任何影响。因此,该规点对输出节点不产生任何影
12、响。因此,该规则节点可以删除。则节点可以删除。规则合并规则合并合并的条件合并的条件v该组节点具有完全相同的结论部该组节点具有完全相同的结论部(如图如图7-2中中输出变量输出变量yi中的第二个语言值节点中的第二个语言值节点);v在该组规则节点中某些条件部是相同的在该组规则节点中某些条件部是相同的(如图如图7-2中输入变量中输入变量x0中的第一个语言值节点的输中的第一个语言值节点的输出与该组规则节点全部相连出与该组规则节点全部相连);v该组规则节点的其它条件输入项包含了所有该组规则节点的其它条件输入项包含了所有其它输入语言变量某一语言值节点的输出。其它输入语言变量某一语言值节点的输出。图图7-2:
13、规则节点合并示例规则节点合并示例 2.有导师学习阶段有导师学习阶段v可采用可采用BP学习学习min)t(y)t(y(21E2)wE()t(w)1t(wEwEnetnetwEffwEffaaw()()第五层第五层 v反向传播到上一层的广义误差反向传播到上一层的广义误差(5)为为 iijiijijijjjjjiuutytymffaaEmE)5()5()5()5()5()5()5()5()5()5()()(2)5()5()5()5()5()5()5()5()5()5()5()5()5()5()5()5()()()()()(iijiiiijijiiijiijijijjjjjiuuumuumtytyff
14、aaEE)()()5()5()5()5()5(tytyfaaEfEjjjjj第四层第四层 v没有任何参数进行更新。唯一需要做的是实没有任何参数进行更新。唯一需要做的是实现误差的反向传播计算。现误差的反向传播计算。2)5()5()5()5()5()5()5()5()5()5()5()5()5()5()5()5()5()4()5()5()5()5()4()5()5()4()4()()()()()(iijiijjijijiiijijjjjiijiiijijijjjjjjjjjjjjuumumtytyuumufEfuuffEfffEfE第三层第三层 v与第四层相似与第四层相似 v如果输出语言变量有如果
15、输出语言变量有m个,则个,则)4()3()4()4()3()4()4()3()3()3()3()3(jijjjjjjjjjjufaffEfaaEfEmkkj1)4()3(第二层第二层 v qk(3)=k(3)当当aj(2)是第是第k个规则节点输入值中的最小值时;个规则节点输入值中的最小值时;v qk(3)=0 其它情况下。其它情况下。2)2()2()2()2()2()2()2()2()2()2()()(2)2(jijiifjjijjjjjimueaEmffaaEmEj)2()3()3()2()3()3()2(jkkkjkkkjafaffEaEotherwiseuuufifufafjkjkjk0
16、,.),min(1)3(2)3(1)3()3()3()3()2()3(kkjqaE)3()2(第二层学习公式第二层学习公式mtmtEaeumjijijfijijij()()()()()()()()()()()2222222122jijijfijijittEaeumj()()()()()()()()()()()22222223122整个学习流程整个学习流程7.1 模糊神经网络控制7.2 基于神经元网络的自适应控制7.3*自适应神经网络结构学习目录目录基于神经元网络的自适应控制基于神经元网络的自适应控制 v神经网络控制器完全满足自适应控制的要素神经网络控制器完全满足自适应控制的要素n在线、实时地了
17、解对象;n有一个可调节环节;n能使系统性能达到指标要求和最优。v常规的神经网络控制器本身也具有一定的自常规的神经网络控制器本身也具有一定的自适应能力适应能力。设计思想设计思想 v与传统的自适应控制器一样与传统的自适应控制器一样,有两种不同的,有两种不同的设计途径设计途径:7.2.1 神经网络的模型参考自适应控制7.2.2 神经网络的自校正控制7.2 基于神经元网络的自适应控制模型参考自适应控制模型参考自适应控制 v通过选择一个适当的参考模型和由稳定性理通过选择一个适当的参考模型和由稳定性理论设计的自适应算法,并利用参考模型的输论设计的自适应算法,并利用参考模型的输出与实际系统输出之间的误差信号
18、,由一套出与实际系统输出之间的误差信号,由一套自适应算法计算出当前的控制量去控制系统自适应算法计算出当前的控制量去控制系统达到自适应控制的目的。达到自适应控制的目的。v在实时性方面都没有重大进展。在实时性方面都没有重大进展。控制策略控制策略v如果被控系统如果被控系统y(k+1)=f(y(k),y(k-1),u(k-1)+g(u(k)v参考系统:参考系统:ym(k+1)=a1ym(k)+a2ym(k-1)+r(k)v则控制输入可取:则控制输入可取:)1()1(),1(),()(1kykukykyfgkum基于神经网络的模型参考自适应控制结构基于神经网络的模型参考自适应控制结构 reimpyypy
19、Z-1TD LTD LTD LTD L+-+-eiecu神经网络N神经网络Nci被控对象ec 图 3-3-1 基于神经网络的模型参考自适应控制结构图参考模型例例7-1 v非线性控制对象为非线性控制对象为 v参考系统的模型为:参考系统的模型为:)()1()(15.2)()1()()1(22kukykykykykyky)()1(20)(60)1(krk-y.k y.kymmm控制策略控制策略v则控制系统的误差方程为则控制系统的误差方程为 其中其中v上述控制可渐渐稳定。上述控制可渐渐稳定。)1()(15.2)()1()()1(),(22kykykykykykykyf1)-(k0.2e(k)0.6e1
20、)(keccc1)(ky1)(ky1)(kempcr(k)1)-0.2y(k1)0.6y(k1)-y(k-f(y(k),u(k)离线辨识的控制效果离线辨识的控制效果vu(k)=-Ni(y(k),y(k-1)+0.6y(k)+0.2y(k-1)+r(k)v取取r(k)=sin(2k/25)图神经网络模型参考自适应控制响应曲线图实线 参考模型输出虚线 实际系统输出图在线辨识的神经网络模型参考自适应控制响应曲线图r(k)y(k-.y(k).)(y(k),y(k-Nu(k)i120601在线辨识后的控制效果在线辨识后的控制效果v确定导师确定导师信号信号 tj(k+1)=yp(k+1)-u(k)图神经网
21、络模型参考自适应控制响应曲线图实线 参考模型输出虚线 实际系统输出图在线辨识的神经网络模型参考自适应控制响应曲线图复杂情况复杂情况v对于对于y(k+1)=f(y(k),y(k-1),u(k-1)+g(u(k)可得可得如果如果 存在,可用神经网络逼近之。如不存存在,可用神经网络逼近之。如不存在,可采用动态在,可采用动态BP学习算法。学习算法。)1()1(),1(),()(1kykukykyNgkumf g1动态动态BP学习算法学习算法 v设网络模型设网络模型已离线精确获得。已离线精确获得。v训练控制网络,使下列标准最小训练控制网络,使下列标准最小()()()y kNy kNu kfg1Je tk
22、cckTc()12)()()(kykykempc结构图结构图rNgmypypyZ-1+-+ec控制器NNcf被控对象 图 3-3-4 不可逆模型的神经网络M RAC控制结构图参考模型+7.2.1 神经网络的模型参考自适应控制7.2.2 神经网络的自校正控制7.2 基于神经元网络的自适应控制自校正控制自校正控制 v如果系统的环境和模型中的参数已知,那么如果系统的环境和模型中的参数已知,那么可以采用适当的设计方法来获取某种意义下可以采用适当的设计方法来获取某种意义下的最优控制器。如果系统的参数未知,则可的最优控制器。如果系统的参数未知,则可用参数在线估计来代替未知的真实参数值。用参数在线估计来代替
23、未知的真实参数值。因此,系统辨识和控制器在线调节是自校正因此,系统辨识和控制器在线调节是自校正控制器设计的关键。控制器设计的关键。举例举例1v被控系统:被控系统:y(k+1)=ay(k)+bu(k)v期望系统特性期望系统特性 y(k+1)=cy(k)+dr(k)v控制策略:控制策略:v其中其中a、b未知时需估计。未知时需估计。u kcaby kdbr k()()()举例举例2v被控系统:被控系统:y(k+1)=f(y(k)+g(y(k)u(k)v期望输出:期望输出:r(k+1)v神经网络逼近:神经网络逼近:v控制策略:控制策略:()(),()(),()()y kf y kwkg y kwku kfg1u kr kf y kwkg y kwkfg()()(),()(),()1BP学习算法学习算法 v指标函数指标函数 v学习规则学习规则 Jekr ky k121121122()()()wkJwkwkJwkfkfgkg()()()()11)1()()()(),()(),()()()1()()(),()(),()()(kekukwkwkygkwkygkygkwJkekwkwkyfkwkygkygkwJggggffgf