1、第第5 5章章 计算智能计算智能n 计算智能涉及神经计算、模糊计算、进化计算和人工生命等领域,这些研究领域体现出生命科学与信息科学的紧密结合,也是广义人工智能力图研究和摹仿人类和动物智能(主要是人类的思维过程和智力行为)的重要进展。n 把计算智能理解为智力的低层认知,它主要取决于数值数据而不依赖于知识。人工智能是在计算智能的基础上引入知识而产生的智力中层任知。生物智能,尤其是人类智能,则是最高层的智能。即CIAIBI。第第5 5章章 计算智能计算智能5.1概述5.2神经计算5.3模糊计算5.4遗传算法 5.5人工生命 5.6粒群优化 5.7蚁群算法 5.1概述概述 什么是计算智能,它与传统的人
2、工智能的区别?第一个对计算智能的定义是由贝兹德克(Bezdek)于1992年提出的。他认为,从严格意义上讲,计算智能取决于制造者提供的数值数据,而不依赖于知识;另一方面,人工智能则应用知识精品。5.1概述概述1.ABC及相关符号的表示含义 A-Artificial,表示人工的(非生物的),即人造的 B-Biological,表示物理的+化学的+(?)=生物的 C-Computational,表示数学+计算机 NN-神经网络 PR-模式识别 I-智能 5.1概述概述2.ABC及其与神经网络(NN)、模式识别(PR)和智能(I)之间的关系 输入 复杂性 层次 复 杂 性人类知识 BNN BPR B
3、I B-生物的(+)传感输入 知识 ANN APR AI A-符号的 (+)传感数据 计算 CNN CPR CI C-数值的 (+)传感器注:.9个节点,表示9个研究领域或学科 .节点间的距离衡量领域间的差异,如CNN与CPN的差异比BNN与BPR小 .符号 意味着“适当的子集”,如:ANN APR AI,CI AI BI。5.1概述概述3.ABC及其相关领域的定义BNNANNCNNBPRAPRCPRBIAICI人类智能硬件:大脑中层模型:CNN+知识精品低层,生物激励模型对人的传感数据结构的搜索中层模型:CPR+知识精品对传感数据结构的搜索人类智能软件:智力中层模型:CI+知识精品计算推理的
4、低层算法人的传感输入的处理以大脑方式的中层处理以大脑方式的传感数据处理对人的感知环境中结构的识别中层数值和语法处理所有CNN+模糊、统计和确定性模型人类的认知、记忆和作用以大脑方式的中层认知以大脑方式的低层认知5.1概述概述总结:计算智能是一种智力方式的低层认知,它与人工智能的区别只是认知层次从中层下降到低层而已。中层系统含有知识(精品),低层系统则没有。若一个系统只涉及数值(低层)数据,含有模式识别部分,不应用人工智能意义上的知识,而且能够呈现出:计算适应性;计算容错性;接近人的速度;误差率与人相近,则该系统就是计算智能系统计算智能系统。若一个智能计算系统以非数值方式加上知识(精品)值,即成
5、为人工智能系统人工智能系统。5.2神经计算神经计算 神经计算就是通过对人脑的基本单元-神经元的建模和联结,来探索模拟人脑神经系统功能的模型,并研制一种具有学习、联想、记忆和模式识别等智能信息处理功能的人工系统。5.2.1人工神经网络研究的进展人工神经网络研究的进展5.2.2人工神经网络的结构人工神经网络的结构5.2.3人工神经网络的典型模型人工神经网络的典型模型5.2.4基于神经网络的知识表示与推理基于神经网络的知识表示与推理5.2.5前馈神经网络前馈神经网络5.2.6Hopfield神经网络神经网络5.2.7自组织映射神经网络自组织映射神经网络5.2.1人工神经网络研究的进展人工神经网络研究
6、的进展一、发展历程40年代心理学家麦卡洛克(Mcculloch)和数学家皮茨(Pitts)合作提出的兴奋与抑制型神经元模型和赫布(Hebb)提出的神经元连接强度的修改规则,他们的研究结果至今仍是许多神经网络模型研究的基础。50年代、60年代的代表性工作是罗森布拉特(Rosenblatt)的感知机和威得罗(Widrow)的自适应性元件Adaline(adapyive lineear element,即自适应线性元)。1969年,明斯基(Minsky)和帕伯特(Papert)合作发表了颇有影响的Perceptron一书,得出了消极悲观的论点,加上数字计算机正处于全盛时期并在人工智能领域取得显著成就
7、,70年代人工神经网络的研究处于低潮。80年代后,传统的Von Neumann数字计算机在模拟视听觉的人工智能方面遇到了物理上不可逾越的极限。与此同时,鲁姆尔哈特(Rumelhart)与Mcclelland以及Hopfield等人在神经网络领域取得了突破性进展,神经网络的热潮再次掀起。5.2.1人工神经网络研究的进展人工神经网络研究的进展二、特点特点1)1)可以充分逼近任意复杂的非线性关系;可以充分逼近任意复杂的非线性关系;2)2)所有定量或定性的信息都等势分布贮存于网络内的各神经元,所有定量或定性的信息都等势分布贮存于网络内的各神经元,故有很强的鲁棒性和容错性;故有很强的鲁棒性和容错性;3)
8、3)采用并行分布处理方法,使得快速进行大量运算成为可能;采用并行分布处理方法,使得快速进行大量运算成为可能;4)4)可学习和自适应不知道或不确定的系统;可学习和自适应不知道或不确定的系统;5)5)能够同时处理定量、定性知识;能够同时处理定量、定性知识;6)6)可硬件实现。可硬件实现。结构特征结构特征:并行式处理并行式处理分布式存储分布式存储容错性容错性能力特征:能力特征:自学习自学习自组织自组织自适应性自适应性5.2.1人工神经网络研究的进展人工神经网络研究的进展三、基本功能基本功能联联想想记记忆忆功功能能5.2.1人工神经网络研究的进展人工神经网络研究的进展三、基本功能基本功能输输入入样样本
9、本 神神经经网网络络 输输出出样样本本 自自动动提提取取 非非线线性性映映射射规规则则非线性映射功能非线性映射功能5.2.1人工神经网络研究的进展人工神经网络研究的进展三、基本功能基本功能 传统分类能力传统分类能力 ANN 分类能力分类能力分类与识别功能分类与识别功能5.2.1人工神经网络研究的进展人工神经网络研究的进展三、基本功能基本功能优化计算功能优化计算功能5.2.1人工神经网络研究的进展人工神经网络研究的进展三、基本功能基本功能 问问 题题 解解 答答 知知 识识 分分 布布 式式 表表 示示 由由 同同 一一 知知 识识 获获 取取、知知 识识 库库 神神 经经 网网 平平 行行 推
10、推 理理 络络 实实 现现 输输 入入 数数 据据 变变 量量 变变 换换 求求 解解 的的 问问 题题 神神 经经 网网 络络 专专 家家 系系 统统 的的 构构 成成知识处理功能知识处理功能5.2.1人工神经网络研究的进展人工神经网络研究的进展 总之,神经网络具有学习和适应、自组织、总之,神经网络具有学习和适应、自组织、函数逼近和大规模并行处理能力函数逼近和大规模并行处理能力 神经网络在模式识别、信号处理、系统辨识神经网络在模式识别、信号处理、系统辨识和优化等方面广泛应用和优化等方面广泛应用5.2.2人工神经网络的结构人工神经网络的结构一、生理神经元的结构与功能生理神经元的结构与功能1.生
11、理神经元的结构生理神经元的结构大多数神经元由一个细胞体(cell body或soma)和突(process)两部分组成。突分两类,即轴突(axon)和树突(dendrite),。轴突是个突出部分,长度可达1m,把本神经元的输出发送至其它相连接的神经元。树突也是突出部分,但一般较短,且分枝很多,与其它神经元的轴突相连,以接收来自其它神经元的生物信号。轴突和树突共同作用,实现了神经元间的信息传递。轴突的末端与树突进行信号传递的界面称为突触(synapse),通过突触向其它神经元发送信息。对某些突触的刺激促使神经元触发(fire)。只有神经元所有输入的总效应达到阈值电平,它才能开始工作。无论什么时候
12、达到阈值电平,神经元就产生一个全强度的输出窄脉冲,从细胞体经轴突进入轴突分枝。这时的神经元就称为被触发。越来越明显的证据表明,学习发生在突触附近,而且突触把经过一个神经元轴突的脉冲转化为下一个神经元的兴奋或抑制。5.2.2人工神经网络的结构人工神经网络的结构2.生理神经元的功能生理神经元的功能从生物控制论的观点,神经元作为控制和信息处理的基本单元,具有下列一从生物控制论的观点,神经元作为控制和信息处理的基本单元,具有下列一些重要的功能与特性:些重要的功能与特性:时空整合功能时空整合功能:神经元对于不同时间通过同一突触传入的神经冲动,具有时:神经元对于不同时间通过同一突触传入的神经冲动,具有时间
13、整合功能。对于同一时间通过不同突触传入的神经冲动,具有空间整合功间整合功能。对于同一时间通过不同突触传入的神经冲动,具有空间整合功能。两种功能相互结合,具有时空整合的输入信息处理功能;能。两种功能相互结合,具有时空整合的输入信息处理功能;兴奋与抑制状态兴奋与抑制状态:即兴奋(细胞膜电位升高)和抑制(细胞膜电位降低)。:即兴奋(细胞膜电位升高)和抑制(细胞膜电位降低)。脉冲与电位转换脉冲与电位转换:突触界面具有脉冲:突触界面具有脉冲/电位信号转换功能。电位信号转换功能。神经纤维传导速度神经纤维传导速度:神经冲动沿神经纤维传导的速度在:神经冲动沿神经纤维传导的速度在1-150m/s之间。之间。突触
14、延时和不应期突触延时和不应期:突触对神经冲动的传递具有时延和不应期,在相邻的二:突触对神经冲动的传递具有时延和不应期,在相邻的二次冲动之间需要一个时间间隔,即为不应期。次冲动之间需要一个时间间隔,即为不应期。每个人脑大约含有每个人脑大约含有1011-1012个神经元,每一神经元又约有个神经元,每一神经元又约有103-104个突触。神个突触。神经元通过突触形成的网络,传递神经元间的兴奋与抑制。大脑的全部神经元经元通过突触形成的网络,传递神经元间的兴奋与抑制。大脑的全部神经元构成极其复杂的拓扑网络群体,用于实现记忆与思维。构成极其复杂的拓扑网络群体,用于实现记忆与思维。5.2.2人工神经网络的结构
15、人工神经网络的结构二二.人工神经元人工神经元1.人工神经元的组成人工神经网络(artificial neural nets,ANN)或模拟神经网络是由模拟神经元组成的,可把ANN看成是以处理单元PE(processing element)为节点,用加权有向弧(链)相互连接而成的有向图。其中,处理单元是对生理神经元的模拟,而有向弧则是轴突-突触-树突对的模拟。有向弧的权值表示两处理单元间相互作用的强弱。来自其它神经元的输入乘以权值,然后相加。把所有总和与阈值电平比较。当总和高于阈值时,其输出为1;否则,输出为0。大的正权对应于强的兴奋,小的负权对应于弱的抑制。在简单的人工神经网模型中,用权和乘法
16、器模拟突触特性,用加法器模拟树突的互联作用,而且与阈值比较来模拟细胞体内电化学作用产生的开关特性。5.2.2人工神经网络的结构人工神经网络的结构2.ANN的数学描述的数学描述令来自其它处理单元(神经元)i的信息为Xi,它们与本处理单元的互相作用强度为Wi,i=0,1,,n-1,处理单元的内部阈值为。那么本神经元的输入为xi为第i个元素的输入,wi为第i个元素与本处理单元的互联权重。f称为激发函数(activation function)或作用函数。它决定节点(神经元)的输出。该输出为1或0取决于其输入之和大于或小于内部阈值。处理单元的输出为 5.2.2人工神经网络的结构人工神经网络的结构激发函
17、数一般具有非线性特性,常用的非线性特性如下图所示,分述于下:阈值型对于这种模型,神经元没有内部状态,激发函数为一阶跃函数,如图(a)所示。这时,输出为:1 ,xi0 f(xi)=U(xi)=0 ,xi0 分段线性强饱和型 见图(b)。Sigmoid型激发函数称为西格莫伊德(Sigmoid)函数,简称S型函数,其输入输出特性常用对数曲线或正切曲线等表示。这类曲线反映了神经元的饱和特性。S型函数是最常用的激发函数,它便于应用梯度技术进行搜索求解。5.2.2人工神经网络的结构人工神经网络的结构三、人工神经网络的基本特性和结构三、人工神经网络的基本特性和结构 1.神经网络的基本特性神经网络的基本特性
18、许多神经元以一定方式连接在一起,即构成神经网络。这种由许多神经元组成的信息处理网络具有并行分布结构。每个神经元具有单一输出,并且能够与其他神经元连接;存在许多输出连接方法,每种连接方法对应一个连接权系数。严格地说,人工神经网络是一种具有下列特性的有向图:对于每一个节电i存在一个状态变量xi;从节点j至节点i,存在一个连接权系统数wji;对于每个节点i,存在一个阈值i;对于每个节点i,定义一个变换函数f i(xi,wji,i),ij;对于最一般的情况,此函数取f i(wij xj-i)形式。j5.2.2人工神经网络的结构人工神经网络的结构2.神经网络的结构神经网络的结构递归网络递归网络有些神经元
19、的输出被反馈至同层或前层神经元,信号能够从正向或反向流通。又叫反馈网络。典型例子:Hopfield网络、Elmman网络和Jordan网络如图:vi表示接点的状态,xi为节点的输入值,xi为收敛后的输出值,i=1,2,n前馈网络前馈网络具有递阶分层结构,由一些同层神经元间不存在互连的层次组成。从输入到输出的信号通过单向连接流通;神经元从一层连接至下一层,不存在同层神经元间的连接。如图:实线指明实际信号流通,虚线表示反向传播。典型例子:多层感知器MLP5.2.2人工神经网络的结构人工神经网络的结构2.神经网络的结构神经网络的结构注:分层形前向网络具有任意精度的模式映射能力,因而可以用作模式分类、
20、匹配等,而反馈型神经网络则是一个非线性动力学系统,它具有如下两个重要特征:1系统具有多个稳定状态,从某一初始状态开始运动,系统最终可以到达某一个稳定状态;2不同的初始连接权值对应的稳定状态也不相同。如果用系统的稳定状态作为记忆,那么由某一初始状态出发向稳态的演化过程,实际上就是一个联想过程,所以反馈型神经网络具有联想记忆的功能。5.2.2人工神经网络的结构人工神经网络的结构决定人工神经网络整体性能l 节点本身的信息处理能力(数学模型)l 节点与节点之间连接(拓扑结构)l 相互连接的强度(通过学习来调整)5.2.2人工神经网络的结构人工神经网络的结构3.神经网络的主要学习算法神经网络的主要学习算
21、法 加拿大心理学家Donald Hebb出版了行为的组织一书,指出学习导致突触的联系强度和传递效能的提高,即为“赫布律”。在此基础上,人们提出了各种学习规则和算法,以适应不同网络模型的需要。有效的学习算法,使得神经网络能够通过连接权值的调整,构造客观世界的内在表示,形成具有特色的信息处理方法,信息存储和处理体现在网络的连接中。神经网络能够通过对样本的学习训练,不断改变网络的连接权值以及拓扑结构,以使网络的输出不断地接近期望的输出。这一过程称为神经网络的学习或训练,其本质是可变权值的动态调整。5.2.2人工神经网络的结构人工神经网络的结构3.神经网络的主要学习算法神经网络的主要学习算法有师学习有
22、师学习 能够根据期望的和实际的网络输出(对应于给定输入)之间的差来调整神经元间连接的强度或权。因此,有师学习需要有老师或导师来提供期望或目标输出信号。典型例子:规则、广义规则或反向传播算法 w0j -1 w1j x1 X wij j oj xj xn wnj Wj r(Wj,X,dj)学 习 信 号 X 生 成 器 dj )()()()(ttd,t,trjjjXXWW)()()()()()(ttd,t,trt1tjjjjXXWWW5.2.2人工神经网络的结构人工神经网络的结构无师学习无师学习 不需要知道期望输出。在训练过程中,只要向神经网络提供输入模式,神经网络就能够自动适应连接权,以便按相似
23、特征把输入模式分组聚集。典型例子:Kohonen算法、Carpenter-Grossberg自适应谐振理论。强化学习强化学习是有师学习的特例。它不许要老师给出目标输出,而采用一个评论员来评价与给顶输入相对应的神经网络输出的优度。典型例子:遗传算法5.2.3人工神经网络的典型模型人工神经网络的典型模型感知器神经网络:感知器神经网络:1.1.感知器感知器(Perceptron)是最是最“古老古老”的网络的网络(Rosenblatt,于,于1975年提年提出出),是一组可训练的线性分类器,目前已很少使用。,是一组可训练的线性分类器,目前已很少使用。有师学习 误差修正 正向 线形分类、预测 2.Mad
24、aLine是是AdaLine的发展,是一组具有最小均方差线性网络的的发展,是一组具有最小均方差线性网络的组合,学习能力较强,但组合,学习能力较强,但I/O间需满足线性关系。间需满足线性关系。有师学习 误差修正 正向 分类,噪声抑制 3.反向传递反向传递(BP)网网是一种反向传递并修正误差的多层映射网,在参数适是一种反向传递并修正误差的多层映射网,在参数适当时,能收敛到较小的均方误差,是当前应用最广的一种网络。缺点是训当时,能收敛到较小的均方误差,是当前应用最广的一种网络。缺点是训练时间长,易陷入局部极小。练时间长,易陷入局部极小。有师学习 误差修正 反向 分类5.2.3人工神经网络的典型模型人
25、工神经网络的典型模型自组织竞争学习神经网络模型:自组织竞争学习神经网络模型:.自组织映射网自组织映射网(SOM)由由Kohonen于于1972年提出。能形成簇与簇之间的连年提出。能形成簇与簇之间的连续映射,起向量量化器的作用续映射,起向量量化器的作用无师学习竞争律 正向自组织映射 5.5.CPN(Counter Propagation Network)由由R Hecht和和Nielsen于于1987年提年提出,亦称对流网,将出,亦称对流网,将Kohonen 特征映射网络与特征映射网络与Grossberg 基本竞争型网络相结基本竞争型网络相结合,充分发挥了它们各自的特长:无导师训练解决网络隐含层
26、的理想输出未知问合,充分发挥了它们各自的特长:无导师训练解决网络隐含层的理想输出未知问题,有导师训练解决输出层按系统要求给出指定输出结果的问题。经过反复学习,题,有导师训练解决输出层按系统要求给出指定输出结果的问题。经过反复学习,PN 可以将任意输入模式映射为输出模式可以将任意输入模式映射为输出模式 无师学习和有师学习 Hebb律 正向 模式映射6 6.自适应共振自适应共振(ART)由由Grossberg提出,是根据可选参数对输入数据进行粗分类的提出,是根据可选参数对输入数据进行粗分类的网络,网络,ART用于二值输入,用于二值输入,ART用于连续值输入。缺点是太敏感,输入有小用于连续值输入。缺
27、点是太敏感,输入有小的变化,输出变化很大。的变化,输出变化很大。无师学习 Hebb律 反向 模式分类5.2.3人工神经网络的典型模型人工神经网络的典型模型 7.认知机认知机(Neocognitron)由由Fukushima于于1972年提出,是迄年提出,是迄今为止结构最复杂的多层网,通过无导师学习,具有选择性注今为止结构最复杂的多层网,通过无导师学习,具有选择性注意的能力,对样品的平移、旋转不敏感。缺点是耗用结点及互意的能力,对样品的平移、旋转不敏感。缺点是耗用结点及互连多,参数多且难选。连多,参数多且难选。5.2.3人工神经网络的典型模型人工神经网络的典型模型 8.双向联想存储器双向联想存储
28、器(BAM)是一类单状态互联想网,具是一类单状态互联想网,具有学习功能。缺点是存储密度较低,且易振荡。有学习功能。缺点是存储密度较低,且易振荡。9.Hopfield网网由由Hopfield于于1982年提出,是一类不带年提出,是一类不带有学习功能的单层自联想网,缺点是要对称连接,内存开销有学习功能的单层自联想网,缺点是要对称连接,内存开销较大较大 10.Boltzmann机机由由 Hinton等提出。建立在等提出。建立在Hopfield网络基础上,具有学习能力,能够通过一个模拟退网络基础上,具有学习能力,能够通过一个模拟退火过程寻求解答。缺点是训练时间较火过程寻求解答。缺点是训练时间较BP网更
29、长。网更长。有师学习 Hebb/模拟退火 反向 组合优化5.2.4基于神经网络的知识表示与推理基于神经网络的知识表示与推理基于神经网络的知识表示基于神经网络的知识表示 这里采用的是一种隐式的表示方法。某一问题的若干知识在同一网络中表示。例如:在有些神经网络系统中,知识用神经网络中所对应的有向权图的邻接矩阵及阈值向量表示的。0-1.50-2.0-1.0 x1x2y1.0041.0701.1352.102-3.121邻接矩阵为:0 0 1.004 1.070 00 0 1.135 1.100 00 0 0 0 2.1020 0 0 0 -3.1210 0 0 0 0该网络代表下列4条规则:IF x
30、1=0 AND x2=0 THEN y=0 IF x1=0 AND x2=1 THEN y=1 IF x1=1 AND x2=0 THEN y=1 IF x1=1 AND x2=1 THEN y=05.2.4基于神经网络的知识表示与推理基于神经网络的知识表示与推理医疗诊断实例:医疗诊断实例:假设系统的诊断模型只有六种症状、两种疾病、三种治疗方案。首先选择一批合适的病人并从病历中采集如下信息:症状:对每一症状只采集有、无及没有记录这三种信息。疾病:对每一疾病也只采集有、无及没有记录这三种信息。治疗方案:对每一治疗方案只采集是否采用这两种信息。其中,对“有”、“无”、“没有记录”分别用+1、-1、
31、0表示。这样每一个病人构成一个训练样本。5.2.4基于神经网络的知识表示与推理基于神经网络的知识表示与推理根据症状、疾病及治疗方案间的因果关系,并通过训练样本对网络的训练得到如下神经网络。其中,x1,x2,x6,为症状;x7,x8 为疾病名;x9,x10,x11 为治疗方案;xa,xb,xc,是附加层,这是由于学习算法的需要而增加的x1x72输入层0-1-2-12033x2x3x4x5x6x8xaxbxcx11x9x10-23333-4-43241-1-4-22-31-1-3-3-3中间层输出层附加层输出层5.2.4基于神经网络的知识表示与推理基于神经网络的知识表示与推理说明:这是一个带正负权
32、值wij的前向网络,有wij可构成相应的学习矩阵。当ij时wij=0;当i0 Xj=wijxi xj=0,Xj=0 i=1 -1,Xj0得x7=1x1x72输入层0-1-2-12033x2x3x4x5x6x8xaxbxcx11x9x10-23333-4-43241-1-4-22-31-1-3-3-3中间层输出层附加层输出层当证据是x1=x3=1,x2=?由 0+21+3 1=5+(-2)(?)0 得x7=1由此可见,在用神经网络进行推理时,即使已知的信息不完全,照样可以进行推理。5.2.4基于神经网络的知识表示与推理基于神经网络的知识表示与推理2.基于神经网络的推理基于神经网络的推理正向网络推
33、理步骤:正向网络推理步骤:把已知数据输入网络输入层的各个节点。利用特性函数分别计算网络中各层的输出。计算中,前一层的输出作为后一层有关节点的输入,逐层进行计算,直到计算出输出层的输出值为止。用阈值函数对输出层的输出进行判定,从而得到输出结果。推理具有如下特征:推理具有如下特征:同一层的处理单元(神经元)是完全并行的,但层间的信息传递是串行的。由于层中处理单元的数目比网络的层次多得多,因此它是一种并行推理。在网络推理中不会出现传统人工智能系统中推理的冲突问题。网络推理只与输入及网络自身的参数有关,而这些参数又是通过多网络进行训练得到的,因此它是一种自适应推理。学习资源学习资源中南大学国家精品课程
34、中南大学国家精品课程人工智能 http:/ 模糊计算就是以模糊计算就是以模糊逻辑模糊逻辑为基础的计算为基础的计算.模糊逻辑(模糊逻辑(Fuzzy Logic)建立在)建立在模糊集理论模糊集理论的基础上,是一种处理的基础上,是一种处理不精确描述不精确描述的软的软计算。与不确定推理处理计算。与不确定推理处理随机事件发生的可能性随机事件发生的可能性相对照,模糊逻相对照,模糊逻辑面向辑面向事物特性和能力的不精确描述事物特性和能力的不精确描述。例如,描述人的年龄可有三个以术语表示的定性值:轻、中、老。尽管作为数值变量时其变量值更简单(如“年龄”等于25),但其值域有许多值(如1100)。定性值是一种形式
35、的数据压缩(年龄只有三个定性值)。定性值往往无明确的分界线,30-40岁之间的人属年轻或中年就是很模糊的,且因人的观念和场合而异。为表示类似这样的一些模糊概念,扎德于1965年提出 模糊集合理论,其基本思想就是把传统集合论中由特征函数决定的绝对隶属关系模糊化,使元素x对子集A的隶属程度不再局限于取0或1,而是可以取0,1上的任何值,以指示元素X隶属于子集A的模糊程度。5.3模糊计算模糊计算 5.3.1模糊逻辑模糊逻辑 5.3.2模糊推理模糊推理 5.3.3模糊控制模糊控制 5.3.1模糊逻辑模糊逻辑 一一.模糊集合及其运算模糊集合及其运算 1.模糊集合模糊集合(fuzzy sets)定义:定义
36、:在论域在论域U上定义一个上定义一个模糊子集模糊子集(简称模糊集)(简称模糊集)A,其对,其对U的任意元素的任意元素x均指定一个值均指定一个值 A(x)0,1,以表示它对,以表示它对A的隶属程的隶属程度,即有度,即有A:U0,1 ,A=x/A其中,其中,A称为称为A的隶属函数的隶属函数。当当A(x)=1时,时,x确定性隶属于确定性隶属于A;而而A(x)=0时,时,x确定性非隶属于确定性非隶属于 A;x取其它值时,隶属程度模糊。取其它值时,隶属程度模糊。总之,一个模糊集总之,一个模糊集 A是以隶属函数是以隶属函数A(x)来描述的,隶属程度的概来描述的,隶属程度的概念构成模糊集理论的基石念构成模糊
37、集理论的基石.5.3.1模糊逻辑模糊逻辑 一一.模糊集合及其运算模糊集合及其运算 1.模糊集合模糊集合(fuzzy sets)在论域在论域U中,可以把模糊子集表示为元素中,可以把模糊子集表示为元素u与其隶属函数与其隶属函数A 的的序偶集合,记为序偶集合,记为 A=(u,A(u)|uU若为连续,则模糊集若为连续,则模糊集A可记作可记作 若若U为离散,则模糊集为离散,则模糊集A可记为:可记为:5.3.1模糊逻辑模糊逻辑 举例:以人的年龄作为论域例来考察模糊集,设立以定性术语来举例:以人的年龄作为论域例来考察模糊集,设立以定性术语来描述年龄的语言变量描述年龄的语言变量“年龄年龄”,其值域为,其值域为
38、:年龄年龄=轻,中,老轻,中,老可以为可以为“年龄年龄”的三个定性值分别建立隶属函数的三个定性值分别建立隶属函数Y、M和和O。它们各以梯形或三角形表示。从图中可见,这三个隶属函数是相它们各以梯形或三角形表示。从图中可见,这三个隶属函数是相互重叠的,即年龄在互重叠的,即年龄在3065岁之间的人不能确定性地划归某一个岁之间的人不能确定性地划归某一个子集。子集。5.3.1模糊逻辑模糊逻辑 2模糊集的运算模糊集的运算设设A和和B为论域为论域U中的两个模糊集,其隶属函数分别为中的两个模糊集,其隶属函数分别为 A和和 B,则对于所有,则对于所有uU,存在下列运算:,存在下列运算:(1)A与与B的并(逻辑或
39、)记为的并(逻辑或)记为AB ,其隶属函数定义为,其隶属函数定义为 (2)A与与B的交(逻辑与)记为的交(逻辑与)记为 AB,其隶属函数定义为:,其隶属函数定义为:(3)A的补(逻辑非)记为的补(逻辑非)记为A,其传递函数定义为,其传递函数定义为5.3.1模糊逻辑模糊逻辑 举例:若论域举例:若论域U=x1,x2,x3,x4上有上有则:则:可见,模糊集合的逻辑运算实质上就是隶属函数的组可见,模糊集合的逻辑运算实质上就是隶属函数的组合运算过程。合运算过程。5.3.1模糊逻辑模糊逻辑 二、模糊逻辑二、模糊逻辑 模糊逻辑模糊逻辑的基本思想是将常规数值变量模糊化,使变量成为以定性术语(也称语言值)为值域
40、的语言变量。当用语言变量来描述对象时,这些定性术语就构成 模糊命题模糊命题。可以省略被描述的对象,则模糊命题可表示为“语言变量定性值”形式。例如张三“年龄轻”就是一个模糊命题,其模糊程度用定性术语“轻”的隶属函数来表示。然后可以对模糊命题作合取、析取、取反等逻辑操作。每个模糊命题均由相应的一个模糊集作细化描述,所每个模糊命题均由相应的一个模糊集作细化描述,所以模糊逻辑操作与模糊集操作是一致的。以模糊逻辑操作与模糊集操作是一致的。5.3.1模糊逻辑模糊逻辑 二、模糊逻辑二、模糊逻辑定义:设定义:设P1,P2,Pm为论域为论域U1,U2,Un上的一组模糊命上的一组模糊命题,相应的隶属函数为题,相应
41、的隶属函数为 P1,p2,p m,当前观察的论域,当前观察的论域元素分别为元素分别为 x P1,xp2,xp m;令;令PV和和P分别表示这些命分别表示这些命题的析取和合取,则题的析取和合取,则PV和和P的隶属程度为的隶属程度为5.3.1模糊逻辑模糊逻辑 令析取和合取隐含着令析取和合取隐含着max和和min操作,则此二式可简写操作,则此二式可简写为为其中,不同的模糊命题可以面向同一论域,即使用相同其中,不同的模糊命题可以面向同一论域,即使用相同的语言变量,但取用的定性值不同,隶属函数也不同。的语言变量,但取用的定性值不同,隶属函数也不同。对于模糊命题的取反,则有对于模糊命题的取反,则有 注:注
42、:让模糊命题的析取和合取隐含让模糊命题的析取和合取隐含max和和min,在一定程度上反映了客观规律,但这种平等看待各模糊命题的观念有时仍,在一定程度上反映了客观规律,但这种平等看待各模糊命题的观念有时仍不符合实际。在真实世界中,影响问题求解的因素往往具有不相同的相对重要性。这可以通过引入加权模糊逻辑来解决不符合实际。在真实世界中,影响问题求解的因素往往具有不相同的相对重要性。这可以通过引入加权模糊逻辑来解决5.3.2模糊推理模糊推理 模糊推理模糊推理有多种模式,其中最重要的且广泛应用的是有多种模式,其中最重要的且广泛应用的是基于模糊规则的推理。模糊规则的前提是模糊命题的逻基于模糊规则的推理。模
43、糊规则的前提是模糊命题的逻辑组合(经由合取、析取和取反操作),作为推理的条辑组合(经由合取、析取和取反操作),作为推理的条件;结论是表示推理结果的模糊命题。所有模糊命题成件;结论是表示推理结果的模糊命题。所有模糊命题成立的精确程度(或模糊程度)均以相应语言变量定性值立的精确程度(或模糊程度)均以相应语言变量定性值的隶属函数来表示。的隶属函数来表示。模糊规则由应用领域专家凭经验知识来制定,并可在模糊规则由应用领域专家凭经验知识来制定,并可在应用系统的调试和运行过程中,逐步修正和完善。模糊应用系统的调试和运行过程中,逐步修正和完善。模糊规则连同各语言变量的隶属函数一起构成了应用系统的规则连同各语言
44、变量的隶属函数一起构成了应用系统的知识库。基于规则的模糊推理实际上是按模糊规则指示知识库。基于规则的模糊推理实际上是按模糊规则指示的模糊关系的模糊关系 作模糊合成运算的过程。作模糊合成运算的过程。5.3.2模糊推理模糊推理 1.直接直接 基于模糊规则的推理基于模糊规则的推理 当模糊推理的输人信息是量化的数值时,可以直接基于模糊规当模糊推理的输人信息是量化的数值时,可以直接基于模糊规则作推理,然后把推理结论综合起来,典型的推理过程可以分为则作推理,然后把推理结论综合起来,典型的推理过程可以分为两个阶段,其中第一阶段又分为三个步骤,表述如下:两个阶段,其中第一阶段又分为三个步骤,表述如下:(1)计
45、算每条模糊规则的结论:输入量模糊化,即求出输)计算每条模糊规则的结论:输入量模糊化,即求出输入量相对于语言变量各定性值的隶属度;计算规则前提部分模入量相对于语言变量各定性值的隶属度;计算规则前提部分模糊命题的逻辑组合(合取、析取和取反的组合);将规则前提糊命题的逻辑组合(合取、析取和取反的组合);将规则前提逻辑组合的隶属程度与结论命题的隶属函数作逻辑组合的隶属程度与结论命题的隶属函数作min运算,求得结运算,求得结论的模糊程度。论的模糊程度。(2)对所有规则结论的模糊程度作)对所有规则结论的模糊程度作max运算,得到模糊推理运算,得到模糊推理结果。结果。5.3.2模糊推理模糊推理 举例举例:观
46、察图所示的模糊控制。设想经验知识库中包括九条观察图所示的模糊控制。设想经验知识库中包括九条规则。描述温差规则。描述温差、温度变化率、温度变化率d和燃料流量修正量和燃料流量修正量y这三个这三个论域的语言变量具有相同的定性值和隶属函数,且这三个论论域的语言变量具有相同的定性值和隶属函数,且这三个论域均归化到实数域域均归化到实数域-1,1上。这些定性值取以下术语:上。这些定性值取以下术语:NB(负大负大)、NS(负小负小)、ZO(零零)、PS(正小正小)、PB(正大正大)5.3.2模糊推理模糊推理 相应的隶属函数如图所示。相应的隶属函数如图所示。设模糊控制器当前输入的数设模糊控制器当前输入的数量值为
47、:量值为:=0.8,d=0,则有两条规则激活:则有两条规则激活:输入量的隶属度为输入量的隶属度为基于基于max-min原则,可以分别计算这两条规则结论的模糊程度原则,可以分别计算这两条规则结论的模糊程度(分别以(分别以1和和2指示):指示):5.3.2模糊推理模糊推理 1(y)和和2(y)实际是将实际是将Nsy(y)和和NBy(y)的的0.3和和0.7以上部分切去以上部分切去后的结果,这种后的结果,这种min运算也称切头法。最后对运算也称切头法。最后对1(y)和和2(y)作作max操作,得到模糊推理结果操作,得到模糊推理结果(记为模糊集记为模糊集H)H(y)1(y)2(y)。5.3.2模糊推理
48、模糊推理 设燃料流量修正量这个论域为有限离散值的集合,即将实数域设燃料流量修正量这个论域为有限离散值的集合,即将实数域-1,l分成分成8个等级,级差为个等级,级差为0.25,则有,则有令令AH1 和和 AH2分别指示相应于这二条规则的推理结果模糊集,则有分别指示相应于这二条规则的推理结果模糊集,则有 5.3.2模糊推理模糊推理 2.基于模糊关系的推理基于模糊关系的推理建立在论域建立在论域 U1,U2,Un上的一个模糊关系上的一个模糊关系R是笛卡尔积是笛卡尔积 U1U2Un上的模糊集合。若这些论域的元素变量分别为上的模糊集合。若这些论域的元素变量分别为 XU1,XU2,XU2 ,则则R的隶属函数
49、记的隶属函数记R(XU1,XU2,XU2)。模糊关系模糊关系 R可形式地定义为可形式地定义为 注:尚未建立一致的理论去指导模糊关系的构造。存在着多种注:尚未建立一致的理论去指导模糊关系的构造。存在着多种构造模糊关系的方法,相关的模糊合成运算方法也不同,形成了多构造模糊关系的方法,相关的模糊合成运算方法也不同,形成了多种风格的模糊推理方法。不过,基于种风格的模糊推理方法。不过,基于max-min原则的算法占居了目原则的算法占居了目前模糊推理方法的主流。前模糊推理方法的主流。5.3.2模糊推理模糊推理 当模糊推理的输人信息是定性术语(以相应的模糊集当模糊推理的输人信息是定性术语(以相应的模糊集表示
50、)时,可以基于模糊关系作推理。介绍简单直观的表示)时,可以基于模糊关系作推理。介绍简单直观的Mamdani方法。方法。设模糊规则形如设模糊规则形如PH,模糊命题模糊命题P和和H相应的模糊集相应的模糊集AP和和AH分别建分别建立在论域立在论域UP和和UH上(相应的元素变量为上(相应的元素变量为xP,xH)。令)。令R(P;H)指指示从示从P推出推出H的模糊关系,则定义的模糊关系,则定义 当实际的输人信息是模糊命题当实际的输人信息是模糊命题P(相应的模糊集为(相应的模糊集为AP)的,则模)的,则模糊推理的输出糊推理的输出H(相应的模糊集为(相应的模糊集为AH)表示为)表示为 5.3.2模糊推理模糊