1、博士研究生:白治江主要内容一、绪论二、模糊逻辑与模糊系统三、遗传算法四、设计模糊分类器的进化方法五、从数据中自动构建基于GA的模糊系统六、递归增量式多目标遗传算法七、抽取模糊规则知识的Agent进化方法八、基于交互影响的模糊规则推理一、绪论实际生活中有着许多模糊的概念和逻辑方式,“给小费”问题就是一个可以用模糊逻辑来分析的经典例子。神经网络微分方程随机选择器模糊逻辑线性逻辑专家系统黑箱L.A.Zadeh(查德)(查德)这些正如模糊逻辑的创始人L.A.Zadeh曾说过:“有很多可有很多可供选择的方法来替代模糊逻辑,供选择的方法来替代模糊逻辑,但模糊逻辑往往是但模糊逻辑往往是最快速最快速和和简单简
2、单有效有效的的”。热水凉水温水温水模糊逻辑快速模糊逻辑快速简单有效简单有效这里,“冷”“热”以及“适当”都是一些模糊概念,基于这种模糊意义上的处理很快就可以使水达到合适的温度。但是,如果要准确测量水温以及添加的水量,就会把简单的问题搞得非常复杂。模糊逻辑精确理论300随着社会进步和科学技术的发展,人们渐渐发现,现有的精确理论精确理论在解决一些问题时往往会显得繁琐繁琐或者束手无策。原因主要有以下三点:(1)精确理论一般需要用数学微分方程来描述自然科学的某些基本规律或系统,但在实际中有的系统所涉及的因素因素很多,而每个因素之间还存在着的关系关系;同时,系统所处的条件条件也千变万化,要用微分方程微分
3、方程来描述这种系统,要么根本无法实现,要么需设定大量的约束条件,最终无法求得结果。微分方程因素因素因素因素因素约束条件过于复杂无法实现(2)有的学科,例如语言学、心理学、文学、生物学和社会科学,往往是采用文字文字方法进行定性的推理或估计。而这些学科中的大多数问题都具有模糊性,比如,语言的“幽默”与“流畅”,心理的“正常”与“不平衡”,文学作品的“通俗”与“严肃”等,都是模糊概念。很明显,用传统的精确理论是无法对这些学科进行数学化和定量分析的。(3)人的智能本身就具有精确性和模糊性两种特征。控制论创始人维纳在指出人能超过任何最完善的机器时,明确指明其重要原因是“人具有运用模糊概念的能力”。实际上
4、,人运用模糊概念的时间占了生活的大部分,对这些具有模糊概念和性质的问题采用模糊数学的方法是无法恰当解决的。维纳:“人具有运用模糊概念的能力”。上述这些也就是模糊逻辑立足于解决的问题。当前模糊逻辑已经被广泛地应用于人们的生产和生活的各个领域,特别在工业控制和自动化领域,模糊逻辑的各种新应用、新产品层出不穷。相对于精确逻辑,模糊逻辑具有如下特点:(1)模糊逻辑是柔性的。对于给定的系统,很容易处理以及直接增加新功能,而不需从头做起。(2)模糊逻辑建立在自然语言的基础上,对数据的精确性要求不高。(3)模糊逻辑能充分利用专家信息。(4)模糊逻辑易与传统的控制技术相组合。创新点1.提出在对数据分布没有任何
5、先验知识的情况下,用进化方法直接从训练数据中建立一个紧致的模糊分类系统。2.研究了未知系统模糊建模的新算法。不但能构造出用户友好的模糊建模系统,还能识别并忽略哑元输入变量。3.提出了一个多目标优化问题的新方法一递归增量多目标遗传算法(RIMOGA)。相对于其它典型的多目标遗传算法,RIMOGA在相同时间内能找到更多且质量更好的解。创新点4.提出了抽取模糊规则知识的Agent进化方法。新方法能在模糊系统的精度和可解释性之间达到好的平衡。5.研究了处理模糊规则间交互影响和从数据中学习非可加集合函数的方法,提高了模糊规则的推理精度。二、模糊集合 对于模糊集合来说,它与经典集合的根本区别在于一个元素可
6、以是既属于又不属于某一模糊集合,亦此亦彼,界限模糊。xYAAxYAuA(x)=0.8uA(y)=0.2uA(x)为隶属度为隶属度BCBCA语言变量语言变量是指自然语句中的词或句,它的取值不是通常的数,而是用模糊语言表示的模糊集合,Zadah对语言变量定义如下:语言变量是由一个五元组(x,T(x),U,G,M)来表征。其中,x是变量的名称;U是x的论域;T(x)是语言变量值的集合;每个语言变量值是定义在论域U上的一个模糊集合;G是语法规则,用来产生语言变量x的值的名称;M是语义规则,用于产生模糊集合的隶属度函数。(x,T(x),U,G,M)T(x):语言变量集合T(x)=冷,适中,热,稍微热,稍
7、微冷,很热,很冷U:论域U=0,100G:语法规则“很,稍微”这些修饰词M:语义规则以水温为例以水温为例语言变量模糊规则库模糊规则库是由若干模糊if-then规则的总和组成,它是模糊系统的核心部分,系统其他部分的功能在于解释和利用这些模糊规则来解决具体问题。一般模糊规则的获得有两个途径:请教专家或采用基于测量数据的学习方法。IfthenIfthenIfthen模糊推理机模糊推理机主要包括将模糊规则库中的模糊if-then规则转换成某种映射,即将输入空间上的模糊集合映射到输出空间的模糊集合。主要包括连接词的计算、if-then规则的表示、直觉推理判据和一些相关的运算性质。连接词运算主要指“and
8、”,“or”和“also”三种操作。输入空间输入空间模糊集合模糊集合输出空间输出空间模糊集合模糊集合连接词计算If-then规则直觉推理运算性质andoralso模糊产生器 模糊产生器的作用是将一个确定的点映射为输入空间的一个模糊集合,也称模糊化。模糊消除器 模糊消除器的目的是将输出空间的一个模糊集映射为一个确定点,以达到实际应用的目的,又称解模糊化、去模糊化、逆模糊化或清晰化。三、遗传算法(略)四、设计模糊分类器的进化方法模式分类模式分类是指将特征空间划分为几个区域并把对象划入由这些区域所定义的类中。分类器设计就是要找出从特征空间Rn到决策空间C的最优映射f。即f:Rn C有许多构建分类器的
9、方法,如统计模型,神经网络及模糊逻辑系统。模糊逻辑具有处理不确定性和模糊性的强大能力,所以它已经被应用于若干复杂的分类系统中。模糊逻辑将类别重叠的事实和软决策机制引入分类系统中,因此,一个模式可能以不同的隶属度属于若干类别。此外,模糊分类器模糊分类器由if-then模糊规则集组成,规则集既能使我们洞察分类器的结构,又能提高系统的可解释性。IfthenIfthenIfthen模糊分类器一般而言,通过将领域知识编码为模糊规则即可建立模糊分类器,但许多情况下,领域知识要么不存在,要么不完整。此时,必须从训练数据中建立分类器。目前,直接从数据中自动建立和学习模糊if-then分类规则的方法有神经模糊技
10、术,聚类方法和进化算法。模糊分类器上述模糊分类器的性能与基于神经网络和统计学的分类技术类似。研究表明神经网络与模糊系统是等价的并可相互转换。模糊分类器的优点在于其规则库结构的可解释性,因为用语言形式表示的模糊分类规则更易于解释和检验。结果的可解释性与模糊规则的数量有关,规则较少的模糊系统往往有更好的可解释性。此外,小的规则库能够消除系统的过拟合现象、增强系统的泛化能力和鲁棒性,从而使性能得以改善。已提出若干方法用于设计紧致的可解释性模糊系统紧致的可解释性模糊系统,如选择策略,迭代复杂性归约技术及基于GA的多目标优化。文献9用基于GA的方法从一个较大的候选规则库中选择少量重要的模糊规则,从而建立
11、紧致的高精度的模糊分类器。文献10提出一个具有复杂性归约的模糊建模方案,算法先用模糊聚类获得初始模型,然后迭代应用规则库归约和基于GA的优化技术提高精度并降低复杂度。文献11中定义了度量模糊系统紧致险的若干准则,再用多目标GA技术导出最小模糊系统。文献12和13阐述了基于模糊规则的系统设计方法,并用TSK模糊系统获得紧致规则库。模糊逻辑在无监督无监督分类方面的典型算法是模糊C均值聚类,但模糊逻辑在有监督有监督分类上的应用并未在著名文献上看到,最近发表的VISIT(variable input spread inference training,VISIT)方法是在这方面的一个有益尝试。本章将适
12、当修改后的VISIT算法与遗传算法相结合,构造了一个有监督的模糊分类器设计新方法,并提出了一个模糊专家系统来实现兼顾精度和可解释性的适应度函数。数据点聚类中心聚类模糊均值聚类对VISIT的修改如下:(1)原始VISIT算法假定所有的论域是等同的,因此在算法开始时选定的是标量值w,a和。然而,在许多实际系统中,不同的特征其作用的论域往往也不同,所以我们将原VISIT算法中的标量参数用3个向量参数W,A和代替,给W,A和选择不同的值,将在相同的数据集上产生不同的模糊系统。(2)原算法只以精度作为唯一的评价标准,新算法则兼顾了精度和可解释性的平衡性,因为可解释性是模糊系统必须考虑的重要特征之一。(3
13、)原算法并未使用任何优化方法,而新方法采用遗传算法提高系统的精度。精度解释性概括地讲,本章中用修改后的VISIT算法与遗传算法相结合构建了用于有监督模糊分类的新算法:首先使用VISIT算法导出每个个体模糊系统,再用遗传算法搜索最优的模糊系统。新算法能够在对数据分布没有任何先验知识的情况下,用进化方法直接从训练数据中建立一个紧致的模糊分类系统。优点优点:(1)可解释性好;(2)有效的特征压缩;(3)与传统方法相当的识别精度。模糊系统模糊系统1.模糊系统模糊系统2模糊系统模糊系统n模糊系统模糊系统最优VISIT算法通过仔细选择和主动调整非对称隶属函数的宽度来克服上述问题。因为隶属函数的宽度是作为训
14、练数据的一个函数而确定,LFE算法所导致的规则爆炸将被相当程度地抑制或者完全消除。基于新隶属函数与它两边最近邻隶属函数之间的距离,VISIT分别独立地调整新函数各个侧边的宽度。同时,其最近邻函数的宽度也被重新计算以便与新加入的隶属函数相适应。对近邻函数宽度的主动调整使得隶属函数宽度的收缩率降低且与给定的数据集相适应。隶属函数相互之间的宽度差别只反映了数据集的本质,而与训练算法无关。注:上述VISIT算法与16中的原始形式有所不同,原作者假定所有的论域是等同的,因此在算法开始时选定的是标量值w,a和。然而,在许多实际系统中,不同的特征其作用的论域往往也不同,所以我们在VISIT算法中使用3个向量
15、参数W,A和,给W,A和选择不同的值,将在相同的数据集上产生不同的模糊系统。找出优良VISIT分类器的主要问题就归结为找出参数W,A和的优良值。通过进化算法抽取模糊规则结论本章提出了通过进化技术设计模糊分类系统的自动方法,对参数W,A,和M作不同的随机初始化可由VISIT算法在相同的数据集上设计不同的模糊系统。进化算法通过同时优化所有这些参数的方式找到最优模糊系统。在对训练数据的分布没有任何先验知识的前提下,新方法能自动建立非常紧致的模糊系统。两个个基准数据集上的仿真结果表明了新方法的有效性。五、从数据中自动构建基于GA的模糊系统用样本数据建立逼近非线性系统的模糊模型是一个研究热点。传统模糊系
16、统中,输入变量的隶属函数隶属函数的数数量量往往是固定的。然而对某些系统,由于输入变量的重要性不同,应当有不同数目的隶属函数赋给不同的输入变量。如果每个输入变量的隶属函数数量被固定而不能自适应地变化,则所生成的模糊系统就可能无法有效逼近实际系统。隶属函数隶属函数隶属函数隶属函数隶属函数隶属函数有些方法通过给更重要的输入变量赋予更多更多的隶属函数成功地解决了这一问题。但这些方法均需提前确定隶属函数总数,或者先确定一个隶属函数数量的上界,再用一个简化阈值进一步约简规则库。隶属函数隶属函数隶属函数隶属函数隶属函数隶属函数隶属函数上界上界已经证明模糊系统是一种通用的逼近器,但如何找出合适的规则数(或隶属
17、函数总数),以及如何处理规则数与逼近精度之间的折衷关系是一个挑战性课题。己经提出了一些自动确定规则数的方法,不过它们把自动确定规则数的问题转化为另一个待定参数。另外,未知系统中可能包含哑元输入变量,构建高效模糊系统时应当忽略这些哑元输入变量。上述方法也没有识别哑元输入变量的能力。没有显著意义的输入变量本章提出基于GA的模糊系统建模算法,新系统具有动态结构,即按照输入变量的重要性赋予不同数量的隶属函数;若某个输入变量只被赋予一个隶属函数,则该变量被看作哑元变量而忽略以便保证模糊系统的高效性。按照系统复杂性和逼近精度之间的折衷关系,提出一个新的性能指标检验方法来确定隶属函数的总数,避免了用繁琐耗时
18、的试探法确定GA参数的弊端。隶属函数隶属函数隶属函数隶属函数隶属函数隶属函数隶属函数隶属函数从数据中自动构建基于GA的模糊系统(算法)结论 研究了未知非线性系统的基于GA的模糊建模。许多需要使用者自定义的参数在新算法中被自动确定,因此即使缺少经验的用户亦可方便地设计模糊系统。此外,新算法能识别并忽略哑元输入变量,实验结果表明新算法能成功地构建紧致性和精度兼具的模糊系统。六、递归增量式多目标遗传算法 本章介绍了一个多目标优化问题的新方法一递归增量多目标遗传算法(recursive incremental multiple objective genetic algorithms,RIMOGA)。
19、与传统多目标遗传算法不同,RIMOGA以递归增量的方式考虑每个目标。第一步整个进化过程被分为与目标数量相等的几个阶段,每个阶段只增加一个目标。每个阶段又分为两步:第一步,用一个独立的群体进化一个特定的目标;第二步,把第一步中单目标群体中性能较好的个体和上一阶段多目标进化的群体集成在一起,所形成的多目标群体作为已增目标集进化的初始群体。第二步特定目标特定目标上一阶段初始群体RIMOGA 毫无疑问,进化时目标数量越小,所用时间越少。所以,为了节省运算我们可以只从一个目标搜索最优解,再通过递归增量方式达到最终结果。如果在递归增量前较好个体所带信息被转移到递归增量后的群体中,则此种递归增量式进化可保证
20、个体的质量。RIMOGE(算法)结论本章提出了一个递归增量多目标遗传算法RIMOGA。与传统方法不同,RIMOGA将进化分为若干阶段,每个阶段只额外多考虑一个目标。实验结果表明,RIMOGA表现出比其他典型多目标遗传算法,如PAES,SPEA和NSGA-II更好的性能。给定相同的时间,RIMOGA能找出更多的解,并且这些解以更一致的方式靠近Pareto前沿,并能均匀地覆盖Pareto前沿的主要部分。七、抽取模糊规则知识的Agent进化方法本章介绍了抽取模糊规则知识的Agent进化方法。每个行为Agent(BehaviorAgent,BA)自主确定模糊集的数量和分布,并利用分级染色体结构和调整策
21、略改进模糊系统的可解释性。BABABABA分级染色体结构分级染色体结构基于可解释性基于可解释性的调整策略的调整策略在所获得的模糊集上使用Pittsburgh型方法抽取精度和可解释性兼具的模糊规则。此外,BA能够相互协作地交换模糊集的信息以便维持解的多样性,获得全局最优解。仿真实验结果表明,新方法能在模糊系统的精度和可解释性之间达到好的平衡。BABABABAIfthenIfthenIfthenIfthenIfthenPitts方法结论本章介绍了用于构建可解释性模糊系统的基于agent的进化方法。在多agent系统中,BA自主地实现以下内部任务:(1)用分级染色体结构和基于可解释性的调整策略获得完
22、备的和可分辨的模糊集分布;(2)基于所获得的模糊集用Pittsburgh型方法抽取可解释性规则,抽取过程中用RIMOGA多目标决策方法作性能评价。仿真结果表明新方法能生成多个精度和可解释性兼具模糊系统。八、基于交互影响的模糊规则推理传统的不精确推理包括主观贝叶斯方法、证据推理方法和MACY方法,它们都涉及处理多个不同前提,相同后项规则推理与可信度计算问题。但在模糊规则进行近似推理时,相同后项规则模糊推理与可信度计算问题,以及研究不同前提之间的关系,目前一些典型的方法未见报道,为了对规则间的交互影响进行处理和建模,论文提出用非可加集合函数代替规则权值,并以关于此集合函数的积分为基础导出推理结论。
23、规则规则1:IF(A=发热)and(B=从SARS感染区来)THEN疑似SARS规则规则2:IF(C=咳嗽)and (D=呼吸困难)THEN疑似SARS规则规则3:IF(A=发热)and (E=多痰)THEN疑似SARS规则规则1:IF(A=发热)and(B=从SARS感染区来)规则规则2:IF(C=咳嗽)and (D=呼吸困难)规则规则1:IF(A=发热)and(B=从SARS感染区来)不同规则前不同规则前提可能对结提可能对结果起到相互果起到相互增强的作用增强的作用规则规则1:IF(A=发热)and(B=从SARS感染区来)THEN疑似SARS规则规则2:IF(C=咳嗽)and (D=呼吸困
24、难)THEN疑似SARS规则规则3:IF(A=发热)and (E=多痰)THEN疑似SARS规则规则2:IF(C=咳嗽)and (D=呼吸困难)规则规则3:IF(A=发热)and (E=多痰)规则规则2:IF(C=咳嗽)and (D=呼吸困难)普通感冒普通感冒不同规则前不同规则前提可能对结提可能对结果起到相互果起到相互冲突的作用冲突的作用结论 当领域专家为一个模糊规则集提供附加信息时,模糊规则之间存在着交互影响。本章使用关于非可加集合函数的非线性积分对交互影响建模,通过将全局权向量扩展为非可加集合函数来处理交互影响。处理规则间交互影响使得WFR推理扩展为一个非线性积分模型,从而使推理精度有所提高。当表示交互影响的非可加集合函数难于由领域专家给定时,可通过解线性规划问题来学习该集合函数。