1、13.8.2 关于结论的不确定性关于结论的不确定性 l关于结论的不确定性也叫做规则的不确定性,它表示当规则的条件被完全满足时,产生某种结论的不确定程度。3.8.3 多个规则支持同一事实时的不确定性 v基于模糊集理论的方法v基于概率论的方法3.8 不确定性推理2基本概念基本概念l1.什么是不确定性推理?l2.为什么要研究不确定性推理?l3.不确定性的表示和度量l4.不确定性的计算l5.不确定性推理方法的分类3基本概念基本概念(1/5)(1/5)l什么是不确定性推理?不确定性推理是建立在非经典逻辑上的一种推理,是对不确定性知识的运用与处理是从不确定性的初始证据出发,通过运用不确定性的知识,最终推出
2、既保持一定程度的不确定性,又是合理和基本合理的结论的推理过程。l例如:A发生的概率是0.7,A发生后B发生的概率是0.8。则A发生引起B发生的概率是0.7*0.8=0.564基本概念基本概念(2/5)(2/5)l为什么要研究不确定性推理?日常生活中含有大量的不确定的信息ES系统中大量的领域知识和专家经验,不可避免的包含各种不确定性。5不确定性推理方法研究产生的原因不确定性推理方法研究产生的原因l很多原因导致同一结果l推理所需的信息不完备l背景知识不足l信息描述模糊l信息中含有噪声l规划是模糊的l推理能力不足l解题方案不唯一例如,多种原因引起同一种疾病。发烧可能因为感冒,也可能因为得了肺炎,需要
3、进一步的知识才能作出具体判断。6不确定性推理方法研究产生的原因不确定性推理方法研究产生的原因l很多原因导致同一结果l推理所需的信息不完备l背景知识不足l信息描述模糊l信息中含有噪声l规划是模糊的l推理能力不足l解题方案不唯一勘探得到的地质分析资料不完备7不确定性推理方法研究产生的原因不确定性推理方法研究产生的原因l很多原因导致同一结果l推理所需的信息不完备l背景知识不足l信息描述模糊l信息中含有噪声l规划是模糊的l推理能力不足l解题方案不唯一疾病的发病原因不十分明确。8不确定性推理方法研究产生的原因不确定性推理方法研究产生的原因l很多原因导致同一结果l推理所需的信息不完备l背景知识不足l信息描
4、述模糊l信息中含有噪声l规划是模糊的l推理能力不足l解题方案不唯一如他不高不矮,今天不冷不热等等。在这类描述中,通常无法以一个量化的标准来描述,所描述的事物通常处在一个大致的范围。比如,认为身高在165cm174cm之间的男士符合不高不矮的描述。9不确定性推理方法研究产生的原因不确定性推理方法研究产生的原因l很多原因导致同一结果l推理所需的信息不完备l背景知识不足l信息描述模糊l信息中含有噪声l规划是模糊的l推理能力不足l解题方案不唯一噪声的存在干扰了人们对本源信息的认知,从而加大了认知上的难度。如语音信号、雷达信号中的噪音干扰带来的信息模糊。10不确定性推理方法研究产生的原因不确定性推理方法
5、研究产生的原因l很多原因导致同一结果l推理所需的信息不完备l背景知识不足l信息描述模糊l信息中含有噪声l规划是模糊的l推理能力不足l解题方案不唯一当需要对某个问题域进行划分时,可能无法找到一个清晰的标准。如根据市场需求情况调节公司产品的内容和数量。11不确定性推理方法研究产生的原因不确定性推理方法研究产生的原因l很多原因导致同一结果l推理所需的信息不完备l背景知识不足l信息描述模糊l信息中含有噪声l规划是模糊的l推理能力不足l解题方案不唯一必须考虑到实现的可能性,计算复杂度,系统性能。如计算机的实现能力,推理算法的规模扩大能力有限等12不确定性推理方法研究产生的原因不确定性推理方法研究产生的原
6、因l很多原因导致同一结果l推理所需的信息不完备l背景知识不足l信息描述模糊l信息中含有噪声l规划是模糊的l推理能力不足l解题方案不唯一没有最优方案,只有相对较优方案。不实施,不能做出最后判断。13l一个人工智能系统,由于知识本身的不精确和不完全,采用标准逻辑意义下的推理方法难以达到解决问题的目的。对于一个智能系统来说,知识库是其核心。在这个知识库中,往往大量包含模糊性、随机性、不可靠性或不知道等不确定性因素的知识。为了解决这种条件下的推理计算问题,不确定性推理方法应运而生。l由于人类认识水平的客观限制,客观世界的很多知识仍不为人们所认知。l不精确思维并非专家的习惯或爱好所至,而是客观现实的要求
7、。在人类的知识和思维行为中,精确性只是相对的,不精确性才是绝对的。知识工程需要各种适应不同类的不精确性特点的不精确性知识描述方法和推理方法。14师氏食狮史师氏食狮史l石室诗士施氏,嗜狮,誓食十狮。氏时时适市视狮。十时,适十狮适市。是时,适施氏适市。氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使恃拭石室。石室拭,氏始试食是十狮尸。食时,始识是十狮尸,实十石狮尸。试释是事。15知识的不确定性知识的不确定性l难于用精确的概念来描述事物 eg 高与不高 比秃子多一根头发的人仍是秃子l专家系统中的不确定性表现在证据或事实的不确定性,第二是规则的不确定性,第三是推理的不确定性。秃子悖
8、论16关于证据的不确定性关于证据的不确定性l证据的歧义性l证据的不完全性l证据的不精确性l证据的模糊性l证据的可信性l证据的随机性同意总理开会I saw a man with a telescope身高大约1.70米年轻如果乌云密布且电闪雷鸣,则很可能要下暴雨。17关于规则的不确定性关于规则的不确定性l构成规则前件的模式的不确定性l观察证据的不确定性l规则前件的证据组合的不确定性l规则本身的不确定性l规则结论的不确定性Eg 如果患者发高烧且常流清鼻涕,则患者感冒可能牛顿定律宏观正确微观不适合18推理的不确定性推理的不确定性l推理的不确定性是指:由于证据和规则的不确定性在推理过程中的动态积累和传
9、播而导致推理结论的不确定性。l需要采用某种不确定性的测度,并能在推理过程中来传递和计算这种不确定性的测度,最终得到结论的不确定性测度。l根据不确定性测度计算方法的不同,不确定推理可以有基于概率理论的不确定推理,基于可信度理论的不确定推理和基于模糊理论的不确定推理.19研究和发展研究和发展lShortliffe等人1975年结合MYCIN系统的建立提出了确定性理论。lDURA等人1976在PROSPECTOR的基础上给出了概率法。lDempster Shafter同年提出证据理论,Zadeh两年后提出了可能性理论,1983年提出了模糊逻辑。20基本概念基本概念(3/5)(3/5)表示问题:即采用
10、什么方法描述不确定性.一般有数值表示和非数值的语义表示方法.计算问题:主要指不确定性的传播和更新,也即获得新信息的过程.主要包括:l已知C(A),AB f(B,A),如何计算C(B)l已知C1(A),又得到C2(A),如何确定C(A)l如何由C(A1),C(A2)计算C(A1A2),C(A1A2)语义问题:指的是上述表示和计算的含义是什么,如何进行解释.21 不确定性的度量是指不确定的程度。根据不同的需要,往往采用不同的数据和方法来度量知识、证据和结论不确定性的程度,同时还需要事先规定它的取值范围。在确定一种量度方法及其范围时,应注意以下几点:(1)量度要能充分表达相应知识及证据不确定性的程度
11、。(2)量度范围的指定应便于领域专家及用户对不确定性的估计。(3)量度要便于对不确定性的传递进行计算,而且对结论算出的不确定性量度不能超出量度规定的范围。(4)量度的确定应当是直观的,同时应有相应的理论依据。22 不确定性的计算主要指不确定性的传递和更新,也即获得新信息的过程。主要包括如下三个方面:1)不确定性匹配算法及阈值的选择 目前常用的解决方法是,设计一个算法用来计算匹配双方相似的程度,另外再指定一个相似的“限度”,用来衡量匹配双方相似的程度是否落在指定的限度内。如果落在指定的限度内,就称它们是可匹配的,相应知识可被应用,否则就称它们是不可匹配的,相应知识不可应用。上述中,用来计算匹配双
12、方相似程度的算法称为不确定性匹配算法,用来指出相似的“限度”称来阈值。基本概念基本概念(4/5)(4/5)23 2)组合证据的不确定性算法 知识的前提条件既可以是简单条件,也可以是用合取或析取把多个简单条件连接起来构成的复合条件。进行匹配时,一个简单条件对应于一个单一的证据,一个复合条件对应于一组证据,称这一组证据为组合证据。目前,用的较多的有如下3种:(1)最大最小法 C(E1 AND E2)=minC(E1),C(E2)C(E1 OR E2)=maxC(E1),C(E2)(2)概率方法 C(E1 AND E2)=C(E1)C(E2)C(E1 OR E2)=C(E1)+C(E2)-C(E1)
13、C(E2)(3)有界方法 C(E1 AND E2)=max0,C(E1)+C(E2)-1 C(E1 OR E2)=min1,C(E1)+C(E2)上述的每一组公式都有相应的适用范围和适用条件。24 3)不确定性的传递算法 求解问题时,一般都需要通过多步推理才能得出结论,并求出结论的不确定性。在这一过程中,不确定性是逐步传递的。因此,为了得到最终结论的不确定性,必须设计不确定性的传递算法。在不同的系统中,由于面向的领域问题有不同特性,所采用不确定性的表示方法不同,因而所用的算法也不一样。不确性的传递一般包括两个子问题:一是在每一步推理中,如何把证据及知识的不确定性传递给结论;二是在多步推理中,如
14、何把初始证据的不确定性传递给最终结论。对于第一个子问题,在不同的不确定推理方法中所采用的处理方法各不相同,这将在下面的几节中分别进行讨论。对于第二个子问题,各种方法所采用的处理方法基本相同,即把当前推出的结论及其不确定性量度作为证据放入数据库中,供以后推理使用。25 4)结论不确定性合成 推理中有时会出现这样一种情况:用不同知识进行推理到得到了相同结论,但不确定性程度却不相同。此时,需要用合适的算法对它们进行合成。若有n条独立的证据i(i=1,2,n),分别求得结论H的不确定性为Ci(H)。则所有证据i的组合导致结论H的不确定性C(H),即定义算法g,使得 C(H)=gC1(H),C2(H),
15、Cn(H)在不同的不确定性推理方法中所采用的合成算法g各不相同,这将在以下的各节中分别予以讨论。26基本概念基本概念(5/5)(5/5)不确定推理方法的分类l形式化方法形式化方法:在推理一级扩展确定性方法在推理一级扩展确定性方法.逻辑方法逻辑方法:是非数值方法是非数值方法,采用多值逻辑、非单调逻采用多值逻辑、非单调逻辑来处理不确定性辑来处理不确定性新计算方法新计算方法:认为概率方法不足以描述不确定性认为概率方法不足以描述不确定性,出出现了确定性理论现了确定性理论,主观贝叶斯方法主观贝叶斯方法,证据理论和模糊证据理论和模糊逻辑等逻辑等新概率方法新概率方法:在传统的概率框架内在传统的概率框架内,采
16、用新的计算工采用新的计算工具以确定不确定性描述具以确定不确定性描述l非形式化方法非形式化方法:在控制一级上处理不确定在控制一级上处理不确定性性如制导回溯、启发式搜索等等如制导回溯、启发式搜索等等27l不确定性推理方法可分为形式化方法和非形式化方法。形式化方法是对确定性推理方法的扩展,它包括逻辑法、新计算法和新概率法。逻辑法是非数值方法,它采用多值逻辑和非单调逻辑来处理不确定性。新计算法认为一般的概率方法不足以描述不确定性,从而出现了确定性理论、主观贝叶斯方法和证据理论等方法。新概率法则试图在传统的概率论框架内,采用新的概率计算方法以适应不确定性描述。非形式化方法则是指启发性方法,通过在控制上处
17、理不确定性,但对不确定性没有给出明确的概念。28常见不确定性推理方法的基本思想常见不确定性推理方法的基本思想l信念网络()信息网络也称贝叶斯网络,是由 年给出的,属于证据推理中的贝叶斯家族,使用概率论方法。信念网络是无圈有向图(),其中结点都是变元,弧表示相关变元间的依赖关系。变元有一些取值对应于互不相同的假设或观察。依赖性强度由条件概率确定。由于通常的概率推理计算量很大,信念网络理论试图利用问题中的独立性信息减少计算量。信念网络提供了一种有效机制利用和检测独立性,从而为古老的概率推理注入了新的活力。该方法现已广泛应用,成为最有影响的不确定性推理方法。沿着这一思路,提出了概率相似性网络理论,相
18、似性网络可以利用更多的独立性信息。29l确定因子方法()在专家系统出现之前,概率论、证据理论和模糊集合论已经得到很大发展。当专家系统研究开始时,研究人员试图发展适合于基于规则的知识密集型系统不确定性管理方案。年代早期,提出了著名的确定因子方法,并用于处理系统中的不确定性信息。l在系统中,知识库是一组形如:证据()假设的规则组成,其中,表示在给定观察下假设的可信度。l可信度可以通过两个函数计算:()(,)。其中,(,)表示:证据成立时,假设相信程度的增加;(,)表示:证据成立时,假设被怀疑程度的增加。的值,表示的否定被确认,表示被确认。值得指出的是,证明了确定因子的原始定义与其综合函数是不协调的
19、,并且提出了确定因子的一种概率解释。指出的修正确定因子理论是理论的一个特殊情形。30l主观贝叶斯方法主观贝叶斯方法最早用于探矿专家系统的设计。主观贝叶斯方法除了使用通常的贝叶斯公式外,还使用一种变形的贝叶斯公式来计算在给定观察下某一假设成立的概率。新的公式基于更多的条件独立性假设。31l证据理论证据理论又称理论,最早由 在年代提出,年代经 发展成现在的形式。证据理论的提出旨在解决概率论推理的两上困难:概率论不能很好地表示无知,一个信念与其否定的主观概率之和为。事实上,概率论推理的两个困难是有密切联系的:无知使得我们对某一命题及其否定的相信程度之和可能不为;而和不为说明信念中有无知。证据理论用两
20、个数值信任度和似然度来表示不确定性,信任度相当于概率的下界,似然度相当于概率的上界。32l可能性理论可能性理论是基于模糊集合论提出的一种不确定性推理方法,后经和等人发展,成为一种重要的推理方法。可能性理论能处理模糊不确定性和不完全信息,其表示不确定性信息的手段是使用可能性度量和必然性度量。尽管从度量上看,可能性理论的度量是证据理论度量的特例,但是这不等于说可能性理论是证据理论的一个特例。事实上,可能性理论具有自己的传播、修正手段,它所处理的对象是带有模糊性的信息。33l粗略集理论粗略集理论是 年提出的一种处理不确定性的方法。该理论特别适合于处理知识获取过程中的不致性。在粗略集理论中,计算一个划
21、分的上、下似是基本的研究问题。基于上、下近似,两组不同的规则集就可以算出来,这就是确定性规则和可能性规则。确定性规则可以使用经典逻辑进行演算。可能性规则由一些数据(其中可能有冲突)支持。可能性可以使用经典逻辑或者任何一种不确定处理方法进行处理。该方法的一个优点是确定性规则和可能性规则可以分开来处理,另一个优点是不需关于数据的定量化信息。34l非单调推理经典的非单调推理方案主要研究在信息或知识不完全情况下如何推出一些合理的可错的结论问题。因此,非单调推理属于定性不确定性推理的范畴。由于大多数非单调推理方案缺乏信念强度的评价手段,因此非单调推理与其它不确定性推理的结合研究逐渐活跃起来。35不确定性
22、推理方法不确定性推理方法确定性理论主观贝叶斯方法证据理论36一一.确定性理论确定性理论 1975年,肖特里菲(E.H.Shortliffe)提出一种不确定性推理方法,并应用于专家系统MYCIN。它以产生式作为知识表示方法,以确定性因子或称可信度作为不确定性的度量。371.1.知识的不确定性表示知识的不确定性表示 规则以AB表示,其中前提A可以是一些命题的合取或析取。可信度CF(B,A)作为规则不确定性度量,它的作用域为-1,1。定义4.11 规则AB,结论B的可信度被定义为)(P)|(P)(P)(P)|(P)(P)|(P)(P1)(P)|(P),(CFBABBBABBABBBABAB当当 CF
23、(B,A)的定义借用了概率,但它本身并不是概率。因为CF(B,A)可取负值,CF(B,A)+CF(B,A)不必为1甚至可能为0。38 定义4.12 CF(B,A)=MB(B,A)-MD(B,A)其中MB为信任增长程度,当MB(B,A)0时,有P(B|A)P(B),表示证据A的出现增加了对B的信任程度。MD为不信任增长程度,当MD(B,A)0时,有P(B|A)P(B),表示证据A的出现增加了对B的不信任程度。定义4.13其他若)(P1)(P)(P),|(Pmax1)(P,1),(MBBBBABHAB其他若)(P)(P)(P),|(Pmin0)(P,1),(MDBBBABHAB39 对于同一个证据
24、A,若存在n个互不相容的假设Bi(i=1,2,n),则1),(CF1HHini因此,若发现专家给出的可信度CF(B1,A)=0.6,CF(B2,A)=0.7,即出现B1和B2互不相容,则说明规则的信度是不合理的,应当进行适当调整。40 在确定性的逻辑推理过程中,前提(规则A B的左部A,也就是证据)要么为真,要么为假,不允许不真不假的情况出现。但是在很多不确定性推理问题中,前提或证据本身是不确定的,介于完全的真和完全的假之间。为了描述这种不确定性的程度,引入了证据的可信度。2.2.证据的不确定性表示证据的不确定性表示41 在推理过程中,不可避免要计算原始证据的与、或、非,还要计算多条规则的使用
25、对计算结果的综合影响。于是,在已知规则和原始证据的可信度度量的情况下,如何计算新的组合证据或规则的不确定性,就成了很关键的问题。在不确定性的传播与更新中,必须解决证据的与、或、非的不确定性计算问题。(1)组合证据的不确定性算法 CF(A1A2An)=minCF(A1),CF(A2),CF(An)CF(A1A2An)=maxCF(A1),CF(A2),CF(An)(2)证据“非”的计算 CF(A)-CF(A)(3)不确定性的传递算法:根据证据和规则的可信度求其结论的可信度。若已知CF(B,A)和证据的可信度CF(A),则结论的可信度CF(B)为 CF(B)=CF(B,A)max0,CF(A)3.
26、3.推理算法推理算法42 (4)多个独立证据推出同一假设的合成算法 如由规则A1B求得CF1(B),又使用规则A2B时,如何更新CF2(B)。或说已知CF(A1),CF(A2)以及CF(B,A1),CF(B,A2)来寻求合成的CF(B)。依(1)先计算出 CF1(B)CF(B,A1)max0,CF(A1)CF2(B)CF(B,A2)max0,CF(A2)进而规定其它情况当当)(CF)(CF0)(CF,0)(CF)(CF)(CF)(CF)(CF0)(CF,0)(CF)(CF)(CF)(CF)(CF)(CF21212121212121BBBBBBBBBBBBBBB43 在MYCIN系统基础上形成的
27、专家系统工具EMYCIN,对上式中的其他情况做了如下修改。在其他情况下|)(CF|,)(CF|min1)(CF)(CF)(CF2121BBBBB CF(B)的更新计算,也可这样来理解。已知CF(A),CF(B,A),B原来的可信度为CF(B),来求B的可信度更新值CF(B|A)。这时的计算可写成当CF(A)=1时,有其他情况当当),(CF)(CF0),(CF,0)(CF)(CF1)(,(CF)(CF0),(CF,0)(CF)(CF1)(,(CF)(CF)|(CFABBABBBABBABBBABBAB44EMYCIN系统中,其他情况下时|),(CF|,)(CFmin|1)(CF),(CF)|(C
28、FABBBABAB 当CF(A)0,可以CF(A)CF(B,A)作为对规则AB的可信度,而CF(B|A)的计算仍可使用CF(A)=1时的公式。但CF(A)1或|A|=0时,M(A)=0 62 由上述定义可知,只有单个元素组成的子集的情况下,其概率分配函数值才有可能大于0,有一个以上元素组成的子集的概率分配函数值均为0。对任何命题AD,其信任函数和似然函数分别为AsiisA)(M)(Bel)(M)(M)(BelDsDAsii,Pl(A)=1-Bel(A)=M(D)+Bel(A)Pl(D)=1-Bel(D)=1-Bel()=1从上面定义可知,对于任何AD及BD均有Pl(A)-Bel(A)=Pl(B
29、)-Bel(B)=M(D)它表示对A或B不知道的程度=163 利用Pl和Bel可以定义A的类概率函数f。定义4.19 A的类概率函数定义为 其中,|A|与|D|分别表示A 和U中元素的个数。由定义4.19,可以证明f(A)具有如下性质:(1)f()=0 (2)f(U)=1 (3)对于AU,有0f(A)1。64 2.知识的不确定性表示 在证据理论中知识用如下的规则表示 IF A THEN B=b1,bn CF=c1,cn 其中,A为条件,即可以是简单条件,也可以是多个子条件的逻辑组合;B为结论,b1,bn为该子集的元素;CF为规则强度,也用集合形式表示,bi与ci一一对应(i=1,2,n)。3.
30、证据的不确定性表示 不确定性证据A的确定性用CER(A)表示。对于初始证据,其确定性由用户给出;对于用前面推理所得结论作为当前推理的证据,其确定性由推理得到。CER(A)的取值范围为0,1,即0CER(A)1。当条件A为多个子条件的合取或析取得组合时,A=A1A2An,则A的确定性 CER(A)=minCER(A1),CER(A2),CER(An)A=A1A2An,则A的确定性 CER(A)=maxCER(A1),CER(A2),CER(An)65 3.推理算法 结论B的确定性可以通过以下步骤求出:(1)求出B的概率分配函数 对于规则IF A THEN B=b1,b2,bn CF=c1,c2,
31、cn则概率分配函数为:M(b1,b2,bn)=CER(A)c1,CER(A)c2,CER(A)cn 如果有两条规则支持同一结论B即 A1B=b1,b2,bn CF=c1,ck A2B=b1,b2,bn CF=c1,ck 则首先分别对每一条规则求出的概率分配函数:M1(h1,h2,hn)M2(h1,h2,hn)然后再用公式M=M1M2,求出B的概率分配函数。如果有n个规则支持同一结论B,则用公式M=M1M2Mn,求出B的概率分配函数。66 (2)求出Bel(B),Pl(B)和f(B)(3)按如下公式求B的确定性CER(B)CER(B)=MD(B/A)f(B)其中MD(B/A)是条件部分与证据匹配
32、度,定义为否则所要求的证据都出现如果 0,B 1,)/(MDAB6721世纪人工智能研究的一个新方向:不确定性人工智能不确定性人工智能的基础科学问题不确定性的计算机模拟68不确定性:不确定性:l随机性l模糊性l不完全性l不稳定性l不一致性不确定性的魅力!不确定性的魅力!随机性和模糊性的关联性随机性和模糊性的关联性69确定性和不确定性确定性和不确定性l精确数学是描述确定性规律的;精确数学是描述确定性规律的;l概率论是揭示随机现象的统计规律性,是对精确数学的突破,概率论是揭示随机现象的统计规律性,是对精确数学的突破,但不排斥概率统计模型可能转化为精确数学模型去处理;但不排斥概率统计模型可能转化为精
33、确数学模型去处理;l模糊集和粗糙集是揭示模糊现象的亦此亦彼的规律性,是对模糊集和粗糙集是揭示模糊现象的亦此亦彼的规律性,是对精确数学的突破,但不排斥模糊学模型可能转化为概率统计精确数学的突破,但不排斥模糊学模型可能转化为概率统计模型甚至精确数学模型去处理;模型甚至精确数学模型去处理;l随机性和模糊性是不确定性的两个方面,确定值可以被看作随机性和模糊性是不确定性的两个方面,确定值可以被看作是不确定性的特例。是不确定性的特例。70自然界中的不确定现象自然界中的不确定现象l随机l模糊l混沌l分形l复杂网络2022-12-771对不确定性现象的研究,并不一定非要分别从随机性对不确定性现象的研究,并不一
34、定非要分别从随机性和模糊性入手去认识,也不一定非要去区分随机体现和模糊性入手去认识,也不一定非要去区分随机体现在那里,模糊在哪里。在那里,模糊在哪里。72混沌混沌 混沌是一种确定性系统中出现的类似随机的过程。因为很难对初值确定得非常精确,近似相同的初值产生很不相同的貌似随机的结果。初值敏感性导致过程的不确定性和不可预测性。73l自动控制理论起始于20世纪20年代,经历了经典控制理论、现代控制理论和智能控制理论三个发展阶段。经典控制理论主要研究线性定常系统,解决单输入单输出问题,采用传递函数、频域法等方法,最终实现对系统的指定目标控制。到了60年代,由于航天技术的需要,诞生了现代控制理论,主要研
35、究多输入多输出系统,及非线性系统等,主要采用系统辨识理论、状态空间法等。经典控制理论和现代控制理论统称为传统控制理论,其共同特点是必须对被控对象或被控对象的系统行为建立数学模型。74l随着科学技术的不断进步和工业生产的不断发展,人们发现,许多现代军事和工业领域所涉及的被控过程和对象都难于建立精确的数学模型,甚至根本无法建立数学模型。如指挥自动化的效能评估、社会经济系统等。特别是对过程任务的控制时,传统控制理论遇到的最大困难就是不确定性问题。一种是系统模型的不确定性,是指系统本身,包括过程和环境,具有许多未知因素和不确定因素,无法建立数学模型,如炼钢炉内温度的控制。(送料、受潮、气压等);另一种
36、不确定性是环境本身的不确定性,主要是指环境与被控对象(过程)间存在着因果关系的强相互作用的场合,如连续生产过程和离散产品加工,这时,环境的变化不能被视为随机干扰。l 75l现代工业控制系统是高度复杂的系统,主要表现在:系统结构和参数具有高维性,时变性;传感器和执行器数量大;信息结构复杂,需要处理的数据量庞大等等。l 为提高社会和经济效益,往往提出多样性的高性能控制目标,如降低成本和能耗,提高产品质量等,然而多样性的高性能要求往往是相互矛盾的,如何实现有效综合,不仅要求生产过程控制自动化,而且希望实现生产与经营管理的综合自动化。对于与控制对象有强相互作用,非结构化和不确定的环境,传统控制理论常常
37、显得无能为力,而促使人们去探索控制理论的新途径。于是,智能控制应运而生。76混沌混沌 蝴蝶效应:亚马逊河热带雨林中的一只蝴蝶扇动了两下翅膀,可能两周之后会引发美国德克萨斯州的一场龙卷风。“失之毫厘,差之千里”。初始条件的微小的差别能引起结果的巨大的差异。77英国海岸线有多长?78欧几里得几何学的研究对象是具有特征长度的几何物体:一维空间:线段,有长度,没有宽度;二维空间:平行四边形,有周长、面积;三维空间:球,表面积、体积;l自然界中很多的物体具有特征长度,诸如:人有高度、山有海拔高度等。l有一类问题却比较特别,曼德布罗特Mandelbrot就提出了这样一个问题:英国的就提出了这样一个问题:英
38、国的海岸线有多长?海岸线有多长?79l也许你会认为,这个问题太简单了,要测量海岸线那还不容易,利用地图或航空测量都能获得答案。l但是,1967年在国际权威的美国科学杂志上发表了一篇划进代的的论文,它的标题就是英国的海岸线有多长?统计自相似性与分数维数中,文章作者曼德布罗(Beonit Mandelbrot)是一位当代美籍法国数学家和计算机专家,当时正在纽约的IBM公司的活特生研究中心工作,而他的答案却让你大吃一惊:他认为,无论你做得多么认真细致,你都不可能得到准确答案,因为根本就不会有准确的答案。英国的海岸线长度是不确定的!它依赖于测量时所用的尺度8081英国海岸线有多长?82认知的尺度认知的
39、尺度83复杂网络:Internet84视觉的不视觉的不确定性:确定性:85视觉的错觉:视觉的错觉:86认知的不确定性:认知的不确定性:87思维的不确定性 思维有精确的一面,更有不 确定的一面。人类习惯于用自然语言进行思维,思维的结果往往是可能如何、大概如何等定性的结论。人类还擅长通过联想的、直觉的、创造的形象思维来思考,很少象计算机一样做精确的数学运算或者逻辑推理,但是这并不妨碍人类具有发达的、灵活的智能,并不妨碍人类具有发达的、灵活的模式识别能力。88模式识别(人脸识别)的不确定性模式识别(人脸识别)的不确定性l身份识别身份识别l表情识别表情识别l性别识别性别识别l年龄识别年龄识别l性格识别
40、性格识别l人种识别人种识别l.89文字识别:文字识别:l内容识别内容识别l写字人身份识别写字人身份识别l性别识别性别识别l年龄识别年龄识别l风格(性格)识别风格(性格)识别l字体识别字体识别l.90手语手语(Sign language)识别:识别:l内容识别内容识别l图形识别图形识别l身份识别身份识别l年龄识别年龄识别l风格识别风格识别l.91声音识别:声音识别:l内容识别内容识别l说话人身份识别说话人身份识别l性别识别性别识别l年龄识别年龄识别l性格识别性格识别l字体识别字体识别l.l语调(情感)识语调(情感)识别别l音乐识别音乐识别l方言识别方言识别l语种识别语种识别l.92纹理识别:纹理
41、识别:静态纹理静态纹理l指纹指纹l脸纹脸纹l声纹声纹l皮、石、木、布纹皮、石、木、布纹l草地、森林、海滩草地、森林、海滩l.动态纹理动态纹理l海浪海浪l喷泉喷泉l烟雾烟雾l云彩云彩l瀑布瀑布l.93三、不确定性人工智能的基础科学问题94不确定性人工智能的基础科学问题:不确定性人工智能的基础科学问题:不确定性知识的形式化表达问题,即不确定性知识的表示问题。不确定性知识的最好表示,就是使用自然语言表示!要不确定性知识的最好表示,就是使用自然语言表示!要研究自然语言基元的定性定量转换模型,给出不确定性研究自然语言基元的定性定量转换模型,给出不确定性转换模型的形式化方法。转换模型的形式化方法。95 研
42、究人类认知活动的切入层次人脑亚细胞的化学、电学层次人脑的神经构造层次自然语言层次数学语言层次符号语言层次脑科学神经科学不确定性不确定性人工智能人工智能数学传统人工智能96基本理念:基本理念:l人脑的思维基本上不是纯数学的;人脑的思维基本上不是纯数学的;l自然语言具有不可替代性;自然语言具有不可替代性;l自然语言中的基元是语言值,它对应的概念,是人类自然语言中的基元是语言值,它对应的概念,是人类思维的基本细胞。思维的基本细胞。l数据和概念之间的转换数据和概念之间的转换是不确定性人工智能研究的基是不确定性人工智能研究的基石。石。97不确定性的度量不确定性的度量熵熵l热力学熵 dS=dQ/T 熵增加
43、原理l玻尔兹曼熵 分子运动的无序程度和混乱程度l仙农熵 H=-k Pi log Pil拓扑熵ll云模型中的熵和超熵98云模型(云模型(Cloud model)l定性和定量转换模型l在众多的不确定性中,随机性和模糊性是最基本的。针对概率论和模糊数学在处理不确定性方面的不足,1995年我国工程院院士李德毅教授在概率论和模糊数学的基础上提出了云的概念,并研究了模糊性和随机性及两者之间的关联性。自李德毅院士等人提出云模型至今短短的十多年,其已成功的应用到数据挖掘、决策分析、智能控制等众多领域。99云发生器和逆向云发生器100正态云模型的数学解释http:/ 正态分布和正态隶属函数是正态云的特例。102
44、云滴的概率密度分布函数:yHEyyExyHxfd2)(2)(exp21)(2e2n22xeX103l期望Ex是云在论域空间分布的期望,是最能够代表定性概念的点,或者说是这个概念量化的最典型样本;熵En代表定性概念的可度量粒度,熵越大,通常概念越宏观,也是定性概念不确定性的度量,由概念的随机性和模糊性共同决定.一方面,En是定性概念随机性的度量,反映了能够代表这个定性概念的云滴的离散程度;另一方面,又是定性概念亦此亦彼性的度量,反映了在论域空间可被概念接受的云滴的取值范围;超熵He是熵的不确定性度量,即熵的熵,由熵的随机性和模糊性共同决定。云滴分布的期望:Ex104云滴的方差:22222e2n2
45、e22x22x2e2ne2e2n22xe2xd2exp21d2)(exp21d2)(exp)(21d2)(exp21d2)(2)(exp21d)(enHEtttyHEyyHxyExyExyHEyyHyHEyyExyHxExXD105云滴的隶属度的不确定性云滴的隶属度的不确定性根据算法产生的确定度Y有的概率密度为与云模型的三个特征参数无关!elseyyyf,010,)ln()(21106“云滴的确定度和数字特征无关云滴的确定度和数字特征无关”的含义的含义l任何定性概念,尽管它们各自有不同的实际含义,即任何定性概念,尽管它们各自有不同的实际含义,即概念的量化值概念的量化值云滴在数域的分布有不同的物
46、理量云滴在数域的分布有不同的物理量纲,也尽管所有云滴表现出不同的确定度,不同的人纲,也尽管所有云滴表现出不同的确定度,不同的人会有不同的认识,不同的时期也会有不同的认识,但会有不同的认识,不同的时期也会有不同的认识,但是确定度的统计分布,总体上是同一个形态。是确定度的统计分布,总体上是同一个形态。l语言值表示的概念,抛弃它们具体的物理含义,反映语言值表示的概念,抛弃它们具体的物理含义,反映在人们脑海中的认知规律是一致的。认知的不确定性在人们脑海中的认知规律是一致的。认知的不确定性中仍然有着确定的规律性,即认识上的共同性。中仍然有着确定的规律性,即认识上的共同性。107正态分布的前提:正态分布的
47、前提:中心极限定理从理论上阐述了正态分布的条件,中心极限定理的简单直观说明:如果决定某一随机事件结果的是大量微小、独立的随机因素之和,并且每一因素的单独作用相对均匀的小,没有一种因素起到主导作用,那么这个随机变量服从正态分布。108正态云模型弱化了正态分布的前提条件109论正态云模型的普适性 中国工程科学2004年第6卷第8期 P28-34110概念的粒度和粒度计算:用熵作为概念的粒度,进行粒度计算;在不同尺度上的概念,反映了确定性和不确定性之间的转换。111四、不确定性的计算机模拟112感知感知视觉视觉记忆记忆记忆随时间而淡忘形成的印象记忆随时间而淡忘形成的印象=0.1=0.8=1.2=1.
48、5=0.52022-12-7113随着时间的推移,印象中的爱因斯坦只剩下一双随着时间的推移,印象中的爱因斯坦只剩下一双深邃的眼睛,而印象中萨达姆也只剩下那浓密的深邃的眼睛,而印象中萨达姆也只剩下那浓密的胡子。胡子。记忆随时间而淡忘形成的印象记忆随时间而淡忘形成的印象114厌恶 愤怒 快乐 轻蔑 悲伤 恐惧 惊讶 标准像 对一个人不同表情的记忆形成标准像115哭脸笑脸哭笑不得3分笑7分哭7分笑3分哭势场图混合势场图逆变换后的像素图像素图116用场运算急剧降维提取主特征用场运算急剧降维提取主特征(a)人脸128*128个象素特征 (b)48个重要特征点 128*128 48!117影响因子对特征点
49、提取的作用影响因子对特征点提取的作用(a)250个特征点,=0.02 (b)70个特征点,=0.04 (c)28个特征点,=0.09 118l当=0.02时,简化人脸图像包含250个特征点,能够很好地反映原始人脸图像的细节信息;而当=0.09时,简化人脸图像仅包含28个特征点,只能大致描述眼睛、嘴巴、眉毛和鼻子根部等面部器官的整体分布特性。在某种意义上,不同值所对应的简化人脸图像就好像从不同距离观察人脸,各有所见之景象,通过推拉镜头,可以改变观察的距离,形成不同粒度的人脸视图。越小,特征点个数越多,对原始人脸图像的描述越细节;反之,越大,特征点个数越少,对人脸图像信息的描述越宏观、越概括。11
50、9一幅一幅128128*128128*256256灰度级的黑白图象,可以认为是灰度级的黑白图象,可以认为是128128*128128个象素点个象素点上的灰度形成的场上的灰度形成的场 (a)标准人脸图像 (b)数据场等势线分布 c)二维势场分布的三维视图 120l取自日本女性面部表情数据库(JAFFE人脸数据库)的一幅标准化人脸图像的数据场等势线分布,原始图像尺寸为256256像素、256级灰度,标准化后的人脸图像为6464像素。从图中可以看出,势场分布的高势区位于脸颊、额头和鼻梁等灰度较大的区域,换言之,人脸图像数据势场的空间分布可以突显脸颊、额头和鼻梁等脸部区域。121非线性扩张非线性扩张: