1、第四章第四章 不确定推理方法不确定推理方法 在日常生活中,人们通常所遇到的情况是信息不够完善、不够精确,即所掌握的知识具有不确定性。人们就是运用这种不确定性的知识进行思维、推理,进而求解问题,所以,为了解决实际问题,必须对不确定知识的表示、推理过程等进行研究,这就是本章将要讨论的不确定推理方法。有关不确定性知识的表示及推理方法目前有很多种,但比较重要且比较著名的方法主要有可信度方法、主观Bayes方法和证据理论方法。本章将在概述不确定推理方法及其概念的基础上,着重对这三种方法进行较详细的讨论。4.1 不确定推理概述 n4.1.1 不确定推理的概念 所谓推理推理就是从已知事实出发,运用相关的知识
2、(或规则)逐步推出结论或者证明某个假设成立或不成立的思维过程。其中,已已知事实知事实和知识知识(规则)是构成推理的两个基本要素。已知事实是推理过程的出发点及推理中使用的知识,我们把它称为证据,而知识(或规则)则是推理得以向前推进,并逐步达到最终目标的根据。一个人工智能系统由总数据库、知识库和推理机构成。其中,总数据库就是已知事实的集合,而知识库即是规则库,是一些人们总结的规则的集合,推理机则是由一些推理算法构成,这些算法将依据知识库中的规则和总数据库中的事实进行推理计算。其中,知识库是人工智能系统的核心。4.1 不确定推理概述4.1.2 不确定推理方法的分类不确定推理方法的分类n目前,不确定推
3、理方法可以分为两大类,一类称为模型方法模型方法,另一类称为控制方法控制方法。n模型方法的特点模型方法的特点是把不确定的证据和不确定的知识分别与某种度量标准对应起来,并给出更新结论不确定性的合适的算法,从而构成相应的不确定性推理模型。不同的结论不确定性更换算法就对应不同的模型。下面介绍的几种不确定推理方法都属于模型法。n控制方法的特点控制方法的特点是通过识别领域中引起不确定性的某些特征及相应的控制策略来限制或减少不确定性系统产生的影响,这类方法没有处理不确定性的统一模型,其效果极大地依赖于控制策略,控制策略的选择和研究是这类不确定性推理方法的关键。启发式搜索、相关性制导回溯等是目前常见的几种控制
4、方法。4.1 不确定推理概述 由于概率论有着完善的理论,同时还为不确定性的合成与传递提供了现成的公式,因而被用来表示和处理知识的不确定性,成为度量不确定性的重要手段。这种纯粹依靠概率模型来表示和处理不确定性的方法称为纯概率方法或概率方法。纯概率方法虽然有严密的理论依据,但它却要求给出事件的先验概率和条件概率,而这些数据又不易获得,因而使其应用受到限制。为此,人们经过多年的研究,在概率论的基础上,发展了一些新的处理不确定性的方法,这些方法包括:可信度方法、主观Bayes方法和证据理论方法。本章的重点即是介绍这三种不确定推理方法。4.1 不确定推理概述n4.1.3 不确定推理中的基本问题不确定推理
5、中的基本问题 1不确定性的表示 不确定性主要包括两个方面,一是证据的不确定性,一是知识的不确定性。因而,不确定性的表示问题就包括证据表示和知识表示。证据不确定性的表示 对于由观察所得到的初始证据,其值一般由用户或专家给出;而对于用前面推理所得结论作为当前推理的证据,其值则是由推理中的不确定性传递算法计算得到。知识不确定性的表示 在表示具有不确定性的知识时,要考虑两个方面的因素:一是要将领域问题的特征比较准确的描述出来,满足问题求解的需要;另一个是要便于推理过程中对不确定性的推算。只要把这两方面因素考虑到,则相应的表示方法才能实用。4.1 不确定推理概述 2 2推理计算推理计算 不确定推理过程主
6、要包括不确定性的传递计算算法、组合证据不确定性算法和结论不确定性的更新或合成算法。假设以CF(E)表示证据E的不确定性程度,而以CF(H,E)表示知识(规则)EH的不确定性程度,则我们要解决的问题即是:(1)不确定性传递问题。(2)证据不确定性的合成问题。(3)结论不确定性的合成问题。4.1 不确定推理概述 3不确定性的量度不确定性的量度 在确定一种量度方法及其范围时,应注意以下几点:(1)量度要能充分表达相应知识及证据的不确定性程度。(2)量度范围的指定应便于领域专家及用户对证据或知识不确定性的估计。(3)量度要便于不确定性的推理计算,而且所得到的结论之不确定值应落在不确定性量度所规定的范围
7、之内。(4)量度的确定应当是直观的,同时应当有相应的理论依据。4.2 可信度方法 4.2.1 可信度的概念可信度的概念 所谓可信度可信度就是人们在实际生活中根据自己的经验或观察对某一事件或现象为真的相信程度。4.2 可信度方法4.2.2 知识不确定性的表示知识不确定性的表示 在基于可信度的不确定性推理模型中,知识是以产生式规则的形式表示的,知识的不确定性则是以可信度CF(H,E)表示的。其一般形式为 IF E THEN H (CF(H,E)(1)E是知识的前提条件,或称为证据。可以是简单条件,也可是复合条件。(2)H是结论,它可以是一个单一的结论,也可以是多个结论。(3)CF(H,E)是该条知
8、识的可信度,称为可信度因子(Certainty Factor)。在专家系统MYCIN中,CF(H,E)被定义为 CF(H,E)=MB(H,E)-MD(H,E)(4.2.1)4.2 可信度方法否则若P(H)-1P(H)-P(H),maxP(H/E)1P(H)1),(EHMB否则若P(H)-P(H)-P(H),minP(H/E)0P(H)1),(EHMD(4.2.2)(4.2.3)4.2 可信度方法4.2.3 证据不确定性的表示证据不确定性的表示 单个证据的不确定性获取方法 如果支持结论的证据只有一条,则证据可信度值的确定分两种情况:第一种情况是,证据为初始证据,其可信度的值一般由提供证据的用户直
9、接指定,指定的方法也是用可信度因子对证据不确定性进行表示,例如CF(E)=0.8表示证据E的可信度为0.8。第二种情况就是用先前推出的结论作为当前推理的证据,对于这种情况的证据,其可信度的值在推出该结论时通过不确定性传递算法计算得到(传递算法将在下面讨论)。证据E的可信度CF(E)也是在-1,1上取值。4.2 可信度方法 组合证据的不确定性的获取方法 如果支持结论的证据有多个,那么这多个证据间的关系有可能是合取的关系,也可能是析取关系。这多个证据构成一个组合证据。(1)当证据是多个单一证据的合取时,即E=E1E2E3En 若E1,E2,E3,En 各证据的可信度分别为CF(E1),CF(E2)
10、,CF(En),则 CF(E)=minCF(E1),CF(E2),CF(En)(4.2.5)(2)当证据是多个单一证据的析取时,即E=E1E2E3En 若E1,E2,E3,En 各证据的可信度分别为CF(E1),CF(E2),CF(En),则 CF(E)=max CF(E1),CF(E2),CF(En)(4.2.6)4.2 可信度方法4.2.4 不确定性的推理计算 只有单条知识支持结论时,结论可信度的计算方法 如果支持结论的知识只有一条,且已知证据E的可信度CF(E)和规则(知识)IF E THEN H 的可信度CF(H,E),则结论H的可信度计算公式如下:CF(H)=CF(H,E)max0,
11、CF(E)(4.2.7)4.2 可信度方法 多条知识支持同一结论时,结论不确定性的合成计算方法 若由多条不同知识推出了相同的结论,但可信度不同,则可用合成算法求出结论的综合可信度。由于对多条知识的综合可通过两两的合成实现,所以下面只考虑两条知识的情况。设有如下知识:IF E1 THEN H (CF(H,E1)IF E2 THEN H (CF(H,E2)则结论H的综合可信度可分如下两步算出:(1)利用公式(4.2.7)分别计算每一条知识的结论可信度CF(H):CF1(H)=CF(H,E1)max0,CF(E1)CF2(H)=CF(H,E2)max0,CF(E2)(2)用公式(4.2.8)求出E1
12、与E2对H的综合影响所形成的可信度CF1,2(H):4.2 可信度方法|)(H)CF|,(H)CFmin(|1(H)CF(H)CF(H)CF(H)CF(H)CF(H)CF(H)CF(H)CF-(H)CF(H)CF)(2121212121212,1HCF若CF1(H)0,F2(H)0若CF1(H)0,CF2(H)0(4.2.8)若CF1(H)与CF2(H)异号4.2 可信度方法 在已知结论原始可信度的情况下,结论可信度的更新计算方法 在某些情况下,如果已知证据E对结论H有影响,且知识IF E THEN H的可信度为CF(H,E),同时结论H原来的可信度为CF(H),那么如何求在证据E下结论H可信
13、度的更新值CF(H/E)呢?即已知规则 IF E THEN H (CF(H,E)及CF(H),求CF(H/E)。这时分三种情况进行讨论:(1)CF(E)=1时,即证据肯定出现时,|)E)CF(H,|,CF(H)min(|1CF(H)E)CF(H,CF(H)E)CF(H,E)CF(H,CF(H)CF(H)E)CF(H,-E)CF(H,CF(H)/(EHCF若CF(H)0,CF(H,E)0 若CF(H)0,CF(H,E)0(4.2.9)若CF(H)与CF(H,E)异号4.2 可信度方法(2)当0CF(E)1时,|)CF(E)E)CF(H,|,CF(H)min(|1CF(H)CF(E)E)CF(H,
14、CF(E)E)CF(H,CF(H)CF(E)E)CF(H,CF(H)CF(E)E)CF(H,CF(H)-CF(E)E)CF(H,CF(H)/(EHCF若CF(H)0,CF(H,E)0若CF(H)0,CF(H,E)0(4.2.10)若CF(H)与CF(H,E)异号(3)当CF(E)0时,规则IF E THEN H 不可使用,对结论H的可信度无影响。实际上,在MYCIN系统中就规定,当CF(E)0.2时,规则IF E THEN H 不可使用。这里介绍了结论可信度的合成算法和更新算法,这两种方法本质上是一致的,但对不同前提条件的题,使用不同的方法,解题的效果或难易程度不同。有些题目使用合成法求解就比较容易,而有些题目就需要使用更新法。4.2 可信度方法4.2.5 可信度方法应用举例 在上节我们介绍了计算结论可信度的两种方法合成法和更新法。这两种方法其实本质上是一样的,下面通过举例分别说明如何利用合成法和更新法,求解不同前提条件下的结论可信度获取问题,并通过例子说明这两种方法的一致性。相关的举例教材给出了多个较详细的例子,请参阅教材