贝叶斯网络的特性课件.ppt

上传人(卖家):三亚风情 文档编号:3048548 上传时间:2022-06-26 格式:PPT 页数:49 大小:661.50KB
下载 相关 举报
贝叶斯网络的特性课件.ppt_第1页
第1页 / 共49页
贝叶斯网络的特性课件.ppt_第2页
第2页 / 共49页
贝叶斯网络的特性课件.ppt_第3页
第3页 / 共49页
贝叶斯网络的特性课件.ppt_第4页
第4页 / 共49页
贝叶斯网络的特性课件.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

1、贝叶斯网络初步内容提纲内容提纲n何谓贝叶斯网络?n贝叶斯网络的语义n条件分布的有效表达n贝叶斯网络中的精确推理n贝叶斯网络中的近似推理n课后习题、编程实现及研读论文7.1 何谓贝叶斯网络?何谓贝叶斯网络?A.贝叶斯网络的由来B.贝叶斯网络的定义C.贝叶斯网络的别名D.独立和条件独立E.贝叶斯网络示例“Above all else, guard your heart, for it is the wellspring of life.” from Proverbs 4:23 NIVA. 贝叶斯网络的由来贝叶斯网络的由来 n全联合概率计算复杂性十分巨大n朴素贝叶斯太过简单n现实需要一种自然、有效的

2、方式来捕捉和推理不确定性知识n变量之间的独立性和条件独立性可大大减少为了定义全联合概率分布所需的概率数目B. 贝叶斯网络的定义贝叶斯网络的定义 n是一个有向无环图(DAG)n随机变量集组成网络节点,变量可离散或连续n一个连接节点对的有向边或箭头集合n每 节 点 Xi都 有 一 个 条 件 概 率 分 布 表 :P(Xi|Parents(Xi),量化其父节点对该节点的影响C. 贝叶斯网络的别名贝叶斯网络的别名 n信念网(Belief Network)n概率网络(Probability Network)n因果网络(Causal Network)n知识图(Knowledge Map)n图模型(Gra

3、phical Model)或概率图模型(PGM)n决策网络(Decision Network)n影响图(Influence Diagram)D. 独立和条件独立独立和条件独立WeatherCavityCatchToothachen Weather和其它3个变量相互独立n 给定Cavity后,Toothache和Catch条件独立E. 贝叶斯网络示例贝叶斯网络示例BurglaryEarthquakeMaryCallsJohnCallsAlarm B EP(A) t t t f f t f f0.950.940.290.001 AP(J) t f0.900.05 AP(M) t f0.700.01

4、P(B) 0.001P(E) 0.0027.2 贝叶斯网络的语义贝叶斯网络的语义n贝叶斯网络的两种含义贝叶斯网络的两种含义n对联合概率分布的表示 构造网络n对条件依赖性语句集合的编码 设计推理过程n贝叶斯网络的语义贝叶斯网络的语义P(x1,., xn) = P(x1|parent(x1) . P(xn|parent(xn)贝叶斯网络的语义公式计算示例:贝叶斯网络的语义公式计算示例: n试计算:报警器响了,但既没有盗贼闯入,也没有发生地震,同时John和Mary都给你打电话的概率。n解: P(j,m,a,b,e) = P(j|a)P(m|a)P(a|b,e) P(b) P(e) = 0.90.7

5、0.0010.9990.998 = 0.00062 = 0.062%贝叶斯网络的特性:贝叶斯网络的特性: n作为对域的一种完备而无冗余的表示,贝叶斯网络比全联合概率分布紧凑得多nBN的紧凑性是局部结构化局部结构化(Locally structured, 也称稀疏稀疏, Sparse)系统一个非常普遍特性的实例nBN中每个节点只与数量有限的其它节点发生直接的直接的相互作用n假设节点数n=30, 每节点有5个父节点,则BN需30 x25=960个数据,而全联合概率分布需要230= 10亿个!贝叶斯网络的构造原则:贝叶斯网络的构造原则: n首先,添加“根本原因根本原因”节点n然后,加入受它们直接影响

6、的变量直接影响的变量n依次类推,直到叶节点叶节点,即对其它变量没有直接因果影响的节点n两节点间的有向边的取舍原则:更高精度概率的重要性与指定额外信息的代价的折衷n“因果模型”比“诊断模型”需要更少的数据,且这些数据也更容易得到贝叶斯网络中的条件独立关系:贝叶斯网络中的条件独立关系: n给定父节点,一个节点与它的非后代节点非后代节点是条件独立的n给定一个节点的父节点、子节点以及子节点的父节点马尔可夫覆盖马尔可夫覆盖(Markov blanket),这个节点和网络中的所有其它节点是条件独立的“But his delight is in the law of the LORD, and on his

7、 law he meditates day and night.” From Psalms 1:2 NIVU1UmXZ1jZnjY1Yn【说明】:给定节点X的父节点U1. Um,节点X与它的非后代节点(即Zij)是条件独立的。U1UmXZ1jZnjY1Yn【说明】:给定马尔可夫覆盖(两圆圈之间的区域),节点X和网络中所有其它节点都是条件独立的。7.3 条件概率分布的有效表达条件概率分布的有效表达 Cold Flu MalariaP(Fever)P(Fever) F F F F F T F T F F T T T F F T F T T T F T T T0.00.90.80.980.40.94

8、0.880.9881.00.10.20.02 = 0.2 X 0.10.60.06 = 0.6 X 0.10.12 = 0.6 X 0.20.012 = 0.6 X 0.2 X 0.1已知:P(fever | cold, flu, malaria) = 0.6 P(fever | cold, flu, malaria) = 0.2 P(fever | cold, flu, malaria) = 0.1,可利用“噪声或噪声或”(Noisy-OR)关系得到下表:包含连续变量的贝叶斯网络包含连续变量的贝叶斯网络Hybrid BNSubsidyHarvestBuysCost S HP(C) t h f

9、 h高斯分布高斯分布高斯分布高斯分布 CP(B) c S型函数型函数P(S) xP(H) 高斯分布高斯分布离散随机变量:离散随机变量:Subsidy, Buys; 连续随机变量:连续随机变量:Harvest, Cost.线性高斯分布:nP(c | h, subsidy) = N(ath + bt, t2)(c) = 1/ (t21/2) e 1/2c-(ath + bt)/tnP(c | h, subsidy) = N(afh + bf, f2)(c) = 1/ (f21/2) e 1/2c-(afh + bf)/t S型函数(Sigmoid function)np(buys | Cost =

10、 c) = 1 / 1 + exp-2(-u+)/ 7.4 贝叶斯网络中的精确推理贝叶斯网络中的精确推理变量分类:n证据变量集E 特定事件e, n查询变量Xn非证据变量集 Y隐变量(Hidden variable)n全部变量的集合U = x E Y(1)通过枚举进行推理)通过枚举进行推理BurglaryEarthquakeMaryCallsJohnCallsAlarm B EP(A) t t t f f t f f0.950.940.290.001 AP(J) t f0.900.05 AP(M) t f0.700.01P(B) 0.001P(E) 0.002n已知,一个事件e = JohnCa

11、lls = true, and MaryCalls = true,试问出现盗贼的概率是多少? n解:解:P(X|e) = P(X,e) = yP(X,e,y) 而P(X,e,y)可写成条件概率乘积的形式。 因此,在贝叶斯网络中可通过计算条件概率的乘积并求和来回答查询。 P(Burgary | JohnCalls = true, MaryCalls = true)简写为: P(B | j, m) = P(B, j, m) = eaP(B, e, a, j, m) = ea P(b)P(e)P(a|b,e)P(j|a)P(m|a) = P(b) e P(e) a P(a|b,e)P(j|a)P(m

12、|a)+P(b)0.01P(e)0.002P(e)0.998P(a|b,e)0.95P(a|b,e)0.05P(a|b,e)0.94P(a|b,e)0.06P(m|a)0.70P(j|a)0.90P(j|a)0.05P(j|a)0.90P(j|a)0.05P(m|a)0.70P(m|a)0.01P(m|a)0.01P(b | j, m)的自顶向下的计算过程nP(B | j, m) = P(B, j, m) = eaP(B, e, a, j, m)= ea P(b)P(e)P(a|b,e)P(j|a)P(m|a)= P(b) e P(e) a P(a|b,e)P(j|a)P(m|a)= 0.00

13、10.002(0.950.90.7 + 0.050.05 0.01) + 0.998 (0.94 0.9 0.7+0.06 0.05 0.01) = 0.00059224+P(b)0.999P(e)0.002P(e)0.998P(a|b,e)0.29P(a|b,e)0.71P(a|b,e)0.001P(a|b,e)0.999P(m|a)0.70P(j|a)0.90P(j|a)0.05P(j|a)0.90P(j|a)0.05P(m|a)0.70P(m|a)0.01P(m|a)0.01P(b | j, m)的自顶向下的计算过程nP(B | j, m) = P(B, j, m) = eaP(B, e

14、, a, j, m)= ea P(b)P(e)P(a|b,e)P(j|a)P(m|a)= P(b) e P(e) a P(a|b,e)P(j|a)P(m|a)= 0.9990.002(0.290.90.7 + 0.710.05 0.01) + 0.998 (0.001 0.9 0.7+0.999 0.05 0.01) = 0.0014919因此,P(B|j, m) = 即在John和Mary都打电话的条件下,出现盗贼的概率约为28%。Example: Tree-Structured Bayesian NetworkDABCFEG p(a, b, c, d, e, f, g) is modele

15、d as p(a|b)p(c|b)p(f|e)p(g|e)p(b|d)p(e|d)p(d) ExampleDABcFEgSay we want to compute p(a | c, g)ExampleDABcFEgDirect calculation: p(a|c,g) = S Sbdef p(a,b,d,e,f | c,g)Complexity of the sum is O(m4)ExampleDABcFEgReordering: S Sd p(a|b) S Sd p(b|d,c) S Se p(d|e) S Sf p(e,f |g)ExampleDABcFEgReordering: S

16、 Sb p(a|b) S Sd p(b|d,c) S Se p(d|e) S Sf p(e,f |g)p(e|g)ExampleDABcFEgReordering: S Sb p(a|b) S Sd p(b|d,c) S Se p(d|e) p(e|g)p(d|g)ExampleDABcFEgReordering: S Sb p(a|b) S Sd p(b|d,c) p(d|g)p(b|c,g)ExampleDABcFEgReordering: S Sb p(a|b) p(b|c,g)p(a|c,g)Complexity is O(m), compared to O(m4)(2)变量消元算法)

17、变量消元算法n消除重复计算,提高枚举算法的效率 n保存中间结果,以备多次使用n从右到左(在树结构中为自底向上)的次序计算BN的计算公式n算法过程:参见人工智能:一种现代方法中的第14章14.4.2节(3)Clustering算法(算法(Joint Tree算法)算法)n单独节点联合起来形成Cluster节点,使得BN结构成为一棵多树多树(Polytree)n多树单连通网络单连通网络,即任何两节点间至多只有一条路径相连 n概率推理包含命题逻辑推理作为其特殊情况,故BN的推理是一个NP问题问题n在多连通的BN结构中,及时每个节点的父节点个数有固定的界限,在最坏的情况下,变量消元算法仍可能具有指数级

18、时间和空间复杂度多连通网络及其CPT:CloudyRainWetGrassSprinkler S RP(W) t t t f f t f f0.990.900.900.00 CP(S) t f0.100.50P(C) 0.50 CP(R) t f0.800.20等价的联合树及其CPT:CloudySpr+RainWetGrass S + RP(W) t t t f f t f f0.990.900.900.00P(C) 0.507.5 贝叶斯网络的近似推理贝叶斯网络的近似推理n大规模多连通大规模多连通BN的精确推理是不可操作的,的精确推理是不可操作的, 必须通过近似推理来解决。必须通过近似推理

19、来解决。n后验概率计算的主要采样方法后验概率计算的主要采样方法n直接采样方法n马尔可夫链蒙特卡罗(马尔可夫链蒙特卡罗(MCMC)方法)方法n变分法(Variational method)n环传播(Loopy propagation)方法 直接采样方法:直接采样方法:n直接采样算法n拒绝采样(Rejection sampling)算法n似然加权(Likelihood weighting)算法上述方法的详细步骤请参见:n人工智能:一种现代方法第14章14.5.1节nBerkeley大学Russell等人制作的PPT http:/aima.cs.berkeley.edu/马尔可夫链蒙特卡罗(马尔可夫

20、链蒙特卡罗(MCMC)算法思想)算法思想:n对前一个事件进行随机改变而生成事件样本nBN为每个变量指定了一个特定的当前状态n下一个状态是通过对某个非证据变量Xi进行采样来产生,取决于Xi的马尔可夫覆盖中的变量当前值nMCMC方法可视为:在状态空间中所有可能的完整赋值空间的随机走动每次改变一个变量,但是证据变量的值固定不变。 MCMC算法执行过程示例:算法执行过程示例:CloudyRainWetGrassSprinkler S RP(W) t t t f f t f f0.990.900.900.00 CP(S) t f0.100.50P(C) 0.50 CP(R) t f0.800.20【要求

21、要求】:查询:查询P(Rain | Sprinkler = true, WetGrass = true)的概率的概率 MCMC算法执行步骤:算法执行步骤:n证据变量证据变量Sprinkler, WetGrass固定为truen隐变量隐变量Cloudy和查询变量查询变量Rain随机初始化,例如, Cloudy = true, Rain = false,初始状态为:C=true, S=true, R=false, W=truen反复执行如下步骤: (1) 根据Cloudy的马尔可夫覆盖(MB)变量的当前值,对Cloudy采样,即根据P(Cloudy|Sprinkler= true, Rain=fa

22、lse)(即转移概率)来采样。即:P(C|S, R) = P(C,S,R) / P(S, R) = P(C)P(S|C)P(R|C) / P(C)P(S|C)P(R|C)+P(C)P(S|C)P(R|C) =(0.50.10.2) / 0.50.10.2+0.5 0.50.8=0.04762 再由计算机生成一个随机数q0,1(可参照概率统计中的随机数生成方法)。比较转移概率值与随机数q的大小,以决定是继续停留在原状态,还是转移到下一个新的状态。判别方法如下: if q q=0.0389,所以,Cloudy由true状态转移到新状态false,即采样结果为:Cloudy = false。故新的当

23、前状态为: C=false, S=true, R=false, W=true (2) 根据Rain节点的马尔可夫覆盖(MB)变量的当前值,对Rain采样,即根据P(Rain | Cloudy = false, Sprinkler = true, WetGrass = true)来采样。假设采样结果为:Rain = true。故新的当前状态为: C=false, S=true, R=true, W=true【注】: 上述过程中所访问的每一个状态都是一个样本,能对查询变量Rain的估计有贡献。 (3)重复上述步骤,直到所要求的访问次数N。若为true, false的次数分别为n1, n2,则查询解

24、为:Normalize() = 若上述过程访问了20个Rain=true的状态和60个Rain = false的状态,则所求查询的解为。CloudyRainSprinklerWetGrassRainCloudyCloudyRainCloudyRainSprinklerSprinklerSprinklerWetGrassWetGrassWetGrass马尔可夫链蒙特卡罗(马尔可夫链蒙特卡罗(MCMC)算法描述:)算法描述: function MCMC-Ask(X, e, bn, N) return P(X | e) local variables: NX, /关于查询变量X的向量计数,初值0 Z

25、,/bn中的非证据变量集 x, / bn的当前状态 利用Z中变量的随机值来初始化x; for j = 1 to N do N(x) N(x) + 1; /x是当前状态x中的查询变量X的值 for each Zi in Z do 给出Zi的马尔可夫覆盖MB(Zi),并根据P(Zi |mb(Zi) 来采样的Zi值; return Normalize(NX) /对NX进行归一化关于关于MCMC算法的补充说明:算法的补充说明:nMCMC方法的一种常用的简单变体为: 吉布斯采样器吉布斯采样器(Gibbs sampler)【注】:上述算法实质上就是吉布斯采样器。nMCMC是概率模型计算中的一种强有力的方法

26、,目前已发展出很多变形,包括: (1)模拟退火算法 (2)随机可满足性(Stochastic satisfiability)算法 课后请研读论文:课后请研读论文:1 Tom M. Mitchell. Does machine learning really work? AI Magazine, 18(3): 11-20, Fall 1997. whttp:/www.aaai.org/Library/Magazine/Vol18/18-03/vol18-03.html 【必读】2 C. Andrieu et al. Jordan. An introduction to MCMC for mach

27、ine learning. Machine Learning, 2003, 5: 5-43. 【可选读】【说明】 对于打算编程实现,或以后可能要用MCMC算法的同学,请认真研读文献2。 马尔可夫链和MCMC方法的中文参考书 :n盛骤 等. 概率论与数理统计(第三版). 高等教育出版社, 2001.n龚光鲁 等. 应用随机过程教程及在算法和智能计算中的随机模型. 清华大学出版社, 2004.“Do not judge, or you too will be judged. For in the same way you judge others, you will be judged, and with the measure you use, it will be measured to you .” From Matthew 7:1-2 NIV

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(贝叶斯网络的特性课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|