ImageVerifierCode 换一换
格式:PPT , 页数:36 ,大小:1.12MB ,
文档编号:7334409      下载积分:22 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-7334409.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(ziliao2023)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(6第六章贝叶斯信念网络资料课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

6第六章贝叶斯信念网络资料课件.ppt

1、1Bayes Classifier 贝叶斯分类2023/8/1622023/8/16一、何谓贝叶斯分类?数据挖掘中以贝叶斯定理为基础,用于分类的技术有朴素贝叶斯分类和贝叶斯信念网络两种。朴素贝叶斯分类假定一个属性值对给定类的影响独立于其他属性的值,即在属性间不存在依赖关系,也因此称为“朴素的”。贝叶斯信念网络也可以用于分类,它是图形模型。它优于朴素贝叶斯,它能够处理属性子集间有依赖关系的分类。它采用监督式的学习方式。二、基本知识32023/8/161、事件概率联合概率(joint probability)表示A事件和B事件同时发生的概率,P(A B)。边际概率(marginal probabi

2、lity)在A和B的样本空间中,只看A或B的概率,称之边际概率。条件概率(conditional probability)在发生A的条件下,发生B的概率,称为P(B|A)。男性(A1)女性(A2)合计赞成(B1)401050反对(B2)12030150合计160402004联合概率:P(男性,赞成)=P(A1B1)=40/200 =0.2边际概率:P(赞成)=P(B1)=P(A1B1)+P(A2B1)=0.25条件概率:P(赞成|男性)=P(B1|A1)=P(A1B1)/P(A1)=0.252023/8/16举例:2、乘法法则(Multiplicative rule)52023/8/16()(

3、)(),()()()()()()()()P ABP ABP B AP A BP AP BP ABP BP A BP AP B A3、独立事件设事件和事件满足以下条件:则称与为独立事件。()()()()0,()()()0,()()P ABP AP BP AP B AP BP BP A BP A或:三、贝叶斯定理6 表示先验概率(Prior probability)。表示后验概率(Posteriori probability),先验概率是由以往的数据分析得到的。根据样本数据得到更多的信息后,对其重新修正,即是后验概率。2023/8/16()()()()()()iiiiP CP X CP CXP C

4、 XP XP X()iP C()iP C X7例:旅客搭乘飞机必须经电子仪器检查是否身上携带金属物品。如果携带金属,仪器会发出声音的概率是97%,但身上无金属物品仪器会发出声音的概率是5%。已知一般乘客身上带有金属物品的概率是30%,若某旅客经过仪器检查时发出声音,请问他身上有金属物品的概率是多少?11111122()()()()()0.3 0.970.89260.3 0.970.7 0.05P X C P CP CXP C XP XP X C P CP X CP C2023/8/16解:设C1=“有金属物”,X=“仪器会发声”,则四、朴素贝叶斯分类的工作过程2023/8/16812121=,

5、nnnXx xxnA AAn、每个数据样本用一个 维特征向量表示,分别描述对 个属性样本的 个度量。2023/8/169122,()(),1,()()=()()()miijiiiiimC CCXXXCP C XP C Xjm jiP X CP CP C XP XP XP X CP C、假定有 个类。给定一个未知的数据样本,分类法将预测 属于具有最高后验概率(条件 下)的类。即是说,朴素贝叶斯分类将未知的样本分配给类,当且仅当根据贝叶斯定理()因此,由于对于所有类为常数,只需要()最大即可。2023/8/161013()()()1()=,nikikkiikkkiiikkkiiiP X CP x

6、CP x CsAP x CssAxCsC、假定属性值相互条件独立,即在属性间不存在依赖关系,这样,概率可以由训练样本估值,其中()如果是离散型属性,则其中是在属性上具有 的类 的训练样本数,而 是 中的训练样本数。2023/8/1611222()1()=(,)22(,)iiiiiiikkCkikCCCCikkCCkAxP x Cg xeCAg xA()如果是连续型属性,则通常假定该属性服从高斯分布。因而,其中,给定类 的训练样本属性 的值,是属性 的高斯密度函数。2023/8/16124()()()()()()()()iiiiiijjiiXCP X C P CCP X C P CP X CP

7、CXP X C P C、为对未知样本 分类,对每个类,计算。样本被指派到类,当且仅当即是说,被指派到最大的类。五、朴素贝氏分类的实例办信用卡意愿:项目项目1 12 23 34 45 56 67 78 89 91010性别性别男男女女女女男男女女女女女女男男男男女女年龄年龄4545314531452030203020202030203020302030314531453145314531453145200152023/8/161()=()()niiikikP X CP CP CP x C()162023/8/16训练样本中对于(女性,年龄介于3145之间,不具学生身份,收入中等)的个人,按照朴素

8、贝叶斯分类会将其分到办信用卡一类中。办卡的概率是(0.044)/(0.044+0)=1(正规化分类的结果P(会)/(P(会)+P(不会)。贝叶斯分类的优缺点:优点:计算速度最快的演算法;规则清楚易懂;独立事件的假设,大多数问题上不至于发生太大偏误;缺点:仅适用于类别变量;仅能应用于分类问题;假设变量间为独立互不影响,因此使用时需要谨慎分析变量间的相关性。2023/8/1617六、贝叶斯信念网络朴素贝叶斯分类假定类条件独立,即给定样本的类标号,属性的值相互条件独立。但在实践中,变量之间的依赖可能存在。贝叶斯信念网络说明联合条件概率分布,它允许在变量的子集间定义类条件独立性。它提供一种因果关系的图

9、形。2023/8/1618例如,得肺癌受其家族肺癌史的影响,也受是否吸烟的影响。2023/8/1619有向无环图条件概率图概率依赖双亲或直接前驱后继非后继独立节点:随机节点:随机变量变量一个简单的例子由左图给出,它对下雨(R)引起草地变湿(W)建模。天下雨的可能性为,并且下雨时草地变湿的可能性为;也许的时间雨下得不长,不足以让我们真正认为草地被淋湿了。在这个例子中,随机变量是二元的:真或假。存在的可能性草地变湿而实际上并没有下雨,例如,使用喷水器时。2023/8/16202023/8/1621()0.9P W R()0.2P WR 可以看到三个值就可以完全指定P(R,W)的联合分布。如果P(R

10、)=0.4,则P(R)=0.6。类似地,而 这是一个因果图,解释草地变湿的主要原因是下雨。我们可以颠倒因果关系并且做出诊断。例如,已知草地是湿的,则下过雨的概率可以计算如下:()0.8PWR()0.1PW R 2023/8/1622现在,假设我们想把喷水器()作为草地变湿的另一个原因,如下图所示。l节点有两个父节点和,因此它的概率是这两个值上的条件概率 。l我们可以计算喷水器开着草地会湿的概率。这是一个因果(预测)推理:2023/8/1623(,)P W R S2023/8/1624=0.1给定草地是湿的,我们能够计算喷水器开着的概率。这是一个诊断推理。2023/8/1625知道草是湿的增加了

11、喷水器开着的可能。现在让我们假设下过雨,我们有:注意,这个值比 小。这叫作解释远离explaining away;给定已知下过雨,则喷水器导致湿草地的可能性降低了。已知草地是湿的,下雨和喷水器成为相互依赖的。2023/8/1626()P S W2023/8/1627某水文站内装有一个小型的警报系统,与该警报是否拉响相关的因素有:洪水到来、地震发生,同时该系统还肩负着安全警报的功能,当水文站发生入室盗窃时,警报同样也会拉响。而洪水的到来与降雨情况有关,地震的发生会反映在地震监测仪的报告中。同时,入室盗窃也会带来地震监测仪的扰动。在水文站以往的数据库中,关于以上这些因素都能找到详细的记录。那么如何

12、从这些数据中挖掘出有用的信息,来帮助工作人员进行决策呢?七、贝叶斯信念网络应用实例七、贝叶斯信念网络应用实例:警报分析警报分析(马克威分析系统)(马克威分析系统)2023/8/16281、有向无环图2、条件概率表2023/8/1629先验概率条件概率表2023/8/16303、推理(1 1)当)当“警报拉响降雨警报拉响降雨 地震、入室盗窃、洪地震、入室盗窃、洪水水”:假设某时刻警报突然拉响了,且此时正在下雨,值班人员要判断此时发生地震、盗窃和洪水的概率分别是多少,以便采取相应的措施加以应对。首先,设置警报和降雨为已知节点,观察值分别为拉响和降雨;并且指定地震、入室盗窃和洪水为目标节点。然后计算

13、各种情况发生的后验概率。2023/8/16312023/8/1632节点名称节点名称降雨降雨警报警报状态取值降雨拉响已知变量的状态观察值状态取值状态取值不发生不发生发生发生概率值100 84.8015.20地震状态取值状态取值不发生不发生发生发生概率值100 12.0088.0入室盗窃状态取值状态取值不发生不发生发生发生概率值100 88.8011.2洪水(2 2)当)当“警报拉响降雨地震监测仪信号弱警报拉响降雨地震监测仪信号弱 地震、入室盗窃、洪水地震、入室盗窃、洪水”:假设,同样在下雨天,警报突然拉响,如果此时值班人员还注意到了地震监测仪的状态处于弱信号的范围,那么到底地震、入室盗窃、洪水

14、中哪个发生呢?解决的办法是设定:降雨节点处于降雨状态,警报节点处于拉响状态,地震监测仪处于弱状态;目标节点仍旧是地震、入室盗窃和洪水。然后,计算后验概率。2023/8/16332023/8/1634节点名称节点名称降雨降雨警报警报地震监测仪地震监测仪状态取值降雨拉响弱已知变量的状态观察值状态取值状态取值不发生不发生发生发生概率值100 100.000.00地震状态取值状态取值不发生不发生发生发生概率值100 8.3391.67洪水状态取值状态取值不发生不发生发生发生概率值100 91.678.33入室盗窃贝叶斯分类的优缺点:优点:在某些领域的应用上,其分类效果优于类神经网络和判定树。用于大型数据库,可以得出准确高且有效率的分类结果。缺点:一般而言,贝叶斯分类中的属性可以出现两种以上不同的值,而目标值则多半为两元的相对状态,如“是/否”,”好/坏”,”对/错”,”上/下”,“发生/不发生”等。2023/8/16352023/8/1636

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|