ImageVerifierCode 换一换
格式:PPTX , 页数:19 ,大小:535.27KB ,
文档编号:3325347      下载积分:18 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-3325347.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(数据挖掘第11讲关联算法Apriori课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

数据挖掘第11讲关联算法Apriori课件.pptx

1、数据挖掘课程培训关联规则广度优先算法自底向上地搜索整个空间,首先生成候选集,然后提取其中的频繁项集算法代表有Apriori、AprioriTid和AprioriHybridAprioriHybrid的效率高于Apriori和AprioriTid深度优先算法利用模式增长的方式算法代表有FP-growth、Eclat和H-MineFP-growth以分而治之的策略,在经过第一次扫描过后,把数据库中的频繁项集压缩进一颗频繁模式树关联规则尿布 啤酒,面包,牛奶 鸡蛋,可口可乐,啤酒,面包 牛奶记录编号记录编号购物清单购物清单1面包、牛奶2面包、尿布、啤酒、鸡蛋3牛奶、尿布、啤酒、可口可乐4面包、牛奶、

2、尿布、啤酒5面包、牛奶、尿布、可口可乐频繁项集记录编号记录编号购物清单购物清单1面包、牛奶2面包、尿布、啤酒、鸡蛋3牛奶、尿布、啤酒、可口可乐4面包、牛奶、尿布、啤酒5面包、牛奶、尿布、可口可乐u项集:项的集合,可以包含1项或多项,如面包,牛奶;项集中有K项就称为K项集,如上为2项集u支持度计数(绝对支持度)项集在事务集中出现的频率,如面包,牛奶=3u支持度(相对支持度)项集在事务集中出现的概率,如面包,牛奶=3/5u频繁项集 满足最小支持度阀值的项集,如这里把最小支持度阀值设置为3,则频繁2项集有面包,牛奶、尿布,啤酒关联规则记录编号记录编号购物清单购物清单1面包、牛奶2面包、尿布、啤酒、鸡

3、蛋3牛奶、尿布、啤酒、可口可乐4面包、牛奶、尿布、啤酒5面包、牛奶、尿布、可口可乐u关联规则:根据一个项集里面的物品可以推测出另一个包含不同物品的项集,如啤酒,面包 牛奶,u规则度量标准-支持度(s)规则中前后两个项集在整个事务集中同时出现的概率-置信度(c)在前项集发生的情况下,由前项推出后项的概率-提升度(l)在含有前项的条件下后项发生的概率,与不包含前项这个条件下后项发生的概率对比 设前项为X,后项为Y:S=P(XUY)/P(I)C=P(XUY)/P(X)L=P(XUY)/P(X)P(Y)关联规则挖掘找出所有的频繁项集由频繁项集产生强关联规则支持度(项集)最小支持度阀值支持度 最小支持度

4、阀值置信度 最小置信度阀值提升度 最小提升度阀值项集生成nullABACADAEBCBDBECDCEDEABCDEABCABDABEACDACEADEBCDBCEBDECDEABCDABCEABDEACDEBCDEABCDE闭频繁项集和极大频繁项集闭频繁项集:频繁项集的支持度和所有包含这个频繁项集的超项集的支持度计数不同极大频繁项集:项集不存在超项集,并且该项集是频繁的项集关系极大频繁项集频繁项集闭频繁项集频繁模式挖掘种类根据完全性分类:根据完全性分类:频繁项集完全集、闭频繁项集、极大频繁项集、被约束的频繁项集、近似的频繁项集、接近匹配的频繁项集、最频繁的k个项集.根据抽象层分类:根据抽象层分

5、类:单层关联规则、多层关联规则(如:电脑打印机,台式机打印机)根据数据维度分类:根据数据维度分类:一维关联规则、多维关联规则根据处理值类型分类:根据处理值类型分类:布尔关联规则、量化关联规则Apriori算法Apriori:先验的、推测的Apriori使用逐层搜索的迭代方法,k项集用于探索k+1项集 扫描数据库,计算出每个项的计数,收集满足最小支持度的项,找出频繁1项集的集合,记为L1;使用L1寻找2项频繁集的集合L2,L2又用来寻找L3,如此下去直到不能再找到频繁k项集。翻译:方法:步骤:特征:找每个Lk都需要一次全库扫描Apriori性质Apriori性质表现如果项集I不满足最小支持度阀值

6、min_sup,则I不是频繁的,即P(I)min_sup;此时项A添加到项集I,组成一个新的项集(IUA)也是不频繁的,即P(IUA)min_supApriori性质图示非频繁项集Apriori实现步骤 根据频繁k-1项集组成的集合Lk-1 产生全部候选k项集Ck;对Ck进行修剪;计算Ck中每一个项集w的支持度;将支持度大于最小支持度阀值的项集添加到频繁k项集Lk中;只能够找到频繁k项集,并且k小于用户预先定义的最大值kmax,重复上面的步骤直到找到k+1项集Apriori实现步骤 对于L中的每一个频繁项集l,产生l的所有非空子集;对于l中的每个非空子集A,如果满足设定的评估标准 (如置信度大于等于最小置信度阀值)。在得到全部频繁项集L后,算法根据这些频繁项集产生关联规则:置信度关联规则度量e度量名称度量名称描述描述公式公式规则置信度直接使用置信度表示,默认评估度量置信度差前、后置信度差的绝对值置信度比率前、后置信度的比例信息差基于信息增益的度量方法标准化卡方基于独立的离散型数据的卡方统计检验信息差公式

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|