Clementine1(基础)课件.ppt

上传人(卖家):三亚风情 文档编号:2901859 上传时间:2022-06-09 格式:PPT 页数:51 大小:2.35MB
下载 相关 举报
Clementine1(基础)课件.ppt_第1页
第1页 / 共51页
Clementine1(基础)课件.ppt_第2页
第2页 / 共51页
Clementine1(基础)课件.ppt_第3页
第3页 / 共51页
Clementine1(基础)课件.ppt_第4页
第4页 / 共51页
Clementine1(基础)课件.ppt_第5页
第5页 / 共51页
点击查看更多>>
资源描述

1、Clementine 基础School of Economics and Management李向东河北工业大学Clementine软件概述ClementineClementine最早属英国最早属英国ISLISL(Integral Integral Solutions LimitedSolutions Limited)公司的产品,后被)公司的产品,后被SPSSSPSS公公司收购司收购20092009年,年,SPSSSPSS被被IBMIBM公式收购公式收购, ,更名为更名为IBM SPSS IBM SPSS ModelerModeler, V14V14版。版。自自20002000年以来,年以来,

2、KDnuggetsKDnuggets公司面向全球开展公司面向全球开展“最近最近1212个月你使用的数据挖掘工具个月你使用的数据挖掘工具”的跟的跟踪调查,踪调查,ClementineClementine一直列居首位一直列居首位Clementine软件概述ClementineClementine的操作与数据分析的一般流程相吻合的操作与数据分析的一般流程相吻合ClementineClementine形象地将各个环节表示成若干个节点,形象地将各个环节表示成若干个节点,将数据分析过程看作是数据在各个节点之间的流将数据分析过程看作是数据在各个节点之间的流动,并通过图形化的动,并通过图形化的“数据流数据流”

3、方式,直观表示方式,直观表示整个数据挖掘整个数据挖掘操作使用操作使用ClementineClementine的目标:建立数据流,即根的目标:建立数据流,即根据数据挖掘的实际需要,选择节点,依次连接节据数据挖掘的实际需要,选择节点,依次连接节点建立数据流,不断修改和调整流中节点的参数,点建立数据流,不断修改和调整流中节点的参数,执行数据流,最终完成相应的数据挖掘任务执行数据流,最终完成相应的数据挖掘任务内容索引nCRISP-DM 过程模型nClementine用户界面n节点基本操作n数据流的基本管理和执行n示例(NC.str)CRISP-DM 过程模型n跨行业数据挖掘标准过程(CRISPDM)q

4、定位是面向行业、工具导向、面向应用q适用于大型工业和商业实践的一般标准n六个阶段:q商业理解q数据理解q数据准备q建模q模型评估q结果发布Clementine用户界面数据流区域工具栏 菜单栏 选项板区节点数据流,输出和模型管理器窗口项目管理窗口一个图标代表在一个图标代表在 Clementine 中进行的一个操作中进行的一个操作一系列连接在一系列连接在一起的节点一起的节点状态窗口 选项板(卡)区n源节点将数据读入 Clementine 中n记录选项节点记录操作n字段选项节点字段操作n图形节点展示数据分布特征和变量关系规律的可视化数据Favorites中集中放置常用的节点。选项板区n建模节点存放建

5、立数据模型;注意:建模算法产生生成的模型n输出节点存放展示数据和数据基本统计特征n导出节点将数据转换成其它格式Clementine软件概述数据流的建立遵循数据挖掘方法论数据流的建立遵循数据挖掘方法论读入数据浏览数据Source选项卡Output选项卡观察单变量分布特点观察多变量相关性Graphs选项卡Output选项卡评估数据质量数据转换和派生数据精简Field Ops选项卡Record Ops选项卡建立多个模型评价选择模型Modeling选项卡建立数据源数据理解数据准备建立模型集成数据基本分析深入分析数据筛选管理选项板数据流,输出和模型管理窗口n在流选项卡中新建、打开、关闭、保存数据流。当前

6、数据流呈现蓝色背景。(*.str)n输出选项卡存放执行数据流后生成的各种数据表,可对其进行管理操作。(*.cou)n模型选项卡存放执行数据流后生成的各种模型计算结果,可对其进行管理操作。(*.gm)项目管理窗口n多条数据流组成一个数据挖掘项目(*.cpj)n将流管理窗口的数据流分别存放到不同目录中,分别对应于数据挖掘的各阶段,以形成一个完整的数据挖掘项目。n加粗黑色显示为当前目录。客户端和服务器端nClementine 可运行在 客户端和服务器端两种模式下n默认模式:客户端n在菜单 “工具” 中选择 “服务器登录”n注意 Clementine 客户端和服务器端版本必须匹配节点基本操作n增加节点

7、增加节点n移动节点n编辑节点编辑节点n重新命名节点n复制节点n删除节点n注解节点n保存节点n重新载入节点n连接节点连接节点n删除节点连接删除节点连接n获得帮助增加节点n双击选项板上节点,自动放置节点到数据流区域q注意:它会自动地连接到“当前”节点( “当前”节点:外带虚线框,或节点成蓝色),n从选项板拖放节点到数据流区域中n在选项板上点击一个节点,然后在数据流区域中点击一下n选中节点,变成淡蓝色未选择未选择选择选择编辑节点n鼠标右击节点,点击 “编辑”n在菜单上还可以选择连接、断开连接、重命名并注释、复制节点、删除、载入节点、保存等操作连接节点n鼠标中键连接节点q通过鼠标中间键点击和拖放来完成

8、n通过按住“Alt”键,拖动鼠标指向第二节点n通过双击来连接节点q双击选项板上节点,自动把新节点连接到数据流区域中的“当前”节点上n鼠标右击节点,点击 “连接”,鼠标点击第二节点。删除节点之间连接n在连接箭头上按下鼠标右键,选择“删除连接”节点调整n节点A-B间插入节点Cq鼠标拖动A、B之间的有向线段到节点Cq已建节点连接A-B-C,绕开节点B直连节点C(拖动A、B之间的有向线段到节点C)q指定节点A为当前节点,按住Alt键同时拖动A、B之间的有向线段到节点C(结果同上)关于源节点n源节点是连接到初始数据源的节点n源节点只能发送数据,不能从其他节点连接到一个源节点不能连接,关于输出节点n输出节

9、点是生成输出、图形、表格和模型的节点n不能从输出(终端)节点连接到任何节点不能连接,帮助菜单n帮助主题nCRISP-DM 帮助n应用程序示例q软件使用n辅助选项帮助q键盘代替鼠标操作 n这是什么数据流的基本管理和执行n数据流中的节点主要实现功能:q读入数据q预处理数据n用表格显示内容n数据分布特征分析和展示n筛选数据参与后续分析q数据建模q模型评价,选择最优模型数据流的操作步骤n选择和管理节点q见前面:选项卡区n节点连接和节点调整q见前面:节点基本操作n设置节点参数难点q鼠标右击节点,选择“编辑”。q节点不同,参数不同q需要知道节点功能,数据分析方法原理。n执行数据流q主菜单:工具执行,执行整

10、个数据流q右击一个节点,选择:从这里执行,表示从当前节点开始执行。q注意:源选项卡节点,后面没有相连节点,注意:源选项卡节点,后面没有相连节点,则不能被执行则不能被执行数据流的其他管理n缓冲(Cache)节点q数据缓冲作用n在一个节点上建立数据缓冲区,存放数据流执行至此的中间结果,可保存到文件中。下次执行可从该节点执行。n源节点和预处理节点可做缓冲节点。缓冲节点超节点n多个节点集成在一个节点。q左侧无连接(对应输入节点)q两侧有连接q右侧无连接(对应输出节点)n查看(放大):n返回:zoom inn取消(expand)(右键,弹出菜单)扩展节点映射n数据流具有通用性,则用新数据替换当前数据流中

11、原有数据,实现对新数据同样的分析和处理。n例如:用B节点替换A节点,使得B连接C。B节点A节点C节点节点映射n选中新数据源节点选中新数据源节点B。右击:数据映射映射到选中要连接的后续节点C,弹出新老数据(A,B节点)对应窗口,系统匹配或用户指定,实现映射。C节点系统匹配或用户指定节点映射结果B节点A节点C节点节点映射n选择其他节点(B节点)替换此节点(A节点)。实现B、C连接。q选中旧数据源节点选中旧数据源节点A。右击:数据映射选择替换节点选中新数据源节点B,弹出新老数据(A,B节点)对应窗口,系统匹配或用户指定,实现映射。B节点A节点C节点示例n公共部门:探索大规模数据存储,改善群众关系,侦

12、测欺诈行为(譬如洗黑钱和逃税),检测犯罪行为和恐怖分子行为模式、电子政务领域。nCRM:客户类型的智能分类和客户流失的准确预测。帮助企业吸引并始终保有最有价值的客户。nWeb 挖掘:准确发现网站浏览者的行为以及提供精确满足浏览者需求的产品或信息n药物发现和生物信息学:对试验室操作获得数据进行分析,药物和基因组的研究。使用 C&R 树模型 n模型:一组规则、公式或方程式,用它们根据一组输入或变量来预测输出。q例如,根据一些特征(如年龄、收入范围以及每天看电视的时间)使用模型来识别最想购买订阅新闻服务的客户。建模数据文件为NewsChan.sav 字段名字段名说明说明AGE年龄CHILDS子女数E

13、DUCATE受教育年限GENDER男或女INC收入范围ORGS组织数TVDAY每天看电视的时间NEWSCHAN接受新闻服务提供说明:NEWSCHAN 字段指示客户是否接受购买订阅新闻服务。 构建流n新建流,将流另存为NewsChan.str数据流SPSS 源节点 nSPSS 源节点从 NewsChan.sav 数据文件读取数据 类型节点n类型节点指定每个字段的数据类型。q例如,范围字段指示字段具有连续数值(如年龄),而集合字段则有两个或更多个不同的值(如男/女或红色/蓝色/绿色)。类型节点n在类型节点中指定方向,表示每个字段在构建模型时的角色。将字段 NEWSCHAN 的方向设置为输出,指示指

14、定的客户是否购买了该服务。这是目标,或者是要预测的字段。将其他字段的方向设置为输入,指示这些字段将用作预测变量。 C&R 树建模节点n生成模型。使用默认设置生成模型。C&R 树建模节点n在建模节点的“字段”选项卡中,已选中要使用类型节点设置的选项,意味着将使用在类型节点中指定的目标和预测变量。n执行生成模型浏览模型n执行完成后,模型块将添加到应用程序窗口右上角的“模型”选项板中。右键单击该模型并选择浏览。浏览模型n“模型”选项卡以规则集的形式显示详细信息,规则集实际上是可根据不同预测变量的值将各个记录分配给子节点的一组规则。浏览模型n模型块中的“查看器”选项卡以树的形式显示相同的模型,每个决策

15、点上都有一个节点。可以使用工具栏上的缩放控件放大特定节点,或缩小节点以查看更完整的树。放大树的左上部分评估模型n右键单击模型块并选择添加到流。在与建模节点相同的位置处,将模型块添加到类型节点中。 评估模型n要查看分数或预测值,将表节点添加到模型块,然后执行表节点。 评估模型预测的准确度n添加一个分析节点,自动执行此操作。对记录评分n通常分析节点,可以针对已知道其实际结果的记录来检验模型。下面,将对不知道其结果的记录进行评分(预测)。q例如,包括其当前不是您的客户但您计划将其包括到促销邮件中的人。 对新记录评分n更新 SPSS 源节点,使它指向其他数据文件n也可以添加一个新的源节点,从它读取要评分的数据。q不管采用哪种方式,新数据集包含的预测变量字段必须与模型所使用的相同(年龄、收入范围等),但不包含目标字段 NEWSCHAN。对新记录评分

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(Clementine1(基础)课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|