1、商业分析员数据仓库知识库接口数据库数据选择知识发现引擎知识发现评价知识发现描述知识发现管理器商业分析员数据仓库知识库接口数据库数据选择知识发现引擎知识发现评价知识发现描述知识发现管理器商业分析员数据仓库知识库数据库接口数据选择知识发现引擎知识发现评价知识发现描述知识发现管理器商业分析员数据仓库知识库数据库接口数据选择知识发现引擎知识发现评价知识发现描述知识发现管理器商业分析员数据仓库知识库数据库接口数据选择知识发现引擎知识发现评价知识发现描述知识发现管理器商业分析员数据仓库知识库数据库接口数据选择知识发现引擎知识发现评价知识发现描述知识发现管理器商业分析员数据仓库知识库数据库接口数据选择知识发
2、现引擎知识发现评价知识发现描述知识发现管理器商业分析员数据仓库知识库数据库接口数据选择知识发现引擎知识发现评价知识发现描述知识发现管理器进化阶段进化阶段商业问题商业问题支持技术支持技术产品厂家产品厂家产品特点产品特点数据搜集(60年代)“过去五年中我的总收入是多少?”计算机、磁带和磁盘IBM,CDC提供历史性的、静态的数据信息数据访问(80年代)“在新英格兰的分部去年三月的销售额是多少?”关系数据库(RDBMS),结构化查询语言(SQL),ODBCOracle、Sybase、Informix、IBM、Microsoft在记录级提供历史性的、动态数据信息数据仓库;决策支持(90年代)“在新英格兰
3、的分部去年三月的销售额是多少?波士顿据此可得出什么结论?”联机分析处理(OLAP)、多维数据库、数据仓库Pilot、Comshare、Arbor、Cognos、Microstrategy在各种层次上提供回溯的、动态的数据信息数据挖掘(正在流行)“下个月波士顿的销售会怎么样?为什么?”高级算法、多处理器计算机、海量数据库Pilot、Lockheed、IBM、SGI、其他初创公司提供预测性的信息自动趋势预测数据库可以由此拓展深度和广度数据挖掘的任务数据挖掘的任务关联分析关联分析YX TX TY YX)|(XYP)(YXP数据挖掘的任务时序模式数据挖掘的任务聚类将物理或抽象对象的集合分组成为由类似的
4、对象组成的多个类的过程。聚类数据挖掘的任务分类分类决策树分类:规则分类:IF()Then()Else()数据挖掘的任务偏差检测数据挖掘的任务预测数据挖掘的算法数据挖掘的分类数据挖掘数据库技术信息科学可视化统计学机器学习其他学科数据挖掘的分类数据挖掘的分类数据挖掘的分类数据挖掘的分类根据应用分类数据挖掘的分类仿生物技术法神经网络方法类神经网络方法类-神经元结构图树突树突轴突轴突突触突触 神经网络方法类ui Yix1 x2 xnf iijjijixwu)()(jjijiixwfufY神经网络方法类i仿生物技术法遗传算法类公式发现法统计分析法模糊数学法可视技术法类型类型身高身高头发头发HR附附第第一
5、一类类人人矮矮金色金色蓝色蓝色高高红色红色蓝色蓝色高高金色金色蓝色蓝色矮矮金色金色灰色灰色第第二二类类人人高高金色金色黑色黑色矮矮黑色黑色蓝色蓝色高高黑色黑色蓝色蓝色高高黑色黑色灰色灰色矮矮金色金色黑色黑色规则的例子规则的例子IF(发色发色=金色金色红色红色)(眼睛眼睛=蓝色蓝色灰色灰色)THEN 第一类人第一类人 IF(发色发色=黑色黑色)()(眼睛眼睛=黑色黑色)THEN 第二类人第二类人 规则知识规则知识 商店个数商店个数位置位置规模规模档次档次经营效果经营效果1010市中心市中心大大高高一般一般1515市中心市中心大大一般一般成功成功8 8市中心市中心一般一般高高成功成功6 6城乡结合
6、部城乡结合部大大一般一般一般一般6 6城乡结合部城乡结合部一般一般一般一般成功成功1010市中心市中心一般一般一般一般一般一般商店定位决策树商店定位决策树 29成功,26一般23成功,20一般6成功,6一般市中心城乡结合部15成功,10一般8成功,10一般一般大高一般8成功10一般高一般6一般6成功大一般15成功10一般/6一般6成功/高一般高一般天气天气温度温度湿度湿度风况风况运动运动晴晴85858585无无不适合不适合晴晴80809090有有不适合不适合多云多云83837878无无适合适合有雨有雨70709696无无适合适合有雨有雨68688080无无适合适合有雨有雨65657070有有不
7、适合不适合多云多云64646565有有适合适合晴晴72729595无无不适合不适合晴晴69697070无无适合适合有雨有雨75758080无无适合适合晴晴75757070有有适合适合多云多云72729090有有适合适合多云多云81817575无无适合适合有雨有雨71718080有有不适合不适合决策树的例子决策树的例子2天气?overcast湿度?风况?70无有天晴有雨适合不适合不适合适合适合多云类型类型身高身高头发头发HR附附第第一一类类人人矮矮金色金色蓝色蓝色高高红色红色蓝色蓝色高高金色金色蓝色蓝色矮矮金色金色灰色灰色第第二二类类人人高高金色金色黑色黑色矮矮黑色黑色蓝色蓝色高高黑色黑色蓝色蓝
8、色高高黑色黑色灰色灰色矮矮金色金色黑色黑色类型类型头发头发眼睛眼睛第一类人第一类人金色金色蓝色蓝色红色红色蓝色蓝色金色金色灰色灰色第二类人第二类人金色金色黑色黑色黑色黑色蓝色蓝色黑色黑色灰色灰色知识基知识基(浓缩数据)浓缩数据)神经网络结构和权值神经网络结构和权值 水里水里金星金星地球地球火星火星木星木星土星土星周期周期P/d882253656874343.510767.5距离距离d/Gm581081492287781430太阳系行星运动数据中包含行星运动周期太阳系行星运动数据中包含行星运动周期(旋转旋转一周所需时间一周所需时间,d),d),以及它与太阳的距离以及它与太阳的距离(围绕太围绕太阳旋转的椭圆轨道的长半轴阳旋转的椭圆轨道的长半轴,Gm),Gm)