1、Principles and Applications of Business IntelligenceChap 12 :商务智能系统 1Introduction to商务智能方法与应用第12章 商务智能系统 Lecture 12: Business Intelligence SystemsPrinciples and Applications of Business IntelligenceChap 12 :商务智能系统 2主要内容 12.1 开源数据挖掘软件 - 12.1.1 概述- 12.1.2 Weka 12.2 商品化的商务智能系统Principles and Application
2、s of Business IntelligenceChap 12 :商务智能系统 312.1.1 开源数据挖掘软件概述 常用的开源数据挖掘或机器学习软件有:- Weka- R软件- RapidMiner- Orange- KNIME- Tanagra- 等 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 4Weka 新西兰怀卡托(Waikato)大学开发的系统,是Waikato Environment for Knowledge Analysis的缩写。该系统用Java语言开发。在windows、Linu
3、x以及Macintosh操作系统上都可以运行。 可以从http:/www.cs.waikato.ac.nz/ml/weka免费下载。 它有四种使用方式:Explorer、Knowledge Flow、 Experimenter和命令行。 Explorer的具体使用方法我们将在12.1.2节介绍。 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 5R软件 提供众多的分析功能以及图形绘制功能。 数据挖掘功能包括分类、聚类、关联规则、回归分析以及时间序列分析等。 还提供统计分析功能。 该软件可从网站http:/w
4、w.r-project.org/下载。 R的内核是用C语言实现的,但是要开发新的挖掘算法使用R提供的脚本语言,即R语言,开发更灵活、快速。Principles and Applications of Business IntelligenceChap 12 :商务智能系统 6RapidMiner 较早的版本称为 YALE (Yet Another Learning Environment)。可以从http:/rapid-下载。 用Java开发的,可以调用Weka中的挖掘算法等组件。使用树状结构来组织各种分析组件。 其用户遍及40多个国家。 可以通过图形化界面、命令行方式以及Java API的方
5、式使用其丰富的数据处理、分析及可视化功能。 可以访问众多的数据源。Principles and Applications of Business IntelligenceChap 12 :商务智能系统 7KNIME(Konstanz Information Miner) 可从http:/www.knime.org下载,在windows、Linux以及Macintosh操作系统上都可以运行。 用Java开发,可以调用Weka中的挖掘算法。使用方式类似于Weka中的Knowledge Flow,可以很方便地通过可视化的方式创建数据分析的整个流程。 该软件的使用方式也与一些商品化的数据挖掘软件,如I
6、BM SPSS和SAS Enterprise Miner相似。Principles and Applications of Business IntelligenceChap 12 :商务智能系统 8Orange 网站为http:/www.ailab.si/orange。 与KNIME类似,也是一种基于组件的数据挖掘开源软件,通过各种控件设置挖掘步骤,组成挖掘流程。 其底层核心由C+开发,用户可以使用脚本语言Python进行扩展开发。在windows、Linux以及Macintosh操作系统上都可以运行。提供了100多个控件(widget),覆盖了绝大多数数据分析功能,使用简单。 提供丰富的可
7、视化功能。Principles and Applications of Business IntelligenceChap 12 :商务智能系统 9Tanagra 可从网站http:/eric.univ-lyon2.fr/ricco/tanagra/en/tanagra.html下载,可运行于Windows操作系统。 其前身是SIPINA,主要实现是有监督的学习算法,如决策树。在此之上,Tanagra增加了无监督的许多学习方法,如聚类、关联分析等。 统计分析功能很强,提供了很多的统计检验、特征选取与构造以及回归分析、因子分析等功能。 可视化能力较弱。Principles and Applica
8、tions of Business IntelligenceChap 12 :商务智能系统 1012.1.2 Weka 主要介绍Explorer方式下Weka的使用方法。 先介绍可输入的数据格式 然后分别以一种典型方法为例说明Weka实现数据预处理、关联分析、分类、聚类、回归分析以及特征提取等主要技术的使用方法。 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 11Weka Explorer的主界面 主界面 Principles and Applications of Business Intelligen
9、ceChap 12 :商务智能系统 12数据文件 Weka可识别的文件格式有多种,包括ARFF、C4.5、CSV等。其中ARFF是其独有的文件格式。 Weka自带了多个ARFF格式的数据文件,如weather、CPU、iris等。 如右图可在写字板中打开weather数据集。 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 13打开数据文件后的Weka界面 界面的左下部分显示的是所有属性 Principles and Applications of Business IntelligenceChap 12
10、:商务智能系统 14数据预处理 要对weather数据集进行关联分析,需要将其中的两个连续类型的属性先进行离散化处理。 单击上图中位于屏幕上半部的choose按钮,在unsupervised类型下的attribute下选择Discretize,如右图所示。选择无监督离散化功能 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 15离散化参数设置 设置离散化为10个等间隔Principles and Applications of Business IntelligenceChap 12 :商务智能系统 16离
11、散化后的weather 数据集 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 17关联分析关联规则的参数设置 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 18输出结果右边为类别的关联规则的部分输出结果 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 19FPGrowth算法 利用FPGrowth算法发现的关联规则 Princip
12、les and Applications of Business IntelligenceChap 12 :商务智能系统 20分类Weka中提供的分类算法列表 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 21输出结果决策树分类器的部分输出结果 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 22可视化显示可视化决策树 Principles and Applications of Business Intelligen
13、ceChap 12 :商务智能系统 23数据规范化与聚类规范化方法的选择 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 24聚类Weka提供的聚类方法列表 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 25回归分析CPU数据集的多元线性回归 (SimpleLinearRegression)结果 Principles and Applications of Business IntelligenceChap 12 :商
14、务智能系统 26特征提取主成分分析的参数设置 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 27结果显示Iris数据集的主成分分析的结果 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 2812.2 商品化的商务智能系统 国外有IBM、甲骨文(Oracle)、SAP、赛仕(SAS)、微策略(MicroStrategy)、Teradata以及微软(Microsoft)等。 国内有用友华表(http:/www.cellso
15、ft.cc/)、浪潮(http:/ 这些商务智能的产品涉及查询、报表、数据仓库、在线分析处理、数据挖掘、文本挖掘及业务可视化工具等。Principles and Applications of Business IntelligenceChap 12 :商务智能系统 29数据仓库主要供应商、产品和网址 供应商产品网址Oracle数据仓库 Oracle Data Integratorhttp:/ Enterprise Data Warehousinghttp:/ Enterprise Data Integration Serverhttp:/ InfoSphere Warehousehttp:/
16、 SQL Serverhttp:/ and Applications of Business IntelligenceChap 12 :商务智能系统 30OLAP主要供应商、产品和网址 供应商产品网址IBM Cognos BI ESSBASEhttp:/ SQL Server OLAP serviceshttp:/ OLAP服务器http:/ BusinessObjects Analysishttp:/ Netweaver BWhttp:/ and Applications of Business IntelligenceChap 12 :商务智能系统 31数据挖掘主要供应商、产品和网址 供应
17、商产品网址IBM SPSS modelerhttp:/ Enterprise Minerhttp:/ Text Minerhttp:/ Intelligent Minerhttp:/ SQL Serverhttp:/ Data MinerOracle ESSBASEhttp:/ TeraMinerhttp:/ and Applications of Business IntelligenceChap 12 :商务智能系统 32商务智能魔力象限2012年2月发布的商务智能魔力象限 Principles and Applications of Business IntelligenceChap 12 :商务智能系统 33