1、Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 1Introduction to商务智能方法与应用第9章 在线分析处理Chapter 9: Online Analytical ProcessingPrinciples and Applications of Business IntelligenceChap 9 : 在线分析处理 2主要内容 9.1 在线分析处理简介 9.2 多维数据模型中的层次设计 9.3 立方体的定义和计算 9.4 OLAP的多维数据分析Principles and Applicatio
2、ns of Business IntelligenceChap 9 : 在线分析处理 39.1 在线分析处理简介 在线分析处理(online analytical processing),简称OLAP- 由E.F. Codd于1993年提出,是针对特定问题的在线数据访问和分析,通过对信息的多种可能的观察形式进行快速的存取,允许管理决策人员对数据进行深入的多方面的探察。- 它是在企业信息系统内积累的数据不断增多,查询要求越来越复杂,分析需求越来越多,操作型信息系统中的查询和报表功能已不能满足要求的背景下产生的Principles and Applications of Business Inte
3、lligenceChap 9 : 在线分析处理 4OLAP OLAP理事会对OLAP的定义如下:-“在线分析处理是一类软件技术,利用它可以使分析人员、管理人员以及主管从多种信息视角通过快速、一致和交互的访问数据,达到对数据的洞察。这些视角是从原始数据转换过来的,反映了企业的真实维度,易于被用户理解” Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 5OLAP软件的12条准则 1993年E. F. Codd “Providing OLAP to User Analysis” 一文中提出了有关OLAP 的十二条
4、准则,阐述了有关OLAP产品极其所依赖的数据模型的一系列概念和衡量标准,这些特征已经在商业领域得到了验证和确认。6.Generic Dimensionally 12.Unlimited Dimensions and Aggregate LevelsPrinciples and Applications of Business IntelligenceChap 9 : 在线分析处理 6OLAP的五个特性 The BI Verdict- 快速(fast)- 分析性能(analysis)- 共享性(shared)- 多维性(multidimensional)- 信息性(information)- 简
5、称FASMIPrinciples and Applications of Business IntelligenceChap 9 : 在线分析处理 79.2 多维数据模型中的层次设计 由于企业内的数据本身就是多维的,在对这些数据分析时不同的分析员也往往从不同的角度去观察,因此OLAP工具需要将数据组织成多维的方式。 基本概念:- 维(dimension)- 度量(measurement)- 层次(Level, concept hierarchy)Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 8什么是维(d
6、imension)?What?Where?When?Who?Why? 维:- 是一个与业务相关的透视图角度或观察- 5WH 谁?客户; 什么?产品; 地方?销售部; 时间?年 为什么?促销- 概括说明关于业务某个方面的一类数据集,如产品、日期和市场, Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 9度量(measure)度量是企业收集和存储的用于评价业务状况的数值性数据,以监测和评估企业成效度量是业务量化的表示。- 销售部经理:销售量、销售金额、成本和利润指标来衡量其业务成效。不同的度量能够反映出不同的业
7、务性质。- 客户的满意度:客户服务部门可能要用电话支持回应时间来衡量它。 Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 10多维模型Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 11层次 为了能够有效进行多维分析,在构建多维模型时要构建每个维度的层次结构- 在层次结构中,位于下层的属性(称为子属性)和上层属性(称为父属性)之间是一对多的关系,即子属性的一个取值对应父属性的一个取值,父属性的一个取值对应子属性的多个取值
8、。Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 129.3 立方体的定义和计算 OLAP多维分析- 给定基于多维数据模型构建的数据仓库,OLAP多维分析就是选择某些维度中的某些层次,交互式地探察某些度量取值的过程。 立方体:- 给定一个包含m个维度、n个度量的事实表,从中选择k个维度,1个度量,每个维度选择一个层次,假设按照选择的维度和度量进行汇总查询得到的表为T(A1, A2, , Ak, Ak+1),其中A1, A2, , Ak为选中的k个层次属性,Ak+1为选中的度量属性。该数据称为一个立方体(cu
9、be)Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 13立方体 3个维度的3个层次和一个度量Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 14多维数据 按产品product 、时间(time)和地理位置(geography)统计的销售量(Sales volume )ProductCountryquarter3个层: Product, Country, Quarter层次汇总路径: Type Region Year B
10、rand Country Quarter Product City Month Office Day Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 15QuarterCountryProductQty20081QtrJapanPC11 QtrJapanVCR41 QtrJapanTV621 QtrIndiaPC41 QtrIndiaVCR41 QtrIndiaTV482 QtrIndiaTV372 QtrIndiaVCR302 QtrChinaPC42 QtrChinaVCR28 示例数据Principl
11、es and Applications of Business IntelligenceChap 9 : 在线分析处理 16基础立方体 Base CuboidDateProductCountry TVVCRPC1Qtr2Qtr3Qtr4QtrChinaIndiaJapan中国中国VCR1季度季度印度印度VCR1季度季度日本日本VCR1季度季度 Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 17Base CuboidDateProductCountry TVVCRPC1Qtr2Qtr3Qtr4QtrChin
12、aIndiaJapan中国中国VCR1季度季度印度印度VCR1季度季度日本日本VCR1季度季度ChinaTotal annual salesof TV in China. Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 18QuarterCountryProductQty1JapanPC11JapanVCR41JapanTV621IndiaPC41IndiaVCR41IndiaTV482IndiaTV372IndiaVCR302ChinaPC42ChinaVCR28CountryproductQtyJapa
13、nPC1JapanVCR4JapanTV62IndiaPC4IndiaVCR34IndiaTV85ChinaPC4ChinaVCR28Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 19A Sample Data CubeTotal annual salesof TV in China.DateProductCountrysumsum TVVCRPC1Qtr2Qtr3Qtr4QtrChinaIndiaJapansum中国中国1季度季度 Principles and Applications of Busin
14、ess IntelligenceChap 9 : 在线分析处理 20QuarterCountryProductQty1JapanPC11JapanVCR41JapanTV621IndiaPC41IndiaVCR41IndiaTV482IndiaTV372IndiaVCR302ChinaPC42ChinaVCR28CountryproductQtyJapanPC1JapanVCR4JapanTV62IndiaPC4IndiaVCR34IndiaTV85ChinaPC4ChinaVCR28QuarterproductQty1PC51VCR81TV1102PC42VCR582TV37 Princip
15、les and Applications of Business IntelligenceChap 9 : 在线分析处理 21CubeDateProductCountrysum TVVCRPC1Qtr2Qtr3Qtr4QtrChinaIndiaJapan中国中国VCR1季度季度印度印度VCR1季度季度日本日本VCR1季度季度VCR1季度季度 Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 22QuarterCountryProductQty1JapanPC11JapanVCR41JapanTV621Indi
16、aPC41IndiaVCR41IndiaTV482IndiaTV372IndiaVCR302ChinaPC42ChinaVCR28QuarterCountryQty1Japan671India562India672China32CountryproductQtyJapanPC1JapanVCR4JapanTV62IndiaPC4IndiaVCR34IndiaTV85ChinaPC4ChinaVCR28QuarterproductQty1PC51VCR81TV1102PC42VCR582TV37 Principles and Applications of Business Intelligen
17、ceChap 9 : 在线分析处理 23CubeDateProductCountrysumsum TVVCRPC1Qtr2Qtr3Qtr4QtrChinaIndiaJapansum中国彩电的年销量中国彩电的年销量彩电日本彩电日本彩电印度彩电印度彩电 Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 24product QtyPC9VCR66TV147CountryproductQtyJapanPC1JapanVCR4JapanTV62IndiaPC4IndiaVCR34IndiaTV85ChinaPC4Chi
18、naVCR28 Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 25CubeDateProductCountrysumsum TVVCRPC1Qtr2Qtr3Qtr4QtrChinaIndiaJapansum1季度季度中国中国1季度季度印度印度1季度季度日本日本1季度季度 Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 26Quarter Country Qty1Japan671India562India672China
19、32QuarterQty1123299 Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 27CubeDateProductCountrysumsum TVVCRPC1Qtr2Qtr3Qtr4QtrChinaIndiaJapansum日本日本日本1季度季度 Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 28Quarter Country Qty1Japan671India562India672China32Country
20、QtyJapan67India123China32Cuboid Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 29A Sample Data CubeDateProductCountrysumsum TVVCRPC1Qtr2Qtr3Qtr4QtrChinaIndiaJapansum Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 30CountryQtyJapan67India123China32AllQtyall22
21、2 Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 31立方体 (quarter, product, country, qty),(quarter, product, qty), (quarter, country, qty), (product, country, qty)(quarter, qty), (product , qty) (country , qty) (all , qty)allproductquartercountryproduct,quarterproduct,countryquart
22、er, countryproduct, quarter, country0-D(apex) cuboid1-D cuboids2-D cuboids3-D(base) cuboidPrinciples and Applications of Business IntelligenceChap 9 : 在线分析处理 3220083qtrUSAOven 10020083qtrUSAMicrowave 5020084qtrCanadaOven 8020084qtrCanadaMicrowave20QuarterCountryProductQty20081qtrJapanPC120081qtrJapa
23、nVCR420081qtrJapanTV6220081qtrIndiaPC420081qtrIndiaVCR420081qtrIndiaTV4820082qtrIndiaTV3720082qtrIndiaVCR3020082qtrChinaPC420082qtrChinaVCR28 Type Region Year Brand Country Quarter Product City Month DaycitycountryRegionBeijingChinaAsiaTokyoJapanAsiaShanghaiChinaAsiaChicagoUSANorth AmericaQuebecCana
24、daNorth AmericaBombayIndiaAsiaPrinciples and Applications of Business IntelligenceChap 9 : 在线分析处理 33度量的聚集运算(aggregation) Sales (productID, dateID, locationID, quantity)-Sum_qty: sum-Ave_qty:average-Max_qty: max-Min_qty: min Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 349.4 OL
25、AP的多维数据分析 OLAP的多维数据分析的主要分析操作类型包括- 切片(slice)- 切块(dice)- 上卷(roll up)- 下钻(drill down)- 旋转(rotate)Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 35多维操作类型 切片(slice)的两种定义:- 固定某一维的取值为其中的一个类别,其他维不变得到的立方体称为一个切片。- 或取两个维中的部分或全部类别,固定其他任何维的取值为其中的一个类别后得到的二维平面。DateProductCountrysumsum TVVCRPC1
26、Qtr 2Qtr3Qtr 4QtrChinaIndiaJapansumDateProductsumsum TVVCRPC1Qtr 2Qtr3Qtr 4QtrCountry=China Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 36多维操作类型 切块(dice)的两种定义:- 固定某一维的取值为其中的一个区间,其他维不变得到的立方体称为一个切块。- 或取三个维中的部分或全部类别,固定其他任何维的取值为其中的一个类别后得到的三维立方体。DateProductCountrysumsum TVVCRPC1Qt
27、r 2Qtr3Qtr 4QtrChinaIndiaJapansumDateProductsumsum TVVCRPC1Qtr 2Qtr3Qtr 4QtrCountry=(China,India)ChinaIndia Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 37多维操作类型 旋转(rotate)的三种情况:- 行列交换- 行维或列维移动到列维或行维上。- 将行维或列维用其他的维代替,就好象在旋转立方体一样。 Principles and Applications of Business Intelli
28、genceChap 9 : 在线分析处理 38切片和旋转举例 切片和旋转可以改变和重新安排报表的维,它提供了观察数据不同的视觉角度: (product, year) (location, year) 切片和旋转是检验数据各个维之间的关系的过程。 Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 39交换行和列 为了使视图易于察看,交换行和列. Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 40多维操作类型向上钻取(rol
29、l up)或上卷:-对数据进行汇总在给定的立方体数据中将其中一个维度的层次用其上层的属性代替(country, product, quarter) (country, product, year)-减少一个维度: (country, product, quarter) (county, product) Type Region Year Brand Country Quarter Product City Month Office DayPrinciples and Applications of Business IntelligenceChap 9 : 在线分析处理 41多维操作类型向下钻
30、取( drill down, or roll down):from less detailed data to more detailed data-显示当前层数据的下一层更细的数据 (country, product, year) (country, product, quarter)-增加一个新的维度: (county, product) (country, product, year) Type Region Year Brand Country Quarter Product City Month Office Day Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 42向下和向上钻取 探察探察向上钻取向上钻取向下钻取前向下钻取前 向下钻取后向下钻取后 Principles and Applications of Business IntelligenceChap 9 : 在线分析处理 43
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。