1、-2-1、运算效率、执行效率是否有保证,比如在数百万记录的原始数据运算效率、执行效率是否有保证,比如在数百万记录的原始数据 量或大运算量情况下,用户需要等待多久。量或大运算量情况下,用户需要等待多久。2、对复杂报表的支持程度怎样,并且能否很方便地进行复杂运对复杂报表的支持程度怎样,并且能否很方便地进行复杂运算和算和 定义展现。定义展现。3、数据分析模型实用性如何,操作界面是否足够友好便于非专业人数据分析模型实用性如何,操作界面是否足够友好便于非专业人 士使用,能否为实际的业务分析提供数据支持。士使用,能否为实际的业务分析提供数据支持。-3-MaxX Analyser 结构组成及功能结构组成及功
2、能-4-报表浏览报表浏览数据库数据库信息门户信息门户OLAPOLAP引擎引擎报表引擎报表引擎数据库数据库连接池连接池业务系统业务系统-5-报表浏览报表浏览数据库数据库OLAPOLAP引擎引擎报表引擎报表引擎业务系统业务系统业务应用业务应用程序程序业务控制业务控制程序程序-6-Windows、Linux、UnixMS SQL、Oracle、SysBase、DB2Java和VS.NET包括对操作系统、数据库、集成语言的适应对环境的适应能力对环境的适应能力包括对调阅模式、导出类型应用的适应对应用的适应能力对应用的适应能力以报表浏览器的形式调阅,以便获得最大限度的数据应用以纯HTML、PDF、EXCE
3、L、JPG等形式调阅报表,通过服务器实时生成上述文件供阅读者浏览或下载-7-数据库数据传统产品的数据来源传统产品的数据来源数据库数据文件数据应用程序数据集数据分析的数据数据分析的数据来源来源-8-无论多大的原始数据量,无论多大的原始数据量,5 5秒秒之内,报表展现!之内,报表展现!在千万记录级的应用场景下,浏览端在千万记录级的应用场景下,浏览端1010秒秒之内之内CubeCube装载完成,开始显示。装载完成,开始显示。-9-数据库数据库报表服务器报表服务器报表浏览报表浏览分包报表流分包数据流-10-数据库数据库数据库数据库数据源数据源数据源数据源数据源数据源数据源数据源内置内置SQLSQL引引
4、擎擎虚拟数据源虚拟数据源报表报表-11-MaxX Analyser 支持多数据库同步连接原始原始数据源,可以内置引擎以SQL标准进行关联运算内置引擎SQL创建窗口-12-基于基于SQLSQL机制的虚拟数据源模式是最具效率的解决模型。机制的虚拟数据源模式是最具效率的解决模型。基于报表多数据源机制的运算模型是最适合的。基于报表多数据源机制的运算模型是最适合的。-13-数据链报表-14-只建立用户感兴趣的数据只建立用户感兴趣的数据-15-动态数据库指令-16-17-报表预编译设置-18-九套常规模型九套常规模型1、3、2、9、5、4、7、6、8、-19-所以,报表能否普遍满足各类复杂表样的关键,所以
5、,报表能否普遍满足各类复杂表样的关键,在于两个方面:在于两个方面:报表是指定数据在页报表是指定数据在页面上的指定表现形式面上的指定表现形式复杂目标适应能力复杂目标适应能力对数对数据的据的控制控制能力能力对表对表现的现的控制控制能力能力-20-每列不同色彩的数据,来源于不同数据源,根据左侧黑白表头的数据循环同步循环展现。-21-说明:说明:1、报表原始数据为所有订单信息。、报表原始数据为所有订单信息。2、针对原始信息的每列运算模式都完全不同,运算结果含义也完全不同。、针对原始信息的每列运算模式都完全不同,运算结果含义也完全不同。3、在本报表中,使用数据源内置引擎对数据按不同规则进行分组计算。、在
6、本报表中,使用数据源内置引擎对数据按不同规则进行分组计算。注意红色部分,这种根据数据排序多次定位的文本处理需求,在传统报表工具中很难实现。-22-在服务器监控台中,可观察到报表动态创建提交的数据库指令-23-1、获得基本原始数据,或者用户指令、获得基本原始数据,或者用户指令。2、根据运算结果或用户指令,按预定义逻辑判断需要获得的数据、根据运算结果或用户指令,按预定义逻辑判断需要获得的数据。3、根据数据需求,动态创建当前数据期期望所需求的、根据数据需求,动态创建当前数据期期望所需求的SQL语句语句。4、实时向数据库提交动态创建的、实时向数据库提交动态创建的SQL,获取数据并进行下一步运算,获取数
7、据并进行下一步运算。5、根据运算结果,如需继续触发动态数据库指令机制,重复、根据运算结果,如需继续触发动态数据库指令机制,重复3-5步骤步骤。-24-序号序号模式模式特征内容特征内容传统工具设计模式1设计模式2报表页面的输出,将中每一个设计部件及其衍生显示,作为一个个独立的对象进行控制,每一个对象具有自身唯一的命名和属性特征。通过修改这些属性,我们可以在一般逻辑之外,对指定对象进行特性设定。页面输出是以绘制点阵方式输出,无法针对某个显示区域进行局部刷新。-25-传统方式下的报表按照自上而下的顺序生成。如果需要在报表上部显示此后部分数据的运算结果的话,往往需要额外的设计处理。弊端:1、如采用在数
8、据源进行预先处理的话,无疑会加重数据库服务器的负担,同时也 增加了数据源设计的复杂度。2、如果在内存中进行预处理的话,一旦面临大数据量情况,极可能导致内存溢出 或者需要长时间耐心等待。3、报表一旦生成,当前显示将无法根据用户在报表中的操作再次做局部调整。-26-基于“对象实例化”的模型,可以在报表生成过程中,对已生成部分进行逆向刷新。实例化对象,可在报表生成后点实例化对象,可在报表生成后点击控制当前行数据是否纳入运算击控制当前行数据是否纳入运算选择范围。选择范围。根据左侧选择对象,进行根据左侧选择对象,进行汇总计算,并动态刷新上汇总计算,并动态刷新上部文本框显示。部文本框显示。-27-所有报表
9、工具都可以支持数据源的顺序、逆序排序,并按这个顺序加以显示。所有报表工具都可以支持数据源的顺序、逆序排序,并按这个顺序加以显示。但是,自有极少数高端产品支持数据的指定顺序但是,自有极少数高端产品支持数据的指定顺序显示。显示。数据源按产品大类顺序显示数据源按产品大类逆序显示数据源指定部分产品大类个性化顺序显示-28-显示顺序的个性化设定-29-所有的成熟报表产品都具有图表功能所有的成熟报表产品都具有图表功能,产品,产品优势:优势:1、提供提供了了7070多大类、多大类、300300多种图表样式,包括了多种图表样式,包括了从柱从柱状、折线、甘特、状、折线、甘特、饼型等通用图表到蜡烛、容量、漏斗等专
10、业图表。饼型等通用图表到蜡烛、容量、漏斗等专业图表。2、支持在同一图表中对比展现多个不同数据源数据,并可支持在同一图表中对比展现多个不同数据源数据,并可以不同以不同 样式进行表现。样式进行表现。3、支持图表的自动分组,可在图表中设置对数据源的分组运算,支持图表的自动分组,可在图表中设置对数据源的分组运算,并将不同并将不同 分组同坐标区分对比显示。分组同坐标区分对比显示。-30-根据单数据源分组计算自动创建多图叠加使用多个数据源,创建多图对比效果-31-这种需要类似甘特图与表这种需要类似甘特图与表格混排的样式,传统产品格混排的样式,传统产品以及表格元素设计模式产以及表格元素设计模式产品,是无法支
11、持的。品,是无法支持的。-32-OLAP是什么?是什么?123多维视图:多维视图:在原始关系型数据的结构基础上加以整合,形成可从多视角观察的数据模型数据切片:数据切片:将多维度交叉数据,在指定维度范围内提取并观察数据钻取:数据钻取:在多维数据结构上,逐层设定细分维度,并根据需求树型下钻详细数据OLAP OLAP 是一种基于多维数据的分析模型是一种基于多维数据的分析模型-33-用维的方法观察数据:用维的方法观察数据:产品大类、时间、销售区域、销售模式等产品大类、时间、销售区域、销售模式等 数据模型等同于业务模型数据模型等同于业务模型销售分析销售分析产品大类产品大类时间时间销售区域销售区域销售模式
12、销售模式珠宝珠宝类类服装服装类类珠宝珠宝类类01年年02年年03年年华东华东区区华南华南区区华北华北区区直销直销渠道渠道终端终端-34-销售地区产品分类时间华东区浙江省杭州市温州市嘉兴市江苏省考察一个特定的维地区维,包括每一个地区到各省份、行政市的销售数据钻取到下面的层次来考察详细情况-35-按不同顺序组织各个维,对结果进行考察销售地区产品分类时间时间销售地区产品分类-36-钻取到各个维地区、省份、行政市销售模式、产品类型、产品销售分析销售分析销售地区销售地区销售模式销售模式时间时间客户客户华东华东区区华北华北区区华南华南区区直销直销分销分销01年年02年年03年年浙江浙江省省江苏江苏省省-3
13、7-用切片的方法从不同角度观察时间产品类型销售模式时间销售模式产品类型2019年每类产品对应于各种销售模式的销售情况每类产品对应于直销模式的每个年度的销售情况-38-OLAPOLAP是完全面向分析设计的数据表现模型是完全面向分析设计的数据表现模型。在。在应用模式、效率构架、数据模应用模式、效率构架、数据模型等方面均作了大量改进和创新。型等方面均作了大量改进和创新。重点表现在如下方面:重点表现在如下方面:可缩放的可缩放的维度设计维度设计内置内置推测推测算法算法最高支持最高支持244244个个维数据指标和维数据指标和10241024个分析数个分析数据指标据指标 数据数据CubeCube的的增量更新
14、增量更新 最为便捷最为便捷的排序设的排序设定定 数据多种数据多种计算表现计算表现形式形式 -39-这种呈树型结构索引分析数据,逐层递进至关键细节目标,完全符合人类思维逻辑,使分析更全面、透彻,更易发现潜在信息。-40-1 1简单移动平均法简单移动平均法 2 2加权移动平均法加权移动平均法 3 3双重指数平滑法双重指数平滑法 4 4三重指数平滑法三重指数平滑法 5 5数据极限显示数据极限显示 6 6首末位显示首末位显示-41-最高支持1024个分析数据最高支持244个分析指标。-42-1、一旦统计数据发生更新,比如数据库增加了新的数据,要对包含新一旦统计数据发生更新,比如数据库增加了新的数据,要
15、对包含新 数据部分信息进行数据部分信息进行OLAPOLAP统计的话,需要重新创建统计的话,需要重新创建CubeCube。2、大多数情况下,分析对象自身原数据量非常大(比如本年度前大多数情况下,分析对象自身原数据量非常大(比如本年度前1111个月的个月的 订单数据),而仅有少量数据发生变更(比如本月的订单数据),这种模式的效订单数据),而仅有少量数据发生变更(比如本月的订单数据),这种模式的效 率无疑是非常低下的率无疑是非常低下的。2、创新创新的的CubeCube增量更新,无需重新生成增量更新,无需重新生成CubeCube,而是基于原有数据,而是基于原有数据 CubeCube,将新数据追加计算生
16、成新的,将新数据追加计算生成新的CubeCube,从而降低服务器负荷,并满足一般统计,从而降低服务器负荷,并满足一般统计 中的实时更新需求中的实时更新需求。-43-点击排序按钮,可直接设数据排序按照该维度数值执行。-44-OLAPOLAP是一个多维交叉计算的数学模型,除了计算汇总、平均、极值等一般计是一个多维交叉计算的数学模型,除了计算汇总、平均、极值等一般计算外,还可以根据生成环境的其它数据,进行如下追加计算显示:算外,还可以根据生成环境的其它数据,进行如下追加计算显示:1 1按列计算百分比按列计算百分比 2 2按行计算百分比按行计算百分比 3 3按列统计名次按列统计名次 6 6与前一行差额与前一行差额 7 7与前一列之和与前一列之和 8 8与前一行之和与前一行之和 4 4按行统计名次按行统计名次 5 5与前一列差额与前一列差额 9 9列合计列合计 1010行合计行合计-45-如前所述如前所述,数据分析的,数据分析的优势并非体现在几个具体的功优势并非体现在几个具体的功能点上,而是以一种优化的、可扩展的设计模型,来能点上,而是以一种优化的、可扩展的设计模型,来获得对复杂应用的全面支持。获得对复杂应用的全面支持。相信随着相信随着对数据分析的对数据分析的进一步深入了解,您会感觉到进一步深入了解,您会感觉到越来越广泛的应用空间。越来越广泛的应用空间。