ImageVerifierCode 换一换
格式:PPT , 页数:53 ,大小:1.95MB ,
文档编号:3539355      下载积分:28 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-3539355.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(数据仓库解决方案概述(最终版).ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

数据仓库解决方案概述(最终版).ppt

1、学 习 公 约手机调整全情投入随时互动课课 程程 要要 求求议程数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具“数据仓库是在企业管理和决策中面向主题的,集成的,与时间相关的和不可修改的数据集合”数据仓库定义OLTP系统系统财务系统财务系统业务系统业务系统计费系统计费系统5-10 年年过去过去详细数详细数据据当前当前详细数据详细数据轻度轻度汇总数据汇总数据高度高度汇总数据汇总数据数据集市数据集市用户分析用户分析网络资源分析网络资源分析数据仓库数据仓库/决策分析系统决策分析系统网管系统

2、网管系统数据仓库是完全不同的数据库系统 事务处理性能是第一位的 支持日常的业务 事务驱动 数据是当前的并在不断变化 存储详细数据(每一个事件或事务)面向应用 针对快速预定义的事务优化设计 可预见的使用模式 支持办事人员或行政人员 支持长远的业务战略决策 分析驱动 数据是历史的 数据是静态的,除数据刷新外 数据反映某个时间点或一段时间 数据是汇总的 面向主题 优化是针对查询而不是更新 支持管理人员和执行主管人员DW/BI 在电信行业的应用-How?立足于现有的OLTP系统 当前数据和历史数据 集中整合之后,构建一个庞大的数据仓库 面向业务分析和决策层 运用多维分析方法,充分挖掘数据中的信息 应用

3、DW/BI的三步曲数据抽取数据抽取数据管理数据管理数据分析数据分析D A T ADATADATADATADATADATADATADATADATADATADATADATADATADATAINFORMATION 信信 息息u数据仓库数据仓库(Data Warehouse)(Data Warehouse)是一种专为联机分析应用是一种专为联机分析应用和决策支持系统提供数据源的结构化的数据环境和决策支持系统提供数据源的结构化的数据环境u数据仓库要解决的问题是从数据库中获取信息的问题。数据仓库要解决的问题是从数据库中获取信息的问题。信信 息息INFORMATION DW/BI 在电信行业的应用-小结什么是

4、数据仓库(Data Warehouse)?业务系统业务系统集成的信息管理集成的信息管理设计和元数据维护设计和元数据维护数据仓库的实际构造示意图议程数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具Sybase数据仓库相关产品的技术构成RelationalPackageLegacyExternalsourceDataCleanToolSource DataDataStagingWareHouseAdmin.ToolsEnterprise DataWarehouse Data Extrac

5、tion,Transformationand loadDatamartDatamartEnterprise/Central DataWarehouseRDBMSROLAPRDBMSRDBMS,Star SchemaArchitectedDatamartsCentralMetadata Data Modeling ToolEnd-UserToolEnd-UserToolMDBEnd-UserToolEnd-UserToolLocal MetadataLocal MetadataSybase数据仓库相关产品介绍集成的主要产品lIntegratelEnterprise ConnectlReplica

6、tion ServerlPowerMartlDesignlWarehouse ArchitectlManagelSybase ASIQlVisualizelBriolCognoslAdministerlWarehouse Control Center议程数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具设计:成功的关键数据库的设计对数据仓库系统的整体性能、装载和建立索引的时间以及数据量的增长等的影响超过任何其它方面。数据仓库设计工具WarehouseArchitect为数据仓库的设计提

7、供三大功能:多维建模度量、维、属性事实表,维表维层次表,事实层次表设计向导聚合(Aggregation Wizard)分区(Partitioning Wizard)逆向工程数据源优化代码生成目标数据仓库引擎(IQ,RDBMS)OLAP分析环境Time identifier=Time identifierProduct identifier=Product identifierCustomer identifier=Customer identifierStore identifier=Store identifierCustomerCustomer identifierdoubleCustom

8、er namechar(30)Sales FactProduct identifierdoubleTime identifierdoubleCustomer identifierdoubleStore identifierdoubleSales totalrealProfitsrealStoreStore identifierdoubleStore namechar(50)TimeTime identifierdoubleDatetimestampMonthchar(50)QuarterdoubleYeardoubleProductProduct identifierdoubleProduct

9、 descriptionchar(80)设计:WarehouseArchitect议程数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具数据抽取、转换、清洗、集成挑战多个、多种异构数据源硬件,OS,RDBMS,文件数据不规范,需要做大量的清洗和整合转换规则复杂,繁多繁琐的日常性工作,占80%工作量数据质量保证数据增量抽取抽取工作过程化,自动化数据抽取、转换、清洗、集成成功的关键支持多个、多种异构数据源轻松方便地设计数据的清洗,转换和整合规则日常事务性工作自动化完成有完善的数据质量保证体

10、系有完备的数据增量抽取直观,面向过程化设计;自动化的执行开放性,可扩展性,易于实施和维护数据抽取、转换、清洗、集成解决的方案手工编程实现使用工具设计和实施PowerMart/PowerCenter开发环境,一系列工具用于设计、执行和维护数据的抽取、转换和装载流程抽取转换引擎(服务器),自动执行集成:PowerMartSourceDatabasesTargetDatabaseDesignerServer ManagerRepository ManagerWarehouseDesignerMappingDesignerTransformationDeveloperSourceAnalyzerRep

11、ositoryServer EngineSybaseInformixOracleMicrosoftIBM/UDBODBCDB2SAPPeopleSoftVSAMFlat FilesWeb LogsXMLIBM MQ GatewaysSybaseInformixOracleMicrosoftODBCIBM/UDBSAP BWPeopleSoft EPMFlat FilesGateways议程数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具数据存储、管理 挑战 数据规模 查询性能 装载速

12、度 易于管理 存取访问成功的关键快速,高效数据存储技术出色的查询性能-特殊的索引技术,并行查询可伸缩性-GB 到 TB 级易于管理-方便,灵活,GUI存取访问-数据随时可用数据管理解决的方案通用的关系数据库系统专门的数据仓库服务器Sybase IQ专门为数据仓库/数据集市设计的关系型数据库专门针对OLAP/DSS而优化的索引和查询处理技术Adaptive Server IQ数据存储:Adaptive Server IQ无处不索引(Index EVERYWHERE)数据压缩(通常达到原始数据的 70-75%)垂直存储技术(Vertical Partitioning)专利的Bit Wise索引技术

13、跨越Bitmap的限制多种索引类型:FP,LF,HNG,HG低级数的限制从100扩充到1000预连接的索引提供额外的显著提高性能手段(Join Index)支持任意设计模式星型、雪花、雪暴、星座模式普通关系模式支持任意加载方式文件、内部数据、外部数据库直接加载开放的接口DateStoreStateClassSales3/1/9632NYA63/1/9636MAA93/1/9638NYB53/1/9641CTA113/1/9643NYA93/1/9646RIB33/1/9647CTB73/1/9649NYA12计算计算“NY”州州A类商店的类商店的平均销售额平均销售额当表的记录数从几万条变为千万

14、和上亿条时,传统RDBMS技术面对的问题:u表扫描的性能极端低下u冗余设计代价高昂、查询读取的无效字段过多u低级数类型数据上索引的失效u普通索引加载和空间代价,造成不能任意建造u即席查询的SQL顺序对性能有显著影响u数值型比较和运算,无恰当手段加速处理传统RDBMS不适合数据仓库IQ的特殊存储方式-垂直存储(按列存储)Sybase IQ:数据是按列存储数据是按列存储的,而不是按行存储的,而不是按行存储DateStoreStateClassSales3/1/9632NYA63/1/9636MAA93/1/9638NYB53/1/9641CTA113/1/9643NYA93/1/9646RIB33

15、/1/9647CTB73/1/9649NYA12 RDBMS data stored by ROWSDateStoreStateClassSales3/1/9632NYA63/1/9636MAA93/1/9638NYB53/1/9641CTA113/1/9643NYA93/1/9646RIB33/1/9647CTB73/1/9649NYA12好处好处:l只存取查询所需的数据只存取查询所需的数据l数据类型是一致的,因数据类型是一致的,因而可以很容易被压缩而可以很容易被压缩l数据库易于修改和管理数据库易于修改和管理Sybase IQ:只读完成查询所只读完成查询所 涉及到的列涉及到的列DateSto

16、reStateClassSales3/1/9632NYA63/1/9636MAA93/1/9638NYB53/1/9641CTA113/1/9643NYA93/1/9646RIB33/1/9647CTB73/1/9649NYA12计算在纽约的计算在纽约的“A”类商店类商店的平均销售额的平均销售额好处好处:无须使用其他的技术,无须使用其他的技术,Sybase IQ 就可以减少就可以减少I/O 超过超过 90%IQ的特殊存储方式-垂直存储(按列存储)“How many MALES are NOT INSURED in CALIFORNIA?GenderMMFMM-800 Bytes/Row10MR

17、OWSStateNYCACTMACA-InsuredYYNYNMYCAMNCAFYNYMNCA1243Gender Insured State+11011101010110MBits10M Bits x 3 col/816K Page=235 I/Os800 Bytes x 10M 16K Page=500,000 I/Osn基本上只能使用表扫描基本上只能使用表扫描n查询过程读取了太多的无效数据查询过程读取了太多的无效数据Example:I/O 的明显减少IQ的索引特点索引即是数据没有索引和数据的分别任何一列可以建立多个索引系统保证至少会存在一个索引(FP)索引的选择和设计主要基于:数据的级数

18、(离散值的个数)在查询中的使用方式和SQL语句的顺序无关索引的种类Fast Projection(FP)数据压缩存储根据数据的特点会自动使用三种方式中的一种Low Fast(LF)Bit map 索引High Non Group(HNG)Bit-wise 索引High Group(HG)G-Array(包括一个改进的B-tree)FP Index normal FP 级数(取值个数)65536 数据被压缩存储ColorRedBlueGreenRedFP Index-FFP 级数 256 内建一个1-byte的参照表Data ValuesRedBlueGreenRedColorRedBlueGr

19、een12311123332Lookup TableDataLF Index传统的 Bit Map 索引级数小于1000 可以唯一使用的可能性JoinsGroup byMIN,MAX,SUM,AVG functionsWhere clause predicatesEquality/Inequality,Ranges,IN listsBitmap Index for STATErow-idAKALARCACODCDEFL100010000200000001301000000410000000501000000.冗余设计时数据量比想象中要小得多每一个取值都有一个相应的位可以适应新的取值出现和行的增

20、加查询:select count(*)from customers where state=ALLF IndexHNG Index Bit-Wise Index 数据按照二进制存储 垂直分布和处理 Sybase的专利技术 cannot be used with certain data types 使用最佳范围 range searches for high cardinality columns 运算(sum and average functions)适合大量二进制的存储数据垂直分片 即每一个位都可以在内部被独立操作由于肯定存在大量的位同时为1或0,因此IQ在内部处理时会自动做数据压缩HN

21、G-High Card Bit-Wise IndexSales6951193712Sales in binary form8 bit4 bit2 bit1 bit01101001010110111001001101111100Sales in binary form8 bit4 bit2 bit1 bit01101001010110111001001101111100HG Index 在Bit-Wise的基础上增加一个B-Tree,并保证树在加载时不会重建 最佳使用场合:Joins Select Distinct,Count Distinct Group ByDateZipStateClass

22、Sales3/16NYA64/19MAA95/15NYB56/111CTA117/16NYB99/23RIB38/37CTA72/26NYA121 104 64 5 61,5,8,.10001001突破性的速度突破性的速度 闪电般的快速查询 快速装载无限的灵活性无限的灵活性 任何查询 任何模式非常经济非常经济 压缩的数据存储 支持多用户查询Sybase IQAdaptive Server IQ 12:专门设计的数据仓库服务器IQ12的技术参数Column limit-now 16,000 per table (up from 255 -Great for SAS&SPSS customers)

23、Row limit-now 281,474,976,710,700 (thats 281 Trillion Rows and change)Device size-up to 128GB(depending on OS)Device limit-now 65,524(up from 2,000)Database Size limit-8.4 PetabytesSybase IQ 真正的数据仓库AndyneBrioBusinessObjectsGentiaInformationAdvantageInformationDiscoveryInfoSpaceLinguisticTechnologyTe

24、leranTechnologySeagateSoftwareMathsoftCognosAdaptiveServerIQ议程数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具Brio.Enterprise 6.0 产品家族Brio Enterprise 功能服务功能服务功能服务BrioQuery查询查询OLAP 查询查询在线分析在线分析(OLAP)报表报表EIS/脚本脚本制图制图审核审核两层安全防护两层安全防护Broadcast Server信息发布信息发布作业调度作业调度批处理查询批

25、处理查询/报表报表事件驱动处理事件驱动处理 报表广播报表广播OnDemand Server零管理客户端零管理客户端Web查询查询适应型报表适应型报表多层安全防护多层安全防护集群服务器支持集群服务器支持SSL(安全套接层加密安全套接层加密)OnDemand ServerWeb ServerBrioQueryIQ数据仓库数据仓库BroadcastServerEmail ServerFile Server*.iqd任何数据源(关系型、平面型,数据仓库)自动生成PowerCube 用户定义的业务规则和维度 10:1的数据压缩图形化的浏览多维数据 完全交互式的报表探察PowerPlay:OLAP 环境C

26、ognos BI 产品结构Data WarehousePC DatabaseOracle,Sybase,Informix,SQL Server,ODBC GatewayImpromptu.DBF.DB.DBF,.DB,.XLS,.WKS,.CSVPortfolioTransformerAuthenticator.MDCPowerCubes.PBBPowerPlay.PYH .MDL.IQD.PPR.IMR议程数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具元数据管理:什么是元数据提供

27、数据对象的准确、全面、一致的定义:什么是“customer”的定义,其内容是什么?提供物理数据到企业模型的映射关系,如:“customer number”的正确格式是什么“product status”有哪些取值?不同系统中相似数据的合并使用规则是什么?提供数据源和抽取信息提供数据项的定义和相关描述数据的使用规则Operational/Legacy DataPhysical Schema ImportTransformation ImportLogical Tool ImportMeta Data Validation,Synchronization,&Promotion元数据管理:Contr

28、ol CenterSybase数据仓库相关产品的技术构成RelationalPackageLegacyExternalsourceDataCleanToolSource DataDataStagingWareHouseAdmin.ToolsEnterprise DataWarehouse Data Extraction,Transformationand loadDatamartDatamartEnterprise/Central DataWarehouseRDBMSROLAPRDBMSRDBMS,Star SchemaArchitectedDatamartsCentralMetadata Data Modeling ToolEnd-UserToolEnd-UserToolMDBEnd-UserToolEnd-UserToolLocal MetadataLocal MetadataPowerMartSybase IQSybase IQCognosPowerMartWarehouseArchitectWCCBrio/BOSybase ASE

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|