大数据项目实施.pptx

上传人(卖家):晟晟文业 文档编号:4105192 上传时间:2022-11-11 格式:PPTX 页数:53 大小:4.61MB
下载 相关 举报
大数据项目实施.pptx_第1页
第1页 / 共53页
大数据项目实施.pptx_第2页
第2页 / 共53页
大数据项目实施.pptx_第3页
第3页 / 共53页
大数据项目实施.pptx_第4页
第4页 / 共53页
大数据项目实施.pptx_第5页
第5页 / 共53页
点击查看更多>>
资源描述

1、大数据项目实施什么是全球数据仓库领导者计什么是全球数据仓库领导者计划?划?What about GDWL program?2什么是全球数据仓库领导者计划?What about GDWL program?我们与全球主要的数据仓库和大数据客户一起工作我们与全球主要的数据仓库和大数据客户一起工作We are working all around the world with key Data Warehouse and Big Data customers我们观察到许多客户的项目实施我们观察到许多客户的项目实施We have seen many customers implementations我们

2、看到很多成功的例子,也有并不如此成功的我们看到很多成功的例子,也有并不如此成功的We have seen successful examples and not so successful我们帮助哪些并不特别成功的客户迈向成功我们帮助哪些并不特别成功的客户迈向成功We helped second category to became the first今天我们也将利用全球客户的经验来描述大数据之旅如何迈向成今天我们也将利用全球客户的经验来描述大数据之旅如何迈向成功功Today I will use world wide customers experience to describe how

3、looks like Big Data Journey对我来说,精彩的演示对我来说,精彩的演示 并不是自己完成的,而是和我们的客户并不是自己完成的,而是和我们的客户一起一起Brilliant presentation for me noting to do myself,just compile customers slides3为什么我们要谈论这个话题?为什么我们要谈论这个话题?Why we are going to talk about this?42012年的大数据年的大数据 Big Data in 2012 5年前大数据引发了大量的年前大数据引发了大量的热议热议5 year ago t

4、erm Big Data have created a lot of buzz 每个人都在谈论它,但只有每个人都在谈论它,但只有很少的客户真的做了一些事很少的客户真的做了一些事情情Everyone was talking about it,but only very few customers really did something 这就像是淘金热!这就像是淘金热!it was like a golden rush!5淘金热 Gold Rush62012 甚至许多人认为并相信,甚至许多人认为并相信,“大数据大数据”是灵丹妙药,是灵丹妙药,可以治疗任何疾病并解决可以治疗任何疾病并解决任何问题任

5、何问题And many people thought and believed,that“big data”is magic pill,which could treat any disease and resolve any problem72014年的大数据年的大数据 Big Data in 2014 2年后人们意识到大数据不是年后人们意识到大数据不是万能的万能的2 years late people realized,that Big Data is not something sacral 其中一些人感到失望其中一些人感到失望Some of them got disappointed

6、更多人开始做一些事情,如运更多人开始做一些事情,如运行新的项目行新的项目Other people start doing something,running new and new projects 正如正如Gartner预测的那样预测的那样All as Gartner predicts82016年的大数据年的大数据 Big Data in 2016 2年后大数据已经从炒作年后大数据已经从炒作循环曲线中消失循环曲线中消失2 years late Big Data has disappeared from the hype cycle curve 现在它是一个技术堆栈,现在它是一个技术堆栈,被许

7、多客户所使用!被许多客户所使用!Now its a technology stack,which used by many customers!9什么是什么是“大数据项目大数据项目”?What is the“big data project”?10什么是什么是“大数据项目大数据项目”?What is the big data project?1)不要将大数据项目视为技术替代项目。它是技术演变。其中一个情况:有些客户开始打算启动将所有关不要将大数据项目视为技术替代项目。它是技术演变。其中一个情况:有些客户开始打算启动将所有关系数据库,并将其替换为大数据系数据库,并将其替换为大数据(Hadoop,

8、NoSQL.)1)Dont think about Big Data project as replacement project.Its evolution.There are some customers,who start with intention to kick-off all relational databases and replace it with Big Data(Hadoop,NoSQL).One of the story:*时间表时间表-2014年:年:“我们的我们的CIO定义了目标定义了目标-用新的大数据技术取代所有关系数据库用新的大数据技术取代所有关系数据库”(

9、C)一家香港公)一家香港公司司*Timeline 2014:“Our CIO define the goal replace all relational databases with new big data technologies”(C)Hong Kong Based company*时间线时间线-2015年:年:“我们开始实施我们开始实施.过了一段时间,我们意识到,考虑到我们的技术资源,这样做几乎过了一段时间,我们意识到,考虑到我们的技术资源,这样做几乎是不可能的。是不可能的。我们不是谷歌,也没有我们不是谷歌,也没有100位开发人员维护这个解决方案位开发人员维护这个解决方案“(C)同一

10、家香港公司)同一家香港公司*Timeline 2015:“We started implementation and after a while,we realized that its almost impossible to do this,given our technical resources.We are not Google and dont have 100s of the developers for maintain this solutions”(C)Hong Kong Based company*时间线时间线-2016:“我们开始考虑混合解决方案,比如我们开始考虑混合解

11、决方案,比如Hadoop或或NoSQL等现代大数据技术对传统技术的补等现代大数据技术对传统技术的补充(而不是取而代之)充(而不是取而代之)”(C)还是这家香港公司)还是这家香港公司*Timeline 2016:“We start thinking about hybrid solution,like complement(instead replacing)to the traditional technologies by modern Big Data technologies,such as Hadoop or NoSQL”(C)Hong Kong Based company11参考架构

12、参考架构(Reference architecture)12数据摄取Data Ingestion信息解释Information Interpretation访问和性能层Access&Performance Layer基础数据层Foundation Data Layer原始数据Raw Data Reservoir数据引擎和多结构数据源数据引擎和多结构数据源Data Engines&Poly-structured sources内容内容Content文档 Docs网络和社交媒体网络和社交媒体Web&Social MediaSMS结构化数据源结构化数据源StructuredDataSources运营

13、数据(Operational Data)COTS数据(COTS Data)流数据和BAM(Streaming&BAM)不可变的原始数据,原始数据不需要解释Immutable raw data reservoirRaw data at rest is not interpreted不可改变的建模数据。业务流程中性形式。从业务流程变更中抽象出来Immutable modelled data.Business Process Neutral form.Abstracted from business process changes过去,现在和将来的企业数据解读。结构化以支持敏捷的访问和导航Past,

14、current and future interpretation of enterprise data.Structured to support agile access&navigation发现探索实验室沙箱Discovery Lab Sandboxes快速开发沙箱Rapid Development Sandboxes基于项目的数据存储以支持特定的数据发现和探索目标Project based data stores to support specific discovery objectives基于项目的数据存储,以促进快速内容/展现交付Project based data stored

15、 to facilitate rapid content/presentation delivery数据源 Data Sources主数据和参考数据源主数据和参考数据源Master&ReferenceData SourcesHDFS 读架构读架构HDFS Schema on read甲骨文数据库甲骨文数据库-写架构写架构Oracle Database Schema on write企业数据服务企业数据服务(Enterprise Data Service)提供高质量的数据环境,为不同的用户群体提供有意义的信息和商业智能,以获得特定的业务成果Delivering a high quality da

16、ta environment that provides meaningful information and business intelligence to a diverse user community in order to achieve specific business outcomes13金Gold业务验证的计算和转换业务验证的计算和转换被确定为对质量至关重要被确定为对质量至关重要管理和制定以适应商业实管理和制定以适应商业实践践Business validated computations and transformationsIdentified as critical t

17、o qualityManaged and formulated to fit business practices集成的,结构化的,集成的,结构化的,定义的定义的Integrated,Structured,Defined经过业务认证和验证,经过业务认证和验证,管理人员定义关键数据管理人员定义关键数据质量信息质量信息 Business Certifed and validated Stewards define critical to quality data profile银SilverIT数量验证(收到的数据是数数量验证(收到的数据是数据加载的)据加载的);IT针对源系统进行针对源系统进行了

18、验证了验证;IT格式认证(空值,数格式认证(空值,数字与字符,与源系统相同的质字与字符,与源系统相同的质量)量)IT Quantity validation(data received is data loaded);IT validated against source systems;IT format certified(nulls,number vs char,same quality as source system)最小操纵的数据最小操纵的数据Minimally manipulated data铜Bronze数据直接来源于数据源数据直接来源于数据源Data directly fro

19、m sourceLG CNS 大数据业务扩张(Big Data Business Expansion)14主动预测predictive被动响应Reactive业务创新业务创新(物联网等物联网等)New Biz Creation(IoT)I.智慧商务智能智慧商务智能/数据仓库数据仓库I.Smart BI/DW传统商务智能/数据仓库Tradition BI/DW业务分析业务分析“解决问题解决问题”Business Analytics Problem Solving大数据大数据/混合混合架构架构Big Data/Hybrid ArchitectureIII.大数据分析(如社交媒体分大数据分析(如社交

20、媒体分析)析)III.Big Data Analytics(Social Media Analytics)II.混合信息架构混合信息架构II.Hybrid Information ArchitectureLG CNS是众多客户之是众多客户之一,他们对传统数据仓一,他们对传统数据仓库进行了现代化改造库进行了现代化改造LG CNS is one of the many customers,who made a modernization of the traditional Data Warehouse架构架构信息架构模型分层描述信息架构模型分层描述Garanti银行银行 智能和分析平台智能和分析

21、平台全数据管理平台:更好的洞察力,实时供应,降低风险全数据管理平台:更好的洞察力,实时供应,降低风险阿尔法银行阿尔法银行 Alfa Bank什么是大数据项目?什么是大数据项目?What is the big data project?1)不要将大数据项目视为关于替换项目。它是技术演变技术演变。Dont think about Big Data project as about replacement project.Its evolution.2)新技术(大数据)允许存储更多数据。如果以前的方式是:“考虑你加载到数据库中的内容”,现在它已经被转换为:“把你拥有的所有数据放在Hadoop(数据池

22、)层上”。您对加载到系统中的数据所需要做的选择性会降低。这是关于数据量数据量New technologies(Big Data)allows to store more data.If previous philosophy was:“think what do you load into Database”,now it have been converted into:“Put everything you have on the Hadoop(Data pool)tier”.You could be less selective with data that you load into

23、the system.its about volume3)这意味着您可以将更多可变数据可变数据存储到您的单一系统(非结构化,半结构化,结构化)It means that you may store more variable data into your single system(unstructured,semi-structured,structured)18Hadoop允许存储大量数据,SunTrust从单一逻辑位置的不同来源获取数据Hadoop allows to store big amount of data,which SunTrust gets from different

24、sources in single logical place甲骨文大数据数据量增长甲骨文大数据数据量增长(Oracle Big Data Growth Volumes)假设持续增长,未压缩估计,不包括假设持续增长,未压缩估计,不包括HDFS复制复制Assumed consistent growth,Uncompressed estimates,Not including HDFS replication国际足联正试图预测足球(足球)比赛中的欺诈行为,因此他们需要来自不同来源的信息,这些信息来自不同的格式。Hadoop允许轻松将其放置在HDFS上FIFA is trying to predic

25、t fraud in football(soccer)games,from this they need information from different sources,which they got in different formats.Hadoop allows easily land it on the HDFS运动数据相关的初始需求运动数据相关的初始需求范围将是:赛程和现场比分(黄牌和红牌,罚球.)球队排队桌子/表格比赛对抗过去的球队比赛(友谊赛,杯赛等)所有4名裁判(裁判员,边裁等)球员和球队的表现通过完成情况跑步距离铲球情况犯规.投注相关信息预期值澳大利亚能源公司的传统架构

26、看起来像一个纠结的网络。HDFS是一种数据总线,它可以将所有数据源都放置在那里Legacy architecture of Energy Australia looks like a tangled Web.HDFS is kind of data bus,where they able to land all data sourcesSmart是菲律宾最大的电信运营商之一,它存储结构化数据是菲律宾最大的电信运营商之一,它存储结构化数据-CDR,但数据量巨,但数据量巨大!大!Smart is one of the biggest Telco operator on the Philippine

27、s,stores pretty structure data CDRs,but volume is huge!初始环境初始环境节点数节点数HDFS总容总容量量回顾什么是大数据项目?回顾什么是大数据项目?What is the big data project?Recap1)不要将大数据项目视为关于替换项目。它是技术演变技术演变。Dont think about Big Data project as about replacement project.Its evolution.2)新技术(大数据)允许存储更多数据。如果以前的方式是:“考虑你加载到数据库中的内容”,现在它已经被转换为:“把你拥

28、有的所有数据放在Hadoop(数据池)层上”。您对加载到系统中的数据所需要做的选择性会降低。这是关于数据量数据量New technologies(Big Data)allows to store more data.If previous philosophy was:“think what do you load into Database”,now it have been converted into:“Put everything you have on the Hadoop(Data pool)tier”.You could be less selective with data t

29、hat you load into the system.its about volume3)这意味着您可以将更多可变数据可变数据存储到您的单一系统(非结构化,半结构化,结构化)It means that you may store more variable data into your single system(unstructured,semi-structured,structured)23成功的大数据项目的关键点成功的大数据项目的关键点Key aspects of the successful Big Data Project24成功的大数据项目的关键点成功的大数据项目的关键点 K

30、ey aspects of the successful Big Data Project1)想象一个“钱钮”,只要你按下它,你就会获得钱。有没有想过?现在忘记吧忘记吧。此按钮不存在!Think about one“money button”,which brings money to you as soon as you press it.Have thought?And now forget.This button doesnt exist!2)艰苦的项目工作是一个关键的成功因素。做测试,试点,到项目。Hard project work is a key success factor.Do

31、 PoCs,Pilots,Projects.3)通常,客户会有许多大数据项目。但是有一个超级有利可图的项目却是非常罕见的。Usually,customers have many Big Data projects.Its very rare,when someone has one super gold profitable project25一年以来,罗氏进行了一年以来,罗氏进行了许多测试和试点。许多测试和试点。并非并非所有的人都成功了。所有的人都成功了。For one year Roche run many PoC and Pilots.Not all of them have been

32、successful.大约有大约有20个测试已经发生个测试已经发生/正在进行中正在进行中About 20 PoCs were conducted/being conducted肿瘤图像坐标的空间分析肿瘤图像坐标的空间分析Spatial analysis on tumor images coordinates人力资源人员分析人力资源人员分析HR people analytics新一代测序数据处理新一代测序数据处理Next generation sequencing data processing预测性维护的统计模型预测性维护的统计模型Statistical model for predictiv

33、e maintenancesTeradata连接器连接器Teradata connector从从2015年开始年开始Since 20155个应用程序个应用程序5 live applications2017年有年有5个新应用程序个新应用程序5 additional apps in 2017项目组合项目组合项目组合项目组合项目类型项目类型Garanti银行经营许多项目,涉及许多业务挑战Garanti bank runs many projects with many divisions,related with many business challenges预警系统下一个最佳供应客户社交网络分析

34、数据治理客户DNA城市分析数据水池7个支柱成功的大数据项目的关键点成功的大数据项目的关键点 Key aspects of the successful Big Data Project1)想象一个“钱钮”,只要你按下它,你就会获得钱。有没有想过?现在忘记吧忘记吧。此按钮不存在!Think about one“money button”,which brings money to you as soon as you press it.Have thought?And now forget.This button doesnt exist!2)艰苦的项目工作是一个关键的成功因素。做测试,试点,到

35、项目。Hard project work is a key success factor.Do PoCs,Pilots,Projects.3)通常,客户会有许多大数据项目。但是有一个超级有利可图的项目却是非常罕见的。Usually,customers have many Big Data projects.Its very rare,when someone has one super gold profitable project4)正在成功实施大数据项目的公司通常拥有CDO(首席数据官)来指明方向。通常他/她是权力和决策者的中心Companies,who is doing successf

36、ul Big Data projects,usually have CDO(Chief Data Officer),who lead this direction.Usually he/she is the center of the power and decision maker5)创新。创建并运行研究实验室和研发部门。技术允许您存储更多数据和更多数据格式。但它本身并不能解决您的业务挑战。Be innovative.Open and run the research labs and R&D.Technologies allow you to store more data and mor

37、e data formats.But it doesnt solve your business challenges itself.29阿尔法银行创新实验室 Alfa Bank innovative Lab30德意志银行实验室 Deutsche Bank Lab31主题探索主题探索主题生态系统观测技术趋势Deutsche Bank Strategic Roadmap德意志银行策略路线跨行业趋势成功的大数据项目的关键点成功的大数据项目的关键点 Key aspects of the successful Big Data Project1)想象一个“钱钮”,只要你按下它,你就会获得钱。有没有想过

38、?现在忘记吧忘记吧。此按钮不存在!Think about one“money button”,which brings money to you as soon as you press it.Have thought?And now forget.This button doesnt exist!2)艰苦的项目工作是一个关键的成功因素。做测试,试点,到项目。Hard project work is a key success factor.Do PoCs,Pilots,Projects.3)通常,客户会有许多大数据项目。但是有一个超级有利可图的项目却是非常罕见的。Usually,custom

39、ers have many Big Data projects.Its very rare,when someone has one super gold profitable project4)正在成功实施大数据项目的公司通常拥有CDO(首席数据官)来指明方向。通常他/她是权力和决策者的中心Companies,who is doing successful Big Data projects,usually have CDO(Chief Data Officer),who lead this direction.Usually he/she is the center of the powe

40、r and decision maker5)创新。创建并运行研究实验室和研发部门。技术允许您存储更多数据和更多数据格式。但它本身并不能解决您的业务挑战。Be innovative.Open and run the research labs and R&D.Technologies allow you to store more data and more data formats.But it doesnt solve your business challenges itself.6)培育人才。公司内部。在大学里(像Caixa银行一样)Grow up the personnel.Insid

41、e the company.In the university(like Caixa Bank does)7)让你的系统更加用户友好。更友好就意味着更少的IT工作Make you systems more user friendly.Than more friendly they are,than less work to the IT33Borse集团 Borse GroupIT转型让业务人员能开发IT系统成功的大数据项目的关键点成功的大数据项目的关键点 Key aspects of the successful Big Data Project1)想象一个“钱钮”,只要你按下它,你就会获得

42、钱。有没有想过?现在忘记吧忘记吧。此按钮不存在!Think about one“money button”,which brings money to you as soon as you press it.Have thought?And now forget.This button doesnt exist!2)艰苦的项目工作是一个关键的成功因素。做测试,试点,到项目。Hard project work is a key success factor.Do PoCs,Pilots,Projects.3)通常,客户会有许多大数据项目。但是有一个超级有利可图的项目却是非常罕见的。Usually

43、,customers have many Big Data projects.Its very rare,when someone has one super gold profitable project4)正在成功实施大数据项目的公司通常拥有CDO(首席数据官)来指明方向。通常他/她是权力和决策者的中心Companies,who is doing successful Big Data projects,usually have CDO(Chief Data Officer),who lead this direction.Usually he/she is the center of t

44、he power and decision maker5)创新。创建并运行研究实验室和研发部门。技术允许您存储更多数据和更多数据格式。但它本身并不能解决您的业务挑战。Be innovative.Open and run the research labs and R&D.Technologies allow you to store more data and more data formats.But it doesnt solve your business challenges itself.6)培育人才。公司内部。在大学里(像Caixa银行一样)Grow up the personne

45、l.Inside the company.In the university(like Caixa Bank does)7)让你的系统更加用户友好。更友好就意味着更少的IT工作Make you systems more user friendly.Than more friendly they are,than less work to the IT8)做数据探索。大数据不仅仅是关于静态报告。你必须探索数据。你必须从数据中挖掘价值Do data Discovery.Big Data its not only about static reporting.You have to explore

46、the data.You have to mine values from the data35分析工具组合分析工具组合已知的问题已知的问题已知的已知的数据来源数据来源未知的问题未知的问题未知的未知的数据来源数据来源数据探索数据探索数据挖掘数据挖掘商务智能商务智能我们现在的分析工具覆盖了所有可能的分析类型最常见的应用场景最常见的应用场景Most common use cases37最常见的应用场景最常见的应用场景 Most common use cases1)数据池-将所有数据存储在一个地方。存储各种格式的大量数据在同一个地方。几乎所有Oracle大数据客户都在为此使用HadoopData p

47、ool store all data in single place.Store big data volumes,variety of the formats in the single place.Almost all Oracle Big Data customers are using Hadoop for this purposes38Garanti银行最常见的应用场景39数据池结构化数据Structure Data半结构化数据Semi Structured非结构化数据Unstructured信用卡行为客户财务客户行为信贷智能应用位置系统和应用日志渠道日志(ATM互联网,IVR,CC

48、)点击流数据客户投诉社交媒体数据语音到文字最常见的应用场景最常见的应用场景 Most common use cases1)数据池-将所有数据存储在一个地方。存储各种格式的大量数据在同一个地方。几乎所有Oracle大数据客户都在为此使用HadoopData pool store all data in single place.Store big data volumes,variety of the formats in the single place.Almost all Oracle Big Data customers are using Hadoop for this purpose

49、s2)数据池提供对广泛信息的访问。如果您的企业有很多客户,那么创建360视图配置文件以向他提供目标报价相当常见Data pool provides access to wide scope of the information.And If your business has a lot of customers,its quite common to create 360 view profile,for making target offers to him40AdNoc 360视图(360 view.AdNoc.)AdNoc是阿联酋的天然气公司AdNoc is Gas company i

50、n UAE他们几乎在每个加油站都有小超市They have minimarket almost on the each Gas station根据客户的消费情况,他在采购期间实时获得相应的报价Based on the customers spending profile,he get corresponding offer in real-time during the purchasing大数据潜在应用场景大数据潜在应用场景2(目标客户促销)(目标客户促销)中国东方航空 360视图(360 view.China Eastern Airlines)这是业务场景实施的基础这是业务场景实施的基础S

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(大数据项目实施.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|