1、大数据时代“”大数据行业发展和趋势Part 12互联网、云计算、大数据发展路径多用户,基础设施连接基础设施高并发,系统快速处理战略资源跨平台,海量数据计算核心竞争力3大数据产业发展的演变4DT信息驱动 IT时代以自我控制、自我管理为主。 信息技术驱动生产,信息流为核心。 数据作为附加产物,碎片化严重。 数据驱动 DT时代以服务、激发生产力为主。 数据驱动业务,以数据流为中心。 数据整合打通链路,加快产业升级。 智能驱动 智能技术应用产业、解放劳动力。 智能驱动决策,机器学习技术 赋能产业改变人与场景交互方式。 “大场景”孵化“大数据”6年“数据处理能力”飙升10万倍Oracle RAC业务原始
2、数据GP单BU数据Hadoop全集团数据阿里云ODPS生态圈数据2014年“双十一”:总数据处理量:100PB0.0976562510.0030.00100.001024.0010240.000200040006000800010000120002009201020112012201320145什么是大数据?6大约30分钟。如果您不想等,可以自己骑车来。根据我们的车辆行驶自动跟踪系统记录,您登记有一辆的摩托车,而您目前正在铁山路右侧骑着这辆摩托车会员卡号是:342623我想要一个海鲜披萨。为什么?你怎么知道我会喜欢吃这种的?你们直接把比萨送我家吧,你们多久会送到?那你们有什么推荐?好。那要一个
3、家庭特大号,多少钱?您的会员卡号是?,你的血压和胆固醇都偏高。您上星期一在借了一本低脂健康食谱。她了心脏手术,还在恢复期。*披萨店为您服务。海鲜披萨不适合您。您可以试试我们的低脂健康比萨。99元,它足够您吃。但您母亲应该少吃。为什么会有大数据 - 大数据来源7机器产生的数据传感器传感器感知和运输不断生产的数据移动设备收集了大量的用户数据大数据的基础条件8移动互联网带来爆炸式的数据增长数据成为一种资产越来越重要存储技术和计算能力飞速发展、成本降低大数据的计算能力9A 大数据大数据B 云计算云计算云计算一般由数量惊人的计算机群构成,谷歌云计算拥有的服务器超过100万台;云计算系统是一个极其庞大的资
4、源池子,用户可以随时、随地、按需灵活地购买,就像购买煤气和自来水一样便利;云计算让普通人体验每秒10万亿次的运算能力。而如此强大的计算能力,可以模拟核爆炸、预测气候变化和市场发展趋势。大数据的存储能力10世界上第一款硬盘IBM商用硬盘存储器一兆字节的存储量需要6000多美元1955年2010年一兆字节的存储量仅需要0.005美分2020年1T硬盘 = 一杯咖啡的钱= 一个图书馆的全部信息大数据的概念11海量 Volume非结构化数据的超大规模和增长 占总数据量的8090% 比结构化数据增长快10倍到50倍 是传统数据仓库的10倍到50倍多样 Variety大数据的异构和多样性 很多不同形式(文
5、本、图像、视频、机器数据) 无模式或者模式不明显 不连贯的语法或句义价值 Value挖掘大量的不相关信息的价值 对未来趋势与模式的可预测分析 深度复杂分析(机器学习、人工智能、商务智能(咨询报告等)高速 Velocity实时分析和离线分析 数据输入、处理与丢弃 互联网接入终端快速增长 快速计算、数据分析大数据的热门应用领域121 沃尔玛基于每月4500万网购数据,结合网上挖掘的对产品的大众评分,开发语义搜索引擎,方便浏览,在线购物者增加1015%,增加销售十多亿美元。还通过对消费者购物行为分析,了解顾客购物习惯,优化商品陈列。2 硅谷Climate公司从美国政府获得30年的气候、60年的农作物
6、收成、14TB的土壤数据,还收集250万个地点的气候数据,向农户提供天气变化、作物、病虫害和灾害、肥料、收获、产量、市场 价格等咨询和保险服务,承诺每英亩的玉米利润增加100美元,如预测有误将将及时赔付。3 丰田利用数据分析在试制样车前避免了80%的缺陷;GE通过对2万台喷气引擎的数据分析,能够提前一个月预测其维护需求,预测准确率达到70%;百度将网民对汽车的各类搜索 请求进行大数据挖掘,帮助一汽等车企深入了解消费者需求,设计新品及资源调配大数据的热门应用领域134 华尔街的银行应用大数据分析风险时间从3月缩短到3小时,价格计算从48小时到20分钟,行为分析从72小时到20分钟;交通银行太平洋
7、信用卡中心采用大数据信贷审批决策引擎,审批效率提高30%;阿里公司基于大数据建设投融资平台。5 美国UPS每天平均运输163万件包裹,用传感器跟踪46000辆车,2011年少跑了8500万英里路程,节约了840万加仑燃料;中远物流公司有100多个配送中心,3000个网点,装GPS的上万辆车每月产生2亿条信息,减排10%。6 苹果公司总裁乔布斯花费几十万美元获得自身全部DNA,希望通过这种方式战胜癌症虽然愿望没有实现,但也将他的生命延长了几年;人体对药品 代谢方式的差异 取决于个体特定的基因、酶和蛋白质组合,因此基因信息对选择最优治疗非常关键。大数据的行业应用 商业案例14农夫山泉每天新增的数据
8、是100G,每月为3TB。采用实时大数据计算,同等数据量的计算速度从过去的24小时缩短到了0.67秒现在采用传统数据仓库,再通过数据报表展现,这个过程长达24小时过去农夫山泉以30%-40%的年增长率,快速超越原先的三甲:娃哈哈、乐百氏和可口可乐。大数据的行业应用 商业案例15北美最大的付费订阅视频网站Netflix2012年,Netflix准备推出自制剧。不过在决定拍什么、怎么拍上,Netflix推出了自己的秘密武器大数据。用大数据拍自制剧收集01预测02拍摄03收集该网站上用户每天产生的行为,如收藏、推荐、回放、暂停等,还包括用户的搜索请求等。分析出凯文史派西、大卫芬奇和“BBC出品”这三
9、种元素结合在一起的电视剧产品将会大火。融合三者拍摄了一部纸牌屋,结果大获成功,成为了2013年全球最火的美剧。大数据行业应用 金融16支付宝“芝麻信用”“芝麻信用分”,授权开通后,每个支付宝用户都可以看到自己的芝麻信用分。分数越高代表信用程度越好,违约可能性越低。天猫淘宝淘宝电影水费电费工商学历学籍公安内部数据外部数据支付宝网购相关行为数据政府已经开放的外部数据芝麻信用分高芝麻信用分低租车、住酒店无押金签证无需财产证明找不到工作租不到房子贷不到款大数据行业应用 医疗案例17案例:Watson通过比对2000万份癌症研究论文,在10分钟得出了诊断结果:患者得了一种罕见白血病。超级计算机Watso
10、n在医疗、医药行业可以帮助做复杂疾病的诊断和数据分析利用认知计算技术缩短治疗方案制定周期医疗机构以利用Watson规范医疗费用帮助分析疾病风险,保证理赔过程的合规性、合理性,防止滥用和欺诈大数据时代“”大数据应用实践和案例Part 218目 录 Contents19企业大数据实践典型案例分享企业大数据应用现状2002大数据应用得到进一步普及35.1%的受访企业已经应用了大数据;同时, 22.9%的企业计划将在未来 1 年内应用大数据,发展前景较为乐观。 0304企业将进一步加大在大数据领域的投入一半以上的受访企业未来计划加大对大数据的投入,其中近20%的企业预计投入增长在50%以上。01数据来
11、源:中国信息通信研究院企业大数据应用场景和效果21企业数据分析方式企业数据分析结果展现方式企业大数据应用场景企业应用大数据带来的效果数据来源:中国信息通信研究院企业大数据应用分析方法22从非结构化数据中提取信息,引入语义分析、图像识别等技术人工智能深入数据内部,用云计算去做人工做不到的数据价值发现挖掘分析建模高质量的数据处理和管理是输出高质量结果的前提数据质量和管理图形化展示数据分析结果,为使用者提供决策依据图形可视化根据可视化和数据挖掘的结果做出预测,风险预估和市场判断预测分析能力数据驱动技术,技术促进商业目 录 Contents23企业大数据应用典型案例分享大数据行业实践现状24大数据业务
12、金融征信电商新零售物联网智能物流生产制造安全监控 几千名 大数据工程师 几万台 服务器 数百PB 的海量数据 几十个 业务板块阿里大数据业务支撑阿里巴巴大数据实践25云数据平台管理层/分析师监管机构合作伙伴运营/BD商户个人用户金融机构新零售大数据来源26搜索、提问数据搜索引擎社交行为数据社交网络用户点击行为数据互联网资金流、信息流数据电子商务地理位置、流数据电子地图模拟形式数据影音资料新零售大数据实践方法论27以客户为中心定:可洞察l 构建主体标签体系l 构建企业全域数据逻辑模型l 全景洞察企业数据资产研:可识别l 采集集关于主体的多源数据l 整合数据,实现统一存储和分析l 研究分析了解主体
13、属性与关系投:可触达l 实现数据驱动运营l 新客挖掘精准营销l 线下门店经营指导优:可服务l 客户服务提升满意度l 运营效果评估优化经营策略l 问题溯源解决实际问题通过“研、定、投、优” 的闭环运营,实现对客户的可识别、可洞察、可触达、可服务企业数据驱动运营28数据采集与整合内部l顾客数据l门店数据l经销商数据l商品数据外部l楼盘数据l区域商圈数据l消费者特征数据,.构建企业全域数据资产视图标签体系l客户标签l资产标签l门店标签全景洞察l商圈画像l消费者画像l门店选址客户服务提升l门店评估l服务能力评估l客户维系l经营决策精准营销l精准铺货l潜客发掘l营销活动l智能推荐l经营指导交付能力提升l
14、服务网点选址l服务能力预估l销售预测l库存优化研 - 用户数据整合29财务 DRP客服 CRM客户体验 CIF品牌 CMSO2O会员顾客唯一ID姓名地址电话1电话2籍贯单位收入满意度性别信息转换全景画像人群透视人群放大投 新零售精准营销线上广告投放 新闻门户 移动APP 视频贴片 Banner 全屏广告 开屏广告 插屏广告 应用墙广告数据整合1线下环境 交通 天气 市政规划 基础设施客群特征 性别、年龄 行为偏好 消费偏好ERPCRM 会员信息 订单和收银 门店渠道 供应链门店区域消费者洞察2营销规则制定3多渠道客户触达引流4WIFI热点 店外客流 店内客流 Mac地址线下广告投放 楼宇LCD
15、视频资源 公交候车亭资源 报刊亭资源 户外立柱大牌资源 LED大屏资源 移动媒体车体资源 机场、火车站、停车场灯箱.线下交易提升,数据回流沉淀5算法驱动的精准营销2l 人群筛选规则 年龄: 3646 客源地:大陆地区 消费等级: 高 信用等级:优30目 录 Contents31企业大数据应用企业大数据实践案例分享 电商个性化推荐大麦网个性化推荐的成果占大麦网整体销售额5%32案例分享 茅台云商云商大中台云计算基础资源服务资源平台安全管控体系业务&大数据应用能力开放多终端多角色消费者经销商网点社会化营销员营销员客服运营领导APPWEB微信钉钉400TV门店(体验店)外部第三方平台网上商城注册登录
16、商品管理交易支付内容发布云商O2O注册登录店铺管理交易支付B2B订单网点服务扫码管理进销存结款云微商线下活动CRM平台客户服务自动应答知识库客服坐席工单管理内部协同成品酒退换会籍管理积分规则兑付规则促销推送会员管理营销管理销售管理销售政策渠道库存渠道营销渠道管理经销商渠道拜访管理合同计划订单管理往来账务消息推送特殊业务仓储物流扫码入、出、调、领终端配送管理调度运输管理运费结算管理新业务应用物流监控众筹、二手拍卖金融、购酒保险创新品牌.线上服务订单管理物流管理圈子运营招商活动对账.线上营销活动广告投放销售信用销售价格销售返利销售费用酒茶食品大健康33定 新零售门店画像34案例分享 协鑫光伏35良
17、品率预测模型关键参数监控模型生产监控大屏多维统计分析良品率提升1个百分点节省生产成本上亿元案例分享 轻松筹制定数据采集策略,整合多源海量数据初步实现数据集中,依据业务主题设计并构建企业数据仓库,搭建企业大数据分析底盘,提升大数据统计分析效率,为其他大数据应用提供支撑。流量运营产品体验项目运营成交分析分享客单价,成交金额,退款金额,支付失败订单,支付时长,支付转化率,复购率 分享人数,分享金额投诉率,买家评价,消息到达新增项目,在筹项目,成功项目,失败项目等对应的数量和金额等客户端/页面的pv,uv,新增用户,注册用户,留存率,页面漏斗,转化率等数据仓库36案例分享 轻松筹37资源费用时间效率成本更快的时间、更高的效率、更低的成本写在最后写在最后成功的基础在于好的学习习惯成功的基础在于好的学习习惯The foundation of success lies in good habits 结束语当你尽了自己的最大努力时,失败也是伟大的,所以不要放弃,坚持就是正确的。When You Do Your Best, Failure Is Great, So DonT Give Up, Stick To The End演讲人:XXXXXX 时 间:XX年XX月XX日