1、大数据应用技术介绍PPT大数据云平台1. 1. 国家大数据战略国家大数据战略2. 2. 什么是大数据什么是大数据3. 3. 大数据如何产生大数据如何产生目 录Contents4. 4. 大数据可以做什么大数据可以做什么5. 5. 中国:从中国:从“数据大国数据大国”走向走向“数据强国数据强国”Part 1国家大数据战略郎丰利4国家大数据战略核心内容加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发展和人民生活改善。加快建设数字中国把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社
2、会治理创新。助力产业转型升级 全面推进重点领域大数据高效采集、有效整合,深化政府数据和社会数据关联分析、融合利用,提高宏观调控、市场监管、社会治理和公共服务精准性和有效性。依托政府数据统一共享交换平台,加快推进跨部门数据资源共享共用。加快建设国家政府数据统一开放平台,推动政府信息系统和公共数据互联开放共享。制定政府数据共享开放目录,依法推进数据资源向社会开放。统筹布局建设国家大数据平台、数据中心等基础设施。研究制定数据开放、保护等法律法规,制定政府信息资源管理办法。 深化大数据在各行业的创新应用,探索与传统产业协同发展新业态新模式,加快完善大数据产业链。加快海量数据采集、存储、清洗、分析发掘、
3、可视化、安全与隐私保护等领域关键技术攻关。促进大数据软硬件产品发展。完善大数据产业公共服务支撑体系和生态体系,加强标准体系和质量技术基础建设。 郎丰利5中国大数据正处于高速发展的窗口期,国家政策大力支持 2020年,中国的数据总量将占全球数据总量比例的20%,成为世界第一数据资源大国和全球数据中心。政策市场社会技术国家级大数据战略陆续发布十八届五中全会提出实施“国家大数据战略”,国务院发布促进大数据发展行动计划、大数据“十三五”规划大数据市场规模50%高速增长2015年我国大数据市场规模达116亿元,预计未来五年50%高速增长法制法规逐步完善已出台电信和互联网用户个人信息保护规定,但仍存在诸多
4、问题技术是基石,加大Hadoop、Spark投入大数据应用仍处于初级技术阶段大数据应用仍处于初级技术阶段2020年,中国大数据市场规模将达1000亿元注:数据不包含基础设施部分数据出处:工信部研究院郎丰利61政府通过大数据实现管理创新,释放经济价值管理体制创新-碎片化到网格化管理管理方法创新-数据开放,共享管理方式创新-数据应用体系科学决策-决策方式 管理模式创新-动态管理04523逐步建立服务政府,提升效率,科学决策的创新管理模式创新目标供给侧改革新型城镇化简政放权政府数据体系建设:自有数据+外部数据政府数据应用:内部应用+外部应用4创新举措123大数据时代政府要领跑,需通过广泛采集数据、综
5、合处理数据,实现公共服务的技术创新、管理创新和模式创新,这是大数据时代的必然选择。管理创新三步走郎丰利7“七步走”解决政府面临的大数据痛点1、设立专管机构,完善管理体系2、整合数据孤岛,统一数据标准3、构建数据汇聚体系,打通数据整合通道4、设计数据存储策略,提升数据存储效率5、打造完整数据治理体系6、制订开放共享策略,促进数据融合安全发展7、夯实运营基础,打造大数据综合运营能力管理机制安全保障数据保密数据分散信息烟囱利益割据技术标准不统一郎丰利8中国大数据未来五年发展趋势中国大数据产业规模年均增长率将超过50%大数据产业包括应用市场、基础设施和软件市场大数据远景产业规模建立数据标准和税务标准体
6、系政府与企业成立大数据相关部门政策制度2017年底形成政府跨部门数据资源共享共用格局2018年底前建成国家政府数据统一开放平台,实现公共数据资源合理适度向社会开放数据开放大数据将成为企业、社会和国家层面重要的战略资源成为重要战略资源云计算为大数据提供弹性可扩展的基础设施支撑环境以及数据服务的高效模式与云计算深度融合出台信息公开与个人隐私相关法规明确数据隐私的标准和条例出台,保障数据安全数据隐私标准建立Part 2什么是大数据郎丰利10本章概要0102什么是大数据大数据的五个特点郎丰利111.什么是大数据它什么都知道它什么都知道会员卡号是:342623我想要一个海鲜披萨。*披萨店为您服务。您的会
7、员卡号是?为什么?海鲜披萨不适合您。根据您的医疗记录根据您的医疗记录,你的血压和胆固醇都偏高。您可以试试我们的低脂健康比萨。那你们有什么推荐?您上星期一在国家图书馆国家图书馆借了一本低脂健康食谱。你怎么知道我会喜欢吃这种的?好。那要一个家庭特大号,多少钱?99元,它足够您一家六口一家六口吃。但您母亲应该少吃。你们直接把比萨送我家吧,你们多久会送到?大约30分钟。如果您不想等,可以自己骑车来。根据我们CRMCRM全全球定位系统球定位系统的车辆行驶自动跟踪系统记录,您登记有一辆车号为车号为SV-568SV-568的摩托车,而您目前正在铁山路右侧骑着这辆摩托车她上月刚做上月刚做了心脏手术,还在恢复期
8、。郎丰利121.什么是大数据大数据挖掘和整合一切有用的信息,为人类社会提供更好的服务。21世纪前10年社交媒体的产生,数据开始呈现爆炸式的增长,大数据的提法开始进入大众的视野并获得了越来越多的关注。郎丰利132.大数据的五个特点类型多75%网络日志、音频、视频、图片、地理位置信息社交媒体中产生的数据25%“1、2、3、4”等传统数字以及符号非结构化数据非结构化数据结构化数据郎丰利142.大数据的五个特点容量大 美国的国会图书馆美国的国会图书馆50005000 百度每天处理数据量百度每天处理数据量根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB,而这个数值还在以每两
9、年翻一番的速度增长,预计到2020年全球将总共拥有35ZB的数据量,增长近20倍,相当于我们地球上所有海滩沙粒总数的57倍。(摘自涂子沛数据之巅大数据)截至2010年,人类拥有的信息总量大概是1.2Z1.2Z存储数据量最大的图书馆之一。2011年4月,拥有235TB的数据一首歌4M10241024一部电影1G1024一图书馆藏书1T1024谷歌每小时处理1P13亿中国人人手1本500页书的信息量总和=1E1024吉(吉(G G)兆(兆(M M)太(太(T T)拍(拍(P P)艾(艾(E E)泽(泽(Z Z)约为5000个美国图书馆总和郎丰利152.大数据的五个特点 数据产生得快数据产生得快一台
10、大型粒子对撞机里共有1.51.5亿个传感器亿个传感器每秒钟发生粒子对撞6 6亿次亿次仅仅使用十万分之一一年积累25PB25PB的数据1TB1TB的硬盘2500025000个个剔除剔除99.999%99.999% 数据处理速度快数据处理速度快大数据通过云计算,以上数据储存仅需2020分钟分钟共计1PB,速度1G/s,还剩144小时已完成50%存取速度快郎丰利162.大数据的五个特点应用价值大大数据之“大”,其实并不在于其表面的“大容量”,而在于其潜在的“大价值”。如果不能把拥有的数据转化为价值,那么拥有再多的数据也是毫无意义的。个人位置大数据服务80008000亿美元亿美元的市场规模麦肯锡研究院
11、对美国的测算零售业大数据帮助企业增加60%60%的利润制造业大数据降低50%50%的产品开发制造装配成本郎丰利172.大数据的五个特点具备大智能更加智能的社会传感器、可穿戴式设备等微小的计算设备将进一步普及“万物皆互联、无处不计算万物皆互联、无处不计算”实时收集数据确保安全行驶谷歌无人驾驶汽车Part 3大数据如何产生郎丰利睿利而行睿利而行19123保存数据的能力在增强处理数据的能力在增强生产数据的能力在增强大数据的背后推手郎丰利睿利而行睿利而行201.随着存储器硬件能力的提升,人类保存数据的能力在增强摩尔定律摩尔定律英特尔的创始人之一戈登摩尔半个世纪来,硬件技术的发展基本符合摩尔定律:同一面
12、积芯片上可容纳的晶体管数量,约每隔1824个月便增加一倍。今天,一根头发尖大小的地方,就能放上万个晶体管。郎丰利睿利而行睿利而行211.随着存储器硬件能力的提升,人类保存数据的能力在增强世界上第一款硬盘IBM商用硬盘存储器一兆字节的存储量需要60006000多美元多美元19551955年年20102010年年一兆字节的存储量仅需要0.0050.005美分美分20202020年年1T硬盘= =一杯咖啡的钱= =一个图书馆的全部信息郎丰利睿利而行睿利而行222.随着物联网技术与互联网经济的发展,人类生产数据的能力在增强传感器传感器感知和运输不断生产的数据移动设备收集了大量的用户数据郎丰利睿利而行睿
13、利而行232.随着物联网技术与互联网经济的发展,人类生产数据的能力在增强社交媒体及互联网经济的发展移动设备收集了大量的用户数据记录各自的活动和行为留下支付行为、空间位置、兴趣爱好、信用历史等每个网民每个网民都是数据的生产者都是数据的生产者郎丰利睿利而行睿利而行243.随着云计算的诞生与发展,人类处理数据的能力在增强爱迪生发明电灯泡自己用电信息时代的信息时代的“云计算云计算”发电机和电线持续供电个人和企业独立发电私人电厂遍地开中央电厂 公共电网付费用电郎丰利睿利而行睿利而行253.随着云计算的诞生与发展,人类处理数据的能力在增强A 大数据大数据B 云计算云计算 云计算一般由数量惊人的计算机群数量
14、惊人的计算机群构成,谷歌云计算拥有的服务器超过100100万台万台; 云计算系统是一个极其庞大的资源池子,用户可以随时、随地、按需灵活地购买,就像购买煤气和自来水一样便利; 云计算让普通人体验每秒10万亿次的运算能力。而如此强大的计算能力,可以模拟核爆炸、预测气候变化和市场发展趋势。Part 4大数据可以做什么郎丰利睿利而行睿利而行271234大数据让政府治理更精准透明大数据让公共服务更智慧大数据让商业创新更迅猛大数据让经济治理更有效 大数据可以做什么郎丰利睿利而行睿利而行281.大数据让政府治理更精准透明郎丰利睿利而行睿利而行291.大数据让政府治理更精准透明百度地图百度地图1用户去目的地前
15、,用百度用户去目的地前,用百度地图搜索地点和规划路线地图搜索地点和规划路线3提前提前1 12 2小时对即将小时对即将到来的风险进行预警到来的风险进行预警2百度地图通过百度地图通过分析大量分析大量数据,数据,预测相关预测相关地点的地点的人流量人流量避免如上海外滩踩踏事件避免如上海外滩踩踏事件一类悲剧再度发生一类悲剧再度发生郎丰利睿利而行睿利而行301.大数据让政府治理更精准透明设计人员编入流感关键词,如温度计、流感症状、肌肉疼痛、胸闷等只要用户输入这些关键词,系统就会展开跟踪分析,创建地区流感图表和流感地图预测出世界上不同国家和地区的流感传播情况2009年,甲型H1N1流感暴发的几周前,“谷歌流
16、感趋势”成功预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,并非常及时,令公共卫生官员备感震惊。而传统上,美国疾病控制中心要在流感暴发一两周之后才可以做到这些。谷歌流感趋势谷歌流感趋势谷歌工程师认为,搜索流感信息的人数与实际患病人数之间存在密切关联。谷歌一周疫情报告郎丰利睿利而行睿利而行311.大数据让政府治理更精准透明大数据“第三只眼”使政府治理更加透明化,打造阳光政府反腐倡廉反腐倡廉反应各地区的腐败轻重程度、廉洁指数、市民抱怨度、市民对政府的满意度等网民搜索反腐关键词郎丰利睿利而行睿利而行322.大数据让经济治理更有效经济治理领域是大数据创新应用的沃土大数据是提高经济治理质
17、量的有效手段郎丰利睿利而行睿利而行332.大数据让经济治理更有效支付宝“芝麻信用”“芝麻信用分”,授权开通后,每个支付宝用户都可以看到自己的芝麻信用分。分数越高代表信用程度越好,违约可能性越低。天猫淘宝淘宝电影水费电费工商学历学籍公安内部内部数据数据外部外部数据数据支付宝网购相关行为数据政府已经开放的外部数据芝麻信用分高芝麻信用分低租车、住酒店无押金签证无需财产证明找不到工作租不到房子贷不到款郎丰利睿利而行睿利而行342.大数据让经济治理更有效12342012年7月,通用电器公司投资1.7亿美元在纽约州斯克内克塔迪市开设了一家电池工厂。郎丰利睿利而行睿利而行353.大数据让公共服务更智慧智慧服
18、务智慧出行智慧家居智慧教育智慧社区智慧医疗智慧物流智慧旅游郎丰利睿利而行睿利而行363.大数据让公共服务更智慧高德导航高德公司基于位置服务大数据的能力,与乌镇、古北水镇两家旅游公司合作,上线了全国首个“智慧景区”服务,解决游客在景区容易遇到的迷路、拥堵、排队等问题。地图渲染分类筛选导游语音智慧景区郎丰利睿利而行睿利而行373.大数据让公共服务更智慧基于大数据技术,有朝一日,机器的诊疗准确率甚至可能超过人类历史上最有名的名医。郎丰利睿利而行睿利而行384.大数据让商业创新更迅猛未来,无论是在中国,还是在世界其他国家,数据密集型产业将成为发展最快的产业。拥有数据最多的公司将迅速崛起为这个时代的领军
19、公司。商业领域变革郎丰利睿利而行睿利而行394.大数据让商业创新更迅猛北美最大的付费订阅视频网站北美最大的付费订阅视频网站NetflixNetflix2012年,Netflix准备推出自制剧。不过在决定拍什么、怎么拍上,Netflix推出了自己的秘密武器大数据。收集收集预测预测拍摄拍摄Part 5中国:从“数据大国”走向“数据强国”郎丰利睿利而行睿利而行411234“数据驱动”已成为全球大趋势中国成为数据强国依然面临严峻的挑战面对机遇与挑战,中国的大思路、大举措中国具备成为数据强国的优势条件本章概要郎丰利睿利而行睿利而行421.“数据驱动”已成为全球大趋势 “大数据研发计划”,2亿美元启动资金
20、,开放多门类政府数据确保商业创新 开设课程,为大数据时代储备“数据科学家”美国 数据价值链战略计划 预计到2020年大数据技术将为欧盟创造GDP9570亿欧元,增加就业人数380万欧盟 “面向2020年的ICT综合战略” 创建最尖端IT国家宣言日本联合国“全球脉动”项目:用大数据对互联网世界进行“情绪分析”提前指导援助项目大数据时代的到来,让“数据驱动”成为新的全球大趋势。世界各国纷纷利用大数据提升国家治理能力,“得数据者得天下”已经成为全球的普遍共识。郎丰利睿利而行睿利而行432.中国具备成为数据强国的优势条件未来,国家竞争的焦点将从资本、土地、人口、资源转向数据空间,全球竞争版图将分为数据
21、强国与数据弱国两大阵营。值得振奋的是,中国具备成为数据强国的优势条件。中国的优势条件A13.6813.68亿亿(2014年)6.496.49亿亿中国移动互联网用户 中国人口中国互联网用户IDC预计到2020年中国的数据总量将达到8.4ZB,占全球数据量的24%,中国将成为世界上第一数据大国和“世界数据中心世界数据中心”。北京公交一卡通日均刷卡 40004000万次万次9.59.5亿亿数据分别来自国家统计局2014,中国互联网中心(CNNIC)第35次中国互联网络发展状况统计报告,工信部2015年10月份通信业经济运行情况等。郎丰利睿利而行睿利而行44电商广告搜索金融医疗百科教育电信城市化创新创
22、业大数据正在得到越来越深入的应用123456791082.中国具备成为数据强国的优势条件中国的优势条件B未来,国家竞争的焦点将从资本、土地、人口、资源转向数据空间,全球竞争版图将分为数据强国与数据弱国两大阵营。值得振奋的是,中国具备成为数据强国的优势条件。郎丰利睿利而行睿利而行452.中国具备成为数据强国的优势条件中国的优势条件C2014年互联网趋势报告:全球10大网站中有四家来自中国;在网络基础设施方面,截至2015年6月底,中国固定宽带接入用户超过2亿,8M以上带宽占比超过了53% ,全国经营性互联网数据中心超过了1000个;在数据处理分析、语音识别、视频识别、商业智能软件、数据中心建设和
23、维护、IT咨询等领域都已有代表性企业形成获取、存储、处理、应用的大数据产业链。未来,国家竞争的焦点将从资本、土地、人口、资源转向数据空间,全球竞争版图将分为数据强国与数据弱国两大阵营。值得振奋的是,中国具备成为数据强国的优势条件。郎丰利睿利而行睿利而行463.中国成为数据强国依然面临严峻的挑战政府数据开放政府数据开放共享不够,潜在共享不够,潜在价值大量淹没价值大量淹没A A海量的数据分散在各个部门、各个层级,彼此分割,形成一个个“信息孤岛”,且对社会、公众开放严重不够。B B个人隐私法律个人隐私法律缺位,信息缺位,信息滥用引发焦虑滥用引发焦虑缺少个人隐私和商业机密的专门法律法规和政策制度,对公
24、民隐私权和知情权范围有待厘清。C C数据控制力尚未数据控制力尚未引起足够重视,引起足够重视,数据话语权堪忧数据话语权堪忧发展形态较为单一,核心的数据“基础设施”大量依赖进口,数据主权极易受到侵蚀。D D人才培育机制薄人才培育机制薄 弱,数据分析型、弱,数据分析型、复合型人才短缺复合型人才短缺人才缺口已经超过100万人。目前我国每年培养的大数据深度学习方面的博士生大概只有50人左右。郎丰利睿利而行睿利而行474.面对机遇与挑战,中国的大思路、大举措大数据是一场关乎中国前途未来,涉及格局深刻调整的革命。幸运的是,这场革命才刚刚开始,面对机遇与挑战,中国已经有了大思路、大举措。2014年3月,“大数
25、据”首次写进了首次写进了政府工作报告政府工作报告,大数据正式作为一种新兴产业,得到了国家层面的大力支持。20042004年年3 3月月5 5日日20152015年年7 7月月1 1日日20152015年年8 8月月3131日日20152015年年1010月月2929日日2015年7月1日,国务院办公厅印发关于运用大数据加强对市场主体服务和监管的若干意见。2015年08月31日,国务院印发关于促进大数据发展的行动纲要。2015年10月29日,党的十八届五中全会通过的“十三五”规划建议提出,要“实施国家大数据战略,推进数据资源开放共享。”这是大数据第一次写入党的全会决议,标志着大数据战略正式上升为
26、国家战略正式上升为国家战略。A郎丰利睿利而行睿利而行48B4.面对机遇与挑战,中国的大思路、大举措核心理念和管理机制01推动政府数据开放共享,建成国家政府数据统一开放平台;推动社会数据共享,形成全社会开发利用数据的氛围;各类数据互联互通起来,释放出数据红利。确立了大数据发展的核心理念和管理机制确立了大数据发展的核心理念和管理机制数据的共享和开放。数据的共享和开放。大数据是一场关乎中国前途未来,涉及格局深刻调整的革命。幸运的是,这场革命才刚刚开始,面对机遇与挑战,中国已经有了大思路、大举措。郎丰利睿利而行睿利而行49B4.面对机遇与挑战,中国的大思路、大举措大数据产业发展新生态02发展大数据与传
27、统产业协同发展的大数据应用发展大数据产品和解决方案建立大数据基础研究和安全可信的大数据技术体系培育高端智能、新兴繁荣的大数据产业发展新生态培育高端智能、新兴繁荣的大数据产业发展新生态。大数据是一场关乎中国前途未来,涉及格局深刻调整的革命。幸运的是,这场革命才刚刚开始,面对机遇与挑战,中国已经有了大思路、大举措。郎丰利睿利而行睿利而行50B4.面对机遇与挑战,中国的大思路、大举措十大重点工程平台建设任务03围绕工程的推进,将建设起政府数据统一共享交换平台、国家政府数据统一开放平台、国家大数据平台、数据中心等一系列国家和地方大数据平台,并在经济社会各个领域推进大数据应用示范和试点,兴起大数据建设的热潮。规划了十大重点工程和一系列国家和区域大数据平台建设任务。规划了十大重点工程和一系列国家和区域大数据平台建设任务。大数据是一场关乎中国前途未来,涉及格局深刻调整的革命。幸运的是,这场革命才刚刚开始,面对机遇与挑战,中国已经有了大思路、大举措。感谢您的聆听大数据云平台