大数据培训知识(-)课件.ppt

上传人(卖家):晟晟文业 文档编号:4474034 上传时间:2022-12-12 格式:PPT 页数:56 大小:2.29MB
下载 相关 举报
大数据培训知识(-)课件.ppt_第1页
第1页 / 共56页
大数据培训知识(-)课件.ppt_第2页
第2页 / 共56页
大数据培训知识(-)课件.ppt_第3页
第3页 / 共56页
大数据培训知识(-)课件.ppt_第4页
第4页 / 共56页
大数据培训知识(-)课件.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

1、目录大数据的背景大数据的背景大数据的定义大数据的定义大数据的分类大数据的分类大数据的应用大数据的应用大数据给我们带来了什么大数据给我们带来了什么大数据面临的挑战和趋势大数据面临的挑战和趋势大数据时代的统计大数据时代的统计一、大数据时代的背景一、大数据时代的背景 21世纪是数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓展了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。互联网(社交、搜索、电商)、移动互联网(微博)、物联网(传感器,智慧地球)、车联网、GPS、医学影像、安全监控、金融(银行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。“大数据”的诞生:半个世纪以来,随着计

2、算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。信息爆炸式的增长,创造出了“大数据”这个概念*。如今,这个概念几乎应用到了所有人类智力与发展的领域中。全球每秒钟发送 2.9 百万封电子邮件,一分钟读一篇的话,足够一个人昼夜不息的读5.5 年每天会有 2.88 万个小时的视频上传到Youtube,足够一个人昼夜不息的观看3.3 年推特上每天发布 5 千万条消息,假设10 秒钟浏览一条信息,这些消息足够一个人昼夜不息的浏览16 年每天亚马逊上将产生 6.3 百万笔订单每个月网民在Facebook 上要花费7 千亿分钟

3、,被移动互联网使用者发送和接收的数据高达1.3EBGoogle 上每天需要处理24PB 的数据新的时代,人们从信息的被动接受者变成了主动创造者大数据时代到来大数据时代到来TBPBZBEB大量新数据源的出现则导致了非结构化、半结构化数据爆发式的增长根据监测,人类产生的数据量正在呈指数级增长,大约每两年翻一番,这个速度在2020 年之前会继续保持下去。这意味着人类在最近两年产生的数据量相当于之前产生的全部数据量数据量增加数据结构日趋复杂这些由我们创造的信息背后产生的这些数据早已经远远超越了目前人力所能处理的范畴大数据时代正在来临.大数据时代到来大数据时代到来二、大数据的定义二、大数据的定义 在20

4、12年的IT业界中,“大数据”(Big Data)成了关注度不断提高的关键词之一。“大数据”是一个起源于欧美的词汇。不过,关于这个词的起源时间并不是十分清楚。至今为止,最具影响力的说法是2010年2月出版的经济学家(The Economist)杂志中的一篇题为“The data deluge”的文章。其中,“deluge”的解释是数据洪流或海量数据。那么,究竟何为大数据?一般来说,可以从狭义和广义两个层面来进行理解。狭义的大数据狭义的大数据 狭义的大数据就是指用现在的一般技术难以管理的大量数据的集合。大数据不仅仅是容量大而已,可以用3v来描述大数据的特征:Volume(容量)、Variety(

5、多样性)、Velocity(速度)。1.容量也就是指数据量,基本上是指从几十TB到几PB这样的 数量级;甚至可能发展到EB数量级。(1TB=1024GB,1PB=1024TB,1EB=1024PB)2.多样性网站日志数据、Facebook等媒体中的文本数据,智能手机中内置的GPS所产生的位置信息,监控摄像机的视频数据等。3.速度也就是数据产生和更新的频率。广义的大数据广义的大数据广义的大数据是一个综合性的概念,它包括因具备3v特征而难以进行管理的数据对这些数据进行存储、处理、分析的技术能够通过分析这些数据获得实用意义和观点的人才和组织 这些人才和组织指的是目前在欧美十分紧俏的“数据科学家”这类

6、人才,以及能够对大数据进行有效运用的组织。由此广义的概念可知,除了自身的特征外,人才的作用在大数据时代中日益突出。三、大数据的分类三、大数据的分类按生产主体划分按数据来源划分按存储形式划分少量企业应用产生的数据 关系型数据库关系型数据库中的数据中的数据 数据仓库中的数据仓库中的数据数据 微博、微信微博、微信 电子商务在线交电子商务在线交易日志数据易日志数据 评论、留言或者评论、留言或者电话投诉等电话投诉等 企业应用的相关企业应用的相关评论数据评论数据 应用服务器日志应用服务器日志 传感器数据(天传感器数据(天气、水、智能电气、水、智能电网等)网等)图像和视频(摄图像和视频(摄像头监控数据等)像

7、头监控数据等)RFID、二维码或、二维码或条形码扫描数据条形码扫描数据大量人产生的数据巨量机器产生的数据大数据的分类大数据的分类按生产主体划分按生产主体划分 1 1、BATBAT为代表的互联网公司。为代表的互联网公司。2 2、电信、金融、保险、电力、石化系统。、电信、金融、保险、电力、石化系统。3 3、公共安全、医疗、交通领域。、公共安全、医疗、交通领域。4 4、气象、教育、地理、政务等。、气象、教育、地理、政务等。5 5、其他,商业销售、制造业、农业、物流和流通等领域、其他,商业销售、制造业、农业、物流和流通等领域。大数据分类大数据分类按数据来源划分按数据来源划分阿里巴巴 目前保存的数目前保

8、存的数据量为据量为近百近百PB 拥有拥有90%以上以上的的电商数据电商数据 交易数据、用交易数据、用户浏览和点击户浏览和点击网页数据、购网页数据、购物数据物数据 2013数据总量接数据总量接近近一千个一千个PB 中文网页、百度中文网页、百度推广、百度日志、推广、百度日志、UGC 以以70%以上的搜以上的搜索市场份额坐拥索市场份额坐拥庞大的庞大的搜索数据搜索数据腾讯 总存储数据量经总存储数据量经压缩处理以后在压缩处理以后在100PB左右左右 数据量月增数据量月增10%大量大量社交社交、游戏、游戏等领域积累的文等领域积累的文本、音频、视频本、音频、视频和和关系类数据关系类数据百度大数据分类大数据分

9、类按数据来源划分按数据来源划分BAT为代表的互联网公司电信行业 用户上网记录用户上网记录、通话通话、信息信息、地地理位置理位置 运营商拥有的数运营商拥有的数据数量都在据数量都在10PB以上以上 年度用户数据增年度用户数据增长长约数十约数十PB 开户信息数据开户信息数据,银行网点和在线银行网点和在线交易数据、自身交易数据、自身运营的数据运营的数据 金融系统每年产金融系统每年产生数据达生数据达数十数十PB 保险系统保险系统数据量也接近接近PB级别电力与石化 仅国家电网采集仅国家电网采集获得的数据总量获得的数据总量就上就上10个个PB级别级别 石油化工、智能石油化工、智能水表等领域每年水表等领域每年

10、产生和保存下来产生和保存下来的数据量也达到的数据量也达到数十数十PB级别。级别。金融与保险大数据分类大数据分类按数据来源划分按数据来源划分电信、金融与保险、电力、石化系统电信、金融与保险、电力、石化系统公共安全 北京:北京:50万个万个监控摄像头,监控摄像头,每天采集视频每天采集视频数据量数据量约约3PB 整个视频监控整个视频监控每年保存下来每年保存下来的数据的数据在数百在数百PB以上以上 仅广州中山大学仅广州中山大学医院医院2013年数据年数据量为量为1000个个TB 整个医疗卫生行整个医疗卫生行业一年能够保存业一年能够保存下来的数据就可下来的数据就可达到达到数百数百PB交通 航班往返一次能

11、航班往返一次能产生数据就达到产生数据就达到TB级别级别 列车、水陆路运列车、水陆路运输产生的各种视输产生的各种视频、文本类数据,频、文本类数据,每年保存下来的每年保存下来的也达到也达到数十数十PB。医疗卫生大数据分类大数据分类按数据来源划分按数据来源划分公共安全、医疗卫生、交通领域公共安全、医疗卫生、交通领域气象与地理 中国气象局保存的中国气象局保存的数据约数据约45PB,每,每年约增年约增数百个数百个TB 各种地图和地理位各种地图和地理位置信息每年置信息每年约数十约数十PB 北京市政务数据资北京市政务数据资源网涵盖旅游、教源网涵盖旅游、教育、交通、医疗等育、交通、医疗等门类,一年上线公门类,

12、一年上线公布了布了余个余个数数据包据包 政务数据多为结构政务数据多为结构化数据化数据政务与教育大数据分类大数据分类按数据来源划分按数据来源划分气象、地里、教育、政务等领域气象、地里、教育、政务等领域大数据分类大数据分类按数据来源划分按数据来源划分其他传统行业线下商业销售、农林牧渔业、线下餐饮、食品、科研、物流运输等行业数据量剧增行业数据量还处于积累期,整个体量都不算大,多则达到PB级别,少则百TB甚至数十TB级别。制造业制造业的存储数据类型:产品设计数据:以文件为主,非结构化,共享要求较高,保存时间较长。企业生产环节的业务数据:数据库结构化数据生产监控数据:数据量非常大商业销售、制造业、农业、

13、物流和流通等领域商业销售、制造业、农业、物流和流通等领域大数据分类大数据分类按存储形式划分按存储形式划分 大数据不仅仅体现数据量大,也体现在数据类型多。如此海量的数据中,仅有20%左右属于结构化数据,80%的数据属于广泛存在于社交网络、物联网、电子商务等领域的非结构化或半结构化数据。大数据分类大数据分类按存储形式划分按存储形式划分即行数据,可用二维表结构来逻辑表达实现主要存储在关系型数据库中先有结构再有数据,结构一般不变处理起来较方便结构化数据结构化数据大数据分类大数据分类按存储形式划分按存储形式划分相对于结构化数据而言,不方便用数据库二维逻辑表来表现非纯文本类数据,没有标准格式包括所有格式的

14、办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息存储在非结构数据库中非结构化WEB数据库:突破了关系数据库结构定义不易改变和数据定长的限制非结构化数据非结构化数据大数据分类大数据分类按存储形式划分按存储形式划分介于完全结构化数据和完全无结构的数据之间格式较为规范,一般都是纯文本数据包括日志数据、XML、JSON等格式的数据一般是自描述的,数据的结构和内容混在一起,没有明显的区分数据模型主要为树和图的形式。半结构化数据半结构化数据四、大数据的应用四、大数据的应用大数据在宏观经济管理领域的应用大数据在宏观经济管理领域的应用大数据在农业领域的应用大数据在农业领域的应用大数据在商

15、业领域的应用大数据在商业领域的应用大数据在金融业的应用大数据在金融业的应用大数据在医疗卫生领域的应用大数据在医疗卫生领域的应用大数据在社会管理中的应用大数据在社会管理中的应用大数据在宏观经济管理领域的应用 IBM日本公司建立了一个经济指标预测系统,它从互联网新闻中搜索出影响制造业的480项经济数据,再计算出PMI预测值,准确度相当高。印第安纳大学学者利用Google提供的心情分析工具,根据用户近千万条短信、微博留言中预测道琼斯工业指数。准确率高达87%。淘宝网建立了“淘宝CPI”,它通过采集、编制淘宝网上390个类目的热门商品价格来统计CPI,它比国家统计局公布的CPI还提前半个月预测经济的走

16、势。大数据在农业领域的应用Google前雇员创办Climate公司,从美国气象局等数据库中获得几十年的天气数据,将各地的降雨、气温和土壤状况及历年农作物产量做成精密图表,从而能够预测美国任一农场下一年的产量。任何一个农场主去他那里问明年种什么能卖出去、能赚钱,他能告诉你,说错了他保证赔偿,赔偿比保险公司还要高,到现在为止他还没有赔过。通过手机上农产品“移动支付”数据、“采购投入”数据和“补贴“数据分析,可准确预测农产品生产趋势,政府可依此决定出台激励措施和确定合适的作物存储量,还可为农民提供服务。大数据在商业领域的应用沃尔玛基于每个月4500万的网络购物数据,并结合社交网络上有关产品的大众评分

17、,开发机器学习语义搜索引擎“北极星“,方便浏览,在线购物者因此增加10%-15%,增加销售十多亿美元。当顾客在超市买东西时,通过手机定位,可以分析他们在货柜前停留时间的长短,从而判断顾客对什么感兴趣。不仅仅是通过手机定位,实际上美国有的超市在购物推车上也安装了位置传感器,根据顾客在不同货物前停留时间的长短来分析顾客可能的购物行为。在淘宝网上买东西时,消费者会在阿里的广告交易平台上留下记录,阿里不仅从交易平台把消费记录拿来自己使用,还会把消费记录卖给其他商家。大数据在金融业的应用华尔街某公司通过分析全球3.4亿微博账户留言来判断民众情绪,人们高兴的时候会买股票,而焦虑的时候会抛售股票,它通过判断

18、全世界高兴的人多还是焦虑的人多,依此决定公司股票的买入或卖出。阿里公司根据在淘宝网上中小企业的交易状况筛选出财务健康和诚信经营的企业,给他们提供贷款,并且不需要这些中小企业的担保。目前阿里公司已放贷上千亿元,坏帐率仅0.3%。2012年年底,四大商业银行的坏账率为1%左右,尽管四大银行要求有担保,但坏账率仍然比阿里高出3倍。大数据在医疗卫生领域的应用 Google通过用户搜索与流感相关词汇的频率,判断某个地方可能会发生流感。2009年在甲型H1N1流感爆发的几周前,Google就做出预测,而且还判断出了流感是从哪里来的。大数据在医疗卫生领域的应用 根据麦肯锡的报告,医疗大数据的分析将为美国产生

19、3000亿美元的价值,减少8%的国家医疗保健支出。大数据在社会管理中的应用广东东莞通过统计当地食盐销售量与上年同期比较,判断农民工数量的变化。这与电信运营商根据活跃移动用户数的变化所推出的数据几乎相当。根据手机用户从这个路口到那个路口所花费的时间,可以判断马路上是不是流量比较多,是否拥堵。根据有多少个手机在同时移动,大致可以了解发生突发事件时的人流聚集情况,还可以通过手机的注册地进一步分析机主究竟是从哪里来的。腾讯为每个微博用户建立了档案,可以从微博帖子分析用户的性格,提前关注可能引起社会不稳定的因素。五、大数据带来了什么?五、大数据带来了什么?大数据既催生出无数新的服务和商业模式,也让一些传

20、统行业找到了新的机会,同时产生了对“数据科学家”这种新兴复合型人才的迫切需求。但是,数据运用和隐私保护之间到底应该如何权衡,也成了一个令各方势力争论不休的话题。所以,对于大数据带来的影响,必须从所以,对于大数据带来的影响,必须从积极影响积极影响和和消消极影响极影响两个层面来分析。两个层面来分析。积极影响积极影响 首先,大数据有利于推动中国新四化转型。首先,大数据有利于推动中国新四化转型。新四化是指新型工业化、信息化、城镇化和农业现代化。大数据将会改变人类生活生产方式,可以为新四化提供转变发展方式的新动力。1.大数据可以强力启动内需;2.大数据可以推动城镇化以智慧城市的新方式发展;3.大数据有利

21、于改进政府管理方式;4.大数据产业将会形成新的增长点。其次,大数据将对微观经济产生重大影响。其次,大数据将对微观经济产生重大影响。IBM的CEO罗睿兰说:“数据将是下一个大的自然资源,将会区分每个行业的胜者与输家。”IBM的全球调查显示:表现优秀的企业使用分析技术的数量比表现较差的企业高五倍。1.未来以政府、电信、教育、医疗、金融、石油石化和电力等行业为重点的大数据应用,将直接拉动整个社会的应用规模;2.数据业务将成为各行各业的主营业务,围绕大数据,企业将向分析级服务升级转型,从而改变各行各业的业态;3.广义的分析级服务得到大发展,包含一切以大数据为基础的高附加值的创新型服务。再次,大数据的发

22、展有利于促进新兴职业的发再次,大数据的发展有利于促进新兴职业的发展。展。在大数据浪潮的冲击下,一门新兴职业即“数据分析师”(数据科学家)正在以势不可挡的气势涌现。大数据使劳动力市场迅速出现了变化,数据分析师成为炙手可热的行业。麦肯锡全球研究所进行过一次调查,根据调查预计,美国需要14万名至19万名以上具备深度分析专长的人员。而对具备数据知识的经理的需求量超过150万名。一个在业界不可言喻的现象出现了,数据分析师已经能够成为最为抢手的热门职业。消极影响消极影响 关于大数据所带来的消极影响主要表现为大数据运关于大数据所带来的消极影响主要表现为大数据运用和用和隐私保护隐私保护之间的矛盾。要在业务中对

23、大数据进行运用,之间的矛盾。要在业务中对大数据进行运用,就不可避免的会遇到隐私问题。就不可避免的会遇到隐私问题。首先,对web上的用户个人信息、行为记录等进行收集,在未经用户许可的情况下将数据转让给广告商等第三方,这种行为严重侵犯了用户的个人隐私权,而且会对其造成一定程度的危害;其次,网页上的行为记录,如浏览记录和购买记录等,如果进行了相当数量的积累,则有可能据此推断出个人的兴趣、爱好、思想倾向等。而对于用户来说,他们很不希望这些信息被别人知道,所以在心理上会感觉到自己的隐私受到了侵犯。在今天,关于隐私隐私是一个很大的问题,而且以后这个问题还会越来越严重,会被人们高度关注。所以,对于企业来说,

24、不仅要遵守正式法律的限制,而且不能逾越顾客所能接受的最低底线。必须时刻把用户的地位放在首位,尽可能的多为顾客提供便利,尽最大努力赢得用户的理解和支持。六、大数据面临的挑战和趋势六、大数据面临的挑战和趋势 从大数据带来的影响可知,大数据浪潮既是一种机遇也是一种挑战,必须权衡利弊。趋势趋势 随着大数据浪潮的加速到来,将出现产业链的整体繁荣。如何在大数据浪潮的洗礼中确保技术架构、人才、政府和企业战略以及商业模式能够“逐浪潮头”,将更需要积极主动的选择合适的技术、方法论、解决方案和发展策略等。环顾整个市场,我们在某些领域已经取得了突破性进展,但是,仍然面临着大量挑战。例如:研发分析各种多元结构化数据的

25、高效技术,提高大数据分析的易用性易用性,让大数据分析技术实现“开箱即用”,使得数据分析成为政府和企业建立核心竞争力的关键途径。另外,具备高端数据分析技能,能够从堆积如山的大量数据中找到金矿,并能够将数据的价值以易懂的方式传达给决策者,最终得以在业务上实现的人才即数据科学家数据科学家是千金难求的。挑战挑战七、大数据时代的统计七、大数据时代的统计大数据时代就不需要统计了吗?大数据时代就不需要统计了吗?有人认为大数据时代,数据的来源更加直有人认为大数据时代,数据的来源更加直接、多元,并且数据的接、多元,并且数据的“样本样本=总体总体”,想要,想要的结论直接就能看出来,已经不需要统计了。的结论直接就能

26、看出来,已经不需要统计了。这种认知,显然是错误的这种认知,显然是错误的 首先,并不是所有的数据都可以直接在网首先,并不是所有的数据都可以直接在网络上得到的,很多数据需要统计部门组织专业络上得到的,很多数据需要统计部门组织专业的调查才能得到,比如,农业生产方面的数据、的调查才能得到,比如,农业生产方面的数据、人口分布等等。人口分布等等。其次,大数据告知信息,但不解释数据,其次,大数据告知信息,但不解释数据,即使把大数据的信息公布出来,大部分民众依即使把大数据的信息公布出来,大部分民众依然不知道数据要表达的信息。然不知道数据要表达的信息。统计依然是数据统计依然是数据分析的灵魂。分析的灵魂。大数据时

27、代的到来,给统计带来机遇,也大数据时代的到来,给统计带来机遇,也带来了挑战。带来了挑战。2014 2014年年1 1月,国家统计局网上转载了月,国家统计局网上转载了“中国中国统计统计,向大数据时代向大数据时代迈进!迈进!”(http:/ 过去,由于人类的认知能力有限,获取大范围数过去,由于人类的认知能力有限,获取大范围数据比较困难,传统的统计是通过观察一小部分样本来据比较困难,传统的统计是通过观察一小部分样本来推测总体,但是推测的数据反映的是总体趋势,往往推测总体,但是推测的数据反映的是总体趋势,往往无法应用到个体。大数据时代的来临,使人类可以有无法应用到个体。大数据时代的来临,使人类可以有机

28、会和条件在非常多的领域和非常深入的层次获得全机会和条件在非常多的领域和非常深入的层次获得全面数据,在此基础上形成的的数据可以更加偏向个体面数据,在此基础上形成的的数据可以更加偏向个体情况,更加符合个体的感知,满足个性化需求。情况,更加符合个体的感知,满足个性化需求。对统计理念的冲击对统计理念的冲击2.2.大数据改变了统计实证的研究范式大数据改变了统计实证的研究范式 传统的统计遵循自上而下的实证研究范式,即先传统的统计遵循自上而下的实证研究范式,即先从经济理论或社会经验出发,根据理论设定指标,再从经济理论或社会经验出发,根据理论设定指标,再去利用统计数据进行实证分析。然而大数据采用的是去利用统计

29、数据进行实证分析。然而大数据采用的是自下而上的数据挖掘范式,以数据为先导从大量的实自下而上的数据挖掘范式,以数据为先导从大量的实际数据中挖掘数据之间的关系并建立模型,乃至形成际数据中挖掘数据之间的关系并建立模型,乃至形成理论和新的认知。这种研究范式是对传统统计研究范理论和新的认知。这种研究范式是对传统统计研究范式的一种颠覆。式的一种颠覆。对统计生产流程的冲击对统计生产流程的冲击制度设计的多样化制度设计的多样化 传统的统计设计是根据统计研究的目的和研究对传统的统计设计是根据统计研究的目的和研究对象的特点,设定统计指标、统计报表以及调查、象的特点,设定统计指标、统计报表以及调查、汇总方法等制度,通

30、过调查、访问将生产行为转汇总方法等制度,通过调查、访问将生产行为转化为可量化的数据。化为可量化的数据。大数据下的制度,面对的是大数据下的制度,面对的是已存在已存在的或者通过一的或者通过一定手段可以获取的大量数据,需要解决的问题是定手段可以获取的大量数据,需要解决的问题是怎么用这些数据。怎么用这些数据。对统计生产流程的冲击对统计生产流程的冲击数据采集智能化数据采集智能化 传统的统计是通过结构化的报表和统一的计量方传统的统计是通过结构化的报表和统一的计量方式将调查对象的行为转化为可用的数据,需要被式将调查对象的行为转化为可用的数据,需要被调查者的参与,一旦调查对象不配合,或者采用调查者的参与,一旦

31、调查对象不配合,或者采用虚报、瞒报、乱报的方式消极配合,虚报、瞒报、乱报的方式消极配合,统计数据的统计数据的质量难以控制质量难以控制,并且矫正这些,并且矫正这些调查误差的成本很调查误差的成本很高高。大数据时代,互联网、物联网、云计算等技术讲大数据时代,互联网、物联网、云计算等技术讲大大提高数据采集的智能化水平,数据来源于信大大提高数据采集的智能化水平,数据来源于信息技术记录下的原始数据,想要息技术记录下的原始数据,想要篡改篡改这些数据非这些数据非常常困难困难,数据的质量数据的质量将会大大提将会大大提高高。对统计生产流程的冲击对统计生产流程的冲击数据分析专业化数据分析专业化 传统的统计分析是根据

32、统计制度设计的要求以及传统的统计分析是根据统计制度设计的要求以及研究对象的认知,研究对象的认知,对采集上来的结构化统计数据对采集上来的结构化统计数据进行计算分析,重点描述过去的这段时间发生的进行计算分析,重点描述过去的这段时间发生的变化,对未来的发展情况进行统计意义上的预测。变化,对未来的发展情况进行统计意义上的预测。大数据背景下的数据分析,面对的大量的大数据背景下的数据分析,面对的大量的已存在已存在于计算机、网络中的海量数据,所要做的是分析于计算机、网络中的海量数据,所要做的是分析挖掘数据之间的内在关系,寻找更多有价值的信挖掘数据之间的内在关系,寻找更多有价值的信息,在这种背景下,需要专业化

33、的数据挖掘与处息,在这种背景下,需要专业化的数据挖掘与处理技术理技术对统计生产流程的冲击对统计生产流程的冲击数据发布透明化数据发布透明化 大数据时代,由于数据的大量存储和共享,统计大数据时代,由于数据的大量存储和共享,统计数据发布的公开数据发布的公开透明程度透明程度将会将会极高极高,没有,没有公开详公开详细细、公允计算方法的数据将会被其他数据替代。、公允计算方法的数据将会被其他数据替代。在发布结果上,仅仅告诉个别人结果,是远远不在发布结果上,仅仅告诉个别人结果,是远远不够的,还需要通过够的,还需要通过可视化可视化、交互交互等方式给予用户等方式给予用户更加更加方便、高效方便、高效的使用方式,提供

34、更为详尽的信的使用方式,提供更为详尽的信息。息。对政府统计职能的冲击对政府统计职能的冲击 大数据时代,各种数据大数据时代,各种数据信息网络平台全面覆盖信息网络平台全面覆盖,每个社会单位每个社会单位都是数据的都是数据的生产者和提供者生产者和提供者,数据存储,数据存储于信息平台的所有者手中,于信息平台的所有者手中,政府统计机构不再是数据政府统计机构不再是数据的绝对拥有者的绝对拥有者,也不再是数据的唯一发布者和解释人。,也不再是数据的唯一发布者和解释人。如果政府统计机构继续在静态的框架下封闭运行,就如果政府统计机构继续在静态的框架下封闭运行,就无法反映经济社会发展的变化情况,无法实现统计信无法反映经

35、济社会发展的变化情况,无法实现统计信息、统计咨询和实行统计监督功能,势必被边缘化息、统计咨询和实行统计监督功能,势必被边缘化2.2.大数据时代政府统计的发展趋势大数据时代政府统计的发展趋势 大数据时代,政府统计应该成为社会经济发展的大数据时代,政府统计应该成为社会经济发展的权威、全面数据的主要提供者,是政府掌握的有关社权威、全面数据的主要提供者,是政府掌握的有关社会管理和运行的行政记录信息标准规范制定者和数据会管理和运行的行政记录信息标准规范制定者和数据结果发布者。政府统计应整合多方行政记录信息,结结果发布者。政府统计应整合多方行政记录信息,结合自身采集数据补充,构建权威的社会经济数据在线合自

36、身采集数据补充,构建权威的社会经济数据在线平台。作为数据整合发布的平台。作为数据整合发布的维护部门维护部门。3.3.借力大数据加速政府统计改改借力大数据加速政府统计改改 为了转变政府统计的角色,需要全面改进当前的为了转变政府统计的角色,需要全面改进当前的政府统计在获取、整理和分析客观事物总体数量方面政府统计在获取、整理和分析客观事物总体数量方面的资料的工作过程,重塑统计基础、强化技术支承、的资料的工作过程,重塑统计基础、强化技术支承、推动应用社会化,全面提升统计能力。推动应用社会化,全面提升统计能力。多渠道智能获取数据多渠道智能获取数据构建真正的大数据平台构建真正的大数据平台体现数据价值体现数

37、据价值多渠道智能获取数据多渠道智能获取数据 统计工作必须适应大数据时代的变化和要求,通过有效统计工作必须适应大数据时代的变化和要求,通过有效利用客观存在的海量数据,能够有效降低统计调查的成本,利用客观存在的海量数据,能够有效降低统计调查的成本,减轻被调查者的负担,缓解被调查者配合程度降低的矛盾,减轻被调查者的负担,缓解被调查者配合程度降低的矛盾,能够提高统计数据的即时性,缩短统计数据生成周期。能够提高统计数据的即时性,缩短统计数据生成周期。大数据时代的自动智能数据采集蒋时代数据生成主要依大数据时代的自动智能数据采集蒋时代数据生成主要依赖于及其的客观测量,如赖于及其的客观测量,如GPSGPS定位

38、测量、收银管理系统、定位测量、收银管理系统、ETCETC电子收费系统等等。当前政府统计法制建设的全国联网直报电子收费系统等等。当前政府统计法制建设的全国联网直报系统很大成都上规范了统计人员的工作方式,但是其中人的系统很大成都上规范了统计人员的工作方式,但是其中人的参与程度仍然很高。参与程度仍然很高。大数据时代,政府统计采集数据,一是要压缩调查规模,大数据时代,政府统计采集数据,一是要压缩调查规模,采集数据有针对性;二是技术手段要多样化、智能化,降低采集数据有针对性;二是技术手段要多样化、智能化,降低人的参与因素和干扰可能;三是应用行政记录与统计上要有人的参与因素和干扰可能;三是应用行政记录与统

39、计上要有所突破,进一步开发应用现有的行政资源。所突破,进一步开发应用现有的行政资源。构建真正的大数据平台构建真正的大数据平台 目前我们发布的数据主要是为了满足党政领导的目前我们发布的数据主要是为了满足党政领导的需求为主,以社会需求为辅。这种模式对统计而言是需求为主,以社会需求为辅。这种模式对统计而言是有局限性的,容易自我封闭。有局限性的,容易自我封闭。大数据时代,政府统计应建设容量足够大的大数据时代,政府统计应建设容量足够大的ITIT基基础设施,容纳所有采集到的数据信息,将历史和现有础设施,容纳所有采集到的数据信息,将历史和现有原始数据文件整理归集到系统中,构建成在线公开的原始数据文件整理归集

40、到系统中,构建成在线公开的官方统计数据平台。未来政府统计部门将公平公开地官方统计数据平台。未来政府统计部门将公平公开地开放数据,所有单位个人都将能从统计机构的网站平开放数据,所有单位个人都将能从统计机构的网站平台获取到需要的、标准统一的、格式开放的数据。台获取到需要的、标准统一的、格式开放的数据。体现数据的价值体现数据的价值 数据只有被人们使用,才会变成有价值的信息,数据只有被人们使用,才会变成有价值的信息,统计成果需要新的返现方式和形式。统计成果需要新的返现方式和形式。除了公布原始基础数据,政府统计数据平台应该除了公布原始基础数据,政府统计数据平台应该具备权威客观、公开透明的基本经济算法、口

41、径和初具备权威客观、公开透明的基本经济算法、口径和初步结果,这些成果应该通过标准的官方经济核算应用步结果,这些成果应该通过标准的官方经济核算应用以及信息产品的形式对外提供。以及信息产品的形式对外提供。政府统计应该利用专业的技术力量和成果,提高政府统计应该利用专业的技术力量和成果,提高数据挖掘分析能力,对巨量原始数据进行专业化处理,数据挖掘分析能力,对巨量原始数据进行专业化处理,将非标准化数据转化为标准化统计数据,从而打好对将非标准化数据转化为标准化统计数据,从而打好对数据进行数据进行“增值增值”的基础。的基础。1、用爱心来做事,用感恩的心做人。2、人永远在追求快乐,永远在逃避痛苦。3、有多大的

42、思想,才有多大的能量。4、人的能量=思想+行动速度的平方。5、励志是给人快乐,激励是给人痛苦。6、成功者绝不给自己软弱的借口。7、你只有一定要,才一定会得到。8、决心是成功的开始。9、当你没有借口的那一刻,就是你成功的开始。10、命运是可以改变的。11、成功者绝不放弃。12、成功永远属于马上行动的人。13、下定决心一定要,才是成功的关键。14、成功等于目标,其他都是这句话的注解。15、成功是一个过程,并不是一个结果。16、成功者学习别人的经验,一般人学习自己的经验。17、只有第一名可以教你如何成为第一名。18、学习需要有计划。19、完全照成功者的方法来执行。20、九十九次的理论不如一次的行动来

43、得实际。21、一个胜利者不会放弃,而一个放弃者永远不会胜利。22、信心、毅力、勇气三者具备,则天下没有做不成的事。23、如果你想得到,你就会得到,你所需要付出的只是行动。24、一个缺口的杯子,如果换一个角度看它,它仍然是圆的。25、对于每一个不利条件,都会存在与之相对应的有利条件。26、一个人的快乐,不是因为他拥有的多,而是他计较的少。27、世间成事,不求其绝对圆满,留一份不足,可得无限美好。28记住:你是你生命的船长;走自己的路,何必在乎其它。29、你要做多大的事情,就该承受多大的压力。30、如果你相信自己,你可以做任何事。31、天空黑暗到一定程度,星辰就会熠熠生辉。32、时间顺流而下,生活

44、逆水行舟。33、生活充满了选择,而生活的态度就是一切。34、人各有志,自己的路自己走。35、别人的话只能作为一种参考,是不能左右自己的。36、成功来自使我们成功的信念。37、相互了解是朋友,相互理解是知己。38、没有所谓失败,除非你不再尝试。39、有时可能别人不在乎你,但你不能不在乎自己。40、你必须成功,因为你不能失败。41、羡慕别人得到的,不如珍惜自己拥有的。42、喜欢一个人,就该让他(她)快乐。43、别把生活当作游戏,谁游戏人生,生活就惩罚谁,这不是劝诫,而是-规则!44、你要求的次数愈多,你就越容易得到你要的东西,而且连带地也会得到更多乐趣。45、把气愤的心境转化为柔和,把柔和的心境转

45、化为爱,如此,这个世间将更加完美。46、一份耕耘,一份收获,付出就有回报永不遭遇过失败,因我所碰到的都是暂时的挫折。47、心如镜,虽外景不断变化,镜面却不会转动,这就是一颗平常心,能够景转而心不转。48、每件事情都必须有一个期限,否则,大多数人都会有多少时间就花掉多少时间。49、人,其实不需要太多的东西,只要健康地活着,真诚地爱着,也不失为一种富有。50、生命之长短殊不重要,只要你活得快乐,在有生之年做些有意义的事,便已足够。51、活在忙与闲的两种境界里,才能俯仰自得,享受生活的乐趣,成就人生的意义。52、一个从来没有失败过的人,必然是一个从未尝试过什么的人。53、待人退一步,爱人宽一寸,人生自然活得很快乐。54、经验不是发生在一个人身上的事件,而是一个人如何看待发生在他身上的事。55、加倍努力,证明你想要的不是空中楼阁。胜利是在多次失败之后才姗姗而来。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(大数据培训知识(-)课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|