1、大数据时代2大纲 一一.认识大数据时代认识大数据时代 二二.大数据的应用领域大数据的应用领域 三.大数据时代的机遇与挑战大数据时代的机遇与挑战 3一.认识大数据时代7:00,你被手机闹钟叫醒。昨晚你带着一款小型可穿戴设备睡觉的。这个设备连接着你手机里的一款大数据的大数据的APPAPP,你打开它就可以看到你昨晚睡觉时翻身次数、心跳和血压状况。根据测量结果,它建议你今天出门之前多喝点橙汁类的饮品来补充维生素。9:00,今天你要带朋友到北京王府井步行街逛逛,你打开某互联网公司的大数据产品“XXXX预测预测”,看看步行街今天预计会有多少人,再看看北京今天的交通预测。“XX预测”根据以往用户定位请求信息
2、建议你乘地铁前往步行街。12:00,逛了一圈,你和朋友都累了,想找个地方吃饭。你打开大数据软件大数据软件,寻找附近的餐馆。通过该软件,你可以提前看到餐馆的视频环境,看看是否人多。大数据还可以把你脸的部分打成马赛克,你不用担心个人信息泄露。2XXX年的一个周末4一.认识大数据时代14:00,吃过午饭,你想去附近的公园玩玩,但你不知道应该去中山公园还是去景山公园。你又打开“XXXX预测预测”,希望它帮你分析一下,哪个公园相对不太拥挤。根据结果,你去了景山公园。16:00,你正在公园里休息,收到了催缴电话费的短信。你很好奇自己过去三年每个月的消费记录。但过去运营商只能让你查到六个月以内的消费信息。因
3、为中国移动至少有5亿用户,每天至少能产生10次计费记录。每天50亿的计费记录,一年下来就是1800亿条记录。这是一个大数据的存储和归纳技术大数据的存储和归纳技术难题。但在大数据时代,过去几年的电话通讯信息都可以查到了。22:00,晚上睡觉的时候,你家的孩子哭闹起来。你把孩子的哭声录入一个大数据软件中。软件能告诉你孩子为什么哭。是饿了,还是哪里不舒服,还是说只是想撒撒娇18:00,你回到了家,你的可穿戴设备告诉你,今天你在室内和室外的时间分别都是多少,你一天内吸入了多少雾霾。5一.认识大数据时代 最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡麦肯锡。麦肯锡称:“数据,已经渗透到当今每一个行
4、业和业务职能领域数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来一波生产率增长和消费者盈余浪潮的到来。”大数据时代的生活令人神往,你对客观世界的认识更进了一步,所做的决策也不再仅仅依赖主观判断。甚至于你的一个习惯动作、你的一次消费行为、你的一份就诊记录,都正在被巨大的数字网络串联起来。移动互联网风潮汹涌。大数据正悄悄包围着我们。甚至连世界经济格局也在酝酿着巨大变革!6一.认识大数据时代 纽约时报2012年2月的一篇专栏中所称,“大数据”时代已经
5、降临,在商业、经济及其他领域中,决策将日益基于数据和分析决策将日益基于数据和分析而作出,而并非基于经验和直觉。而作出,而并非基于经验和直觉。亚马逊前任首席科学家Andreas Weigend说:“数据是新的石油数据是新的石油。”哈佛大学社会学教授加里金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”7一.认识大数据时代 2012年3月份美国奥巴马政府发布了“大数据研究和发展倡议大数据研究和发展倡议”,投资2亿以上美元,正式启动“大数据发展计划”。计划在科学研究、环境、生物医学等领域利用大数据技术进行突破。奥巴马政府的这
6、一计划被视为美国政府继信息高速公路(Information Highway)计划之后在信息科学领域的又一重大举措。2012年5月,联合国发表名为大数据促大数据促发展:挑战与机遇发展:挑战与机遇的政务白皮书中,指出大数据对于联合国和各国政府来说是一个历史性的机遇,还探讨了如何利用包括社交网络在内大数据资源造福人类。联合国的大数据白皮书还建议联合国成员国建设“脉搏实验室脉搏实验室”“”“Pulse Labs”Pulse Labs”网络开发大数据的潜在价值一.认识大数据时代8 随着一系列标志性事件的发生和建立,人们越发感觉到大数据时代的力量。因此2013年被许多国外媒体和专家称为“大数据元年大数据元
7、年”。当今“大社会”,三分技术,七分数据,得数据者得天下。一.认识大数据时代9 大数据时代:生活、工作与思维的大变革一书的作者维克托迈尔舍恩伯格,如是说,“如果你是一个个人,如果你拒绝的话如果你是一个个人,如果你拒绝的话,可能会失去生命,如果是一个国家的话,拒,可能会失去生命,如果是一个国家的话,拒绝大数据时代的话,可能失去这个国家的未来绝大数据时代的话,可能失去这个国家的未来,失去一代人的未来。,失去一代人的未来。”这一句话恐怕不能算作耸人听闻,因为每当人们站在现在这个节点的时候,总会去眺望未来,但是未来往往在你不经意当中已经悄悄地来到你的身边。10 一.认识大数据时代硬件成本的降低网络带宽
8、的提升云计算的兴起网络技术的发展智能终端的普及电子商务、社交网络、电子地图等的全面应用物联网大数据时代到来的必然性:大数据时代到来的必然性:11一.认识大数据时代p 大数据很抽象,表示数据规模的庞大。p 大数据泛指巨量的数据集,因可从中挖掘出有价值的信息而受到重视。华尔街日报将大数据时代、智能化生产、无线网络革命大数据时代、智能化生产、无线网络革命称为引领未来繁荣发展的重大技术变革。目前对大数据尚未有一个公认的定义,不同的定义基本上是从特征出发,试图给出大数据的定义。12一.认识大数据时代维基百科给出的定义:大数据是指利用常用软件工大数据是指利用常用软件工具捕获、管理和处理数据所耗时具捕获、管
9、理和处理数据所耗时间超过可容忍时间的数据集。间超过可容忍时间的数据集。“3V”定义规模性(Volume)多样性(Variety)高速性(Velocity)“4V”定义价值性(Value)真实性(Veracity)(IDC)(IBM)13一.认识大数据时代全球流量累计达到1EB(即10亿GB)的时间一年(2001)一个月(2004)一周(2007)一天(2013)一天产生的信息量可刻满1.881.88亿亿张DVD光盘全球网民平均每月使用流量:1M(1998)10M(2000)100M(2003)1G(2008)10G10G(20142014)14一.认识大数据时代我国网民数量居世界之首,每天产生
10、的数据量也位于世界前列。淘宝网站u单日数据产生量超过5 5万万GBGBu存储量40004000万万GBGB百度公司u目前数据总量1010亿亿GBGBu存储网页1 1万亿页万亿页u每天大约要处理6060亿次亿次搜索请求一个8Mbps的摄像头u一小时能产生3.6GB3.6GB的数据u一个城市每月产生的数据达上千万上千万GBGB医院u一个病人的CT影像数据量达几十几十GBGBu全国每年需保存的数据达上百亿百亿GBGB15一.认识大数据时代从从数据库数据库(database(database,DB)DB)到到大数据大数据(big data(big data,BD)BD)“池塘捕鱼池塘捕鱼”VSVS“大
11、海捕鱼大海捕鱼”“鱼”是待处理的数据数据规模小(以MB为处理单位)大(以GB、TB、PB为处理单位)数据类型单一(结构化为主)繁多(结构化、半结构化、非结构化)模式和数据的关系先有模式后有数据(先有池塘后有鱼)先有数据后有模式模式随数据增多不断演变处理对象数据(池塘中的鱼)(“鱼”,通过某些“鱼”判断其他种类的“鱼”是否存在)处理工具One size fits allNo size fits all16 大数据就如同蜜蜂,其主要价值是传播花粉,自己生产的蜂蜜价值并不大。2013年世界范围内狭义的大数据产业产值只有186亿美元,但广义的大数据应用几乎覆盖所有产业。据麦肯锡公司预测,开放数据仅在教
12、育、保健等7个行业便可释放3.23.2万亿万亿5.45.4万亿美元万亿美元的经济价值。二.大数据的应用领域17二.大数据的应用领域天文学天文学生物医学生物医学电子政务电子政务气候学气候学企业管理企业管理教育学教育学金融学金融学市场营销市场营销公共服务公共服务商业智能商业智能传媒业传媒业生活娱乐生活娱乐天文学天文学生物医学生物医学电子政务电子政务气候学气候学企业管理企业管理教育学教育学金融学金融学市场营销市场营销公共服务公共服务商业智能商业智能传媒业传媒业生活娱乐生活娱乐总统选举总统选举总统选举总统选举情报学情报学情报学情报学图书馆学图书馆学图书馆学图书馆学二.大数据的应用领域政治领域 奥巴马的
13、数据团队对数以千万计的选民邮件进行了大数大数据挖掘据挖掘,精确预测出了更可能拥护奥巴马的选民类型,并进行了有针对性的宣传,从而帮助奥巴马成为了美国历史上唯一一位在竞选经费处于劣势下实现连任的总统。大数据帮助奥巴马大数据帮助奥巴马成功实现连任成功实现连任二.大数据的应用领域政治领域 奥巴马的例子告诉我们,只要数据量够数据量够大,够及时,挖掘够深刻大,够及时,挖掘够深刻,我们完全可以洞悉每个选民的投票几率。迅速普及的互联网与移动互联网,悄然为记录人的行为数据提供了最为便利、持久的载体。最重要的是,在这些强大的数据收集终端面前,人们没有掩饰的意图,从而创造着过去无法收集与分析的海量数据,这让所有社会
14、科学领域能够让所有社会科学领域能够从宏观群体走向微观个体,让跟踪每一个人从宏观群体走向微观个体,让跟踪每一个人的数据成为了可能,从而让研究人性成为了的数据成为了可能,从而让研究人性成为了可能。可能。20二.大数据的应用领域政治领域 大数据的发展,将极大地改变政府的管理模式,有利于节约政府投资、加强市场监管能力、提高政府决策能力、提升公共服务能力,实现区域化管理。重“一站式”服务轻“激励型”服务我国电子政务的发展现状我国电子政务的发展现状:重性质性政务信息轻量化性政务数据政府门户网站信息以文本、图片、视频等非结构化信息为主,但没有关于财政税收、医疗保险等可量化分析的结构化数据。“一站式”服务包括
15、申请、办证、审批等,忽略了开放原生态数据激发社会主体的创造性、主动性。大数据在我国电子政务领域的应用大数据在我国电子政务领域的应用 21二.大数据的应用领域政治领域 从反映政府网站页面吸引力的跳出率指标来看,政府网站用户的总体跳出总体跳出率率为为63.33%63.33%,即有2/3左右的用户来到政府网站之后仅访问一个页面就离开了。说明当今以性质性为主的政府信息黏度不够,并不能满足社会需求,量化性当今以性质性为主的政府信息黏度不够,并不能满足社会需求,量化性政务数据才是社会真正急需的。政务数据才是社会真正急需的。头疼,找不到我想要的数据!22二.大数据的应用领域政治领域 目前,我国有60多个城市
16、,将构建“智慧城市”的目标列入“十二五规划”中。智慧城市即利用大数据的整合和分析来治理社会。2013年两会期间,有代表提议将发展大数据上升为国家战略发展大数据上升为国家战略。大数据背景下,我国电子政务创新模式的转变:大数据背景下,我国电子政务创新模式的转变:关注焦点从信息向数据转变1增值基础从公开向发布、开放转变2行为方式从独立向协同转变323二.大数据的应用领域政治领域数据是数据是生成信生成信息和知息和知识的原识的原生素材生素材 如将我国城镇居民医疗数据与保险数据对比分析可以优化保险企业报销比例,发现虚假报销行为;与制药厂数据比对分析可以调节药品的生产量与销售渠道。但医疗政策信息并不能发挥这
17、样的作用。数据是数据是舆情监舆情监督的有督的有利依据利依据 2008年,政府公布4万亿元的经济刺激计划,但社会对资金的具体去向及其准确数额却无从得知;汶川地震灾后重建近2亿资金的用途也因没有准确的数据公开而被暗箱操作,违规使用当今电子政务中,信息公开实质是性质性信息的公开,而数据才是舆情监督的真正证据。关注焦点关注焦点从信息向数据转变从信息向数据转变 24二.大数据的应用领域政治领域从信息向数据的转变是政府从后台走向阳光的转变。从信息向数据的转变是政府从后台走向阳光的转变。25二.大数据的应用领域政治领域增值基础增值基础从公开向发布、开放转变从公开向发布、开放转变 大数据时代,数据增值的关键在
18、于数据的整合与分析,整合的前提就是数据的开放。数据公开是意识上的、被动的;数据发布是行动上的、主动的。数据公开、发布是一条一条的;数据开放是一片一片的。政府态度从被动转为主动;政府态度从被动转为主动;数据从点对点转为面对面。数据从点对点转为面对面。二.大数据的应用领域政治领域26行为方式行为方式从独立向协同转变从独立向协同转变 如济南电子政务数据交换平台实现了工商、国税、质检、公安、社保等20多个部门涉税数据的共享,国税局与地税局通过数据比对,发现了25000条数据差异,落实纳税企业5000多户,补缴税款2700多万元。内部协同内部协同:各地区政府、各层级政府和各部门之间外部协同外部协同:政府
19、与社会之间自上而下、自下而上的互动27二.大数据的应用领域金融领域 华尔街“德温特资本市场”公司首席执行官保罗霍廷每天的工作之一,就是利用电脑程序分析全球3.43.4亿微博账户的亿微博账户的留言留言,进而判断民众情绪,再以“1”到“50”进行打分。根据打分结果,霍廷再决定如何处理手中数以百万美元计的股票。霍廷的判断原则很简单:如果所有人似乎都高兴,那就买入;如果大家的焦虑情绪上升,那就抛售。这一招收效显著当年第一季度,霍廷的公司获得了7%7%的收益率的收益率。28二.大数据的应用领域金融领域大数据助力推进高频金融交易和小额信贷大数据助力推进高频金融交易和小额信贷高频交易高频交易:实时性要求高、
20、数据规模大。目前沪深两市每天4个小时交易时间会产生3亿条以上逐笔成交数据,通过对历史和实时数据的挖掘创新,以创造和改进数量化交易模型,并将之应用于基于计算机模型的实时证券交易过程中。小额信贷小额信贷:阿里巴巴和建行在2007年推出一个专注于小企业的贷款计划e贷通贷通,阿里巴巴利用拥有的用户信息及交易数据,通过大数据技术自动判定是否给予企业贷款;而建行坐拥巨额资金,希望贷款给无信用记录但发展势头良好的小企业。到2012年底,阿里在累计服务小微企业超过20万家,放贷300多亿元,坏账率仅为0.3%左右,低于商业银行水平。29二.大数据的应用领域金融领域大数据协助金融企业精准营销大数据协助金融企业精
21、准营销 招商银行通过数据分析识别出招行信用卡高价值客户经常出现在星巴克、DQ、麦当劳等场所后,通过“多倍积分累计多倍积分累计”“”“积分店面兑换积分店面兑换”等活动吸引优质客户;通过构建客户流失预警模型,对流失率等级前20%的客户发售高收益理财产品予以挽留,使得金卡和金葵花卡客户流失率分别降低了15个和7个百分点;通过对客户交易记录进行分析,有效识别出潜在的小微企业客户,并利用远程银行和云转介平台实施交叉销售,取得了良好成效。30二.大数据的应用领域金融领域 虽然目前大数据的研究与应用在金融业还处于初级阶段,但是价值已经显现出来。未来,大数据可能成为最大的金融交易产品。未来金融大数据将会如基础
22、设施基础设施一样,有金融数据提供方、金融监管者,金融大数据的交叉复用等,最终将成为金融业进行重要活动的基础设施。31315学习成绩1入学率2辍学率3识字的准确率5升学率4作业的正确率6考试时答题的顺序11师生互动的时长与频率回答问题的时长、正确率课堂举手次数回答问题的次数平均每道题花费的时间1278910学校教育中的学校教育中的“大数据大数据”二.大数据的应用领域教育领域现在,大数据分析已经被应用到美国的公共教育中,成为教学改革的重要力量。32二.大数据的应用领域教育领域 美国联邦政府教育部2012年参与了一项耗资2亿美元的公共教育中的大数据计划,旨在通过运用大数据分析来改善教育。联邦教育部从
23、财政预算中支出2500万美元,用于理解学生在个性化层面是怎样学习的。美国高中生和大学生的糟糕表现高中生退学率高达30%(平均每26秒就有一个高中生退学),33%的大学生需要重修,46%的大学生无法正常毕业。大数据能否拯救美国的公立教育?比尔盖茨曾打赌说,利用数据分析的教育大数利用数据分析的教育大数据能够提高学生的学习成绩,拯救美国的公立学据能够提高学生的学习成绩,拯救美国的公立学校系统。校系统。他称过去十几年里教育领域的技术发展陷入了停滞,研发投入远远不够。盖茨充满信心地认为,教育技术未来发展的关键在于数据。教育技术未来发展的关键在于数据。33二.大数据的应用领域教育领域通过大数据你可以知道:
24、通过大数据你可以知道:p一个学生成绩不好是由于他因为周一个学生成绩不好是由于他因为周围环境而分心了吗?围环境而分心了吗?p期末考试不及格是否说明学生未掌期末考试不及格是否说明学生未掌握学习内容,还是因为他请了很多病握学习内容,还是因为他请了很多病假的缘故?假的缘故?在加拿大,教育科技公司“渴望学习渴望学习”(Desire 2 Learn)已经面向高等教育领域的学生,推出了基于过去的学习成绩数据预测并改善未来学习成绩的大数据服务项目。通过监控学生阅读电子化的课程材料、提交电子版的作业、通过在线与同学交流、完阅读电子化的课程材料、提交电子版的作业、通过在线与同学交流、完成考试与测验,成考试与测验,
25、就能让计算程序持续、系统地分析每个学生的教育数据。老师得到的不再是过去那种只展示学生分数与作业的结果,而是像阅读材料的时间长短等这样更为详细的重要信息。这样老师就能及时诊断问题的所在,提出改进的建议,并预测学生的期末考试成绩。34二.大数据的应用领域生活娱乐方面爱在那儿!爱在那儿!爸爸去哪儿爸爸去哪儿大数据解读大数据解读 新华社新媒体中心联合数托邦创意分析工作室抓取了新浪微 博上提及“爸爸去哪儿”45.5万条原创微博,并对36.7万独立原发作者用户(去除疑似水军账户)、1300余万条用户微博及近1亿的关系进行数据分析。结果发现:爸爸爸爸去哪儿去哪儿不仅成为名副其实的不仅成为名副其实的“口碑王口
26、碑王”,还使娱乐节目发,还使娱乐节目发生了很多微妙变化。生了很多微妙变化。35二.大数据的应用领域生活娱乐方面粉丝性别比例:粉丝性别比例:“爸爸粉”女性占到八成。难道是因为星爸太帅?当然,这与微博中女性用户占比较高和她们更爱分享转评的习惯也有关。用户年龄分布:用户年龄分布:覆盖适龄婚育群体,观众气质更显成熟。不少适龄青年发微博称,“看到某某,我也好想结婚,想有个这样的儿子女儿。”地区偏好排行:地区偏好排行:爸爸去哪儿的观众明显向GDP高地聚集。对湘派娱乐节目免疫力极强的京、沪、苏、蜀等地罕见上榜。爸爸去哪儿偏好度前十省份中,有个GDP十强省份,涵盖3个直辖市。这是否能说明,一部分“先富起来”的
27、人,对亲子关系有更深的焦虑和更多的期待?36二.大数据的应用领域生活娱乐方面赞助商热度:赞助商热度:主冠名赞助商强势冒出,在几乎没有社交媒体营销配合下,微博热度强劲增长。英菲尼迪从第三期开始广告植入,话题增量立竿见影。思念水饺配合“爸爸吃神马”等互动促销,参与度有所增加。只是不知,三大赞助商的投入是否与这一结果完全契合?明星关注度:明星关注度:数据来自于每期节目播出后一周内5对父子的原发微博提及量(含昵称)。张亮父子低调亮相,关注度逐期上升,成功实现实现“逆袭”。37赞助商潜在赞助商明星同类节目竞争者节目组观众大数据解读大数据解读可能的受益可能的受益者者二.大数据的应用领域生活娱乐方面满足了自
28、己“八卦”的需求。对这个节目有了深入的了解。从爸爸去哪儿的成功中可以学到什么?本次赞助是否成功?成功在哪里?为以后广告的投放提供了经验。了解了自己及孩子在观众心中的“热度”,为下一步转型及孩子未来的规划提供参考。根据之前的数据分析,大胆推出了低成本同名电影并大获成功!第二季的拍摄紧锣密鼓地进行着为决策提供支持。若自己的目标客户与该节目的观众一致,可以考虑下一季的赞助。38二.大数据的应用领域生活娱乐方面 40天,天,36亿人次。亿人次。这是2014年春运的总时间和总出行人数。在这场堪称人类历史上最大规模的短期迁徙中,人群从哪儿去了哪儿?哪些线路最热门人群从哪儿去了哪儿?哪些线路最热门?在以往,
29、这些问题可能难以精确回答。但随着技术进步,通过应用“大数据”这一技术利器,人们已经接近“在迷宫中感受全局”地看见春运的全景。大数据首次播报春运迁徙实况大数据首次播报春运迁徙实况39二.大数据的应用领域生活娱乐方面 国内有2亿手机用户使用百度地图,用户每次位置变化,百度都能得到数据。把手机网民的定位信息汇总成大数据进行分析,就能勾勒出人们的迁徙轨迹。此次百度图景化地展示春运情况,是基于LBS(基于地理位置的服务)技术的一次创新。它的数据每8小时更新一次,囊括了全国铁路、公路和航空在内的线路。新闻视频:新闻视频:2014年年1月月25日日,“据据”说春运说春运40三.大数据时代的机遇和挑战 今天,
30、大数据似乎成了“灵丹妙药”,“包治百病”,无所不能。但千万别把“大数据”用做解决世界上所有问题的全能办法,无论是管理城市到消除贫困,制止恐怖袭击、疾病流行到拯救地球环境等,以为有了“大数据”,就没有解决不了的问题,这也是一种误解。人类的思想、个人的文化和行为模式、不同国家及社会的存在发展都非常复杂、曲折和独特,显然不能全部由计算机来“数字自己说话”。无论到何时,其实都还是人在思考和无论到何时,其实都还是人在思考和“说话说话”。41三.大数据时代的机遇和挑战大数据技术促进国家和社会发展大数据技术促进国家和社会发展大数据蓝海成为企业竞争的新焦点大数据蓝海成为企业竞争的新焦点大数据时代呼唤创新型人才
31、大数据时代呼唤创新型人才大数据技术的运用仍有困难大数据技术的运用仍有困难大数据给信息安全带来新挑战大数据给信息安全带来新挑战42三.大数据时代的机遇和挑战机遇机遇大数据技术促进国家和社会发展大数据技术促进国家和社会发展 大数据技术的运用前景是十分光明的。当前,我国正处在全面建成小康社会征程中,工业化、信息化、城镇化、农业现代化任务很重,建设下一代信息基础设施,发展现代信息技术产业体系,健全信息安全保障体系,推进信息网络技术广泛运用,是实现四化同步发展的保证。大数据分析对我们深刻领会世情和国情,把握规律,实现科学发展,做出科学决策具有重要意义,我们必须重新认识数据的重要价值。43三.大数据时代的
32、机遇和挑战 大数据所能带来的巨大商业价值,被认为将引领一场足以与20世纪计算机革命匹敌的巨大变革。大数据正在对每个领域都造成影响,包括商业、经济等领域。大数据正在促生新的蓝海,催生新的经济增长点,正在成为企业竞争的新焦点。在今天的大数据时代,商业的生态环境在不经意间发生了巨大的变化:网民和消费者的界限正在变得模糊,无处不在的智能终端,随时在线的网络传输,互动频繁的社交网络让以往只是网页浏览者的网民的面孔从模糊变得清晰,对于企业来说,他们第一次有机会进行大规模的精准化的消费者行为研究:作为保持着持续变革欲望的企业,主动地主动地拥抱这种变化,从战略到战术层而开始自我的蜕变拥抱这种变化,从战略到战术
33、层而开始自我的蜕变和进化将会让他们更加适应这个新的时代,大数据和进化将会让他们更加适应这个新的时代,大数据蓝海成为未来竞争的制高点。蓝海成为未来竞争的制高点。机遇机遇大数据蓝海成为企业竞争的新焦点大数据蓝海成为企业竞争的新焦点44三.大数据时代的机遇和挑战机遇机遇大数据时代呼唤创新型人才大数据时代呼唤创新型人才 盖特纳咨询公司预测大数据将为全球带440万个IT新岗位和上千万个非IT岗位。麦肯锡公司预测美国到2018年需要深度数据分析人才44万49万,缺口14万19万人;需要既熟悉本单位需求又了解大数据技术与应用的管理者150万,这方面的人才缺口更大。中国 是人才大国,但能理解与应用大数据的创新
34、人才更是稀缺资源。45三.大数据时代的机遇和挑战数据收集数据收集 要对来自网络包括物联网和机构信息系统的数据附上时空标志,去伪存真去伪存真,尽可能收集异源甚至是异构的数据,还可与历史数据对照,多角度多角度验证数据的全面性和可信性。数据存储数据存储 要达到低成本、低成本、低能耗、高可靠低能耗、高可靠性目标性目标,要用到冗余配置、分布化和云计算技术,存储时对数据进行分类,通过过滤和去重,减少存储量,并加入便于检索的标签。数据处理数据处理 大数据的复杂性使得难以用传统的方法描述与度量,需要将高维图像等多媒体数据降维后度量与处理,利用上下上下文关联文关联进行语义分析,从大量动态及可能模棱两可的数据中综
35、合信息,并导出可导出可理解的内容理解的内容。结果的可视化呈现结果的可视化呈现 使结果更直观以使结果更直观以便于洞察便于洞察。目前,尽管计算机智能化有了很大进步,但还只能针对小规模、有结构或类结构的数据进行分析,谈不上深层次的数据挖掘,现有的数据挖掘算法在不同行业中难以通用。挑战挑战大数据技术的运用仍有困难大数据技术的运用仍有困难 目前,大数据技术的运用仍存在一些困难与挑战,体现在大数据挖掘的四个环节中。大量数据的集中存储增加了其泄露的风险;一些敏感数据的所有权和使用权并没有清晰界定。复杂的数据存储在一起,可能造成企业安全管理不合规;安全防护手段更新升级慢,存在漏洞黑客可收集更多有用信息,大数据
36、分析让攻击更精准;大数据为黑客发起攻击提供了更多的机会46三.大数据时代的机遇和挑战挑战挑战大数据给信息安全带来新挑战大数据给信息安全带来新挑战加大隐私泄露风险对现有存储和安防措施提出挑战被运用到攻击手段中47三.大数据时代的机遇和挑战 斯诺登的爆料引起一片哗然,根据他提供的资料,被卷入“棱镜门”事件的公司包括微软、雅虎、谷歌、苹果、Facebook等9大IT业巨头。在“棱镜门”事件开始发酵之后,这些公司先是赶紧出面否认与美国政府的监视项目进行过合作,并相继发表声明,呼吁政府采取更透明态度,以证明他们的“清白”。事情的起因是美国中情局前职员斯诺登向媒体爆料,过去6年间,美国的情报部门通过一个代
37、号为“棱镜”的项目,从多家知名互联网公司获取电子邮件电子邮件、在线聊天内容、照片、文档、视频等网络私人数据,跟踪用户一举一动、在线聊天内容、照片、文档、视频等网络私人数据,跟踪用户一举一动。他说,自己只需要坐在办公桌前,动动指头,敲敲键盘,就能了解很多人的私密信息。48三.大数据时代的机遇和挑战 一方面我们通过对大量用户数据的分析,公司、企业、政府都可以更好的了解用户行为、消费习惯的等等,从而可以提供更好的服务。但是另外一方面,这又不可避免的对用户的隐私构成威胁、挑战。很多人已经意识到,在数据的应用方面,相关法律法规的制定变得越来越重要。相关法律法规的制定变得越来越重要。作为用户,需要明确界定自己在数据的使用方面具有什么权力和义务;作为企业和政府,需要逐渐的定位清楚,在多大程度上可以并且用什么样的方式来使用用户的数据。在现有的互联网结构下,我们所有的网络行为对于服务提供商来说都是透明透明的。人们既想借助互联网平台与别人交流,又想自己不被窥探,这是完全不可能的。网络隐网络隐私安全私安全将是未来一个巨大的问题。49当前当前,大数据的应用只是冰山一角大数据的应用只是冰山一角,绝大部分隐绝大部分隐藏在表面之下。藏在表面之下。未来,大数据所带来的精彩值得期待!未来,大数据所带来的精彩值得期待!50