大数据处理技术简介ppt课件.ppt

上传人(卖家):三亚风情 文档编号:2611735 上传时间:2022-05-11 格式:PPT 页数:52 大小:6.46MB
下载 相关 举报
大数据处理技术简介ppt课件.ppt_第1页
第1页 / 共52页
大数据处理技术简介ppt课件.ppt_第2页
第2页 / 共52页
大数据处理技术简介ppt课件.ppt_第3页
第3页 / 共52页
大数据处理技术简介ppt课件.ppt_第4页
第4页 / 共52页
大数据处理技术简介ppt课件.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

1、12320002000年年 数字数据只占全球数据量的数字数据只占全球数据量的1/41/420072007年年 所有数据中只有所有数据中只有7%7%是存储在报纸、书是存储在报纸、书籍、图片等媒介上的模拟数据,其余籍、图片等媒介上的模拟数据,其余93%93%全是全是数字数据(二进制数据)数字数据(二进制数据)Google Google 单日单日数据处理数据处理量量超过超过 24 24 PBPBFacebookFacebook 单日单日照片更新量超过照片更新量超过 1 1千万千万张张淘宝网淘宝网 单日数据产生量超过单日数据产生量超过 5 5万万 GBGB4 “大数据大数据”是指一个是指一个数据集(数

2、据集(DatasetsDatasets),它的尺它的尺寸大到已经无法由寸大到已经无法由传统的数据库软件传统的数据库软件去采集、储存去采集、储存、管理和分析。、管理和分析。5行数据行数据, ,存储在数据库里存储在数据库里, ,可以用二维表可以用二维表结构结构来逻辑来逻辑表达实现的表达实现的数据。数据。例如:二维表自描述,数据结构和内容混杂在自描述,数据结构和内容混杂在一起一起的数据。的数据。例如: XML、HTML等。除去以上两种类型除去以上两种类型例如:音视频、图片等。6789l无法储存几亿行长,几百万行宽的表格,无法储存几亿行长,几百万行宽的表格,巨大的数据巨大的数据直接导致数据库崩溃直接导

3、致数据库崩溃l半半结构化数据和脏数据结构化数据和脏数据将会导致出错(类型不严格)将会导致出错(类型不严格)10111213141516.10G100M/S10G10G10G10G1799%*99%*99%*99%*99%=95%95%*95%*95%*95%*95%=76% 181910G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G10G202122232425262728293031323334 1.系统要求:系统要求:Linux(U

4、buntu/CentOS/) 2.java运行环境(安装运行环境(安装JDK) 3.安装安装SSH 4.安装安装Hadoop3536 Hadoop云的实际操作373839404142 public class WordCount public static class Map extends MapReduceBase implements Mapper private final static IntWritable one = new IntWritable(1); private Text word = new Text(); public void (LongWritable key,

5、 Text value, OutputCollector output, Reporter reporter) throws IOException String line = value.toString(); StringTokenizer tokenizer = new StringTokenizer(line); while (tokenizer.hasMoreTokens() 4344 454647 计算节点和储存节点普通机器即可计算节点和储存节点普通机器即可 通过增加节点即扩展通过增加节点即扩展 副本机制副本机制 Map/Reduce框架框架4849为程序员提供类SQL语句编写,底层将HiveQL(Hive- SQL)转换为MapReduce编译运行提供给用户使用的脚本语言,简化MapReduce代码编写低延时、分布式的非关系型数据库分布式协同工作系统向Hadoop应用(Hive/Pig)共享元数据505152

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(大数据处理技术简介ppt课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|