客户端工作汇报课件.ppt

上传人(卖家):三亚风情 文档编号:3335679 上传时间:2022-08-20 格式:PPT 页数:15 大小:2.06MB
下载 相关 举报
客户端工作汇报课件.ppt_第1页
第1页 / 共15页
客户端工作汇报课件.ppt_第2页
第2页 / 共15页
客户端工作汇报课件.ppt_第3页
第3页 / 共15页
客户端工作汇报课件.ppt_第4页
第4页 / 共15页
客户端工作汇报课件.ppt_第5页
第5页 / 共15页
点击查看更多>>
资源描述

1、hadoophadoop入门介绍入门介绍苏州瑞翼信息技术有限公司朱健1.hadoop why?1.数据非结构化+半结构化,传统数据库无法处理。2.数据量大,传统关系型数据库无法承载。数据库更新小部分数据,B-tree效率高。但是大量数据时,效率低。需要sort/merge来重建数据库。一个趋势:寻址时间(磁盘慢的原因)的提高远远慢于传输速率(带宽)的提高。流式读取主要取决于传输速率传输速率。1.hadoop why?传统数据库传统数据库MapReduce数据大小GBPB访问交互式、批处理批处理更新多次读写一次写入多次读写结构静态模式动态模式完整性高低横向扩展(scaling out)非线性线性

2、线性!2.hadoop版本变迁史版本变迁史2.hadoop版本变迁史版本变迁史3.一个简单的批处理分层架构一个简单的批处理分层架构(hadoop 1.x)runtime(linux,jvm)基础设施(hdfs,job,zk)基础平台层(scheduler,hbase,hive)用户网关层客户应用层(行为分析,账单,清结算等等)4.hadoop生态圈生态圈5.基础组件基础组件Hadoop Common:The common utilities that support the other Hadoop modules.Hadoop Distributed File System(HDFS):A

3、distributed file system that provides high-throughput access to application data.Hadoop YARN:A framework for job scheduling and cluster resource management.Hadoop MapReduce:A YARN-based system for parallel processing of large data sets.6.HDFS7.YARN7.YARNResourceManager(RM):主要接收客户端任务请求,接收和监控NodeManager(NM)的资源情况汇报,负责资源的分配与调度,启动和监控ApplicationMaster(AM)。NodeManager:主要是节点上的资源管理,启动Container运行task计算,上报资源、container情况给RM和任务处理情况给AM。ApplicationMaster:主要是单个Application(Job)的task管理和调度,向RM进行资源的申请,向NM发出launch Container指令,接收NM的task处理状态信息。8.MapReduce8.MapReduce8.MapReduceQ&A

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(客户端工作汇报课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|