ImageVerifierCode 换一换
格式:PPTX , 页数:18 ,大小:2.42MB ,
文档编号:7475160      下载积分:2 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-7475160.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(QXX)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(4.2.1 大数据处理的基本思想与架构 ppt课件-2024新浙教版(2019)《高中信息技术》必修第一册.pptx)为本站会员(QXX)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

4.2.1 大数据处理的基本思想与架构 ppt课件-2024新浙教版(2019)《高中信息技术》必修第一册.pptx

1、第四章第四章 数据处理与应用数据处理与应用 了解大数据处理架构和基本思路。了解静态数据、流数据和图数据三者的区别。大数据具有数据量大、数数据量大、数据来源于类型多样、处理据来源于类型多样、处理速度快等速度快等特点,简单的表格处理软件已经无法满足大数据的处理需求,同时,大数据技术、理论和处理大数据技术、理论和处理方法也在不断发展方法也在不断发展,为大数据的处理提供了越来越有力的支持支持。医疗大数据可视化医疗大数据可视化处理大数据时,一般采用分治思想分治思想(“分而治之分而治之”)。分-将问题分解为规模更小的子问题治-将规模更小的子问题逐个击破解决合-将已解决的子问题合并,最终得出原问题的解大数据

2、处理按照类型按照类型可划分为、和。静态数据-指在处理时已收集完成、在计算时不会发生改变的数据,一般采用;流数据-指不间断地、持续地到达的实时数据,随着时间的流逝,流数据的价值也随之降低,通过可以得到更有价值的分析结果;图数据-现实世界中的许多数据,如社交网络、道路交通等数据,可采用进行处理。知识点一:批处理计算(知识点一:批处理计算(静态数据:静态数据:处理时已收集完处理时已收集完成、在计算时不会发生改变的数据成、在计算时不会发生改变的数据)Hadoop:是一个可运行于上的分布式系统基础架构,适用于静态数据的。SparkSpark:与HadoopHadoop相似,启用了内存存储中间结果,运行速

3、度比HadoopHadoop快很多。(1 1)分布式文件系统)分布式文件系统HDFSHDFS是谷歌文件系统(GFS)的开源实现。:将大规模海量数据保存在不同的存储节点中,并用分布式系统进行管理。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。比如:的底层一般采用HDFS实现。(2 2)分布式数据库)分布式数据库HBaseHBase是一个高可靠、高性能、可伸缩、是谷歌BigTable数据库的开源实现。HBase建立在HDFS提供的底层存储基础上,采用基于列列的存储方式,主要用来存储非结构化数据和半结构化数据。(3 3)分布式并行计算模型)分布式并行计算模型MapReduceMapRedu

4、ce主要由Map(映射)和Reduce(归纳)2个函数构成。二、流计算(二、流计算(流数据流数据:不间断地、持续地到达的不间断地、持续地到达的实时实时数据数据)主要的流计算软件系统:IBM InfoSphere(捕获和分析动态数据)Twitter(推特风暴)!S4(雅虎分布式流计算)(银河流数据处理平台)Facebook(是的替代产品)三、图计算(三、图计算(图数据图数据:以图的形式呈现的,或者是可以图的形式呈现的,或者是可以转换为图以后再进行分析的数据,如以转换为图以后再进行分析的数据,如社交网络社交网络、网、网络浏览与购买行为、传染病的传播路径等。络浏览与购买行为、传染病的传播路径等。)目前通用的图处理软件主要包括两类:四、实时处理与批处理的整合四、实时处理与批处理的整合Twitter开源了大数据处理系统,该系统实现了在一个平台架构下的整合。平台的整合缩短了批处理与流处理之间的,有利于减少系统的,降低使用。是检测和修正错漏的数据、整合数据资源、规整数据格式、提高数据质量。数据缺失、数据重复、数据异常、逻辑错误、格式不一致等。公式以“=”开头,由常数、函数、单元格引用和运算符组成的式子(公式不仅用于计算,更重要的是构建计算模型)。1.1.分析数据;分析数据;2.2.创建图表(创建图表(););3.3.检查图表。检查图表。

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|