1、存储基础知识存储基础知识RAIDRAID技术技术 RAIDRAID基本概念基本概念定义定义 RAID RAID(Redundant Array of Independent DisksRedundant Array of Independent Disks)即)即独立磁盘冗独立磁盘冗余阵列余阵列,RAIDRAID技术将多个单独的物理硬盘以不同的方式组合成一个逻辑技术将多个单独的物理硬盘以不同的方式组合成一个逻辑硬盘,从而达到提升存储容量、读写性能和数据安全性的目的。根据不硬盘,从而达到提升存储容量、读写性能和数据安全性的目的。根据不同的组合方式可以分为不同的同的组合方式可以分为不同的RAIDR
2、AID级别级别RAID 0RAID 0数据条带化,无校验RAID 1RAID 1数据镜像,无校验RAID 2RAID 2海明码错误校验及校正(不常用)RAID 3RAID 3数据条带化读写,校验信息存放于专用盘(不常用)RAID 4RAID 4单次写数据采用单个硬盘,专用盘存放校验数据(不常用)RAID 5RAID 5数据条带化,校验信息分布式存放RAID 6RAID 6数据条带化,分布式校验并提供两级冗余未使用未使用 RAID一旦硬盘损坏,资料将丢失!作业将停顿!资料仍然存在!使用使用 RAIDRAIDRAID出现原因出现原因 一一 未使用未使用 RAID使用使用 RAID硬盘容量单块硬盘容
3、量硬盘容量=单块硬盘容量 x NRAIDRAID出现原因出现原因 二二 一旦硬盘损坏,资料将丢失一旦硬盘损坏,资料将丢失!作业将停顿作业将停顿!未使用未使用 RAID使用使用 RAIDI/O 1I/O 2I/O 1I/O 2(Disk 1)(Disk 2)节省时间速度 N x 单块硬盘的速度Total request execution timeSoftware setupAccess TimeData TransferSoftware CompletionRAIDRAID出现原因出现原因 三三 CPU运算速度飞速提高,数据读写速度不应该成为计算机系统处理的瓶颈RAIDRAID基本概念基本概念
4、 条带条带 分条条带硬盘0硬盘2硬盘1硬盘3l大数据块写入RAID时会被分成多个数据块并行写入多块硬盘,这些大小一致的数据块就称为条带。同时数据读取时会并行从多块硬盘读取条带数据,最后完整输出。l条带无疑会大幅度提升整体读写效率。条带无疑会大幅度提升整体读写效率。RAIDRAID基本概念基本概念 重建(重建(RebuildRebuild)数据盘A1A0PA0A1PXOR故障数据盘校验盘A2A2XOR数据盘更换l某块硬盘出现故障后,一旦将其更换为正常硬盘,RAID便会通过其他硬盘数据计算出坏盘上原有的数据,再将数据重建回新添硬盘上。RAIDRAID基本概念基本概念物理卷和逻辑卷物理卷和逻辑卷 R
5、AID10RAID5 RAIDRAID由几块硬盘(物理卷)组成由几块硬盘(物理卷)组成 RAIDRAID可以多个硬盘按照指定容量创建一个或多个逻辑卷,便通过可以多个硬盘按照指定容量创建一个或多个逻辑卷,便通过LUNLUN(Logic Unit NumberLogic Unit Number)来标识。)来标识。一个逻辑卷对于主机来说一个逻辑卷对于主机来说就是一块硬盘(物理卷)就是一块硬盘(物理卷)物理卷物理卷逻辑卷逻辑卷多个物理卷上创建1个逻辑卷多个物理卷上创建2个逻辑卷LUN1LUN2LUN3RAID 0 RAID 0 条带存储条带存储(Striping)(Striping)原理原理:又称数据
6、分条,即把数据分成若干相等大小的小块,并把它们写到阵列上不同的硬盘上,这种技术又称“Stripping”(即将数据条带化),RAID0在读写时是以并行的方式对各硬盘同时进行操作。q 优点 磁盘空间利用率最高 在所有的级别中,RAID 0的速度是最快的q 缺点 无冗余功能,如果一个磁盘损坏,则所有的数据都无法使用 不适合关键业务q 应用 媒体编辑 图像编辑 需要高带宽的应用RAID 1 镜像镜像/双工双工优点数据安全性相对其它RAID级,是最好的缺点磁盘利用率只有50%,是所有RAID上磁盘利用率最低的一个级别原理原理:即每个工作盘都有一个镜像盘,每次写数据时必须同时写入镜像盘,读数据时只从工作
7、盘读出,一旦工作盘发生故障立即转入镜像盘,从镜像盘中读出数据。当更换故障盘后,数据可以重构,恢复工作盘正确数据 q 应用 财务 金融 需要高数据可用性的应用RAID 3(条带分布条带分布+专用盘校验专用盘校验)q原理原理:使用至少三块硬盘配置,在其中的一块硬盘上存贮专用的校验数据,当某块硬盘出现故障时,其它硬盘可以通过校验数据将有故障的硬盘的数据重新恢复出来。q特点特点:数据以位或字节的方式存于各盘(分散记录在组内相同扇区的各个硬盘上)优点优点高可用性磁盘利用率较高(N-1)并行I/O传输,顺序读性能较高缺点缺点校验盘成为性能瓶颈每次读写牵动整个组,每次只能完成一次I/O q 应用应用 流媒体
8、服务器 图像编辑 视频编辑RAID 5(条带技术条带技术+分布式校验分布式校验)q原理:原理:RAID5 将所有校验的数据分别存贮在所有的硬盘上,每一个硬盘的不同地方既存贮数据,也存贮校验数据。当某块硬盘出现故障时,其它硬盘可以通过校验数据将故障的硬盘的数据重新恢复出来。优点优点高可用性磁盘利用率较高(N-1),没有固定的校验盘,奇偶校验信息均匀分布在阵列所属的所有磁盘中随机读写性能高允许在同一组内并发进行多个写操作缺点缺点异或较验影响存储性能q 应用应用 文件及应用服务器 数据库服务器 Web,E-mail 局域网服务器RAID6(Double parity drive)高级数据保护)高级数
9、据保护较高的数据冗余性能;超强的数据保护能力,可以应付多颗盘同时出错;允许在同一组内并发进行多个写操作计算校验地址占用较多的处理时间;较低的RAID6 P+QRAID6 P+Q会根据公式计算出P和Q的值,当有两个数据同时丢失时,仍可以计算出原数据磁盘1磁盘2磁盘3磁盘4磁盘5条带1数据1a数据1b数据1cP1Q1条带2数据2d数据2eP2Q2数据2f条带3数据3gP3Q3数据3h数据3i条带4P4Q4数据4j数据4k数据4l条带5Q5数据5m数据5n数据5oP5RAID 级别比较级别比较项目项目RAID0RAID0RAID1RAID1RAID10RAID10RAID5RAID5、RAID3RA
10、ID3最小配置1243性能HighestLowestRAID5RAID10RAID0RAID1RAID5 RAID10特点无容错最佳的容错最佳的容错提供容错磁盘利用率100%50%50%(N-1)/N描述不带奇偶效验的条带集磁盘镜像RAID0与RAID1的结合带奇偶效验的条带集其中RAID3与RAID5的区别为:RAID3更适合于顺序存取,RAID5更适合于随机存取。需要根据具体的应用情况决定使用那种RAID级别。RAID性能比较性能比较RAID级*RAID-0RAID-1RAID-5RAID-10RAID-50RAID-6别名条带镜象分布奇偶位条带镜象阵列条带 分布奇偶阵列条带分布奇偶条带容
11、错性没有有有有有有冗余类型没有复制奇偶位复制奇偶位两种奇偶位热备盘选项没有有有有有有需要的磁盘数一个或多个只需2个三个或更多只需4个不小于6的偶数(6,8,10,12,14,16)(因为RAID5最少3个,再做镜像,就是6个)四个或更多可用容量NN/2 N-1 N/2N-2N2DAS NAS SAN存储体系架构介绍存储体系架构介绍 服务器直接后挂存储设备,最经济的一种结构。网络上直接挂接的存储设备,相当于一个网络文件共享服务器。应用光纤技术的SAN网络,传输介质为光纤,性能最高,目前使用较广 iSCSI-利用TCP/IP协议连接存储设备,可以理解为SCSI over IP,是将SCSI命令封装
12、到TCP/IP数据包中,通过IP网络传输SCSI数据。DAS-直连存储直连存储Client 2Server AApplication AServer BApplication BServer CApplication CDisks for Server ADisks for Server BDisks for Server CClient 3Client 1Local AreaNetworkSAN-存储局域网络存储局域网络Client 2Client 3Client 1Server AApplication AServer BApplication BServer CApplication C
13、Disks for Server ADisks for Server BDisks for Server CSANLocal AreaNetworkDisk ArrayNAS-网络附加存储网络附加存储Disks for File System ADisks for File System BNAS Device AFile System ANAS Device BFile System BInternal/External connectivityto disks or arraysServer AFile System AServer BFile System BClient 1Client
14、 2Client 3Local AreaNetworkSAN、iSCSI、NAS的特点的特点NAS为解决数据共享问题和优化文件(File)存储而产生的存储技术文件管理系统在存储设备端,是文件服务+IP的一种技术多应用于非结构化数据(文件)SAN为解决DAS的问题而产生的存储技术是DAS+网络的一种技术多应用于OLTP系统(如:ERP)iSCSIiSCSI也叫IP SAN多应用于PC服务器平台、Windows(SQL Server、Exchange)、Linux、小型数据库应用系统应用系统NASSAN/iSCSI操作系统操作系统文件管理系统文件管理系统RAID控制控制磁盘读写磁盘读写应用系统应用
15、系统IO调用模式调用模式存储架构适用分类存储架构适用分类SAN:提供可用性、可管理性和扩展性目标应用目标应用:数据库/ERP/OLTP灾难恢复数据仓储NAS:易于安装和管理,低价位,目标应用目标应用:文件服务器集中/更换PDM/CAD文件共享DAS:只适用于小型商务只适用于小型商务IP-SAN与与FC-SAN比较比较IP-SAN适用环境:异地间的数据交换及容灾,备份,非关键应用的集中存储。FC-SAN适用环境:关键应用的集中存储、备份及容灾。优点缺点IP-SAN部署成本低共享网络(IP网络复用,提高网络利用率)维护简便适合远距离传输传输效率低(正常IP网络利用率不足50%)传输安全性低传输延时
16、无保障一般占用大量主机资源FC-SAN传输效率高传输安全性高传输延时极小占用主机资源少技术成熟应用范围最广的专业存储架构部署成本较高需要专属网络DAS优点:成本低,对于小型用户来说,易于维护缺点:性能不高,系统停机多,资源无法共享,多系统环境下的管理成本增加NAS优点:方便,文件级的数据共享,集中化管理缺点:需要贡献文件系统,安全性无法保障,性能一般,磁盘级数据无法共享集中,复杂系统的成本大,维护难,扩容受限SAN优点:集中化的管理,高性能,减少停机时间,安全保障高缺点:成本昂贵、系统复杂。磁盘阵列的兼容性限制了设备选择空间及资源共享。机械硬盘机械硬盘 机械式硬盘结构机械式硬盘结构主轴马达(S
17、pindle Motor)磁头基座(Base Plate)磁头停放区(Parking Zone)盘片(Media)传动部件接口l容量:容量:指硬盘能存储的数据量大小,以字节为基本单位l单碟容量:单碟容量:硬盘都是由一个或几个盘片组成的,单碟容量就是指包括正反两面在内的单个盘片的总容量 l转速:转速:即主轴马达转动速度,单位为RPM(Round Per Minute),即每分钟盘片转动圈数l缓存:缓存:是硬盘控制器上的一块内存芯片,具有极快的存取速度,它是硬盘内部盘片和外部接口之间的缓冲器机械式硬盘主要指标(一)机械式硬盘主要指标(一)l平均访问时间:平均访问时间:硬盘磁头找到目标数据所需的平均
18、时间平均寻道时间:磁头寻找目标数据所在磁道所需的平均时间平均潜伏时间:当磁头移动到数据所在的磁道后,等待指定的数据扇区转动到磁头下方的时间l数据传输率:数据传输率:内部数据传输率:数据从盘片表面传输到硬盘的缓存的速率外部数据传输率:数据从硬盘的缓存读出到外部总线的速率机械式硬盘主要指标(二)机械式硬盘主要指标(二)l硬盘的读写速度同硬盘的转速成正比l更高的转速可缩短硬盘的实际读写时间l硬盘缓存的大小直接影响硬盘的整体性能转速和缓存对硬盘性能的影响转速和缓存对硬盘性能的影响硬盘接口类型硬盘接口类型硬盘容量发展硬盘容量发展容容量量FC硬盘硬盘 100GB 300GB 750GB 1000GB146
19、GB300GBSAS硬盘硬盘250GB 400GB 500GB 750GB1000GBSATA硬盘硬盘73GB 300GB146GB 500GB73GB 300GB146GB 20192019SCSI硬盘硬盘73GB 2000GB2000GB600GB450GB450GB600GB硬盘对比硬盘对比FC磁盘、SAS磁盘、企业级SATA磁盘的性能对比硬盘类型转速MTBF平均寻道时间持续读写速率应用特点企业级SATA磁盘7200 RPM120万小时8.5ms2530MB/秒大容量、小吞吐量,高性价比SAS磁盘15000 RPM160 万小时3.5ms80 MB/秒大容量、高可靠FC磁盘15000 R
20、PM160 万小时3.5ms4055MB/秒高可靠、负荷能力高、企业级应用ATA/IDE接口硬盘简介接口硬盘简介Power连接器主/从盘 跳线40-pin连接器lATA(Advanced Technology Attachment)硬盘是传统的桌面级硬盘,主要应用于个人PC机,也经常称为IDE硬盘lATA接口为并行ATA技术,下一代的产品是串行ATA(SATA)l最高速度133M/S,已达性能极性。SATA接口硬盘介绍接口硬盘介绍lSATA:串行ATA(Serial AdvancedTechnologyAttachment)lSATA硬盘采用点对点连接方式,支持热插拔,即插即用lSATA采用串
21、行方式进行数据传输,第二代(SATA)300MB/s接口硬盘目前仍是主流,SATAD目前已经商用,速率为600MB/sSCSI接口硬盘介绍接口硬盘介绍lSCSI(Small Computer System Interface)小型计算机系统接口lSCSI硬盘并发处理性能优异,常应用于企业级存储领域lSCSI硬盘采用并行接口,接口速率目前发展到320MB/s,基本已经达到极限,已被其串行版本SAS硬盘完全替代80-pin 80-pin 公接头公接头SAS接口硬盘介绍接口硬盘介绍lSAS(Serial Attached SCSI)串行SCSI 接口lSAS是一种点对点、全双工、双端口的接口lSAS
22、专为满足高性能企业需求而设计,并且兼容SATA硬盘,为企业用户带来前所未有的灵活性l接口速率为300MB/S,600MB/S(SAS)FC接口硬盘介绍接口硬盘介绍l FC-AL(fibre channel arbitrated loop)是一种双端口的串行存储接口l FC-AL利用类似SATA/SAS所用的4芯连接,提供一种单环拓扑结构,一个控制器能访问126个硬盘l 4Gb/S的硬盘接口速率Services 固态硬盘固态硬盘 Solid State Disk固态硬盘的定义固态硬盘的定义 固态硬盘,是由控制单元和固态存储单元(DRAM或FLASH芯片)组成的硬盘,简单的说就是用固态电子存储芯片
23、通过阵列的形式而够成的硬盘。其内部存储单元利用固态电子存储芯片阵列取代了传统HDD硬盘的磁碟组。固态硬盘的接口规范定义、功能及使用方法均与普通硬盘完全相同,在产品外形和尺寸上也完全与普通硬盘一致,包括3.5 英寸、2.5 英寸、1.8 英寸多种类型。SSD基于DRAM基于FLASHMLCMulti-Level Cell多层单元NANDNORSLCSingle Layer Cell 单层单元固态硬盘的存储介质分为两种:固态硬盘的存储介质分为两种:采用闪存(FLASH芯片)作为存储介质采用DRAM作为存储介质固态硬盘的类型固态硬盘的类型SLC更昂贵,但也更可靠,速度快,且写次数更高(只是容量小)。
24、SLC和MLCSLC和MLC两者的差异在于每单元存储的数据量(密度),MLC的存储容量比SLC大,但是SLC更简单可靠,SLC读取和写入的速度都比MLC更快,而且SLC比MLC更耐用,MLC每单元可擦除1万次至5万次,而SLC可擦除10w次以上,所以,企业级的闪存产品一般都选用SLC,这也是为什么企业级产品比家用产品贵很多的原因。SSD单层单元与多层单元单层单元与多层单元数据存取速度快数据存取速度快。固态硬盘没有传统硬盘复杂的机械结构,既没有磁碟,也不存在磁头,它无需花费较长的时间寻道,读取速度更不会受到转速的限制。防震抗摔防震抗摔。SSD固态硬盘内部不存在任何机械部件,这样即使在高速移动甚至
25、伴随翻转倾斜的情况下也不会影响到正常使用。没有噪音,发热低没有噪音,发热低。由于与传统硬盘物理结构不同,SSD 固态硬盘不存在磁头臂寻道的声音和盘片高速旋转的噪音,也没有机械马达和风扇,工作噪音值为0分贝。固态硬盘优点四工作温度范围大四工作温度范围大。机械硬盘只能在555摄氏度范围内工作,固态硬盘的温度范围可达-1070摄氏度,一些工业级固态硬盘的工作温度范围设置达到了-4-85摄氏度(军用)。五,SSD固态硬盘比常规1.8英寸硬盘重量轻重量轻20到30克。可千万别小看这些重量,在笔记本电脑、卫星定位仪等随身移动产品上,更小的重最有利于便携。此外,重量的减轻也使得笔记本搭载多块SSD固态硬盘成
26、为可能。成本高成本高。每单位容量价格是传统硬盘的510倍(基于闪存),甚至200300倍(基于DRAM)。容量低容量低。目前固态硬盘最大容量远低于传统硬盘。一般固态硬盘的容量是32、64、128G,256GB在目前的主流固态硬盘中处于高端。写入寿命有限(基于闪存)写入寿命有限(基于闪存)。SSD的寿命主要是闪存写入次数的限制。一般闪存写入寿命为1万到10万次,特制的可达100万到500万次,固态硬盘缺点固态硬盘与传统硬盘优劣势对比 固态盘的基本构成与原理固态盘的基本构成与原理 Interface Protocol Media Management Error Detection&Correction End-to-End Multi-bit Error Correction固态盘的技术优势固态盘的技术优势 -低延时低延时15K rpm drives(8 drives)Enterprise Flash Drives(8 drives)SATA drives(8 drives)