1、2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang1第1章RAID与大容量存储n本章目的: n 了解海量存储的基础知识; n 掌握RAID及RAID分级的概念2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang2RAID概念nRAID的全称为nRedundant Array of Inexpensive/Independent Disks,n而不是某些词典中所说的nRedundant Access Independent Disk
2、s,n它的中文名称为n廉价(独立)磁盘冗余阵列。nRAID 等级n磁盘阵列针对不同的应用使用不同的技术,称为RAID 等级,每一等级代表一种技术2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang3RAID-0等级nRAID0(Striped Disk Array without Fault Tolerance,没有容错设计的条带磁盘阵列),n如图1-1所示图1-1 RAID0结构图解2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jia
3、ng4RAID-1等级nRAID-1的定义是nMirroring and Duplexing(相互镜像)n结构如图1-2所示2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang5RAID-2等级nRAID2是目前最为复杂的RAID系统等级之一nRAID2之所以复杂是因为它采用了早期的错误检测与修正技术汉明码(Hamming Code)校验技术n图1-4 RAID-2结构图解2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang6RAI
4、D-3等级nRAID3的定义是nParallel Transfer with Parity(并行传输及校验)n图1-5 RAID-3结构图解2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang7RAID-4等级n定义是Independent Data Disks with Shared Parity Disk(独立的数据硬盘与共享的校验硬盘)n图1-6 RAID-4结构图解2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang8RAI
5、D-5 等级nRAID-5和RAID-4相似,但避免了RAID-4的瓶颈,方法是不用校验磁盘而将校验数据以循环的方式放在每一个磁盘中2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang9RAID-6和RAID-7等级nRAID-6(Independent Data Disks with Two Independent Distributed Parity Schemes,n带有2个独立分布式校验方案的独立数据硬盘)等级n是在RAID5基础上,为了进一步加强数据保护而设计的一种RAID方式,实际上是一种扩展RAID
6、5等级nRAID-7不仅仅是一种技术,还是一种存储计算机(storage computer)。nRAID7存储计算机操作系统(storage computer operating system)是一套实时事件驱动操作系统,主要用来进行系统初始化和安排RAID7磁盘阵列的所有数据传输,并把它们转换到相应的物理存储驱动器上2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang10第2章磁盘存储阵列容错和性能介绍n本章目的: n 理解磁盘阵列的容错功能; n 掌握磁盘阵列在一些不同应用背景下的性能2022-4-25 Co
7、pyright SEI ECNU . All Rights Reserved.Author: NK Jiang11磁盘输入输出系统的4大要求n(1) 增加存取速度; n(2) 容错(fault tolerance),即安全性; n(3) 有效地利用磁盘空间; n(4) 最大限度地平衡CPU、内存及磁盘的性能差异,提高计算机的整体工作性能2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang12n磁盘阵列的额外容错功能 n多数据流对磁盘阵列系统性能的影响n单主机连接情况下的磁盘阵列存储系统性能n多主机同时访问时系统性
8、能变化n来自不同主机的多个数据流对小规模磁盘阵列存储系统性能的影响n来自不同主机的多个数据流对大规模磁盘阵列存储系统性能的影响n来自不同主机的多个数据流对NAS存储系统性能的影响n产品举例分析2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang13相关磁盘阵列存储术语nSCSI(Small Computer System Interface,小型计算机系统接口)nATA(AT Attachment,AT嵌入式接口)即俗称的IDE(Integrated Drive Electronics)nSerial ATA(串
9、行ATA,SATA)采用的是串行数据传输方式nNAS(Network Attached Storage,网络连接存储nDAS(Direct Attached Storage,直连式存储)nSAN(Storage Area Network,存储区域网络)nArray 磁盘阵列模式是把几个磁盘的存储空间整合起来,形成一个大的、单一连续的存储空间nArray Spanning(阵列跨越)2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang14第3章存储网络技术n本章目的: n 介绍与存储有关的网络技术; n 介绍存储网
10、路体系结构; n 讨论新一代多层智能化存储网络; n 讨论存储网路的发展趋势; 2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang15存储网络基础nSCSIn是连接存储设备与服务器的最通用的方法nTCP/IPnTCP协议和IP协议共同构成了通信协议族,这组协议是Internet获得成功的主要因素n以太网n最早由Xerox公司所开发的以太网(IEEE 802.3)是局域网领域得到最广泛使用的技术,也是桌面计算机互联的最佳技术nFiber Channeln大多数的存储区域网络(Storage Area Networ
11、ks,SAN)都是基于一个叫做Fiber Channel(FC)的体系结构。nFC的发展是为了解决服务器和存储设备之间的通信要求。这些要求包括速度、容量和可靠性等2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang16存储体系结构n直连式存储(DAS)n在直连式存储(Direct Attached Storage,DAS)方式中,存储设备是通过电缆(通常是SCSI接口电缆)直接连到服务器的,输入输出(I/O)请求直接发送到存储设备nDAS结构如图3-1所示2022-4-25 Copyright SEI ECNU
12、. All Rights Reserved.Author: NK Jiang17存储体系结构n网络连接存储(NAS)n网络连接存储(Network Attached Storage,NAS),即将存储设备连接到现有的网络上,提供数据和文件服务n结构如图3-2所示2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang18存储体系结构n存储区域网络(SAN)n存储区域网络(Storage Area Networks,SAN)是一个用在服务器和存储资源之间的、专用的、高性能的网络体系,为实现大量原始数据的传输而进行了专门
13、的优化nSAN与NAS的区别和联系n技术上是互补nSAN是以数据为中心的,而NAS是以网络为中心的2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang19以太网和存储网络相结合的多层环境niSCSIniSCSI(Internet SCSI,Internet小型计算机接口)n是IETF(Internet Engineering Task Force,互联网工程任务组)制订的一项标准,用于将SCSI数据块映射成以太网数据包nFCIPn(Fiber Channel over IP)是在TCP/IP上用管道技术来实现Fi
14、ber Channel的受推荐标准。n它采用封装技术将Fiber Channel协议封装在IP包中,以使它能够通过IP网nSAN的应用n(1) 数据共享n(2) 存储共享n(3) 数据备份 n(4) 灾难恢复2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang20存储网络的未来发展n多层智能化存储网络n用一种层次化的方式来实现网络和存储智能,为存储网络的发展开辟了一个新的纪元n存储管理的自动化与智能化n提高存储效率n减少总体拥有成本,增加投资回报2022-4-25 Copyright SEI ECNU . All
15、 Rights Reserved.Author: NK Jiang21如何建造企业SAN系统n怎样才能找到建设存储环境的最佳构件?n从目前的标准来衡量,最佳构件即是由其最终建成的基础设施能给予应用系统充分支持,并能随业务需要灵活扩展。nSAN应用系统评估n包括以下5项n1. 应用要求n2. 数据存储要求n3. 备份和灾难恢复战略n4. 网络连接要求n5. 服务器连接要求2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang22n1. 应用要求n1) 宕机冗余n2) 性能n3) 增长2022-4-25 Copyrig
16、ht SEI ECNU . All Rights Reserved.Author: NK Jiang23n2. 数据存储要求n1) 数据位置n了解数据量和数据的位置很关键。数据是放在统一的存储库中,还是分布在存储小区内; 存储据点之间的电缆距离和与服务器的连接等都必须要纳入考虑范围。长途连接(大于10km)会有特别的连接要求,如支持长途连接的Switch、光纤信号转发器和桥接等。n2) 数据量n需要存取的数据量是决定网络带宽和存储网络连接数量的关键因素。存储阵列的规模和性能特点将决定支持阵列的必要网络连接数量。此外,每个存储端口支持的服务器数量由存储制造商确定,以避免网络堵塞和瓶颈。n3) 数
17、据和存取共享2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang24n3. 备份和灾难恢复战略n集中式、离网、少服务器备份是促使企业实施SAN的主要因素。关于备份如何生成的评估也是必要的,因为它将决定连接范围和吞吐量大小。集中式备份战略要求设计完备的SAN。为了使战略成功,从备份设备到每一个存储设备之间都应该有一条高速、高可用性的数据路径2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang25n4. 网络连接要求n1) 端口计数要求
18、n评估支持现有和未来增长所需网络连接数十分重要。如果在部署初期没有考虑增长因素,事后不断追加网络规模和重新配置会浪费大量资源,并增加宕机时间。在最初设计中,如果没有包括完备的扩展战略,在实际应用中不断扩展的网络会出现传输量不平衡的现象,并最终影响整个网络的性能和可用性。n2) 网络传输模式n为统一存储而实施的SAN与为少服务器备份应用而实施的SAN的传输模式有很大不同。服务器和存储设备之间的新连接需要考虑额外的端口计量。如果忽略了这一点,SAN没有为传输量的增长做好准备,当数据在全网范围内传输时,很有可能产生“瓶颈”。n3) 带宽要求2022-4-25 Copyright SEI ECNU .
19、 All Rights Reserved.Author: NK Jiang26n5. 服务器连接要求n每个服务器的SAN连接请求需要从带宽、性能和可用性等方面确定,目的是了解每一种连接在正常和高峰传输环境中的不同要求2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang27存储网络系统中的交换机n如果是支持大型企业应用,就需要多类型的交换机(Switch),每种Switch在基础设施中承担不同的任务。有些Switch承担到存储库的主要连接,因此需要非常高的可用性。其他Switch用于支持服务器集群的整合,只需要高性
20、能和较少端口数量nSwitch类型n分为3种:n光纤信道Switch(Director)、n网络Switch和n判优环路Switch(或称环路Switch)n分类也不是绝对的,某个厂商的Director在一定情况下可能是另一厂商的网络Switch2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang28不同类型Switch比较n1) 可用性n可用性用于衡量Switch正常运行时间,也用于衡量满足应用系统和基础网络需要的能力n2) 性能n无论是只安装一台Switch,还是要建立完整网络,性能问题都不能回避。Switc
21、h的性能取决于Switch的结构。结构性能实际上取决于整体网络设计和网络内的传输模式n3) 扩展性n扩展性指的是SAN能以对业务损害最小的方式增大规模n4) 成本n在采购网络基础设施时,成本是最重要的考虑因素2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang29企业存储网络系统管理n网络的不断扩展,管理重点从Switch转移到网络,管理问题变得重要起来nSAN交换机管理侧重Switch配置和流量监控。该功能有助于用户评估端口的应用情况和Switch的总容量n网络管理则侧重于全网运行,而非某个Switchn网络故
22、障隔离和恢复也是网络管理的重点n在多供应商网络中,用户要管理异构SAN,要使用多种管理工具,导致管理变得更加复杂,成本也更高2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang30第4章备份带库n本章目的: n 引入磁带库的概念; n 介绍磁带库的发展史; n 介绍磁带库的评估指标及其重要性2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang31磁带库基础n磁带存储还是由于其本身固有的特质确保青春不老n主要概念n1. 磁带库的机械手
23、n2. 磁带库分区 n3. 磁带库连接 n4. 广泛兼容的连接性n5. 多类型磁带机支持 n6. 海纳百川的容量n7. 稳步提高的性能 n8. 逐渐进步的可靠性n9. 磁带库的分类2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang32磁带库备份工作原理n图4-1是磁带库备份工作原2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang33图4-2典型SAN拓扑图2022-4-25 Copyright SEI ECNU . All Ri
24、ghts Reserved.Author: NK Jiang344.2磁带库的发展n1. 虚拟磁带库 n虚拟磁带库将磁盘空间模拟成磁带,在传统的磁带备份系统中,数据直接从应用系统传输到磁带中,使用虚拟磁带库以后,数据首先备份到虚拟磁带库即磁盘中,然后由虚拟磁带库再备份到磁带上n特点n2. 磁带库的智能化n磁带库的智能化就是充分发挥软件的功能,加强磁带库的管理以及连接性能,使得数据备份更安全更可靠n3. WORMn(Write Once Read Many,一写多读)技术是通过软件和硬件设备相结合的控制,使存储介质只能写入一次数据,而不能重复写入且不允许修改,从而为特殊、重要数据备份提供了最安全的保证n4. iSCSI n越来越多的磁带库厂商都支持iSCSI2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang354.3磁带库评估n1. 升级及兼容性问题n2. 部件产品寿命n3. 能否充分发挥磁带机性能n4. 数据链路调节功能2022-4-25 Copyright SEI ECNU . All Rights Reserved.Author: NK Jiang36nEnd of Part 1