1、版本:版本:V3.0(201406)V3.0(201406)华为存储双活解决方案技术胶片 2目录1Click to add Title4Click to add TitleClick to add Title2背景与挑战华为存储双活解决方案成功案例3竞争分析 3 4IT系统建设面临的问题 系统1系统2系统3阵列同步/异步复制2、阵列复制,主备建设n 业务恢复时间长n 无法保证7*24小时不间断运行文件服务器1、共享存储阵列,单点故障风险n 存储阵列任何故障,都可能造成系统停止运行n 单存储阵列损坏,数据丢失,无法挽回EMCIBMHW3、利旧难,管理难n 存储系统更新,原有存储弃之可惜n 各厂商
2、的存储管理软件互不兼容,管理难度高EMCIBMHW 5如何解决IT存储系统面临的问题?n整个系统全冗余架构n数据零丢失n业务不中断1n原有组网改动小n兼容原有存储系统,资源充分利用,减少升级成本 23n故障全自动切换,预留足够的时间在线解决问题n存储系统统一管理,降低管理难度,减少运维成本消除所有单点故障兼容原有存储系统管理简单 6目录1Click to add Title4Click to add TitleClick to add Title2背景与挑战华为存储双活解决方案成功案例3竞争分析 71.单存储故障,数据零丢失,业务不中断2.不影响原有网络架构3.主机层不用安装任何软件4.虚拟化
3、异构阵列,保护现有投资5.易扩容,易维护客户价值本地存储双活方案ServerStorage ArrayStorage ArrayVISSAN镜像VIS:华为虚拟化智能存储Server 8同园区存储双活方案1.单栋楼故障,数据零丢失,业务不中断2.两栋楼对同一业务同时提供服务,提高服务效率据客户价值VISStorage ArrayVISStorage ArraySingle Mode FiberServerServerServerServerIP SwitchFC SwitchIP SwitchFC SwitchSingle Mode Fiber 9同城存储双活方案1.单数据中心故障,数据零丢失
4、,业务不中断2.两数据中心同时对外提供服务,提高服务效率3.两数据中心存储统一管理,降低管理难度4.拓扑可视化:图形化展示双活物理拓扑图与业务逻辑拓扑,监控双活数据中心运行状态;客户价值VISStorage ArrayVISStorage ArrayServerServerServerServer30km30kmSingle Mode FiberDWDMDWDM 10典型应用场景Oracle RACVMware/FusionSpheren双活访问,负载均衡两中心组成一个RAC集群,同时对同一数据库业务提供服务,负载均衡n透明应用切换存储、服务器或网络故障时,数据库业务透明切换,用户无感知n人为
5、误操作恢复与Oracle数据库应用结合的快照技术,恢复人为误操作数据n与DRS结合实现负载均衡支持vSphere集群DRS功能,实时监控服务器资源利用率,虚拟机自动负载均衡n灵活在线迁移支持虚拟机迁移功能,虚拟机在线迁移,保证系统维护时数据零丢失,业务不中断n应用自动切换存储、服务器或网络故障时,虚拟机自动快速迁移,减少业务中断时间和运维复杂度 11方案亮点智能灵活高效便捷业务永续l数据就近访问l业务自动负载均衡l平滑演进两地三中心l业务双活访问l接管和兼容各品牌设备l存储设备统一管理l7x24小时业务连续运行lRPO=0、RTO=0l维护过程业务不中断 12方案概述n双活方案配置VIS产品。
6、nVIS接管两个数据中心的磁盘阵列,利用VIS镜像卷技术,实现两中心数据的互备保护。nVIS将镜像卷提供给两个数据中心的主机同时访问。数据中心A主机写IO数据中心B主机写IOVIS集群数据中心A数据中心B主机1主机2核心部件-VIS产品 13方案关键技术跨中心网络优化跨中心双活访问跨中心数据保护华为存储双活解决方案跨中心可视化管理 14跨中心数据保护-跨中心镜像镜像卷主机盘223314镜像镜像卷镜像数据盘数据中心1 阵列VIS集群主机数据中心2 阵列跨中心镜像跨数据中心镜像l 保证任一数据中心发生灾难时,另一中心有相同数据可供访问;l 实时同步两个数据中心存储阵列之间数据;l 故障切换对主机透
7、明;l 支持3镜像技术,数据保存3份,进一步提高数据可靠性;l 支持接管异构存储做镜像 15跨中心数据保护-逻辑错误保护数据恢复l 当遭遇病毒攻击或人为误操作等异常时,采用快照对原卷进行回滚,实现数据恢复;l 镜像级别的快照回滚,保证两个数据中心存储阵列之间数据同时回滚;数据测试l 不影响生产,使用快照数据快速构建模拟的生产环境,进行其它辅助教学和测试,提高灾备环境的利用率l 一键测试快照数据的一致性和可用性,一键完成测试环境的清理镜像卷主机盘镜像镜像卷镜像数据盘数据中心1 阵列VIS集群主机数据中心2 阵列快照卷主机盘逻辑错误保护生成快照回滚数据 16跨中心存储双活访问VIS 私有网络VIS
8、集群数据中心1数据中心2应用系统(主机层)跨站点VIS集群地域优化访问l 针对双活数据中心场景,先进的地域识别优化技术,减少跨站点通讯,提高系统性能故障不间断访问l 在各单部件和链路故障,甚至整个数据中心故障,都可以实现业务自动无缝切换 17跨中心存储双活访问-地域优化访问VIS集群数据中心1数据中心2应用应用应用集群优化读“Site Read”模式以避免虚拟化引擎跨数据中心读取数据,提升方案整体性能。其流程如下:l 读请求到镜像卷;l 镜像卷根据策略下发请求到与虚拟化引擎在同一个数据中心的镜像数据盘读取数据;l 镜像数据盘返回读数据;l 镜像卷返回读数据。18AA集群VISVIS数据中心1数
9、据中心2应用应用应用集群A节节点点数据中心1数据中心2AP集群A节节点点P节点节点数据中心1数据中心2AP集群应用应用应用集群应用应用应用集群跨中心存储双活访问-地域优化访问优化写AA集群的每个节点都能够承接写IO,由本地节点处理本地主机的IO请求,避免主机将写IO发给跨数据中心的存储,减少跨数据中心的访问次数。没有优化写AP集群只有主站点的主控制器可以读写数据。部分主机需要将IO发给跨数据中心的存储,导致多次跨数据中心访问,严重影响性能。19VIS 私有网络VIS集群VIS节点节点VIS节点节点VIS节点节点VIS节点节点应用数据中心1数据中心2VIS 私有网络VIS节点节点VIS节点节点V
10、IS节点节点VIS节点节点应用数据中心1数据中心2VIS集群优先本地多路径软件支持优选本地路径模式,将优先使用本地VIS节点来下发I/O,只有当本地节点路径故障后才跨数据中心访问远端VIS节点。故障后,也能优化读写跨中心存储双活访问-地域优化访问 20跨中心存储双活访问-故障不间断访问故障场景是否自动切换Oracle RAC业务是否不中断VMware业务是否不中断单中心主机节点故障虚拟机自动迁移单中心VIS故障单中心阵列故障同城链路故障虚拟机自动迁移单数据中心故障虚拟机自动迁移 21单中心主机单中心VIS单中心阵列单数据中心同城链路StorageStorage arraysVISServerS
11、torage arraysVIS数据中心A数据中心BServer故障切换1.单中心主机突发故障2.RAC、VMware集群自动检测故障3.Oracle业务切换,虚拟机自动迁移4.自动业务切换RAC1 RAC2RAC3 RAC4故障恢复1.主机故障恢复2.自动重组集群3.业务负载均衡同城网络跨中心存储双活访问-故障不间断访问 22单中心主机单中心VIS单中心阵列单数据中心同城链路StorageVISServerVIS数据中心A数据中心BServer同城网络故障切换1.单中心VIS突发故障2.VIS集群自动检测故障3.上层业务无影响故障恢复1.VIS故障恢复2.自动重组集群3.上层业务无影响RAC
12、3 RAC4Storage arraysStorage arraysRAC1 RAC2跨中心存储双活访问-故障不间断访问 23单中心主机单中心VIS单中心阵列单数据中心同城链路StorageVISServerVIS数据中心A数据中心BServer同城网络故障切换1.单中心阵列突发故障2.VIS集群自动检测阵列故障3.IO自动下发到正常阵列故障恢复1.阵列故障恢复2.手动恢复镜像关系3.自动同步新增数据,业务负载均衡增量数据同步RAC3 RAC4Storage arraysStorage arraysRAC1 RAC2跨中心存储双活访问-故障不间断访问 24单中心主机单中心VIS单中心阵列单数据
13、中心同城链路StorageVISServerVIS数据中心A数据中心BServer同城网络故障切换1.单数据中心部件全故障2.集群自动检测故障3.Oracle业务切换,虚拟机自动迁移故障恢复1.故障中心设备恢复2.自动重组集群,手动恢复镜像关系3.自动同步新增数据,业务负载均衡增量数据同步DBRAC3 RAC4Storage arraysStorage arraysRAC1 RAC2跨中心存储双活访问-故障不间断访问 25单中心主机单中心VIS单中心阵列单数据中心同城链路StorageVISServerVIS数据中心A数据中心BServer同城网络故障切换1.同城链路突发故障2.集群自动检测故
14、障并进行仲裁3.Oracle业务切换,虚拟机自动迁移故障恢复1.修复同城链路2.自动重组集群,手动恢复镜像关系3.自动同步新增数据,业务负载均衡增量数据同步仲裁抢占成功RAC3 RAC4Storage arraysStorage arraysRAC1 RAC2跨中心存储双活访问-故障不间断访问 26第三方仲裁阵列存储资源池存储阵列2VISVIS集群私有网络仲裁盘1仲裁盘2仲裁盘3VIS分裂成子集群心跳异常抢占仲裁盘存活/自杀数量:3块仲裁盘条件:2块及以上仲裁盘可访问机制:抢到2块及以上仲裁盘者存活 仲裁原理存储阵列1仲裁盘1 仲裁部署优选:设置第三方仲裁站点备选:将第三地仲裁盘配置在任意一个
15、数据中心,并实施必要的掉电保护措施,例如部署独立UPS电源FCFC或IPIP跨中心存储双活访问-故障不间断访问 27华为存储和网络结合的解决方案n 低时延,100km实测1.3ms以内n 高带宽,单光纤最大支持80*40=3.2Tbit/sn 稳定带宽,距离扩展功能保证长距离传输带宽不下降应用支持的距离n Oracle数据库,支持100km距离n VMware虚拟机,支持300km距离Storage arraysServerSwitchSwitchDWDMDWDMVISStorage arraysServerVIS跨中心网络优化 28缩短路由优选路由传输距离(km)DCF(us)FBG(us)
16、80650.05100 810.05120 970.05建议选择FBG补偿方式色散补偿优化光纤传输距离优化解码方式纠前误码率纠后误码率NCG-解码增益(dB)时延值(us)一级解码2.17E-31E-158.542.32二级解码2.07E-3无8.5384.64三级解码3.04E-4无6.98126.97OSNR余量充足的场景,选择一级解码以减少时延OSNR余量较小的场景,优先选择二级解码前向纠错优化业务汇聚板类型时延值(时延值(us)合波/分波板10业务板波长转换类:1015支路线路类:20带宽需求小于40Gb/s,建议不使用合波/分波板建议优选波长转换类业务板业务汇聚板优化0.03%3.0
17、0%6.97%12.50%77.50%跨中心网络优化-低延时设计 29应用应用主机主机存储存储FC/IP Switch管理软件管理软件拓扑展示设备发现状态监控故障通知存储路径容量、性能趋势查看报表维护网络网络跨中心可视化管理 30性能表现-Oracle RAC场景配置类别配置数据库数量1数据库类型OLTPRAC节点数3业务模型Order Entry workload(Swingbench)读写比例6:4数据总量10TB当并发用户数相同时,拉远100km双活方案和本地高可用方案相比,事务处理能力基本无影响。测试结果结论0km3433210296630547239817225km334321026
18、9030535239366650km33318102468303072391770100km3305299156301668387606400用户1200用户3600用户4800用户050000100000150000200000250000300000350000400000450000TPM(Transactions Per Minute)TPM(Transactions Per Minute)31双活数据中心间相距100km时,不同用户数对应的事务处理性能,与本地高可用性能几乎相同。类别配置数据库类型OLTP读写比例3:2连接SQL数据库的并发连接数192用户数1200、1600、200
19、0SQL Server节点数单节点数据总量300GB-0.06%-0.01%-0.07%3000.00 3500.00 4000.00 4500.00 5000.00 5500.00 6000.00 120016002000TPMCTPC-C UsersTPMC Performancelocal100KM注:采用TPC-C业务模型进行测试配置测试结果结论性能表现-VMware场景SQL Server应用 324500470049005100530055005700590061006300650010:46:2610:47:2710:48:2810:49:2910:50:3010:51:3110
20、:52:3110:53:3210:54:3310:55:3410:56:3510:57:3611:00:3911:01:3911:02:4011:03:4111:04:4211:05:4311:06:4411:07:44TPMCTPMCTimeTimeSQL Server vMotion Performance(100km)TPMCvMotion duration:10:50:0210:54:40双活数据中心间相距100km时,虚拟机跨数据中心vMotion时,事务处理能力几乎无影响。结论:性能表现-VMware场景SQL Server应用 33目录1Click to add Title4Cl
21、ick to add TitleClick to add Title2背景与挑战华为存储双活解决方案成功案例3竞争分析 34方案缺点网关和阵列组网不可靠,VPELX不能直接访问异地站点的阵列。站点A的VPLEX只能通过站点B的VPLEX访问站点B的阵列,如果站点B的VPLEX故障,站点B的阵列不可访问,只有站点A有最新数据,存在数据丢失风险;历史数据恢复复杂,VPELX结合RecoverPoint实现CDP,但恢复历史数据耗时,所有数据恢复完成后,主机才能访问。VIS采用快照后台回滚,1秒恢复完成后,主机即可访问;EMC方案对阵列要求高,VPELX结合RecoverPoint方案,对阵列性能要
22、求高,配置SAS盘数比VIS多一倍;对阵列容量要求高,每个IO都要记录日志,容量需求高,而且RP只有56.25%的日志空间利用率;基于Vplex产品构建,两台Vplex设备拉远,形成远程集群Metro功能,实现跨站点数据同步EMC VPLEX方案优势真AA集群 35技术缺陷架构不可靠,两个控制器划分为一个IO group,一个IO group只有两个控制器。双活方案把一对IO group中的两个SVC控制器拉远到两个数据中心。一个LUN只能属于一个IO group。当一个控制器故障时,主机需要跨数据中心访问SVC控制器;当两个控制器都故障时,业务中断;运维复杂,需要提前规划,将不同的LUN负载
23、均衡到不同的IO group,LUN在保护组间迁移,需要中断业务;IBM SVC方案优势支持分级存储,压缩,快照等增值特性方案优势方案缺点SVCSVCIO groupSVCSVCIO groupSVCSVCIO groupSVCSVCIO group站点1站点2基于SVC产品构建,将同一对IO Group的两节点拉远,形成远程集群卷镜像(Vdisk Mirror)功能,实现跨站点数据同步 36方案关键点方案缺点架构不可靠,将一个集群的两节点拉远,每个站点只有单节点,当一个控制器故障时,主机需要跨数据中心访问SVC控制器;当两个控制器都故障时,业务中断;架构复杂,需要额外配置至少4个FC转SAS
24、设备(外购);接管现网异构存储时,破坏被接管阵列原有数据基于FAS、V系列等存储产品构建,两控拉远,形成远程集群同步复制功能,实现跨站点数据同步NetApp MetroCluster方案优势全系列(FAS阵列和V系列虚拟化网关)产品均支持支持SSD加速,快照,数据压缩,精简配置,重删增值特性站点1站点2FAS1FAS3FAS2FAS4代表物理机框代表逻辑集群 37存储双活对比特性图网关形态阵列形态EMC VPLEX MetroIBM SVC 华为VISNetapp MertroCluster业务能力/负载均衡AA集群AP集群AA集群AP集群单LUN可靠性容许多节点故障容许1节点故障容许多节点故
25、障容许1节点故障成本1.增加网关;2.只支持对FC阵列的虚拟化;1.增加网关;2.只支持对FC阵列的虚拟化;3.仲裁链路只支持FC,或增加FCIP支持IP1.增加网关;1.增加FC转SAS桥接器;可视化管理1.不支持1.不支持1.专业的双活容灾管理软件,支持可视化展示双活物理拓扑,并能监控各网元(主机、虚拟化网关、磁盘阵列)的状态1.不支持 38目录1Click to add Title4Click to add TitleClick to add Title2背景与挑战华为存储双活解决方案成功案例3竞争分析 39“华为在我们提出到成都参观到最后成行只有短短3天时间的情况下,快速响应,搭建了一
26、套模拟我们生产系统的同城灾备方案测试环境,其效率之高、反应之迅速给我们留下了深刻印象”某保险IT技术部负责人 王主任所有数据存储在一套磁盘阵列,存在存储单点故障。无容灾系统,灾难恢复能力低,未达到保监会要求。要求具备实现3DC容灾架构能力,要求容灾系统管理简单。要求完成生产系统跨平台迁移及版本升级、完成容灾系统的迁移,整体提升信息化建设水平。要求完成灾难恢复演练,保证容灾系统可用性。客户需求本地双活存储架构:生产站点任一存储故障,另一存储自动提供读写访问,RP0=0,RTO=0。同城应用级容灾:Oceanstor 18500异步远程复制+灾备服务器,实现数据异地保护的同时通过灾备系统进行数据分
27、析,优化同城灾备端IT架构,整体实现应用级容灾。可视化容灾管理:基于点对点容灾存储架构,配合容灾管理软件实现自动化容灾切换、容灾演练管理,支持脚本定制。解决方案解决生产中心存储单点故障问题,提高生产系统可用性;自动化容灾管理软件,简化日常容灾系统维护复杂度,效率提升3倍,支持定制化脚本,提高操作灵活性;提升了系统的可扩展性、可维护性和高可用性以及抵御重大自然灾难能力,满足保监会要求。客户价值某保险核心业务系统容灾 40经过近1年的审慎考虑和详细测试,客户最终选择综合排名第一的华为解决方案构建其云平台双活数据中心。随着业务的快速发展,对IT系统的投资增加,希望能在满足业务增长需求的基础上减少服务
28、器投资,快速部署,按需分配,建设业务层的虚拟化平台;保证管道局核心业务数据在出现灾难时,数据零丢失;在不增加人力投入的前提下,实现数据库业务和虚拟机业务的故障自动检测以及在故障时能自动切换,方便运维;原有存储设备停产,导致服务水平下降,希望提供持续的、快速的服务响应能力;实现业务数据本地备份和异地备份,解决数据逻辑错误。客户需求华为虚拟化网关与高端存储构建跨数据中心存储双活平台,实现应用级的“A-A”双活:任一站点故障,业务自动切换至另一站点,RPO=0,RTO 0;第三地仲裁的可靠机制:双活站点第三地仲裁,配合实现可靠性双活中心方案双活与传统备份融合:解决数据逻辑错误紧密与业务结合:虚拟化业
29、务和Oracle RAC数据库业务,配合双活存储平台,构建IT层次双活平台解决方案双活平台实现数据零丢失,保护信息资产;双活平台故障自动切换,相对原有主备方式,RTO由小时级降至分钟级,效率提升近60倍;虚拟化平台实现按需分配和部署,在线迁移,对数据中心维护升级无需停止生产业务;故障自动检测与自动切换机制,减少人为干预,节约运维成本。客户价值华为双活解决方案助力中国石油天然气管道局云平台建设客户赠言:张总(项目实施总领导,信息科长):“本项目金额不大,但麻雀虽小,五脏俱全、管道局将此作为一个内部优秀案例,体现中国企业对IT建设的实施和管理水平并不比国外企业差。华为公司在此项目中的贡献有目共睹,
30、无论在前期规划、项目组织与实施、项目管理、技术水平上都是体现出了高水平,我们表示比较满意,达到了预期”。张总针对此项目对比了IBM、EMC:“在当初选择是使用EMC、IBM上,现在看来,我们选择华为存储是非常、完全正确的,我们没有后悔,华为可能在销售额上超过了他们,但我相信,在很近的将来,华为存储一定会全方位超越国外厂商,后续我们还要与华为合作,在场的国外厂商也不要避讳,我就是这么认为的”。会后我们在与张总交流中,张总非常赞成一起搞一个验收会,将项目作为一个样板点对外宣传,张总非常支持。41上海海事局双活数据中心业务繁多,占用大量的物理服务器资源,TCO高。希望进行业务虚拟化平台建设,减少服务
31、器投资业务数据前期没有进行容灾保护,数据存在丢失的风险。希望在故障场景下,VMware业务能实现自动切换,方便运维客户以往的手工方式备份,效率低,备份的执行无法统一监管。希望采用专业备份设备对业务数据本地备份,操作管理便捷,并解决数据逻辑错误客户需求VIS集群跨数据中心实现数据实时镜像,业务数据可靠性提高构建存储双活平台,两站点数据可实时访问,业务可任意站点运行基于存储的双活,构建VMware vSphere集群,虚拟机可跨站点实现负载均衡双活平台与业务的紧密结合,构建各层面双活架构,保障了任意站点故障时,业务自动切换到另一站点;数据中心任意部件故障时,业务实现自动切换业务数据的备份保护,解决
32、数据逻辑错误第三地仲裁的可靠机制:双活站点第三地仲裁,配合实现可靠性双活中心方案解决方案数据零丢失,保护信息资产虚拟化平台实现按需分配和部署,在线迁移,便于维护与升级故障场景业务自动切换,减少运维成本历史数据备份,解决数据逻辑错误客户价值10km 42中国计量学院减少服务器投资,快速部署,按需分配,建设业务层的虚拟化平台实现双活数据中心,当任一数据中心级发生故障时,能够保证业务的连续性需提供详细的FC网络和以太网拓扑。客户需求应用级的“A-A”双活平台:任一数据中心故障,业务自动切换至另一数据中心,实现RPO=0和RTO0。与业务的最佳实践:VMware虚拟化业务和Oracle RAC数据库业
33、务,配合双活存储平台,构建IT层次双活平台。详细业务、心跳等的FC网络Zone和以太网络Vlan规划。解决方案数据零丢失,保护信息资产高业务连续性,减少因业务停顿带来的损失自动切换,减少运维成本客户价值 43吉林市人民医院双活数据中心核心系统能在主备机房同时提供业务机房故障,能快速自动切换,减少业务中断时间客户需求主机房与备机房的组成“分布式VIS6000集群”,作为一个整体,协同工作。利用“分布式VIS集群”实现HIS系统和PACS数据的冗余。“分布式VIS集群”管理主机房和备机房所有存储资源,并为服务器提供存储空间。主机房新增HDP3500E实现主机房系统的数据备份。解决方案数据零丢失,保
34、护信息资产自动切换,减少核心业务中断时间客户价值1km 44广东东莞长安医院存储双活解决方案案例 存储单点故障,数据丢失风险高 核心系统业务恢复时间长华为解决方案系统7*24小时持续运行,保障核心业务不中断业务双活访问,提高服务效率异构利旧,保护已有设备投资客户价值客户挑战Multiple-mode fiber生产站点1Data Center2Oracle RACHWHWHWHWHWHWIBMIBMHDSHDSHWHWLANMirrorHeartbeatLANData Center1Storage FC SwitchSingle-mode fiberStorage IP SwitchFC Sw
35、itchIP SwitchIPFCLANVIS Cluster采用华为存储双活解决方案,提供跨站点高可用平台光纤直连保证链路带宽和时延核心业务系统HIS、PACS、LIS均双活部署HUAWEI ENTERPRISE ICT SOLUTIONS HUAWEI ENTERPRISE ICT SOLUTIONS A BETTER WAYA BETTER WAYCopyright2012 Huawei Technologies Co.,Ltd.All Rights Reserved.Copyright2012 Huawei Technologies Co.,Ltd.All Rights Reserve
36、d.The information in this document may contain predictive statements including,without limitation,statements regarding the future financial and operating results,future product portfolio,new technology,etc.There are a number of factors that could cause actual results and developments to differ materially from those expressed or implied in the predictive statements.Therefore,such information is provided for reference purpose only and constitutes neither an offer nor an acceptance.Huawei may change the information at any time without notice.