1、FusionCloud私有云灾备前言l本章主要讲述了在私有云场景下容灾和备份实现过程,并介绍了私有云灾备所涉的组件。目标l学完本课程后,您将能够:q了解华为私有云场景下备份实现的过程q了解华为私有云场景下容灾实现的过程目录1.私有云灾备总体架构私有云灾备总体架构2.私有云备份方案详述3.私有云容灾方案详述私有云灾备的总体架构基于基于OpenStack架构结合华为灾备技术构建的端到端的云灾备服务架构结合华为灾备技术构建的端到端的云灾备服务BaaS云平台云平台FusionSphereOpenStack灾备管理灾备管理BCManagereReplication服务运营平台服务运营平台ManageOn
2、e服务门户服务门户OpenStackOpenStack租户门户管理员门户服务目录服务目录云硬盘备份云服务器备份DRaaSeBackup云服务器主备容灾HardwareHardware基于基于OpenStack架构结合华为灾备技术构建的端到端的私有云灾备服务架构结合华为灾备技术构建的端到端的私有云灾备服务网络虚拟化存储虚拟化服务目录ManageOne SC服务门户管理员门户租户门户策略调度统计计量资源管理策略配置FuisonSphereOpenStackNovaCinderNeutron备份存储生产存储网络服务器eBackup业务编排ECSEVSCSDRCSBS运营运营管管理理平台平台云平台云平
3、台Nova-DriverCinder-DriverNeutron Plug-inVMVMKVMVMVMVRM计算虚拟化CSHAVMVMVMwareVHAeReplicationBCManager灾灾备备管理管理ManageOne OC运维管理平台运维管理平台资源监控故障告警日志审计.私有云灾备逻辑架构目录1.私有云灾备总体架构2.私有云备份方案详述私有云备份方案详述3.私有云容灾方案详述私有云备份的定义l和服务器虚拟化不同,备份在私有云中是一种服务-CSBS。云服务器备份服务(Cloud Server Backup Service,CSBS)对云服务器提供备份保护服务,利用多个云硬盘的一致性备
4、份数据,恢复云服务器业务数据,支持本地备份和备份数据的远程复制。云服务器备份服务云服务器备份服务单个数据中心,归属于一个Region,本地备份和本地恢复多个数据中心,归属于一或多个Region,本地备份和本地恢复多个数据中心,归属于一个Region,两级备份(本地备份后再将备份数据复制到另一个数据中心),本地恢复和跨数据中心恢复适用场景适用场景云硬盘本地备份云服务器云硬盘跨AZ恢复云服务器异地备份存储AZ-A本地恢复备份复制AZ-BRegion-A本地备份存储本地恢复私有云备份的基础架构ManageOne SC:向用户提供统一的云备份自助管理平台,用户按需申请备份服务;CSBS Karbor:
5、数据保护服务编排,负责保存和调度备份策略,提供对接云管理平台的API接口;BCManager eBackup:备份管理软件,Manager&Workflow负责备份、恢复执行流程控制,Server&Proxy负责数据的存取;FusionSphere OpenStack:提供备份、恢复等API接口。方案组件方案组件云数据中心云数据中心云外部接入网络云外部接入网络云接入网络ManageOne SC/OC云管理层CSBS KarborBCManager eBackup备份管理层VMVM虚拟化层生产存储备份存储存储层FusionSphere OpenStack云平台层私有云备份的框架 方案组件方案组件
6、ManageOne SC2节点虚拟化主备部署全局CSBS Karbor3节点虚拟化高可靠部署RegionBCManager eBackupManager&Workflow:2节点虚拟化高可靠部署RegionServer&Proxy:至少2节点物理部署(最多可扩展到64个)POD/AZ备份存储NAS&S3存储:FusionStorage 6.0 File/Object OceanStor 9000 NAS/S3 OceanStor V3融合存储 NAS AWS S3NA生产存储SAN存储:OceanStor V3融合存储 SAN FusionStorage 6.0 Block Dorado V3
7、NA云数据中心云数据中心DC出口出口路由器汇聚交换机核心交换机接入交换机接入交换机管理集群计算集群eBackupServer&ProxyFC/IP交换机IP交换机生产存储备份存储ManageOne SCCSBS KarboreBackup Manager&WorkflowSCVMKbVMeBkVM私有云备份的物理部署架构私有云网络规划备份系统设计l本地备份+本地恢复级联场景非级联场景备份系统设计l两级备份+本地恢复级联场景非级联场景备份系统设计l两级备份+本地恢复+跨AZ恢复(级联场景)备份系统设计l两级备份+本地恢复+跨AZ恢复(非级联场景)租户创建备份服务,需要设置备份策略、复制策略、备份
8、对象。一个典型的配置示例如下:租户创建备份服务,需要设置备份策略、复制策略、备份对象。一个典型的配置示例如下:云备份服务使用流程如下:云备份服务使用流程如下:服务实例基本信息:服务名称,服务期限,服务范围(AZ)备份策略信息:调度策略(调度计划、执行时间点),保留策略(按份数保留、按时间保留)复制策略信息:是否复制,调度策略(调度计划、执行时间点),保留策略(按份数保留、按时间保留)备份对象信息:云服务器租户租户系统自动创建备份服务实例云备份服务实例设置基本信息、备份策略、复制策略、备份对象手工备份/复制/恢复系统自动备份/复制创建备份服务私有云备份使用流程应用场景-本地备份eBackup 备
9、份节点SCVMCSBSVMeBkVM备份、恢复管理流备份、恢复数据流应用场景应用场景说明说明受黑客攻击受黑客攻击或病毒入侵或病毒入侵通过云备份服务,可立即恢复到最近一次没有受黑客攻击或病毒入侵的备份时间点。数据被误删数据被误删通过云备份服务,可立即恢复到删除前的备份时间点,找回被删除的数据。应用程序更应用程序更新出错新出错通过云备份服务,可立即恢复到应用程序更新前的备份时间点,使系统正常运行。云服务器宕云服务器宕机机通过云备份服务,可立即恢复宕机之前的云服务器的硬盘数据,或恢复到其他云服务器中。CSBS适用适用场景:场景:单机非集群云服务器,云服务器有多个云硬盘时需保证云硬盘间的数据备份一致性
10、。应用场景-备份远程复制租户租户租户手工触发或者系统自动调度ManageOne SCCSBS Kabor1.2、启动备份服务1.3、调度备份策略V3 SAN/FusionStorage BlockFusionSphere OpenStackCinder DrivereBackup DriverCinderNAS/S3V3/9000/FusionStorage2.3、创建卷快照,一致性激活Cinder APICSBS ConsoleeBackup PlugineBackupManager&Workflow级联级联OpenStackNovaeBackupServer&Proxy2.1、获取VM元数
11、据2.2、创建卷快照、一致性激活2.4、备份卷快照2.5、备份卷快照3.1、挂载卷快照,获取首次全备或者增量备份数据3.2、写入备份数据本地备份实现原理租户租户选择备份副本恢复原云主机/指定云主机ManageOne SCCSBS Kabor1.2、恢复VMV3 SAN/FusionStorage BlockFusionSphere OpenStackCinder DrivereBackup DriverCinderNAS/S3V3/9000/FusionStorageCinder APICSBS ConsoleeBackup PlugineBackupManager&Workflow级联级联O
12、penStackNovaeBackupServer&Proxy1.3、VM关机卸卷1.4、恢复卷1.6、恢复卷2.2、挂载卷写入备份数据2.1、读取备份数据恢复实现原理租户租户租户创建复制策略ManageOne SCCSBS Kabor1.2、创建复制策略1.3、调度复制策略V3 SAN/FusionStorage BlockFusionSphere OpenStackCinder DrivereBackup DriverCinderNAS/S3V3/9000/FusionStorageCinder APICSBS ConsoleeBackup PlugineBackupManager&Wor
13、kflow级联级联OpenStackNovaeBackupServer&Proxy2.1、导入复制备份记录,通知拷贝2.2、拷贝备份数据3.1、读取备份数据2.3、拷贝备份数据S39000/FusionStorage3.2、写入备份数据AZ2AZ1备份远程复制实现原理目录1.私有云灾备总体架构2.私有云备份方案详述3.私有云容灾方案私有云容灾方案详述详述CSDRpCSDApVHA私有云容灾的定义和备份一样,容灾在私有云中也是是一种服务-CSDR。云服务器容灾服务(Cloud Server Disaster Recoveryi,CSDR)为云服务器提供异地容灾保护,当生产中心故障,可在异地容灾中
14、心快速恢复云服务器,确保业务持续运行。云云服务器服务器容灾容灾服务服务 两个跨异地的数据中心,各部署一套Openstack,分别归属于两个Region。生产虚拟机和容灾虚机部署为主备容灾模式,正常状态下只有生产虚拟机运行,容灾虚拟机关机,数据通过存储进行远程复制。支持通过容灾测试、演练、故障恢复保证业务可用性。适用场景适用场景Region ARegion B架构特点架构特点对应用透明基于IaaS提供存储层的跨Region远程复制,管理员无需感知VM内应用高效复制存储层复制,支持存储层复制,支持RPO=0,对,对VM性能零性能零影响影响高可靠性支持远程复制一致性组支持远程复制一致性组,实现跨VM
15、的远程复制数据一致性VM1FusionSphere OpenStackPrimary DCSecondary DCManageOne SC(Master)OceanStor V3VM2VM1VM2Master LUNSlave LUNOceanStor V3 存储层存储层阵列远程复制阵列远程复制FusionSphere OpenStack ManageOne SC(Standby)云服务器跨中心容灾切换云服务器跨中心容灾切换存储层存储层虚拟化层虚拟化层服务门户层服务门户层BCM eReplicationBCM eReplication 核心运营运维组件跨中心容灾核心运营运维组件跨中心容灾Key
16、stoneMasterKeystoneStandby私有云容灾服务的逻辑架构容灾组网要求容灾组网要求 每个DC一个Region。每DC管理网络独立部署,DC间三层路由互通 每DC业务网络独立部署、有独立DC出口。DC间公网三层路由互通,二层不互通。每个DC独立部署非SDN网络方案 管理网络通过专网或专线互通,DC间时延RTT100ms 如果业务网络为Internet,则每个DC部署独立出口。如果同为专网,与管理网络可共用物理链路,逻辑上进行业务隔离 存储使用iSCSI链路互联,与管理业务网络逻辑隔离,往返RTT100ms核心交换机FWLB核心交换机FWLBV3存储PrimarySecondar
17、yFC交换机计算集群管理服务器管理服务器FC交换机V3存储接入交换机汇聚交换机计算集群接入交换机汇聚交换机管理交换机管理交换机WANACAC私有云容灾服务的物理组网架构 特点特点支持跨支持跨VM一致性组一致性组用户在同一个云主机主备服务实例中,可添加多台云主机多个VM挂接的所有卷,可保证远程复制的数据一致性,防止同一个应用出现数据不一致VM1(DB)租户VM3(Web/App)VM2(DB)远程复制一致性远程复制一致性DataSystem一致性组一致性组VM1LUNsVM2LUNsDataSystem一致性组一致性组VM1LUNsVM2LUNs云数据中心1云数据中心2关键技术一:跨VM的远程复
18、制一致性存储资源池Oceanstor 18000 V3Oceanstor 5600 V3存储资源池Oceanstor 5600 V3Oceanstor 6800V3HyperReplication1、高中低型号阵列互通复制、高中低型号阵列互通复制2、相邻版本的互通、相邻版本的互通灾备存储生产存储灾备存储生产存储LUN AN+1NCacheNN-1CacheLUN BVM多时间点的专利复制技术多时间点的专利复制技术HyperReplication特点特点基于华为多时间点专利的复制技术多时间点专利的复制技术,保证阵列内灾难发生时的数据一致性支持高中低互通的容灾技术,根据容量、性能需要选择阵列,提供
19、灵活适应性,节约投资节约投资关键技术二:HyperReplication远程复制正常访问过程正常访问过程租户访问业务租户访问业务VM1、用户向客户侧DNS请求业务域名解析2、用户获取业务IP后,访问Site1的业务VM3、业务VM的读写IO,均发送给Site1存储阵列的生产LUN组4、写IO,根据同步或异步复制策略,远程复制给Site2的存储阵列的从端LUN组租户访问租户访问SC及云服务及云服务1、用户向客户侧DNS请求SC管理域名解析2、用户获取SC IP后,访问Site1的ServiceCenter、每个云服务的前端界面3、ServiceCenter、每个云服务的前端,调用后端API、Op
20、enStack API时,根据本机Host域名记录解析IP地址4、ServiceCenter、每个云服务的前端,获取API的IP地址后,发起API请求,完成业务的增删改查操作Site1(Region1)Openstack存储资源池计算资源池服务器存储网络VM1VM2VM3网络储资源池Service Center(主)(主)BCManager(备份)(备份)云平台云平台 FusionsphereSite2(Region2)Openstack存储资源池计算资源池服务器存储网络VM1VM2VM3网络储资源池Service Center(备)(备)BCManager(主)(主)云平台云平台 Fusio
21、nsphere客户侧DNSHostnameIP AddressSC域名Primary Cloud IP1业务域名Primary Cloud IP2租户1、业务VM DNS解析2、访问业务VM3、读写生产LUN4、同步/异步远程复制1、SC DNS解析2、访问SC及云服务界面4、前端访问后端/OpenStack API3、云服务前端,请求后端/OpenStack DNS解析HyperReplication正常访问流程容灾测试过程容灾测试过程容灾测试过程容灾测试过程1、租户登录SC,触发容灾测试流程2、BCM触发测试前数据复制3、从LUN创建快照、克隆卷4、克隆卷挂载至容灾VM,容灾VM接入测试网
22、络5、启动容灾VM租户访问业务租户访问业务VM6、租户访问容灾VM,验证数据完整性。(测试对生产VM无影响,可同时正常访问。测试过程无需修改DNS)Openstack存储资源池计算资源池服务器存储网络VM1VM2VM3网络储资源池Service Center(主)(主)BCManager(备份)(备份)云平台云平台 Fusionsphere Openstack存储资源池计算资源池服务器存储网络VM1VM2VM3网络储资源池Service Center(备)(备)BCManager(主)(主)云平台云平台 FusionsphereHyperReplication客户侧DNS租户2、测试前数据复制
23、3、从LUN创建快照,创建克隆卷4、挂载至容灾VM,容灾VM接入测试网络5、启动容灾VM6、访问容灾VM,验证数据完整性1、启动测试流程生产VM无影响HostnameIP AddressSC域名Primary Cloud IP1业务域名Primary Cloud IP2Site1(Region1)Site2(Region2)容灾测试流程容灾演练(计划性迁移)过程容灾演练(计划性迁移)过程容灾计划性迁移过程容灾计划性迁移过程1、管理员登录BCM,触发计划性迁移流程2、BCM停止生产VM,卸载卷3、执行计划性迁前的数据复制4、从LUN升主,挂载至容灾VM5、容灾VM接入容灾恢复网络6、启动容灾VM
24、租户访问业务租户访问业务VM7、(可选)切换业务VM的DNS记录(业务访问域名记录)8、租户登录容灾VM,检验、启动业务系统(生产VM切换至容灾VM,完成容灾演练过程)Openstack存储资源池计算资源池服务器存储网络VM1VM2VM3网络储资源池Service Center(主)(主)BCManager(备份)(备份)云平台云平台 Fusionsphere Openstack存储资源池计算资源池服务器存储网络VM1VM2VM3网络储资源池Service Center(备)(备)BCManager(主)(主)云平台云平台 FusionsphereHyperReplication客户侧DNS租
25、户3、迁移前数据复制4、从LUN升主,挂载至容灾VM5、容灾VM接入测试网络6、启动容灾VM8、访问容灾VM,验证业务系统1、启动计划性迁移流程2、停止生产VM,卸载卷HostnameProduction IPDR IPSC域名Primary Cloud IP1业务域名Primary Cloud IP2Secondary Cloud IP27、切换业务VM DNS记录Site1(Region1)Site2(Region2)容灾演练流程故障切换流程 Openstack存储资源池计算资源池服务器存储网络VM1VM2VM3网络储资源池Service Center(主)(主)BCManager(备份)
26、(备份)云平台云平台 Fusionsphere Openstack存储资源池计算资源池服务器存储网络VM1VM2VM3网络储资源池Service Center(备)(备)BCManager(主)(主)云平台云平台 FusionsphereHyperReplication客户侧DNSHostnameProduction IPDR IPSC域名Primary Cloud IP1Secondary Cloud IP1业务域名Primary Cloud IP2Secondary Cloud IP22、切换ManageOne1、切换Keystone4、存储阵列切换、启动容灾云主机Failover租户3、
27、切换SC的Host域名记录解析IP地址切换外部DNS的SC DNS记录故障切换过程故障切换过程切换容灾基础环境切换容灾基础环境1、切换访问认证组件Keystone组件2、切换服务发放系统 ManageOne SC3、切换SC的Host域名记录解析IP地址,切换外部DNS记录(仅ManageOne登录域名记录)切换云容灾服务实例切换云容灾服务实例4、通过BCM,一键式完成:存储层LUN配置可读、挂载至灾备端计算节点拉起容灾云主机,接入容灾恢复VPC5、租户登录容灾占位VM,检验、启动业务系统6、(可选)切换业务VM的DNS记录(业务访问域名记录)Site1(Region1)Site2(Regio
28、n2)回切切换过程回切切换过程切换容灾基础环境切换容灾基础环境1、切换访问认证组件Keystone组件2、切换服务发放系统 ManageOne SC3、切换SC的Host域名记录解析IP地址,切换外部DNS记录(仅ManageOne登录域名记录)切换业务系统切换业务系统4、通过BCM,一键式完成:灾备中心阵列数据反向同步;执行重保护;执行故障恢复后回切(可选);启动原生产云主机(可选)5、租户登录原生产的VM,检验、启动业务系统6、(可选)切换业务VM的DNS记录(业务访问域名记录)Openstack存储资源池计算资源池服务器存储网络VM1VM2VM3网络储资源池Service Center(
29、主)(主)BCManager(备份)(备份)云平台云平台 Fusionsphere Openstack存储资源池计算资源池服务器存储网络VM1VM2VM3网络储资源池Service Center(备)(备)BCManager(主)(主)云平台云平台 Fusionsphere客户侧DNS2、切换ManageOne1、切换KeystoneHyperReplication启动原生产虚拟机Failover租户4、反向同步;重保护;故障回切;启动原生产VM主备切换切换内部服务DNS记录HostnameProduction IPDR IPSC域名Primary Cloud IP1Secondary Clo
30、ud IP1业务域名Primary Cloud IP2Secondary Cloud IP23、切换内部服务DNS记录外部SC DNS记录5、切换业务VM DNS记录Site1(Region1)Site2(Region2)故障恢复后回切流程容灾服务申请流程租户提交容灾申请时,需要选择容灾对象和租户提交容灾申请时,需要选择容灾对象和SLA,一个典型的配置示例如下:,一个典型的配置示例如下:v 管理平台支持的容灾业务创建流程如下:管理平台支持的容灾业务创建流程如下:租户租户p服务实例基本信息(名称,服务到期时间)p容灾对象信息(VM)p容灾SLA信息:容灾周期,对端AZp恢复VM的VPC,IP地址
31、容灾管理员容灾管理员同意同意v 主备容灾整体使用流程:主备容灾整体使用流程:申请容灾服务填写容灾配置和SLA服务内容审批同意/返回修改/拒绝开通容灾服务申请云服务器容灾服务实例容灾测试容灾清理容灾计划性迁移故障恢复重保护重保护回切(反向执行计划性迁移)回切(反向执行计划性迁移)网络互通要求网络互通要求:主备容灾要求生产中心和灾备中心的OM_Service、Public_Service和存储复制网络三层互通。其他网络平面互通要求,需要参考FusionCloud多Region部署基础网络互通设计。存储复制网络可以使用FC或者IP网络。私有云容灾网络设计目录1.私有云备份方案详述2.私有云容灾方案私
32、有云容灾方案详述详述pCSDRCSDApVHA生产中心发生灾难(生产中心停电、火灾等):可对受CSHA服务保护的生产云服务器自动或手工切换到灾备中心,快速启动容灾云服务器。计划内停机(计划性停电、日常运维等):容灾管理员可对受CSHA服务保护的生产云服务器进行一键式的计划性迁移,在灾备中心快速启动容灾云服务器,保证业务数据零丢失;并在原生产中心完成计划性活动后,容灾管理员对受保护云服务器进行反向重保护,并在合适时间通过计划性迁移将业务切回到原生产中心。云服务器高可用服务的定义云服务器高可用服务(Cloud Server High Availability)为云服务器提供同城数据中心间的高可用保
33、护。当生产中心发生灾难时,被保护的云服务器能够自动或手动切换到灾备中心。云服务器高可用服务云服务器高可用服务适用场景适用场景高可用服务物理DC生产VMsMgmt虚拟资源容灾VMsMgmt虚拟资源AZ2AZ1DC1统一容灾服务管理DC2FusionSphere Openstack Region高可用保护资源管理控制云服务器高可用总体架构Page37 存储层:基于存储阵列的HyperMetro双活特性,在存储层提供双活LUN,同时挂载于生产或容灾云服务器中。对计算层提供多路径访问,可在单独存储层故障时自动完成双活故障切换。计算层:通过将生产云服务器、容灾云服务器配置为容灾关系,并添加到保护组中,实
34、现对生产云服务器的保护。正常情况下,仅生产云服务器工作,当需要进行故障切换时,由BCManager eReplication调用Openstack进行容灾服务器的启动操作。网络层:典型部署下,生产中心网络出口、容灾中心网络出口通过不同的外部网络关联到不同的VPC上。在创建生产、容灾云服务器时,将他们分别接入生产中心VPC、容灾中心VPC。因此生产、容灾云服务器的私网IP地址,可以申请相同的IP。公网IP地址,根据网络出口的外部网络网段规划,需要配置不同的EIP地址。方案架构方案架构云服务器高可用部署原则Page38 方案组件方案组件BCManager eReplicationCSHA Cons
35、ole:2节点虚拟化拉远部署eReplication Server:2节点虚拟化拉远部署FusionSphere Openstack一套openstack拉远部署ManageOne,公共组件&基础服务主备虚拟化部署仲裁 存储仲裁:1节点物理化部署 仲裁云平台:1节点物理化部署 IAM仲裁:1节点物理化部署存储 OceanStor V3/V5 Dorado V3eReplication(Server+Console)虚拟化部署FusionSphereDataCenter BHyperMetroeReplication(Server+Console)FC SAN管理IP网路第三方仲裁站点第三方仲裁
36、站点仲裁云平台仲裁网路Compute ClusterCompute ClusterOceanStor V3/V5/DoradoIAM仲裁OceanStor V3/V5/DoradoDataCenter AFusionSphereManageOne,公共组件&基础服务存储仲裁ManageOne,公共组件&基础服务(主)(主)(备)(备)云服务器高可用应用场景Page39存储层计算&云平台层网络层广域网正常运行时业务访问流 单中心故障业务访问流AZ1AZ2VPC1VPC1VM1VM1应用应用 VM1 VM1应用应用WANVM HAHyperMetroRegionAZ1AZ2EIP1专线EIP1专线
37、外部网络访问切换访问VM1GSLBGSLBDNS解析DNS解析传统单机应用或无容灾应用上云,基于传统单机应用或无容灾应用上云,基于IaaS层层VMVM提供高可用提供高可用应用自身不支持高可用容灾,需要依赖IaaS层提供VM的高可用应用无App-DB的分层结构,或分层后希望统一容灾切换要求方案在站点故障时,VM可跨站点自动或手工切换启动要求存储数据零丢失、存储层数据一致性多个VM要求在切换过程中保证VM启动顺序原有局点为原有局点为Vmware HA HA集群跨集群跨DCDC或或SRMSRM多多DCDC部署场景部署场景场景规划场景规划生产VM、容灾VM分别位于同一Region的不同AZ生产VM、容
38、灾VM接入不同的VPC,对应不同的DC网络出口采用EIP访问时,应用需支持通过URL访问,可通过GSLB自动探测实现自动切换采用专线访问时,VM访问流量需要手工切换外部网络的路由条目有切换顺序、数据一致性要求的VM,添加到同一个保护组进行协同切换应用场景应用场景云服务器高可用实例创建原理Page40ManageOne(SC)业务业务发放发放BCManager eReplication 云云容灾组件容灾组件租户租户容灾服务化Console服务界面服务界面FusionSphere Openstack计算管理接口Nova存储/容灾管理接口Cinder/DRExtend网络管理接口Neutron配置自
39、动化生产中心生产中心灾备中心灾备中心AZ1AZ2123 4657891.租户申请云服务器高可用实例2.ManageOne下发实例创建命令到BCM3.检查生产端以及容灾端的计算以及存储资源4.检查生产云服务器5.检查容灾云服务器6.分配存储资源7.创建容灾端卷8.设置容灾端云服务器以及生产端云服务器容灾标签9.执行初始数据同步计划性迁移实现原理Page41ManageOne(SC)业业务发放务发放BCManager eReplication 云云容灾组件容灾组件Console服务界面服务界面FusionSphere Openstack计算管理接口Nova存储/容灾管理接口Cinder/DRExt
40、end网络管理接口Neutron生产中心生产中心灾备中心灾备中心758AZ1AZ2云平台仲裁服务云平台仲裁服务云平台仲裁服务云平台仲裁服务6容灾维护管理员用户用户3 4121.租户向容灾维护管理员申请计划性迁移2.容灾维护管理员下发计划性迁移命令3.关闭、锁定生产端云服务器4.卸载、锁定生产端主机卷5.DRExtend暂停双活一致性组6.BCM调用Nova,取消容灾端云服务器锁定状态,取消保留从卷,将主、从卷挂载到容灾云服务器7.解锁、启动容灾云服务器8.将生产端云服务器设置为占位云服务器,调换生产以及容灾云服务器的容灾标签,并创建双活容灾关系故障切换实现原理Page42ManageOne(S
41、C)业业务发放务发放BCManager eReplication 云云容灾组件容灾组件Console服务界面服务界面FusionSphere Openstack计算管理接口Nova存储/容灾管理接口Cinder/DRExtend网络管理接口Neutron生产中心生产中心灾备中心灾备中心AZ1AZ2云平台仲裁服务云平台仲裁服务云平台仲裁服务云平台仲裁服务云平台仲裁服务云平台仲裁服务第三方仲裁中心第三方仲裁中心存储仲裁服务存储仲裁服务123456781.DC故障,云平台仲裁服务判断站点故障2.BCM查询仲裁结果,并做切换前检查3.检查生产端计算、存储复制链路状态4.检查生产端服务器集群状态5.暂停
42、存储双活6.挂载从卷7.解锁、启动容灾云服务器8.将生产端云服务器设置为占位云服务器,调换生产以及容灾云服务器的容灾标签,并创建双活容灾关系重保护实现原理Page43ManageOne(SC)业业务发放务发放BCManager eReplication 云云容灾组件容灾组件12Console服务界面服务界面FusionSphere Openstack计算管理接口Nova存储/容灾管理接口Cinder/DRExtend网络管理接口Neutron生产中心生产中心灾备中心灾备中心67AZ1AZ23云平台仲裁服务云平台仲裁服务云平台仲裁服务云平台仲裁服务云平台仲裁服务云平台仲裁服务第三方仲裁中心第三方
43、仲裁中心存储仲裁服务存储仲裁服务541.DC故障,云平台仲裁服务判断站点故障2.BCM查询仲裁结果,并做切换前检查3.检查生产端计算、存储复制链路状态4.检查生产端服务器集群状态5.暂停存储双活6.挂载从卷7.解锁、启动容灾云服务器8.将生产端云服务器设置为占位云服务器,调换生产以及容灾云服务器的容灾标签,并创建双活容灾关系关键技术-存储双活Page44在云数据中心,App和DB都运行于云服务器VM里,租户访问App,App生成的数据存储在DB里,通过云服务器VM将IO保存在存储设备中。在存储双活过程中,租户通过App将IO下发到DB,DB将IO下发到AZ1与AZ2的两台存储上,然后返回给主机
44、,实现数据的实时镜像。在正常场景下,生产、容灾LUN均同时挂载于生产云主机;而容灾云主机不挂卷,因此不能启动。存储双活原理存储双活原理关键技术-自动故障切换Page45计算节点BCM eReplication(Active)Primary DCSecondary DC仲裁Monitor心跳Third DCKVMKVMKVMKVM HA心跳 Quorum Monitor Quorum MonitorQuorum ServerBCM eReplication(Standby)三层IP互通三层IP互通Openstack管理节点Openstack管理节点KVMKVMKVMKVM计算节点存储存储灾备组件
45、BCManager eReplication实时监控站点间仲裁状态,若某一站点仲裁全部故障,则会触发BCManager eReplication对整站点的状态检查以每个CSHA实例为单位,依次检查各实例所在存储的复制链路状态及AZ下全部计算节点的状态,若全部为故障状态,则判定为整站点故障,触发自动切换;否则判定为局部故障,不触发自动切换。局部故障场景下,用户可通过手动故障切换的方式把业务虚拟机切换到容灾站点自动故障切换原理自动故障切换原理目录1.私有云备份方案详述2.私有云容灾方案私有云容灾方案详述详述pCSDRpCSDAVHA云硬盘高可用服务的定义Page47云硬盘高可用(Volume Hi
46、gh Availability,以下简称VHA)针对华为私有云的云服务器(ECS),在数据中心内提供VHA服务,当数据中心内单套存储发生故障时,数据不丢失,云服务器业务不中断。云硬盘高可用服务云硬盘高可用服务同一个可用分区内至少部署两套存储配置为双活关系(同一个AZ内支持配置多对双活存储,支持与未配双活的存储共存)。生产虚拟机的存储采用双活模式,为主机同时提供读写服务,两套存储之间数据实时同步。两套存储之间使用FC或iSCSI链路互联,跨机房时往返RTT2ms。使用场景使用场景主Lun云服务器AZ1存储A存储BHyperMetro双活访问,数据零丢失从Lun云硬盘存储仲裁服务器双活访问云硬盘高
47、可用基础架构 Page48 ManageOne SC:向用户提供统一的云硬盘高可用自助管理平台,用户按需申请备份服务 VHA Console:提供VHA服务控制台 BCManager eReplication:容灾双活管理软件,实现容灾双活环境的管理,配置双活业务 FusionSphere OpenStack:提供创卷、挂卷等API接口 DRExtend:为主从卷创建双活pair和双活一致性组,并将双pair加入到双活一致性组 存储仲裁服务器:为两套存储提供仲裁服务,当存储设备间出现通信异常,仲裁服务器决定由哪一套存储继续提供业务方案组件方案组件云数据中心云数据中心ManageOne SC/O
48、C、IAM、服务、服务Console、DNS核心运营运维组件BCManager eReplication容灾组件VMVMVM云服务器存储&备份执行层FusionSphere OpenStack云平台OceanStor/DoradoOceanStor/Dorado存储层HyperMetroVHA ConsoleDRExtend云硬盘高可用部署原则Page49 方案组件方案组件VHA Console2节点虚拟化高可靠部署eReplication2节点虚拟化高可靠部署,或者单节点部署生产存储 Dorado V3 SAN OceanStor V3、V5R7存储仲裁 虚拟化部署或物理机部署MO,公共组件
49、,基础服务VHA ConsoleeReplicationFusionSphere虚拟化计算资源池FC/IP交换机HyperMetro存储仲裁服务器AZ1生产存储1生产存储2虚拟机部署物理机部署仲裁网络存储接入网络管理网络双活链路云硬盘高可用应用场景Page50应用场景应用场景说明说明存储故障存储故障为华为私有云云服务器的系统卷及数据卷提供本地存储双活保护服务,当数据中心内单套存储发生故障时,数据不丢失,云服务器业务不中断。VHA适用场景:适用场景:当客户对存储数据有高可用保护的需求时,并且客户只有一个数据中心,无法满足跨站点高可用容灾的要求时,可以选择部署VHA服务云数据中心云数据中心Mana
50、geOne SC/OC、IAM、服务、服务Console、DNS核心运营运维组件BCManager eReplication容灾组件VMVM云服务器存储&备份执行层FusionSphere OpenStack云平台OceanStor/DoradoOceanStor/Dorado存储层HyperMetroVHA ConsoleDRExtend云硬盘高可用实现原理Page511、租户申请创建VHA实例;2、eReplication调用OpenStack Cinder接口创建从Lun3、eReplication调用DRExtend接口创建卷双活4、eReplication调用DRExtend接口创建