1、XXX院双楼双域双活数据中心建设方案123纲要整体解决方案与关键技术说明总体需求说明双楼双域双活价值体现XXX院机房与应用分析A楼主数据中心汇聚交换机应用资源汇聚交换机计算资源层医生站/护士站核心区核心交换机 汇聚交换机千兆电口链路千兆光口链路虚拟化插卡式板卡万兆光口链路运维审计运维平台;ADDC图例SAN链路WAF外网医保外联区综合安全业务网关日志审计负载均衡应用资源B楼备数据中心HIS高性能区域:HIS、EMR、LISPACS大容量区域:PACS及相关业务OTHERS 区域:OA、决策、追溯集成平台手麻、财务、建设目标与总体思路总体目标总体目标:1、建设、建设双活双活+容灾数据中心,以容灾
2、数据中心,以满足满足HIS、EMR、LIS等负载等负载、业务连续性、数据可靠性的、业务连续性、数据可靠性的要求要求2、灾备采用云数据中心的建设模式,体现云数据中心的建设模式与价值,为未来提升、灾备采用云数据中心的建设模式,体现云数据中心的建设模式与价值,为未来提升IT能力打下基础能力打下基础场景场景需求需求技术方案技术方案方案说明方案说明备注备注HISHIS区域(包含区域(包含HISHIS、LISLIS、EMREMR)HIS、LIS、EMR高IO性能要求采用全闪存超融合企业级云方案构建统一标准化架构、高性能、高可靠性、易扩展、统一管理、灵活调配1、HIS双活(数据0丢失,业务秒切);2、HIS
3、灾备,可进行回滚HIS区域核心业务系统实现双活,RPO=0,RTO=0SLB(服务器负载均衡)+Oracle Rac(数据库双活)+集群延伸(分布式存储双活)应用层(B/S架构HIS):AD负载均衡数据库层:Oracle RAC双活架构数据层:集群延伸(分布式存储双活)HIS核心业务区域数据灾备(可回滚)本地/异地持续数据备份,能够实现误删除恢复等问题采用Dataguard(最大保护模式/最大性能模式)承载PACS+others的超融合架构服务器PACS大容量需求,others各种应用系统需整合采用SSD+HDD服务器集群+EDS(分布式存储)SSD+HDD集群:承载PACS、others应用
4、层+数据层;EDS:承载PACS数据、others等备份介质1、重要应用灾备(数据0丢失,业务5min恢复)2、非重要业务(数据小时级别备份)重要业务保证灾备RPO=0,RTO=5min1、备份介质:VS灾备卷/EDS2、CDP:持续数据保护1、采用VS分卷在备数据中心划分一个灾备卷;2、CDP(持续数据保护)将应用备份到灾备卷/EDS;非重要业务实现RPO=小时级别,应用可拉起、备份介质:VS灾备卷/EDS2、CBT:定时备份1、CBT(持续数据保护)将应用备份到灾备卷/EDS;HIS ORACLE数据库数据库双活oracle extended RAC跨数据中心RAC,无需存储双活支持RAC
5、为写入同步,因此对网络要求高数据库容灾备份dataguard、always on等,或者数据库灾备软件同步日志记录,网络消耗较少,需要一定技术能力整体解决方案与关键技术说明统一纳管,双楼双域双活数据中心XXX院机房与应用分析A楼主数据中心汇聚交换机汇聚交换机医生站/护士站核心区核心交换机 汇聚交换机千兆电口链路千兆光口链路虚拟化插卡式板卡万兆光口链路图例SAN链路超融合全闪存平台卷1延伸集群故障域1超融合全闪存平台卷1延伸集群故障域2Oracle Rac集群延伸双活B楼备数据中心超融合SSD+HDD平台卷2paces+others超融合SSD+HDD平台卷3灾备卷CBT/CDPDataGuar
6、d等集群1:全闪存集群集群2:常规性能集群集群1:全闪存集群承载HIS、LIS、EMR包含故障域1与故障域2故障域1:主机房故障域2:备机房俩个故障域:(1)数据双副本同步;(2)应用层vAD负载;(3)数据库层RAC同步集群2:SSD+HDD常规性能资源池包含存储卷1和存储卷2存储卷1:承载paces,others的生产存储卷2:用户灾备卷,HIS采用DataGuard进行灾备,others采用CDP/CBT进行虚拟机单位备份,数据可拉起aSVaNetaSANaSEC计算网络存储安全超融合架构产品超融合架构产品核心交换层安全服务层计算资源层存储交换层数据存储层NASSANiSCSI访问路由层
7、超融合集群服务器虚拟化架构服务器虚拟化架构超超融合架构云融合架构云数据中心数据中心VMVMVMVMVMVMVMVMVMDockerDockerVMVMVMDockerDocker虚拟化计算虚拟化存储虚拟化安全虚拟化网络VMVMVMVMVMVMVMVMVMDockerDockerVMVMVMDockerDocker虚拟化计算虚拟化存储管理aCMP超融合 VS 服务器虚拟化计算安全存储网络管理OR超融合一体机OR云操作系统稳定安全高性能云操作系统超融合一体机计算存储网络安全超融合-软件定义数据中心超融合-四大IT能力中心企业云-监控中心企业云-可靠性中心DataCenter 1 主数据中心主数据中
8、心故障域故障域A10 GE SW10 GE SW1 GE Core SW1 GE Core SWaSwitchaSwitchaSwitchaSwitchaRouteraRouter核心互联(大二层)存储互联(二层)10 GE SW故障域故障域BaSwitchaSwitchaSwitchaSwitchaRouteraRouter1 GE Core SWDataCenter 2 备数据中心备数据中心深信服超融合集群双活数据中心架构图VMVMVMVMaCloudVM数据中心AVMVMVMVMVMaCMP虚拟网络数据中心B存储池1.延伸的aCloud平台:两地数据中心提供同一个aCloud集群,提供统
9、一的计算、存储、网络资源池。HA/热迁移3.延伸的存储:基于存储延伸,为上层提供统一的存储访问入口,同一份数据在两个数据中心各有一份副本,当上层应用下发写I/O时,同时往两地副本进行写操作,只有都返回成功,才算I/O成功,以此保障数据一致性。4.延伸的网络:数据中心两地,运行在aCloud上的虚拟机,在统一的、所画即所得的虚拟网络页面中进行网络编排。2.故障域:两个数据中心的aCloud分别作为两个故障域,在aCloud平台上的虚拟机也按照active-active的方式,遵循互斥规则分布在两个故障域中,保证不会有任何一个部分出现单点故障。5.HA:结合aCloud HA功能,当一个故障域中的
10、一台主机出现故障离线时,该主机上的虚拟机可以从当前故障域中的另一台主机上重新开启,快速恢复计算能力,这个过程中流量会通过集成的虚拟负载均衡负载到其它active的虚拟机节点上,业务不会中断。6.DRS:结合aCloud DRS功能,当一个故障域中的一台主机资源过载时,该主机上的虚拟机可以自动热迁移到当前故障域的另一台主机上,均衡各主机的资源使用情况,使故障域内的各主机可以持续稳定地运行。这个过程中业务不会中断。7.双活:将active-active的应用虚拟机节点分布在两个故障域中,当任何一个故障域出现故障时,另外一个故障域的应用虚拟机节点也能持续地运行,这个过程业务不会中断。集群延伸-实现数
11、据双活Oracle Rac-实现数据库双活解决性能问题OracleRAC解决使用障碍解决冗余问题超融合自身采用全冗余架构设计超融合提供高性能平台IO处理能力(SSD缓存、分层)共享盘存储高可用心跳链路高可用RAC节点反亲和性DRX热添加重要虚拟机大页内存NUMA绑定东西向高速虚拟链路网页部署向导硬件配置选型指导标准Oracle模板物理外置存储向导实施指导&实施视频备用中心 生产中心Real-time Queries持续传输和应用Redo Log 实时查询 physical standby在redo apply同时,支持只读查询 DR+实时查询 无闲置资源Oracle Dataguard-解决数
12、据库误删除等问题vAD-解决应用层单点故障应用A应用A备份应用B应用B备份数据中心A数据中心B访问应用A访问应用B分应用主备模式aSV(Hypervisor)aSV(Hypervisor)VM变更块备份VM变更块恢复aStor第三方存储设备虚拟机定时备份aSV(Hypervisor)aSV(Hypervisor)IO LogIO MirroraStor第三方存储设备虚拟机CDP持续数据保护 无需授权许可 备份网络和备份介质要求低 RPO=1小时 异步镜像IO性能影响小 支持文件级恢复 RPO秒级CBT/CDP-简单有效的灾备方式记录每一个IO,并采用了缓存异步复制技术,开启CDP功能后,会将I
13、O数据到专用内存里,然后异步写入到备份存储,整个过程对虚拟机的io性能无任何影响。可实现数据回退CDP-实时数据保护一键拉起数据安全可靠-磁盘故障重建服务器虚拟化aSV存储虚拟化aSANABCQAJVTSDBFUKSOMQDGCHHERDUFVMEJGTPO!ACB磁盘故障时,虚拟机业务不受影响,通过另外一个副本进行IO操作;磁盘故障后,将触发数据重建,重建过程采用I/O多并发,即从多个源端磁盘读取,往多个目的端磁盘写入的,实现了数据的快速重建,可达每TB/30min。数据安全可靠-主机故障后数据重建服务器虚拟化aSV存储虚拟化aSANABCQAJVTSDBFUKSOMQDGCHHERDUFVMEJGTPO!ACB主机故障时,HA机制生效,几分钟内虚拟机将在其他主机自动重新启动,并访问剩下的一个副本,业务继续运行。主机故障后,将触发数据重建,重建过程采用I/O多并发,即从多个源端磁盘读取,往多个目的端磁盘写入的,实现了数据的快速重建,可达每TB/30min。OKSGQ容灾大屏与监控中心展示所有站点、受保护虚拟机组当前的容灾状态,可以直接看到异常状态,并且详细告警异常原因,帮助用户快速排障,降低风险。