1、 未雨绸缪,有备无患灾备技术灾备技术灾备的目的 灾备,被誉为企业信息安全的最后一道防线,是新时代产业信息化运营的保障体系之一。它的终极目标是确保组织单位的数据不丢,业务不停,在规定的时间内持续、稳定地对外提供服务。灾备的起源与发展 灾备是灾难备份的缩略语,而从更严格意义上说,信息系统的灾备应当是指信息系统的灾难备份与恢复,这它包含两层含义:灾难前的备份与灾难后的恢复。1979 年,SunGard 在美国费城建立了全世界第一个灾备中心后来,IT 备份发展到了灾难恢复规划(DRP)随着灾备业务的不断更新,灾备的外延也越来越广,不仅包括数据备份和系统备份,业务连续规划、灾难恢复规划、灾难恢复预案、业
2、务恢复预案,还包括通信保障、危机公关、紧急事件响应、第三方合作机构和供应链危机管理等等。灾备的重要性 美国德克萨斯州大学:“只有 6%的公司可以在数据丢失后生存下来、43%的公司会彻底关门、51%的公司会在两年之内消失。”在灾难之后,如果无法在 14 天内恢复信息作业,有 75%的公司业务会完全停顿,20%的企业在两年之内被迫宣告破产。美国明尼苏达大学:“在遭遇灾难的同时又没有灾难恢复计划的企业中,将有超过 60%在两到三年后退出市场。”2016 年灾备行业的一份可用性报告显示:企业每年因应用停机所造成 的损失达到 1600 万美元,可用性差距进一步扩大。灾备行业术语:数据备份灾备行业术语:数
3、据备份灾备行业术语:数据备份 双机热备按工作中的切换方式分为:主-备方式(Active-Standby 方式)和双主机方式(Active-Active 方式)主-备方式指的是一台服务器处于某种业务的激活状态(即 Active 状态),另一台服务器处于该业务的备用状态(即 Standby 状态)。双主机方式即指两种不同业务分别在两台服务器上互为主备状态(即 Active-Standby 和Standby-Active 状态)。灾备行业术语:数据备份 本地容灾,一般指主机集群,当某台主机出现故障,不能正常工作时,其他的主机可以替代该主机,继续进行正常的工作。异地容灾,是指在与生产机房有一定距离的异
4、地建立与生产机房类似的信息平台(备份中心),并采用特定的技术将生产中心的数据传输到该备份中心,从而在生产中心发生较大的灾难如火灾或地质灾害时,仍能对生产数据进行保护的容灾系统。灾备行业术语:数据备份 备份与容灾的区别:备份是为了应对灾难来临时造成的数据丢失问题;容灾是为了在遭遇灾害时能保证信息系统能正常运行,帮助企业实现业务连续性的目标。灾备行业术语:业务连续性 业务连续性(Business Continuity)是指在中断事件发生后,组织在预先确定的可接受的水平上连续交付产品或提供服务的能力。业务连续性(BC)针对的事件场景应包括三类:一般故障(Outage)、紧急事件(Emergency)
5、和灾难事件(Disaster)。实现业务连续性所需的 IT 措施包含三个方面:业务状态数据的备份和复制、业务处理能力的冗余和切换、外部接口冗余和切换。灾备行业术语:业务连续性 业务连续性的技术手段通常包括以下两种:1.高可用性(High Availability,简称 HA):群集系统 2.灾难恢复(Disaster Recovery):灾难恢复(DR)(国内通常简称为灾备或容灾)属于业务连续性的技术层面。在信息服务中断后,调动资源,在异地重建信息技术服务平台(包括基础架构、通信、系统、应用及数据),灾难恢复也包括本地的恢复与重建。灾备行业术语:业务连续性流行的灾备系统往往包括本地的 HA 集
6、群和异地的 DR 数据中心。从故障角度,HA 主要处理单组件的故障导致负载在集群内的服务器之间的切换,DR 则是应对大规模的故障导致负载在数据中心之间做切换。从网络角度,LAN 尺度的任务是 HA 的范畴,WAN 尺度的任务是 DR 的范围。从云的角度,HA 是一个云环境内保障业务连续性的机制,DR 是多个云环境间保障业务连续性的机制。从目标角度,HA 主要是保证业务高可用,DR是保证数据可靠的基础上的业务可用。灾备行业术语:灾难恢复衡量指标 RTO(Recovery Time Objective)恢复时间目标 RPO(Recovery Point Objective)恢复点目标 DOO(De
7、graded Operations Objective)降级运行目标 NRO(Network Recovery Objective)网络恢复目标 APIT(Any Poit In Time)任意时间点回退灾备的三个等级 数据级灾备 应用级灾备 业务级灾备灾备行业国内外标准及认证 国际标准:SHARE78、ISO 22301、BS 25999灾备行业国内外标准及认证 国家标准:GB/T20988-2007:信息安全技术信息系统灾难恢复规范GB/T 30146-2013:公共安全业务连续性管理体系要求GB/T 31595-2015:公共安全业务连续性管理体系指南灾备关键技术分类数据复制技术切换技术
8、重复数据删除技术 基于软件的重复数据删除 基于硬件的重复数据删除数据加密与传输技术 源端加密 传输加密三种常见存储形态及对应架构 常见的存储方式主要包括:DAS(Direct Attached Storage)直连附加存储 SAN(Storage Area Network)存储区域网络 NAS(Network Attached Storage)网络附加存储 OBS(Object-Based Storage)对象存储三种常见存储形态及对应架构直连附加存储(DAS)DAS 这种存储方式与普通的 PC 存储架构一样,外部存储设备都是直接挂接在服务器内部总线上,数据存储设备是整个服务器结构的一部分。存
9、储区域网络(SAN)SAN 的支撑技术是光纤通道(FC Fiber Channel)技术。其最大特性是将网络和设备的通信协议与传输物理介质隔离开,这样多种协议可在同一个物理连接上同时传送。SAN 由以下三个部分组成:存储和备份设备包括磁带、磁盘和光盘库等。光纤通道网络连接部件包括主机总线适配卡、驱动程序、光缆、集线器、交换机、光纤通道和 SCSI 间的桥接器。应用和管理软件包括备份软件、存储资源管理软件和存储设备管理软件。网络附加存储(NAS)NAS采用单独为网络数据存储而开发的一种文件服务器来连接所存储设备,自形成一个网络。这样数据存储就不再是服务器的附属,而是作为独立网络节点存在于网络之中
10、,可由所有的网络用户共享。对象存储系统(Object-Based Storage System)是综合了 NAS 和 SAN 的优点,同时具有 SAN 的高速直接访问和 NAS 的数据共享等优势,在一个持久稳固且高度可用的系统中存储任意的对象,且独立于虚拟机实例之外。应用和用户可以在对象存储中使用简单的API 访问数据。对象存储系统 软件定义存储 Ceph RBD Mirror:原理其实和 MySQL 的主从同步原理非常类似,简单地说就是利用日志进行回放(replay):通过在存储系统中增加 Mirror 组件,采用异步复制的方式,实现异地备份。灾备技术创新:软件定义存储(SDS)Docker
11、 OpenStack:云计算基础架构的事实标准 让灾备建设与运维更加简单、系统开放可兼容及利旧,以及让灾备资源能够以服务的方式自动完成分配和发放,成为当前灾备建设的新趋势和诉求。灾备技术创新:容器 超融合基础架构(Hyper-Converged Infrastructure,或简称“HCI”)也被称为超融合架构,是指在同一套单元设备中不仅仅具备计算、网络、存储和服务器虚拟化等资源和技术,而且还包括缓存加速、重复数据删除、在线数据压缩、备份软件、快照技术等元素,而多节点可以通过网络聚合起来,实现模块化的无缝横向扩展(scale-out),形成统一的资源池。所以,这个“超”字,同样可理解为“大”。
12、灾备技术创新:超融合 对灾备技术发展趋势的要求是能够满足不同云计算平台、长距离、大数据量的数据复制、传输和业务从本地到云端、云端到云端的快速接管的需求。灾备技术创新:云计算 借助边缘计算,可以将海量数据灾备至周边任一物联网终端,同时,通过数据的分块技术,对源端数据在本地进行切分,切分后的数据块在本地完成加密再传输至不同的“边缘”,保证了数据灾备至“边缘”的安全性。灾备技术创新:边缘计算云灾备 云灾备是指灾备业务的云端实现形式,主要包括云备份与云容灾。云备份与云容灾是一个有机的统一体。其中云备份是指备份技术将生产存储数据直接备份到公有云上,进而实现数据备份与恢复功能;云容灾则是指通过数据/系统的
13、云端迁移、高可用等方式实现业务的快速接管,保证业务连续性。云灾备的概念与分类 基础设施减少 降低 IT 成本 按需付费 高度机动性 高度灵活性 快速恢复 安全备份 服务导向云灾备的特点 云环境下灾备技术架构的核心在于所有资源的“池”化,即通过实现服务器、存储、网络、安全组件以及机房等其他辅助设施的资源“池”化,构建一个标准化、可弹性伸缩的资源平台,再借助高效的云调度和管理平台实现各类资源在不同应用间的动态调配。虚拟化管理平台可实现对多达上万个虚拟机的高效管理和集中控制,可针对 CPU、内存、磁盘和网络带宽的阈值及业务需求优先级进行预定义,虚拟化平台的扩展功能也十分强大。同时,虚拟化平台还具备高
14、可用的功能,通过对虚拟机采用的故障切换解决方案保持较高的可用性。云灾备与虚拟化SaaS(Software-as-a-Service 软件即服务):本质依然是软件。通过 SaaS 这种模式,用户只要接上网络,通过浏览器就能直接使用在云端上运行的应用,并由供应商负责维护和管理云中的软硬件设施,同时以免费或者按需使用的方式向服务商支付费用;PaaS(Platform-as-a-Service 平台即服务):通过云将IaaS 层资源动态管理和分配,用有限的资源提供身份认证管理、应用资源管理、工作流控制管理、服务总线管理、基础资源调度等服务。PaaS 本身就是一种平台化的服务模式,因此在 PaaS 层的
15、灾备主要是通过对用户服务器进行多机房部署和异地容灾,进而在基础设施上保障了高可用性。IaaS(Infrastructure-as-a-Service 基础设施即服务):云计算的最底层,也可以理解为 OSI(Open System Interconnection)的物理层及数据链路层。别墅式的云灾备系统就需要更多的借助OpenStack 等开源代码平台进行搭建。云灾备的业务模式云灾备的服务模式云灾备的主要产品形态:云迁移 云迁移不只是从本地到云的转变,还有可能是从一个云到另一个云的迁移,比如从公有云迁移到另一个公有云、从私有云迁移到公有云等等。云灾备的主要产品形态:云备份与恢复 公有云备份和恢复
16、可选择私有云+公有云平台+三大运营商云平台的方案。私有云备份和恢复可与企业现有的私有存储对接,或二次开发整合到企业现有 IT 资源中。混合云备份和恢复:灾难恢复一般采用主从架构。一些用户(通常是行业用户)会把核心应用放到私有云上,然后将非核心应用或者创新应用部署在公有云;另外一些用户出于安全等因素的考虑,将业务数据放在私有云,而将应用运行在公有云上。场景适合已有公有云和私有云业务或未来计划上云的企业用户。云灾备的主要产品形态:云高可用 本地到云端高可用场景特点是 IT 系统本地运行,实时数据云灾备,图形化监控,异常告警,一旦本地出现故障,用户可以进行一键切换或者自动切换,实现云平台与本地实现无
17、缝的业务连续性接管。云端到云端高可用场景特点是在按需分配的基础上,通过云端与云端的灾备,既可大大节省建立多个专有灾备中心的费用,又可享受海量存储和高性能云计算的服务。灾备技术及行业未来发展趋势云灾备将成为主要形势之一 在 Gartner 最新发布的魔力象限表明,当前的数据备份及恢复应用呈现出可以针对数据中心的各类负载的备份及恢复工作趋势;备份及恢复服务供应商对云环境的亲和性、对于云环境的适应能力以及在满足数据中心工作的可扩展性等方面都成为未来该领域的竞争热点。智能化成为灾备的下一个趋势 灾备带宽智能化:用户可以根据需要自动调节带宽的多少;灾备计算智能化:智能化灾备可以快速对 CPU 的数据进行
18、增减,以匹配生产端的业务应用;业务切换的智能化:智能灾备可以监测到业务的停止需不需要切换,让切换更加智能,并且在灾备演练和客户真实发生故障时,都能够达到秒级高可用切换。政府信息化云灾备案例 首先在本地服务中心与本地灾备数据中心之间建立应用高可用保护,数据通过实时同步传输至本地灾备数据中心,然后在本地灾备数据中心与云平台建立云灾备保护,通过在云平台上部署的虚拟机建立对本地灾备数据中心灾备服务器的一对一式的保护,当本地灾备数据中心出现服务器故障或者数据丢失时,可快速从云平台将数据恢复,同时云平台也可将数据恢复至本地服务中心。云灾备建立“两地三中心”模式:应用级高可用灾备系统实现应用级与实时数据级的双重保护。