容灾

容灾

建立的两套或多套功能相同的IT系统
容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。
    中文名:容灾 外文名: 所属学科: 分类:数据级容灾、应用级容灾 环境:相隔较远的异地 方法:建立两套或多套功能相同的IT系统

指导文件

2005年4月,国务院信息化工作办公室正式向信息产业部、广电总局、中国人民银行、铁道部、税务部、民航总局、海关总署、证监会、保监会、国家电网公司下发了《重要信息系统灾难恢复指南》。

该指南主要从灾难恢复规划的管理、灾难恢复的需求分析、灾难恢复等级的确定、灾难恢复等级的实现、灾难恢复预案的制订、落实和管理等方面,对灾难恢复的规划和准备活动的规范化要求进行全面描述。

《重要信息系统灾难恢复指南》还以规范性附录的形式对灾难恢复的等级划分进行了描述,并以灾备资料性附录的形式对灾难恢复预案的框架进行了说明。

2007年7月,国务院信息化工作办公室领导编制的《重要信息系统灾难恢复指南》正式升级成为国家标准《信息系统灾难恢复规范》(GB/T20988-2007)。这是中国灾难备份与恢复行业的第一个国家标准,并于2007年11月1日开始正式实施。

容灾备份的关键技术

在建立容灾备份系统时会涉及到多种技术,如:SAN或NAS技术、远程镜像技术、基于IP的SAN的互连技术、快照技术等。这里重点介绍远程镜像、快照和互连技术。

1.远程镜像技术

远程镜像技术是在主数据中心和备援中心之间的数据备份时用到。镜像是在两个或多个磁盘或磁盘子系统上产生同一个数据的镜像视图的信息存储过程,一个叫主镜像系统,另一个叫从镜像系统。按主从镜像存储系统所处的位置可分为本地镜像和远程镜像。远程镜像又叫远程复制,是容灾备份的核心技术,同时也是保持远程数据同步和实现灾难恢复的基础。远程镜像按请求镜像的主机是否需要远程镜像站点的确认信息,又可分为同步远程镜像和异步远程镜像。

同步远程镜像(同步复制技术)是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的I/O事务均需等待远程复制的完成确认信息,方予以释放。同步镜像使拷贝总能与本地机要求复制的内容相匹配。当主站点出现故障时,用户的应用程序切换到备份的替代站点后,被镜像的远程副本可以保证业务继续执行而没有数据的丢失。但它存在往返传播造成延时较长的缺点,只限于在相对较近的距离上应用。

异步远程镜像(异步复制技术)保证在更新远程存储视图前完成向本地存储系统的基本操作,而由本地存储系统提供给请求镜像主机的I/O操作完成确认信息。远程的数据复制是以后台同步的方式进行的,这使本地系统性能受到的影响很小,传输距离长(可达1000公里以上),对网络带宽要求小。但是,许多远程的从属存储子系统的写没有得到确认,当某种因素造成数据传输失败,可能出现数据一致性问题。为了解决这个问题,目前大多采用延迟复制的技术(本地数据复制均在后台日志区进行),即在确保本地数据完好无损后进行远程数据更新。

2.快照技术

远程镜像技术往往同快照技术结合起来实现远程备份,即通过镜像把数据备份到远程存储系统中,再用快照技术把远程存储系统中的信息备份到远程的磁带库、光盘库中。

快照是通过软件对要备份的磁盘子系统的数据快速扫描,建立一个要备份数据的快照逻辑单元号LUN和快照cache。在快速扫描时,把备份过程中即将要修改的数据块同时快速拷贝到快照cache中。快照LUN是一组指针,它指向快照cache和磁盘子系统中不变的数据块(在备份过程中)。在正常业务进行的同时,利用快照LUN实现对原数据的一个完全的备份。它可使用户在正常业务不受影响的情况下(主要指容灾备份系统),实时提取当前在线业务数据。其“备份窗口”接近于零,可大大增加系统业务的连续性,为实现系统真正的7×24运转提供了保证。

快照是通过内存作为缓冲区(快照cache),由快照软件提供系统磁盘存储的即时数据映像,它存在缓冲区调度的问题。

3.互连技术

早期的主数据中心和备援数据中心之间的数据备份,主要是基于SAN的远程复制(镜像),即通过光纤通道FC,把两个SAN连接起来,进行远程镜像(复制)。当灾难发生时,由备援数据中心替代主数据中心保证系统工作的连续性。这种远程容灾备份方式存在一些缺陷,如:实现成本高、设备的互操作性差、跨越的地理距离短(10公里)等,这些因素阻碍了它的进一步推广和应用。

目前,出现了多种基于IP的SAN的远程数据容灾备份技术。它们是利用基于IP的SAN的互连协议,将主数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备援中心SAN中。当备援中心存储的数据量过大时,可利用快照技术将其备份到磁带库或光盘库中。这种基于IP的SAN的远程容灾备份,可以跨越LAN、MAN和WAN,成本低、可扩展性好,具有广阔的发展前景。基于IP的互连协议包括:FCIP、iFCP、Infiniband、iSCSI等。

衡量容灾备份的两个技术指标

RPO(RecoveryPointObjective):即数据恢复点目标,主要指的是业务系统所能容忍的数据丢失量。

RTO(RecoveryTimeObjective):即恢复时间目标,主要指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。

RPO针对的是数据丢失,而RTO针对的是服务丢失,二者没有必然的关联性。RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定。对于不同企业的同一种业务,RTO和RPO的需求也会有所不同。

现状

从去年后半年的一次调查结果来看,每个公司都开始非常认真的应对灾难。该调查结果显示,有74%的受访者称他们所在的公司已经有了灾难应对方案,这个数值比早先的一些调查结果高。有48%的受访者表示他们正在对此进行规划。另外有52%的人表示他们的灾备中心是属于他们自己公司的,而29%的受访者表示他们的灾备中心是租来的。仅有11%的人将他们的灾备中心放在云服务提供商那里进行托管。

而在两年前的一项调查中,54%的受访者表示他们的每两年会定期测试一下他们的灾备计划,而现在这项指标降为了47%,另外有21%的人表示每年会进行演练而还有24%的受访者说他们并无定期的灾备演练计划,而这是一项随时可能发起的演习。不管演习的频率是怎样的,80%的人表示他们期望应用在24小时内恢复回来,能快速恢复回来当然是不错的,因为其中有42%的人说他们不能丢失任何的数据。

受访者同样表示他们现在越来越能接受灾备规划,同时也表达了他们对云服务的担忧。但有人也表达了些他们自己的看法,因为他们的数据从来没有被恢复过。

常用数据容灾软件

AcronisBackup&Recovery可备份和恢复Windows或Linux服务器。它提供基于磁盘的备份、灾难恢复与数据保护,支持磁盘、磁带或云端存储选项、目录、搜索,以及集中管理。

MoebiusforSQLServer提供了数据库层面基于事务的双活技术、灾难恢复与数据保护。

著名IT传媒至顶网(ZDNetChina)的“2016年度数据保护和容灾产品奖”花落飞康软件的数据保护和容灾产品ContinuousDataProtector(CDP)和NetworkStorageServer(NSS)9.0。

相关词条

相关搜索

其它词条