容災

容災

建立的兩套或多套功能相同的IT系統
容災系統是指在相隔較遠的異地,建立兩套或多套功能相同的IT系統,互相之間可以進行健康狀态監視和功能切換,當一處系統因意外(如火災、地震等)停止工作時,整個應用系統可以切換到另一處,使得該系統功能可以繼續正常工作。容災技術是系統的高可用性技術的一個組成部分,容災系統更加強調處理外界環境對系統的影響,特别是災難性事件對整個IT節點的影響,提供節點級别的系統恢複功能。
    中文名:容災 外文名: 所屬學科: 分類:數據級容災、應用級容災 環境:相隔較遠的異地 方法:建立兩套或多套功能相同的IT系統

指導文件

2005年4月,國務院信息化工作辦公室正式向信息産業部、廣電總局、中國人民銀行、鐵道部、稅務部、民航總局、海關總署、證監會、保監會、國家電網公司下發了《重要信息系統災難恢複指南》。

該指南主要從災難恢複規劃的管理、災難恢複的需求分析、災難恢複等級的确定、災難恢複等級的實現、災難恢複預案的制訂、落實和管理等方面,對災難恢複的規劃和準備活動的規範化要求進行全面描述。

《重要信息系統災難恢複指南》還以規範性附錄的形式對災難恢複的等級劃分進行了描述,并以災備資料性附錄的形式對災難恢複預案的框架進行了說明。

2007年7月,國務院信息化工作辦公室領導編制的《重要信息系統災難恢複指南》正式升級成為國家标準《信息系統災難恢複規範》(GB/T20988-2007)。這是中國災難備份與恢複行業的第一個國家标準,并于2007年11月1日開始正式實施。

容災備份的關鍵技術

在建立容災備份系統時會涉及到多種技術,如:SAN或NAS技術、遠程鏡像技術、基于IP的SAN的互連技術、快照技術等。這裡重點介紹遠程鏡像、快照和互連技術。

1.遠程鏡像技術

遠程鏡像技術是在主數據中心和備援中心之間的數據備份時用到。鏡像是在兩個或多個磁盤或磁盤子系統上産生同一個數據的鏡像視圖的信息存儲過程,一個叫主鏡像系統,另一個叫從鏡像系統。按主從鏡像存儲系統所處的位置可分為本地鏡像和遠程鏡像。遠程鏡像又叫遠程複制,是容災備份的核心技術,同時也是保持遠程數據同步和實現災難恢複的基礎。遠程鏡像按請求鏡像的主機是否需要遠程鏡像站點的确認信息,又可分為同步遠程鏡像和異步遠程鏡像。

同步遠程鏡像(同步複制技術)是指通過遠程鏡像軟件,将本地數據以完全同步的方式複制到異地,每一本地的I/O事務均需等待遠程複制的完成确認信息,方予以釋放。同步鏡像使拷貝總能與本地機要求複制的内容相匹配。當主站點出現故障時,用戶的應用程序切換到備份的替代站點後,被鏡像的遠程副本可以保證業務繼續執行而沒有數據的丢失。但它存在往返傳播造成延時較長的缺點,隻限于在相對較近的距離上應用。

異步遠程鏡像(異步複制技術)保證在更新遠程存儲視圖前完成向本地存儲系統的基本操作,而由本地存儲系統提供給請求鏡像主機的I/O操作完成确認信息。遠程的數據複制是以後台同步的方式進行的,這使本地系統性能受到的影響很小,傳輸距離長(可達1000公裡以上),對網絡帶寬要求小。但是,許多遠程的從屬存儲子系統的寫沒有得到确認,當某種因素造成數據傳輸失敗,可能出現數據一緻性問題。為了解決這個問題,目前大多采用延遲複制的技術(本地數據複制均在後台日志區進行),即在确保本地數據完好無損後進行遠程數據更新。

2.快照技術

遠程鏡像技術往往同快照技術結合起來實現遠程備份,即通過鏡像把數據備份到遠程存儲系統中,再用快照技術把遠程存儲系統中的信息備份到遠程的磁帶庫、光盤庫中。

快照是通過軟件對要備份的磁盤子系統的數據快速掃描,建立一個要備份數據的快照邏輯單元号LUN和快照cache。在快速掃描時,把備份過程中即将要修改的數據塊同時快速拷貝到快照cache中。快照LUN是一組指針,它指向快照cache和磁盤子系統中不變的數據塊(在備份過程中)。在正常業務進行的同時,利用快照LUN實現對原數據的一個完全的備份。它可使用戶在正常業務不受影響的情況下(主要指容災備份系統),實時提取當前在線業務數據。其“備份窗口”接近于零,可大大增加系統業務的連續性,為實現系統真正的7×24運轉提供了保證。

快照是通過内存作為緩沖區(快照cache),由快照軟件提供系統磁盤存儲的即時數據映像,它存在緩沖區調度的問題。

3.互連技術

早期的主數據中心和備援數據中心之間的數據備份,主要是基于SAN的遠程複制(鏡像),即通過光纖通道FC,把兩個SAN連接起來,進行遠程鏡像(複制)。當災難發生時,由備援數據中心替代主數據中心保證系統工作的連續性。這種遠程容災備份方式存在一些缺陷,如:實現成本高、設備的互操作性差、跨越的地理距離短(10公裡)等,這些因素阻礙了它的進一步推廣和應用。

目前,出現了多種基于IP的SAN的遠程數據容災備份技術。它們是利用基于IP的SAN的互連協議,将主數據中心SAN中的信息通過現有的TCP/IP網絡,遠程複制到備援中心SAN中。當備援中心存儲的數據量過大時,可利用快照技術将其備份到磁帶庫或光盤庫中。這種基于IP的SAN的遠程容災備份,可以跨越LAN、MAN和WAN,成本低、可擴展性好,具有廣闊的發展前景。基于IP的互連協議包括:FCIP、iFCP、Infiniband、iSCSI等。

衡量容災備份的兩個技術指标

RPO(RecoveryPointObjective):即數據恢複點目标,主要指的是業務系統所能容忍的數據丢失量。

RTO(RecoveryTimeObjective):即恢複時間目标,主要指的是所能容忍的業務停止服務的最長時間,也就是從災難發生到業務系統恢複服務功能所需要的最短時間周期。

RPO針對的是數據丢失,而RTO針對的是服務丢失,二者沒有必然的關聯性。RTO和RPO的确定必須在進行風險分析和業務影響分析後根據不同的業務需求确定。對于不同企業的同一種業務,RTO和RPO的需求也會有所不同。

現狀

從去年後半年的一次調查結果來看,每個公司都開始非常認真的應對災難。該調查結果顯示,有74%的受訪者稱他們所在的公司已經有了災難應對方案,這個數值比早先的一些調查結果高。有48%的受訪者表示他們正在對此進行規劃。另外有52%的人表示他們的災備中心是屬于他們自己公司的,而29%的受訪者表示他們的災備中心是租來的。僅有11%的人将他們的災備中心放在雲服務提供商那裡進行托管。

而在兩年前的一項調查中,54%的受訪者表示他們的每兩年會定期測試一下他們的災備計劃,而現在這項指标降為了47%,另外有21%的人表示每年會進行演練而還有24%的受訪者說他們并無定期的災備演練計劃,而這是一項随時可能發起的演習。不管演習的頻率是怎樣的,80%的人表示他們期望應用在24小時内恢複回來,能快速恢複回來當然是不錯的,因為其中有42%的人說他們不能丢失任何的數據。

受訪者同樣表示他們現在越來越能接受災備規劃,同時也表達了他們對雲服務的擔憂。但有人也表達了些他們自己的看法,因為他們的數據從來沒有被恢複過。

常用數據容災軟件

AcronisBackup&Recovery可備份和恢複Windows或Linux服務器。它提供基于磁盤的備份、災難恢複與數據保護,支持磁盤、磁帶或雲端存儲選項、目錄、搜索,以及集中管理。

MoebiusforSQLServer提供了數據庫層面基于事務的雙活技術、災難恢複與數據保護。

著名IT傳媒至頂網(ZDNetChina)的“2016年度數據保護和容災産品獎”花落飛康軟件的數據保護和容災産品ContinuousDataProtector(CDP)和NetworkStorageServer(NSS)9.0。

相關詞條

相關搜索

其它詞條