越來越多的行業用戶選擇利用云計算技術構建自己的數據中心,但業務集中、數據集中的同時,也意味著風險的集中。
一旦發生數據中心人為誤操作、網絡故障甚至災難時,企業及分支機構將無法對外提供服務,甚至關鍵數據也會丟失。
從GitLab事件看企業災備現狀
去年,全球知名的開源托管服務平臺GitLab數據丟失事件可能大多數人還印象深刻,因為缺乏完善的災備方案,人為誤刪數據庫致使系統宕機,并且長時間無法恢復。慶幸的是,運維工程師利用一次偶然產出的LVM快照,使數據得以恢復到6個小時之前的狀態,但中間丟失的那部分數據對用戶的潛在影響是無法用數字衡量的。
事實上,缺失災備方案的并不只有GitLab,諸多企業均存在類似的情況。由于成本和技術等原因,企業只應用傳統的本地備份方案,并且通常只針對企業重要的業務數據(數據庫、電子郵件等)進行備份,而不對操作系統及應用程序進行備份。故障發生后,需要耗費大量的時間在備份文件的導入恢復和配置上。業務恢復周期長、操作復雜,很多企業在做了災備方案后,卻束之高閣,無法應用。
因此,如何以更高的性價比實現企業業務連續性,平衡風險、效率與成本,是當前企業用戶的迫切期望。
企業災備建設需要“因地制宜”
不同類型的風險其影響程度、發生概率和造成的損失大小是不同的, 在討論企業災備建設方案之前,可以將企業各信息系統所面臨的風險因素、概率、影響和應對手段進行分析,以便于企業根據風險的抵御能力以及應用系統的重要程度,評估如何采取相應的災備措施來減低各種風險和威脅可能帶來的影響和損失。

企業信息化風險評估與應對措施
根據上面的分析,基于不同的風險抵御能力,災備的建設分為兩個維度、四個層次:
- 數據維度(本地、異地)
- 業務維度(同城連續性、異地連續性)
企業應用云計算技術之前,災備的建設更多還是解決數據層面的問題,主要是利用傳統存儲設備的數據復制特性,由存儲設備統一完成上層業務(包括數據庫系統)的跨地域數據復制。但因為技術綁定和所有業務系統共吃一個”大鍋飯”的原因,建設成本高昂,災備效率不高,兼容性和數據一致性也存在一定的風險,并且由于只是數據級的復制,依舊無法解決數據備份和業務恢復復雜度高的問題。
那么,如何應用云計算技術解決這些問題,并且構建業務維度的災備體系呢?
建設以云計算技術為核心的業務連續性災備架構
首先對云計算技術進行定義,參考目前大型互聯網公司,例如Google、Facebook、阿里、騰訊的基礎設施架構和應用架構,深信服認為下一代IT架構應該具備基礎設施超融合、應用系統集群化兩大特征。云計算技術就是支撐這兩大關鍵特征的平臺技術,例如分布式、虛擬化、應用編排、流量分發等。具備這樣技術能力的數據中心可以稱之為云數據中心。
其次,在數據中心領域,通常會從兩個方面去考慮業務可用性的實現:
1)重新定義數據中心架構,尤其針對傳統集中式架構的業務系統,例如傳統ERP系統。此類系統非常關鍵,架構無法輕易變動,需要在基礎架構層面去實現高可靠和高可用。
由于云數據中心的超融合基礎架構本身就具備高度容錯能力,以深信服企業級云的超融合基礎架構為例,基礎架構支持數據多副本、數據持續保護、虛擬機HA、支持數據庫集群化部署等多種高可靠機制。因此,對于此類傳統業務的業務連續性,重點考慮的是業務跨站點數據復制和業務切換的設計。
2)重新定義應用架構,使之具備分布式能力,通過應用層集群和流量分發技術構建業務雙活,甚至多活能力,同時基于云計算資源池化、統一編排等能力,資源調配可以非常靈活,擴展也會非常容易。
因此,深信服認為云數據中心災備建設的核心在于如何構建一個彈性安全可靠的基礎架構去支撐分布式的業務集群,如何基于業務要求選擇合適的數據復制方式,如何對多個數據中心進行業務和流量感知,如何在出現故障時能夠統一地進行災備切換。
由此,得出了以業務連續性為中心的云數據中心災備參考架構:

首先,云數據中心通過超融合基礎架構以軟件定義的方式進行構建,超融合實現了物理拓撲的架構極簡,硬件上只有x86服務器和交換機,所有的資源承載節點都是x86服務器,所有的網絡通道都是以太網絡,包括其中的存儲網。超融合基礎架構本身就具備高度的容錯能力,例如虛擬存儲的多副本機制、虛擬機HA、虛擬負載均衡等。
其次,在參考架構中設計全局負載均衡和服務器負載均衡,對多個數據中心進行業務感知與流量分發,可以根據不同的性能需求選擇用物理方式或者虛擬網元方式進行部署?;谪撦d均衡實現數據中心流量切換智能化,出現故障時能夠統一進行災備切換。
數據中心數據復制路徑基于IP網絡,很容易實現通道冗余,降低成本,基于虛擬化環境的副本同步機制,從基礎架構層面保證數據可靠。針對結構化和非結構化數據特點,采用獨立的數據復制方式,并進行統一管理,高效低成本,也避免了單一基于底層存儲復制技術的技術風險。通過評估業務對連續性的要求、分析數據中心間的網絡狀況等因素,合理選擇同步或異步方式實現主備或雙活。
這樣的參考架構,更容易實現應用高性能、高可用的目標,降低IT投入成本,同時也可以平滑支撐應用架構的演進。
寫在最后
災備建設是一個復雜的系統工程,深信服云IT秉承簡單、穩定、安全、易用的產品宗旨,以業務為中心,融合多種災備技術到企業云管理平臺內,提供了面向海量虛擬機備份的數據備份、面向關鍵業務的持續數據保護、異地災備、VMware災備、公有云災備等多個解決方案,用戶可根據自己的業務特點,靈活地選擇合適的災備方式。
在不遠的將來,深信服企業級云平臺將內置災備云服務,已經使用深信服企業級云的用戶可以像使用蘋果手機iCloud服務一樣輕松享受災備服務,將關鍵業務的關鍵數據一鍵式備份到云端。
深信服除了提供自身產品的完善災備解決方案外,還與業界優秀的廠商進行生態合作,對Veritas、愛數、火星高科等廠商的災備產品都進行了兼容性測試或認證,消除用戶的后顧之憂。