云計算、虛擬化技術廣泛運用的今天,為業務進行和維護帶來方便的同時,數據中心也面臨各種威脅和風險。云祺根據全球業務中斷事件,以及真實案例總結出,常見的導致數據中心業務中斷的三大原因。
一 硬件故障
包括服務器/存儲宕機、Raid系統停止工作、內存虛擬驅動器受損等原因。
某云服務商因硬件故障導致服務器不可用數據丟失,聯系服務器提供商和多家專業數據恢復公司緊急恢復后,仍多次恢復失敗,最后確認數據無法恢復。
隨著硬件系統發展的成熟度,針對硬件冗余方案較完善,比如雙機熱備、存儲雙活、虛擬化方式等,因硬件故障發生業務中斷的事件概率不斷下降。
二 邏輯錯誤
邏輯錯誤又包括了軟件原因和人為原因。軟件原因有應用系統出現錯誤、文件系統崩潰、數據庫邏輯故障、病毒入侵等。人為原因有數據誤刪除、虛擬設備被刪除、惡意操作等。
某銀行電腦脫機致網絡癱瘓,業務中斷三小時;某公司被勒索病毒入侵,巨額勒索金額下,不得不“犧牲”業務數據;某云服務商遭員工惡意刪除數據庫,影響百萬用戶,預計賠付1.5億元…
邏輯錯誤是導致數據丟失、業務中斷事件發生的重要原因。
三 自然災害
比如發生火災、地震、暴雨等意外與自然災害。
亞馬遜位于弗吉尼亞的US-East-1數據中心因為一場風暴導致業務癱瘓,由于數據中心停止運行,亞馬遜的云服務Amazon Web Services也因此一度中斷服務;某學校機房在一場連續暴雨中意外進水,數據中心直接被毀…
此類事件發生概率小,但具有無法預測性,且一旦發生則是無法挽救。
總結以往業務中斷的安全事件就能發現,一旦數據中心因各種原因造成業務中斷的情況發生,將嚴重影響企業業務的正常運營,不僅使用戶體驗差,影響企業品牌聲譽,甚至可能導致直接經濟利益損失。無論是獨受其害還是波及他人,企業的業務中斷和數據丟失帶來的損失都是不可估量的。
所以如何保證數據中心的業務連續運營是數據中心管理者們首先要考慮的重要問題。那么如何才能有效保證數據中心的業務連續性?云祺建議:
一 建 立 專業的 容災備份 系統
信息系統屬于企業重要的信息基礎設施,對于信息系統安全、數據安全,災備是最基礎的技術需求,幾乎所有的信息資產都需要災備保護,以確保在任何意外故障情況下,信息系統的正常運轉。云祺為重要業務系統提供虛擬機、數據庫、文件的定時備份、實時備份、異地備份、恢復等容災備份解決方案,保障用戶業務系統高可用。

二 定期災難恢復演練
從用戶終端到服務器、存儲器、甚至包括機房環境,需要做定期災難恢復演練。災備預案、預案演練、預案維護,風險和災難規避評估、確定整體恢復策略,通過這些活動可以將數據中心業務中斷的風險有效降低。
云祺容災備份解決方案在生產環境中構建一個隔離的、可驗證的災難恢復演練區域,在不影響現有生產環境的前提下,用戶可將多個已備份的級聯關鍵業務虛擬機配置到同一個災難演練預案中,通過可視化的配置和操作即可快速的執行整個災難演練計劃,從而確保了災難發生時,能夠正確的恢復關鍵業務,同時實現備份數據的完整性、一致性、可用性驗證。

建立專業、可靠的災備系統和業務連續性體系不僅僅是規范企業自身的IT建設,更是用戶除了產品質量需求以外,對企業服務質量又一重要訴求。