快照
在媒體對持續數據保護(Continuous Data Protection,CDP)解決方案的報道迅速升溫后,最終用戶也受到CDP即時數據恢復和零數據損失的吸引,但是有一個問題還有待于回答:CDP與快照的區別是什么?選擇的依據是什么?
從表面上看,這兩種數據保護方法有很多共同之處。但是仔細對比之后,會發現一些重大差別。
根據全球網絡存儲工業協會(SNIA)的定義,快照(Snapshot)是對出現在特定時刻的數據的復制。換句話說,快照是一個數據集的靜態圖像,這個數據集可以是一個處于特定時刻的Oracle數據庫或家用文件系統。
快照的工作原理
很多快照功能都可以歸入兩個大類之一:全復制或差別復制。
全復制快照復制整個數據集。全復制快照常常通過稱為鏡像分離的流程來實現,3TB 數據庫的全復制快照占用額外的3TB磁盤空間。
差別復制快照僅處理上次快照之后出現的增量。這類快照占用較少的磁盤空間,但是需要更多的系統處理開銷。差別快照技術有幾種實施方式,如寫即復制(CoW)、寫即重定向(RoW)和隨處寫(WA)。
這兩種快照方法的重要區別在于存儲成本和性能。此外,因為全復制快照不依賴于主數據,所以這種方法往往使某些類型的數據損壞更容易恢復。
快照價值主張
備份窗口
快照可以迅速建立,并可用作傳統備份和歸檔的數據源。因為宕機或應用中斷窗口縮小為快照建立所需時間,所以快照可以縮小或消除備份窗口。
恢復窗口
快照存儲在磁盤上,而磁盤可以快速直接存取,這與磁帶較慢的流式存取完全不同。從磁盤恢復比從磁帶恢復速度快,而且就差別復制快照而言,還無需復制整個數據集;謴退钑r間常常稱作恢復時間目標(RTO)。
多個恢復點
很多時候由于快照建立時刻延遲而使數據損壞無法恢復。中午時刻建立的快照對于發生在上午11:59的數據損壞毫無用處。因此,有靈活和頻繁的恢復點、或稱恢復點目標(RPO)是很重要的?蛻粲袝r對快照進行旋轉,以獲得更高的RPO粒度。但是快照增多的代價是極大地提高成本。
重新確定數據用途
用戶常常要執行輔助操作,這些操作在生產系統上進行太昂貴或容易引起混亂。這些輔助操作可能包括歸檔之前的審計、報告、應用或升級測試、數據挖掘,等等?煺諡檫@些操作提供一份接近實況數據的拷貝。
CDP
“持續數據保護”中的關鍵詞是持續。就給定數據集而言,CDP提供一個恢復點的連續體,能夠存取任何時間點上的數據,而不僅針對那些由快照流程預先確定的特殊時刻。CDP允許應用恢復到特定事件之前,而不是恢復到預先確定的時間點上;謴忘c在事件發生后選定并動態重建。
CDP提供粒度無限的恢復點(RPO),有些情況下可以提供接近即時的恢復時間(RTO)。這是因為,一般情況下,一有寫操作就進行CDP保護。每一次數據修改都記錄在案,恢復可以發生在任何時間點,時間點的劃分可以一直細化到單個寫操作。
微粒度恢復
CDP保護的一個重要優點是其微粒度性。對單個時間點圖像的復制操作由于沒有其他選擇,就整個數據集而言缺乏微粒度性。有些復雜的方法可以用來實現一致性,但是在大多數情況下,單個時間點技術不具有微粒度性。這意味著,要建立一個恢復點,應用一定會受到影響。獲取快照時,應用一般以某種方式置于靜態。這個過程很復雜,而且容易引起故障。
基于CDP的恢復具有微粒度性,這種方法可提供一個完整的數據集,無論應用在恢復時是否是靜態的,數據集都可以恢復。這種能力常常稱為緊急事故一致恢復,與容錯和高可用性系統中采用的恢復模式相同。
由于與生俱來的微粒度性,CDP可以實現非常強大和易用的恢復流程。
恢復效率
有些CDP方案允許其RPO選項隨著時間的推移向下移交。任意時間點恢復按照政策提供給一組時間段,而較靠后的時間段只能從專門存儲的恢復點恢復。具有這種能力的CDP系統可以延展自己的恢復時間表,同時降低存儲容量需求。
CDP價值主張
備份窗口
與快照類似,CDP去除了備份窗口。與大多數快照不同的是,CDP這么做是自動的,無需應用交互或干預。由于CDP恢復具有動態和非破壞性的特點,所以用戶能夠在不損壞內容完整性的前提下審計備份。
與快照不同,CDP圖像不是必須預先確定、管理和存儲的單個固定時間點上的圖像。CDP圖像可以隨意建立,因此允許在寬得多的范圍內執行備份操作。例如,有了CDP系統,就可以在審計了午夜時數據的狀況和可恢復性后,于早上7:00運行午夜備份;或者僅僅因為它允許日班人員執行備份而這樣做。
恢復窗口
就恢復而言,CDP系統分成兩類。第一類提供虛擬化恢復,這意味著接近即時的恢復。虛擬化恢復允許在應用數據可用后,即在客戶系統重新上線和運行后,處理此次恢復的數據移動任務。從恢復時間目標的角度看,沒有比提供虛擬化恢復的CDP產品速度更快的產品了。
另一類是大家熟知的定向恢復,也叫作向后或向前滾動恢復。這種恢復方法利用寫操作的改寫或重新運行記錄及時將應用數據送回來。這種恢復的恢復時間取決于恢復操作要回溯的時間有多長,但是一般情況下,與快照恢復時間相同或比其快得多?煺栈謴蜁r間取決于快照利用差別復制的能力。
多個恢復點目標
CDP提供無限個RPO,而快照系統提供的是單個RPO。有些廠商建議,通過建立多個快照來獲得類似CDP的RPO能力。這一般來說是沒有吸引力的,因為每個快照都是需要建立(在應用的干預下)、存儲和管理(并非微不足道而且昂貴)的另一個目標。換句話說,快照要求用戶在故障發生前預先確定可能的恢復點,然后管理每一個預先確定的點。CDP允許用戶動態重建以前的任何數據點,而且是在故障發生后,因此恢復點可以確定在緊挨著故障發生的那一刻。
此外,大多數CDP解決方案都具有用數據歷史上的特定事件或特殊時刻解釋時間表的能力,這使用戶能夠恢復到任何特定的時間點,以及恢復出在這些標定時間之間的任何數據。
重新確定數據用途
CDP提供微粒度數據集,能以比快照高得多的靈活性重新確定數據的用途。CDP是動態建立數據圖像的,數據圖像可以反復重建,可以不受主線數據影響進行審計、保存和歸檔,還可以用作單個解決方案,向多個重新確定用途的活動提供數據。
CDP已經走出了媒體宣傳的紙上談兵階段,很多主流數據中心都已經定期使用CDP了。因為CDP擁有所有快照固有的優點,又比快照具有更細的粒度,恢復時間也短得多。
如果零宕機時間和零數據損失是你的目標,那么CDP是惟一選擇
文章來源于領測軟件測試網 http://www.kjueaiud.com/