2014年1月14日 星期二

[網路管理] 淺談集中式資料備份的方式與規劃的注意事項

Reference:http://www.ringline.com.tw/index.php/zh/support/techpapers/storage/140-2009-08-23-08-46-37.html

淺談集中式資料備份的方式與規劃的注意事項
前言
通常一提到資料的備份,腦海當中顯現出來的情境大略就是有幾台伺服器主機,藉由網路聯結在一起,然後在伺服器主機安裝設定備份系統管理軟體,以及磁帶機或磁帶館,接下來設定好備份的政策,最後就讓備份管理系統自動化進行資料的備份,系統管理只要每天看看備份記錄是否正常,…,這是一般的資料備份作業方式。可是當系統發生故障或是使用者需要之前的資料,而必須請系統管理人員進行還原先前備份的資料時,資料真的可以還原回來嘛?成功率有多高呢?相信答案真的有如「冬天飲水,冷暖自知」。


通常一般的資訊單位在採購備份系統前,會請一些系統供應商提供建議,甚至要求實機測試,可是這樣的程序並不能保證備份系統建置之後,真的可以符合日後的作業需求。有鑑於此,在規劃與設計一個完善的資料備份解決方案時,必須要考慮一些實際的狀況以及未來可能會面臨的狀況,以便購置的備份系統軟硬體設備可以發揮其投資效益:快速且安全的完成資料的備份、迅速且精準的還原所需的資料。接下來,本文將說明目前常見的資料備份方式,並討論在規劃資料備份方案時,應該要注意的事項。


一、規劃的考慮事項


1.RPO 與 RTO

(1)RPO (Recovery Point to Object)
RPO是指當災害發生時,系統或資料必須回復的時間點;或是指,當災害發生時,系統或資料可允許的停機或停用的時間。例如,某企業的電子商務系統,若是其資料庫主機的資料發生損毀時,必須要在30分鐘之內回復到正常的作業,所以這個30分鐘就是RPO。


(2) RTO (Recovery Time to Object)
RTO是指當災害發生時,所採用的系統復原工具設備或解決方案,可讓系統或資料復原到可正常運作的狀況時,所需花費的時間。市面上存在著許許多多的系統或資料復原的工具設備,當您要選擇一種適合的解決方案時,必須要看這些設備或方案是否符合RPO的需求。
由於現在企業e化的程度越來越廣,所以通常會存在有多種不同的應用系統,而試問:是否所有的應用系統其RPO都一樣?答案是否定的。以上面的例子而言,某企業的電子商務系統是關係著該企業的營業收入,因此,它的停機時間長短必定會影響到營業收入、商譽…等,更嚴重的情況,甚至會導致該企業永遠停業。所以,它的RPO必定是非常短的,甚至會要求到『Non Stop』的狀況。另外,該企業的人力資源系統,相對而言,可允許的停機時間就比較長,甚至可以達到數天之久。


2.現有的主機環境
在規劃一個資料備份方案的時候,必須要瞭解有哪些主機要做資料的備份,這些主機是安裝哪一種作業系統(含版本、Patch),它上面安裝哪一種資料庫或應用軟體(含版本、Patch),這些主機的服務或用途,這些主機可允許的最長停機時間,這些主機的資料容量,甚至是每日或每週的資料增加量,這些主機的廠牌型式,CPU數量,記憶體容量等。建議以表列的方式加以記錄,例如下表所示。


主機名稱
/用途
作業系統
/版本
資料庫 /
版本
CPU
記憶體
磁碟容量
/使用量
每週資料增量比率
RPO
DB01/ERP
RHEL 3.0
Oracle 10g R2
Xeon 3.0 x 2
4GB
500GB / 90GB
5%
30分鐘
DB02/PDM
RHEL 3.0
Oracle 9i
Xeon 3.0 x 4
8GB
2TB/ 500GB
10%
30分鐘
Mail_01
Win2003
Exchange 2000
Xeon 3.0 x 2
2GB
300GB /
60GB
8%
1小時
RDFS_01
FAS3020C
DataONTAP
7.0



4TB / 950GB
13%
10分鐘
AP01/ERP
Win2003
WebLogic
Xeon 3.0 x 1
1GB
288GB/
40GB
N/A
1小時

AP02/ERP
Win2003
WebLogic
Xeon 3.0 x 1
1GB
288GB/
40GB
N/A
1小時

AP03/ERP
Win2003
WebLogic
Xeon 3.0 x 1
1GB
288GB/
40GB
N/A
1小時
 

3.依據RPO的需求,選擇合適的解決方案

以上述的案例而言,由於Oracle資料庫、電子郵件系統、研發單位的資料皆集中儲存在NetApp FAS3020C設備上,而且實際的儲存容量已經多達1,600GB,而且其RPO皆很短的時間,因此若採用傳統的Host-bases備份解決方案的話,資料的回復時間實在無法符合需求。但若是以Storage-based的備份解決方案,透過Storage的快照技術,比較可以符合RPO的要求 (註:有關Host-based與Storage-based的資料備份解決方案,將在下個章節介紹說明)。


4.解決方案軟硬體設備與現有主機環境的支援性比對(support matrix)通常資料備份解決方案的原廠,皆會提供其軟硬體設備的支援性比對(support matrix)資料,以比對軟體設備與欲執行備份作業的主機系統之間的相容性。有些設備廠商僅提供它所支援的作業系統、應用軟體的名稱與版本;有的設備廠商則會提供更為詳細的資料,甚至作業系統與應用軟體的patch版本都有,因此可在評估之前,加以考慮。


5.制定資料備份政策
備份政策所指的是,在一個自動化的備份環境當中,針對欲備份的主機資料,預先設定其備份排程、備份資料如何存放在媒體、備份型態(全備份、差異性備份、增量備份)的設計、媒體的保存周期(Retention period)等等。一個完善
的備份政策,不但可減少系統管理人員在資料備份作業的管理複雜度,並可進一步提高資料還原的成功率。


6.資料還原驗證與定期演練計畫
一般的使用者通常都認為只要安裝設定好所購置的資料備份軟體設備,然後備份作業進行正常,就以為該資料備份解決方案已經完成。但事實是如此嘛?答案是不一定的!因為沒有經過完整資料還原驗證的備份資料,充其量只能說僅完成了一半。


依照實際的經驗而言,系統管理人員縱使在完成資料備份解決方案的安裝設定,並且執行完相關的教育訓練,若是沒有進行之後定期的資料還原驗證計畫,通常在發生資料損毀而必須將已備份的資料加以還原時,常常會有手忙腳亂且不知所措的窘境發生。
為了避免這種情況發生,筆者在此建議,一但資料備份解決方案建置完成並上線之後,必須要執行定期的資料還原作業,以便對往後實際的狀況進行備份政策的調整,甚至針對各種可能發生資料損毀的災害,進行災害演練計畫。


二、資料備份的方式介紹
以下就市面上常見的幾種資料備份方式加以說明;


● Host-Based備份解決方案

1.LAN-based Backup
是集中式備份方案的入門型解決方案,主要就是將備份管理軟體,安裝在欲備份的主機系統上,而所有的備份作業皆由另一台備份伺服器主機所控制,而且備份的媒體(通常是磁帶機會磁帶櫃)也裝置在這台備份伺服器主機上。其參考架構如下:


備份作業的資料流:
➀備份伺服主機下指令給備份客戶端
➁備份客戶端的代理程式再將指令下給資料庫備份的代理程式
➂資料庫備份的代理程式則呼叫資料庫軟體的儲存介面管理程式(例如:Oracle的RMAN、MS SQL Server的VDI)
➃透過資料庫軟體的儲存介面管理程式去讀取欲備份的資料檔案與交易記錄檔
➄這些備份的資料則由備份客戶端透過網路傳送到備份伺服器主機,再寫入磁帶機或磁帶櫃當中。


2.LAN-free Backup
是集中式備份方案的進階型解決方案,也是將備份管理軟體,安裝在欲備份的主機系統上,但是備份的媒體則是分享給備份客戶端使用,而且備份資料流則是透過儲存網路(Storage Area Network, SAN)來加以傳遞,所以也稱為SAN Backup。其參考架構如下:


備份作業的資料流:
➀備份伺服主機下指令給備份客戶端
➁備份客戶端的代理程式再將指令下給資料庫備份的代理程式
➂資料庫備份的代理程式則呼叫資料庫軟體的儲存介面管理程式(例如:Oracle的RMAN、MS SQL Server的VDI)
➃資料庫軟體的儲存介面管理程式透過儲存網路去讀取欲備份的資料檔案與交易記錄檔
➄這些備份的資料則由備份客戶端透過儲存網路寫入磁帶機會磁帶櫃。



3.Off-Host Backup
備份客戶端主機預先安裝了資料磁區管理軟體(Volume Manager)與備份軟體,由磁區管理軟體針對其儲存設備上的線上磁區(Primary volume)產生鏡射磁區的複本,再由備份軟體呼叫磁區管理軟體將鏡射磁區複本分離,並且由備份伺服主機掛載此鏡射磁區複本,並寫入磁帶機或磁帶櫃當中。與上述的LAN-free備份不同的是,由於備份的資料並沒有透過備份客戶端主機加以傳遞,因此它不會對備份客戶端主機的I/O產生額外的負擔,所以才稱之為「Off-Host Backup」,此時的Host是指備份客戶端主機而言。其參考架構如下:

 
備份作業的資料流:
➀備份客戶端主機預先透Volume Manager磁區管理程式,針對主要的資料磁區產生第二份或第三份的鏡射磁區複本。通常第二份鏡射複本作為主要磁區的備援,第三份鏡射複本則作為備份或其它的用途。
➁備份伺服主機下達備份作業的指令給備份客戶端主機。
➂備份客戶端的代理程式程式呼叫磁區管理程式,將鏡射複本與主要磁區加以分離。
➃已經被分離的鏡射複本則由備份伺服主機透過儲存網路掛載。
➄備份伺服主機再將所掛載的鏡射複本寫入磁帶機或磁帶櫃。


● Storage-Based備份解決方案
所謂Storage-Based的備份解決方案,主要是因為欲備份的系統主機(Production Server)扮演著非常關鍵的任務角色,而且資料儲存容量非常多,為了有效縮短備份作業所需的時間,以及減低系統主機效能受備份作業影響的程度,所以充分運用儲存設備所提供的時間點資料快照備份(Point-in-Time Copy, PiTC)功能,以滿足此關鍵任務主機的資料備份需求。

1.Server-less Backup
此種備份的架構與上述的Off-Host Backup非常類似,最大的差別主要是主要的資料磁區複本所產生的方法不同。由於目前市面上高知名度的磁碟陣列供應商幾乎都有針對該公司的磁碟陣列設備,提供了時間點資料快照備份 (PiTC)功能,所以這個功能可透過與備份軟體的結合,提供給用戶一可快速有可靠的資料備份解決方案。目前主要的磁碟陣列供應商與旗下的產品線有提供此種功能的主要有:EMC公司Symmetrix系列的TimeFinder®、HDS公司Lightning 99XX系列與USP、NSC系列的ShadowImage®、Sun Microsystems公司StorEdge 99XX系列的ShadowImage®、以及HP公司XP系列的Business Copy®。
Server-less Backup參考架構如下:



備份作業的資料流:
➀Oracle資料庫主機針對Storage的Third mirror / snapshot volume維持控制的狀態
➁備份軟體的Server-Free代理程式呼叫Oracle資料庫,並且下指令給Storage,將Third mirror / snapshot volume進行分離
➂備份主機將與Oracle資料庫進行邏輯磁碟物件比對(Logical Disk Object Mapping)的動作,連結邏輯的檔案名稱(logical file names)與實際的資料區塊(physical data blocks),以確保資料的正確性。
➃Oracle資料庫主機的Server-Free代理程式會藉由「SCSI Extend Copy」功能進行資料的搬移,將Storage上的third mirror / snapshot volume傳送到備份磁帶設備上。
➄當備份作業執行完畢,備份軟體將會通知Oracle資料庫主機,並且由Oracle下指令給Storage重新建立third mirror / snapshot volume與原來mirror之間的資料同步,讓third mirror / snapshot volume的內容更新到最新的狀態。


2.NetApp’s solution
NetApp公司的Storage有著專利的Snapshot資料快照技術,並且支援NDMP (Network Data Management Protocol)的協定,所以若要在短時間內完成資料的備份與還原,NetApp的儲存設備提供了最佳的方案。




由於資料庫主機的資料儲存在NetApp Filer Storage當中,一旦要執行備份作業時,Filer Storage就扮演著NDMP Host的角色,將儲存的資料直接透過NDMP協定傳送到磁帶櫃當中,而且備份的作業並不會對線上主機以及網路頻寬產生任何的效能影響。


結論
隨著企業e化的程度逐漸加深,如何完善的保護企業珍貴的數位化資產,並且在災害發生時,可以快速的加以還原,是企業資訊單位必須面對的重要課題。有鑑於此,本文介紹了目前市面上大部份的資料備份與還原解決方案,並且提出了在規劃資料備份與還原方案時,必須考慮的事項。以上的這些論點是一個基本的架構論述,因為企業所存在的應用系統是多樣化的,因此在實際規劃的情況下,所要考慮的事項可能還會更加的細微,架構方面也可能會更加的複雜。







(作者現任職於麟瑞科技)

沒有留言:

張貼留言