一、備份軟件的功能和作用
磁帶驅(qū)動器的管理。一般磁帶驅(qū)動器的廠商并不提供設(shè)備的驅(qū)動程序,對磁帶驅(qū)動器的管理和控制工作,完全是備份軟件的任務(wù)。磁帶的卷動、吞吐磁帶等機(jī)械動作,都要靠備份軟件的控制來完成。所以,備份軟件和磁帶機(jī)之間存在一個兼容性的問題,這兩者之間必須互相支持,備份系統(tǒng)才能得以正常工作。
磁帶庫的管理。與磁帶驅(qū)動器一樣,磁帶庫的廠商也不提供任何驅(qū)動程序,機(jī)械動作的管理和控制也全權(quán)交由備份軟件負(fù)責(zé)。與磁帶驅(qū)動器相區(qū)別的是,磁帶庫具有更復(fù)雜的內(nèi)部結(jié)構(gòu),備份軟件的管理相應(yīng)的也就更復(fù)雜。例如機(jī)械手的動作和位置、磁帶倉的槽位等等。這些管理工作的復(fù)雜程度比單一磁帶驅(qū)動器要高出很多,所以幾乎所有的備份軟件都是免費(fèi)的支持單一磁帶機(jī)的管理,而對磁帶庫的管理則要收取一定的費(fèi)用。
備份數(shù)據(jù)的管理。作為全自動的系統(tǒng),備份軟件必須對備份下來的數(shù)據(jù)進(jìn)行統(tǒng)一管理和維護(hù)。在簡單的情況下,備份軟件只需要記住數(shù)據(jù)存放的位置就可以了,這一般是依靠建立一個索引來完成的。然而隨著技術(shù)的進(jìn)步,備份系統(tǒng)的數(shù)據(jù)保存方式也越來越復(fù)雜多變。例如,一些備份軟件允許多個文件同時寫入一盤磁帶,這時備份數(shù)據(jù)的管理就不再像傳統(tǒng)方式下那么簡單了,往往需要建立多重索引才能定位數(shù)據(jù)。
數(shù)據(jù)格式也是一個需要關(guān)心的問題。就像磁盤有不同的文件系統(tǒng)格式一樣,磁帶的組織也有不同的格式。一般備份軟件會支持若干種磁帶格式,以保證自己的開放性和兼容性,但是使用通用的磁帶格式也會損失一部分性能。所以,大型備份軟件一般還是偏愛某種特殊的格式。這些專用的格式一般都具有高容量,高備份性能的優(yōu)勢,但是需要注意的是,特殊格式對恢復(fù)工作來說,是一個小小的隱患。
備份策略制定是一個重要部分。我們知道需要備份的數(shù)據(jù)都存在一個2/8原則,即20%的數(shù)據(jù)被更新的概率是80%。這個原則告訴我們,每次備份都完整的復(fù)制所有數(shù)據(jù)是一種非常不合理的做法。事實(shí)上,真實(shí)環(huán)境中的備份工作往往是基于一次完整備份之后的增量或差量備份。那么完整備份與增量備份和差量備份之間如何組合,才能最有效的實(shí)現(xiàn)備份保護(hù),這正是備份策略所關(guān)心的問題。
還有工作過程控制。根據(jù)預(yù)前制定的規(guī)則和策略,備份工作何時啟動,對哪些數(shù)據(jù)進(jìn)行備份,以及工作過程中意外情況的處理,這些都是備份軟件不可推卸的責(zé)任。這其中包括了與數(shù)據(jù)庫應(yīng)用的配合接口,也包括了一些備份軟件自身的特殊功能。例如很多情況下需要對打開的文件進(jìn)行備份,這就需要備份軟件能夠在保證數(shù)據(jù)完整性的情況下,對打開的文件進(jìn)行操作。另外,由于備份工作一般都是在無人看管的環(huán)境下進(jìn)行,一旦出現(xiàn)意外,正常工作無法繼續(xù)時,備份軟件必須能夠具有一定的意外處理能力。
數(shù)據(jù)恢復(fù)工作。數(shù)據(jù)備份的目的是為了恢復(fù),所以這部分功能自然也是備份軟件的重要部分。很多備份軟件對數(shù)據(jù)恢復(fù)過程都給出了相當(dāng)強(qiáng)大的技術(shù)支持和保證。一些中低端備份軟件支持智能災(zāi)難恢復(fù)技術(shù),即用戶幾乎無需干預(yù)數(shù)據(jù)恢復(fù)過程,只要利用備份數(shù)據(jù)介質(zhì),就可以迅速自動的恢復(fù)數(shù)據(jù)。而一些高端的備份軟件在恢復(fù)時,支持多種恢復(fù)機(jī)制,用戶可以靈活的選擇恢復(fù)程度和恢復(fù)方式,極大的方便了用戶。
二、備份技術(shù)最新發(fā)展
隨著存儲技術(shù)的發(fā)展,在SAN、NAS這些新的存儲架構(gòu)中,備份技術(shù)也發(fā)展出了LAN Free Backup、Serverless Backup等全新的技術(shù)。
所謂LAN Free Backup顧名思義,就是指釋放網(wǎng)絡(luò)資源的數(shù)據(jù)備份方式。在SAN架構(gòu)中。備份服務(wù)器相應(yīng)用服務(wù)器發(fā)送指令和信息,指揮應(yīng)用服務(wù)器將數(shù)據(jù)直接從磁盤陣列中備份到磁帶庫中。在這個過程中,龐大的備份數(shù)據(jù)流沒有流經(jīng)網(wǎng)絡(luò),為網(wǎng)絡(luò)節(jié)約了寶貴的帶寬資源。在NAS架構(gòu)中,情形十分類似,磁帶庫直接連接在NAS文件服務(wù)器上,備份服務(wù)器通過一種稱為NDMP的協(xié)議,指揮NAS文件服務(wù)器將數(shù)據(jù)備份到磁帶庫中。細(xì)心觀察之下會發(fā)現(xiàn),這兩種方式雖然都節(jié)約了網(wǎng)絡(luò)資源,但卻增加了服務(wù)器的工作負(fù)荷。下一代的Serverless Backup技術(shù)就是以全面的釋放網(wǎng)絡(luò)和服務(wù)器資源為目的的。
Serverless Backup技術(shù)的核心就是在SAN的交換層實(shí)現(xiàn)數(shù)據(jù)的復(fù)制工作,這樣備份數(shù)據(jù)不僅無需經(jīng)過網(wǎng)絡(luò),而且也不必經(jīng)過應(yīng)用服務(wù)器的總線,完全的保證了網(wǎng)絡(luò)和應(yīng)用服務(wù)器的高效運(yùn)行。目前一些廠商推出了自己在這方面的相關(guān)產(chǎn)品和解決方案,但是比較成熟且開放性好的產(chǎn)品還在進(jìn)一步發(fā)展中。到目前為止,Serverless Backup技術(shù)已經(jīng)成為所有相關(guān)廠商爭相追逐的目標(biāo),無疑是備份技術(shù)領(lǐng)域內(nèi)最大的熱點(diǎn),相信在不久之后,用戶就可以真正享受到這一新技術(shù)帶來的成果。
除了備份架構(gòu)的新進(jìn)展之外,在備份介質(zhì)選擇上,也出現(xiàn)了一些新的趨勢。
傳統(tǒng)上備份介質(zhì)主要是磁帶設(shè)備為主,這主要是因?yàn)榇艓г趩挝蝗萘康某杀旧希^之其他介質(zhì)具有非常大的優(yōu)勢。但是隨著技術(shù)的發(fā)展進(jìn)步,尤其是ATA技術(shù)的發(fā)展,硬盤的成本在迅速的下降。現(xiàn)在,在一些場合下,磁盤作為備份介質(zhì)其優(yōu)勢已經(jīng)越來越明顯。一些廠商正在著力勸說用戶采用更加方便高效的磁盤代替磁帶作為備份介質(zhì),更有一些廠商甚至推出了包含磁盤和備份軟件的整體設(shè)備――備份一體機(jī)。
事實(shí)上,磁盤作為備份介質(zhì)的最大好處就是其介質(zhì)管理工作的簡化和性能的提升。前面提到過,一個磁帶庫的管理工作非常的復(fù)雜繁瑣,如果考慮到對不同廠家的不同型號的磁帶庫產(chǎn)品,都提供良好支持的話,工作無疑是極其艱巨的。而磁盤介質(zhì)則幾乎不存在這樣的問題。這也是備份軟件廠商看好磁盤備份的理由之一。
然而,磁帶介質(zhì)本身的技術(shù)發(fā)展并沒有受到這一理念的沖擊。相反的,就在磁盤介質(zhì)向離線存儲領(lǐng)域進(jìn)軍的同時,磁帶介質(zhì)也借數(shù)據(jù)遷移技術(shù)的發(fā)展,大踏步的向在線存儲領(lǐng)域發(fā)展著。
數(shù)據(jù)遷移技術(shù)也稱為分層存儲管理,是一種將離線存儲與在線存儲整合的技術(shù)。傳統(tǒng)上,離線數(shù)據(jù)是靜態(tài)的,無法實(shí)時的被訪問,而數(shù)據(jù)遷移技術(shù)正是沖破這一限制,將離線的數(shù)據(jù)與在線的數(shù)據(jù)統(tǒng)一調(diào)度,從而實(shí)現(xiàn)所有數(shù)據(jù)的實(shí)時訪問。與磁盤備份技術(shù)相反,這一技術(shù)的主要目的就是以一定的存儲系統(tǒng)性能為代價,換取大型海量存儲系統(tǒng)的總體擁有成本。
數(shù)據(jù)遷移的工作原理比磁盤備份技術(shù)略為復(fù)雜。簡單的說,就是將大量不經(jīng)常訪問的數(shù)據(jù)存放在磁帶庫等離線介質(zhì)上,在磁盤陣列上只保存少量訪問頻率高的數(shù)據(jù)。當(dāng)那些磁帶介質(zhì)上的數(shù)據(jù)被訪問時,系統(tǒng)自動的把這些數(shù)據(jù)回遷到磁盤陣列中;同樣,磁盤陣列中很久未訪問的數(shù)據(jù)被自動遷移到磁帶介質(zhì)上。從某種意義上講,磁盤陣列以一個磁帶庫的“中間緩存”的方式被使用,既保證了大多數(shù)情況下數(shù)據(jù)訪問的響應(yīng)性能,也避免了大量利用率低的數(shù)據(jù)長期占用成本較高的磁盤空間。