數據存儲產業服務平臺

磁帶遷移:絕不簡單卻又迫在眉睫

DOSTOR存儲在線 5月18日國際報道:計算機所用的磁帶大概已經存續了60年左右的時間。這項技術比目前大多數技術行業從業人士還要年長。 由于磁帶備份市場的規模已經遠遠小于歸檔市場的規模,磁帶遷移就成為磁帶行業現在面臨的最大問題之一。

大規模歸檔方案的數據遷移通常會是一個連續的過程。造成這種現象主要有兩個關鍵原因,它們是:

磁帶的密度每隔18個月到24個月就會增加一倍,但是同期磁帶的性能大約只能提升20%。這意味著即便磁帶驅動器數量不再增加,遷移歸檔數據所需的時間也將越來越長。

磁帶驅動器的某些接口如光纖通道1Gb和2Gb已經不再被業界支持。如果不進行遷移,磁帶庫的數量就會增加,那必然導致成本的大幅上升。

鑒于這些原因及其他一些原因,遷移到新磁帶技術就成為當前迫在眉睫的一項任務,同時,遷移必須將其他硬件如服務器、RAID存儲和交換機等也都包括進去。

以前的數據遷移比較簡單,但是由于種種原因,現在的數據遷移變得不再簡單了。據我了解,我所知道的公司沒有幾家已經完成了備份遷移,但他們都知道他們必須遷移歸檔數據。 大部分備份的數據都是短暫的。不錯,薩班斯奧克斯利法案要求企業將某些數據保存下來,但是大多數企業并不會經常陷入訴訟案件。 況且,磁帶在5年內都是可讀的,因此,企業只需將磁帶保存在冷庫中即可。

這類數據的數量與歸檔數據如病歷卡、哈勃太空望遠鏡或國家海洋大氣管理局衛星圖像等數據的數量比起來是微乎其微的。 現在,每一輛汽車和每一架飛機都必須將其結構模型數據和設計資料歸檔保存,以便日后發生問題時調用。在不遠的將來,我們的基因組也將能被保存下來。 大規模歸檔的數量增長速度比磁帶密度的增長速度更快一些,比磁帶性能的增長速度更加快?,F在,LTO磁帶的密度幾乎增加了一倍,但其性能大概只提升了20%左右。 許多數據中心要花一年的時間將歸檔數據從舊式磁帶驅動器X遷移到新式磁帶驅動器Y?,F在已經有了一些軟件,可以讓歸檔數據從一家軟件廠商遷移到另一家軟件廠商的過程變得相對容易一些,但是對于那些沒有使用版權磁帶格式的廠商來說,這個過程將更加順利。由于各廠商的情況都不相同,因此我就不在這里展開詳談了。 磁帶介質遷移是非常困難的一件事,因此它需要慎重規劃以策萬全。

需要考慮的因素包括:

硬件方面的考慮

根據歸檔軟件的不同,有4種類型的硬件必須作為遷移計劃的部分內容考慮進去:

– 磁帶驅動器,包括舊式和新式;

– 連接驅動器的光纖通道交換機接口;

– RAID存儲設備;

– 服務器;

舊式和新式磁帶驅動器的數量取決于兩個因素:

– 完成遷移的速度;

– 用戶負載流量是多少以及遷移過程中需要的負載流量是多少;

1、磁帶

要想決定需要的磁帶驅動器的數量是很難的。要想滿足用戶需求,到底需要多少新式磁帶驅動器呢? 需要多少舊式磁帶驅動器呢?隨著遷移數據數量的增多,需要多少新式磁帶驅動器呢? 這是否會隨著時間的推移而發生變化? 如果一項作業需要等待去檢索歸檔數據,這會對數據中心造成何種影響? 顯然,這些所有的問題都很難回答。這些問題中,可能只有一部分問題能夠通過建模的方式找到答案。但是其他的問題,建模也無能為力。 從舊式磁帶驅動器上讀取所有的數據,然后寫入新式磁帶驅動器,這個過程需要花多長的時間,僅這個問題就異常復雜。

如果以LTO-4 800GB、120MB/s來簡單計算,讀取整個驅動器的數據需要將近2個小時的時間。因此,磁帶驅動器可能需要使用2個小時。因為一旦開始讀取驅動器的數據,一般政策都規定必須將驅動器上的所有數據都讀取出來。 當然,這也是一個政策方面的問題以及HSM軟件的潛在政策問題。這只是遷移中必須考慮到的一個問題而已。

根據歸檔數據所使用的數據使用模式的不同,歸檔支持需要多長的時間?對工作時間的利用情況如何?由于歸檔經常發生變化,因此很難判斷歸檔負載是多少。因此,你必須準備更多的磁帶驅動器,因為那些驅動器的使用時間通常都比預期的時間更長一些。

這通常會變成一個預算平衡的問題,舊式磁帶驅動器的成本通常很低,但新式磁帶驅動器的成本要高得多。等待遷移的時間越長,磁帶驅動器和磁帶的成本就越低,但是遷移舊式磁帶驅動器上的所有數據所需的時間就越長。 因此,很難決定最佳的成本模型。

2、光纖通道交換機接口

鑒于你可能會購買更多的磁帶驅動器和存儲設備,你可能會需要更多的交換機接口。你也許已經配置了足夠的備用接口來增加新硬件,但是如果新的存儲設備或磁帶驅動器要求使用新一代光纖通道技術,你可能還需要升級你的交換機。 

3、RAID存儲設備

大多數歸檔系統都必須先將數據從舊式磁帶上讀取出來,寫入磁盤,然后再從磁盤上讀取出來,寫入新式磁帶。如果歸檔系統要求在遷移過程中使用磁盤,那么你還需要輔助存儲空間和帶寬來支持遷移。 增加的數量取決于你有多少備用的帶寬和存儲空間。例如,完全讀取LTO-4磁帶的數據并將數據寫入LTO-5磁帶就需要大量的存儲空間和帶寬。 如果你想一次性讀取和寫入,那么你就必須準備1.5TB的存儲空間以及140MB/s的數據寫入帶寬和240MB/s的數據讀出帶寬。這可能會占用很大一部分RAID控制器的帶寬,大約是8GB光纖通道支持帶寬的30%左右。

4、服務器

要求先將數據讀出并寫入磁盤的歸檔系統所需的CPU資源比磁帶到磁帶遷移解決方案中的歸檔系統所需的CPU資源更多。他們還需要更多的存儲帶寬和PCIe總線帶寬來移動數據。 擁有足夠的服務器來匹配存儲和磁帶帶寬需求,會增加架構設計問題的難度。

軟件方面的考慮

顯然,每一個歸檔軟件廠商都有一套工具來支持向新式磁帶硬件進行的數據遷移。這些工具通常都有很多可調整參數,讓管理員可以控制遷移的速度以及遷移對系統造成的影響。 通常,它們是根據工作負荷量來進行調整的,但是鑒于讀取磁帶所花的時間太長,因此調整問題被認為是滿足要求之前需要考慮的另一個重要問題。

用戶

用戶通常希望各種資源都是可用的。但是通常,這都是不現實的。 如果你想遷移磁帶數據,被占用的資源就會更多,你必須判斷遷移會對用戶造成多大的影響。通常,這是一個折中的選擇問題。

最終歸結為成本

如果你愿意花費足夠多的時間和金錢來構建和安裝所有的新硬件,那么將PB級的數據讀出并寫入新磁帶可能需要幾周的時間。實際上,從來沒人這么干過。 遷移也從來不會需要非常長的時間來完成。這是在用戶需求和財務壓力之間求得平衡的重要問題。

有一個問題經常被忽略,但最后卻給用戶造成了巨大的成本,那就是舊硬件的維護問題。還有一個必須考慮的問題是磁帶庫的空間和成本。 購買新庫是因為你的庫空間用完了,將舊的庫遷移到更新、密度更高的庫有助于節省成本。這個問題并不容易說清楚,因為其中的變化太多,用戶的需求也很復雜,此外還涉及到硬件配置、維護成本、采購新庫的成本等等。 總的來說,磁帶遷移絕非易事。它不可能很精確地完成,因為總是會出現一些無法預見的變化。

在很大程度上,我通常都是根據EJ(技術判斷)來做決定。 我通常計劃在1年的時間內完成遷移,最多也不能超過18個月。我會盡量增加磁帶驅動器和存儲設備的數量,一開始只采購一點點,然后每隔幾個月增加一點,因為那些產品的價格會隨著時間的推移而下降,這樣就可以用時間來換取一定的成本節約。 磁帶通常是大型歸檔方案中成本最高的項目。(例如,5萬件磁帶,每件單價85美元,那么總價就達到了420萬美元。因此,在合理的范圍內等待一定的時間是可以節省大量的成本的。)

磁帶遷移絕不簡單,而且代價高昂。但是,等待磁帶和硬件消亡了再換用新一代存儲產品所需付出的代價更大。

未經允許不得轉載:存儲在線-存儲專業媒體 » 磁帶遷移:絕不簡單卻又迫在眉睫
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走