數據存儲產業服務平臺

DoSTOR專家觀點 給磁帶一個機會 也許會有收獲

DoSTOR專家觀點:本文作者Henry Newman是國外某知名存儲網站的資深編輯。在同用戶的溝通中發現存儲的費用不僅僅來自于驅動器和RAID控制器等設備,設備電耗以及冷卻系統同樣需要花費數據中心的大量預算。

在線備份商完全錯了。

上周的文章(請見:在線備份提供商系統選擇謹慎 選擇磁盤而不是磁帶)指出在線備份提供商廣泛采用磁盤來取代磁帶,這使我思索如果我們回到不那么講究利潤的1999年會怎么樣。僅僅根據采購成本和能源使用成本,這些廠商就可以通過使用磁帶庫而不是磁盤,節約成本并且提供幾乎同樣快的–而且可能更可靠的–服務。

對于那些相信SATA(串行ATA接口)將能夠減少磁盤成本的人來說,他們應該讀一讀我在去年寫的存儲的真實成本(Part1 Part2)這篇文章。如果你希望得到良好的性能和可靠性,那么磁盤并不一定便宜。

看起來在線備份商好像正堅定不移地朝向磁盤備份走去。但是我認為這對于家庭備份、小型企業甚至大型組織的備份來說卻不是一個正確的選擇,因為磁盤在許多方面都比磁帶更加昂貴,而且磁帶還有很大的"綠色"優勢。一些在線備份廠商正在使用MAID(大規模閑置磁盤陣列)來降低能源成本,但是磁帶還是比MAID要更加便宜,甚至將MAID的能耗節省包括進去還是如此。

成本

開始,我們將比較不同廠商所提供的不同技術。被選擇的廠商并不是基于任何偏好,而是那些我認為容易在英特網上找到定價的廠商。這些廠商可能沒有列出最優的價格,但是其相對價格卻很能說明問題。

大型企業IBM的基于磁帶庫的模塊售價38365美元,而擴展單位售價28125美元。這個產品具有6000個槽位,足以容納非常多的磁帶驅動器。如果說我們有20個LTO-4(線性磁帶開放協議)驅動器,每個驅動器成本為16710美元,而LTO-4磁帶是每盒140美元。那么對于一個模塊,15個擴展單位,20個驅動器和6000個磁帶來說,其總成本為1634439美元。

未壓縮總容量為4.6PB左右,帶壓縮則為9.2PB。無壓縮的每PB成本為357049美元,而帶壓縮的每PB成本則為178524美元。對于LTO-4來說,根據其規格,壓縮比率為2比1。

現在讓我們使用標準的針對SATA的RAID(獨立磁盤冗余陣列)技術來做同樣的事情,因為對于備份以及恢復,英特網堵塞所引起的比性能問題更大。

在磁盤控制器上,我選擇Sun公司的StorageTek 6940。這其實是LSI的產品,只不過是由多個廠商貼牌后銷售。我將這個磁盤控制器設置為每個控制器12個托盤,每個托盤16個1TB驅動器,那么總共就是192TB,成本為663695美元。

那么使用Sun 6940的每PB成本為3456745美元,而使用LTO-4的無壓縮每PB成本為357049美元,帶壓縮則為178524美元。

這也就是說磁盤比起無壓縮的磁帶幾乎貴10倍。當然,這里還有一些告誡:

  • Sun 6940的帶寬為1800MB/秒,而20個未壓縮磁帶驅動器的帶寬為2400MB/秒(20乘以120MB/秒)。
  • 我并沒有包括進分層存儲管理軟件(HSM)的成本,這也是不便宜的,雖然比磁帶自動機械臂要便宜許多;我也沒有包括進高可靠性磁盤高速緩存的成本,HSM也要使用這種高速緩存來作為緩沖。

能源成本

讓我們在磁盤這邊再加上另一個必須考慮的成本,那就是能耗。如果我需要一個完整的4.2PB未壓縮容量的磁帶庫用于我的在線備份公司,那么磁帶庫的能耗幾乎可以忽略不計。如果是用SATA驅動器,那么情況就完全不同了。使用4.6PB的SATA磁盤,并使用RAID -6 8+2以提高可靠性,也就是5250個驅動,不包括熱備援。如果為了安全,而增加3%的熱備援驅動器,那么也就是5355個驅動器,335個磁盤托盤,每個托盤16個驅動器。在SATA驅動器上使用SAS(串行SCSI)接口以提高可靠性,那么就是每個驅動器功率為13瓦特。如果使用標準的SATA接口,那么每個驅動器功率為11.6瓦特。

總功率是:5355個驅動器乘以13瓦特每驅動器+335乘以375瓦特每托盤,也就是195千瓦。我們將單位能耗成本定為每千瓦10美分。

磁盤容量

驅動器數

每個驅動器功率(w)

驅動器和托盤總功率(kw

每千瓦小時成本為10美分

磁盤和托盤年成本

4.6PB

5355

13

195.24

$19.52

$171,030

這還未包括進所產生的熱量,而經過計算,我發現是1.45倍于成本。因此,根據目前的電力成本計算,每年總能耗成本為247994美元,而這種成本不會在任何很快的未來內下降。同時,磁盤驅動器還不能壓縮數據,而磁帶驅動器可以在硬件內自動完成壓縮。這對于家庭互聯網備份來說是一個比較大的問題,因為大部分數據必須被預先壓縮成jpg和mp3格式,因此,最好的比較方法就是將無壓縮磁帶和無壓縮磁盤相進行比較,即使這里可能有一些壓縮。

性能

我們大部分人都通過電纜調制解調器或DSL(數字用戶線路)連接來從家中或企業連接到互聯網。對于實時持續數據傳輸來說,其速率是在128KB/秒到3MB/秒之間。這也就是說,對于8MB大小的文件傳輸,如果是最低速率,需要512秒,如果是最高速率,則為21秒。我懷疑我們中有幾個人經常使用3MB/秒的下載速率,這還是至少是光纜,而且上傳也達不到這個速率。

磁帶從拾起、載入到定位的時間大約是69秒。如果你有磁盤高速緩存,那么上傳的時候你就不用擔心,因為數據先是進入磁盤緩存中然后再被寫入表中。真正的問題是下載。

對于這種類型的服務來說,采用兩種模式可能更好:大部分情況下,恢復一些文件;如果發生災難情況,則恢復所有文件。如果我有一些文件,這些文件是隨機建立而不是建立在同一個時間的,那么,如果它們不是一次性排隊,那么我可能每個文件都會產生一些延遲。但是如果這些文件一次性排隊,磁帶驅動器可用且所有文件都流入,那么我只有69秒的延遲。69秒鐘后,等磁帶開始傳輸數據,我就可以流入流出數據。如果要恢復大量數據,那么HSM軟件開始從磁帶進行文件預提升(Pre-stage)的速度要比你在家或在辦公室在固定機器上接收數據的速度要快很多。最開始的延遲時間為69秒,但是鑒于互聯網帶寬限制,恢復文件的時間要比從磁帶讀取數據到HSM磁盤高速緩存的時間要大得多。至少對于我來說,這是"顯而易見的做法"。

當然,MAID的延遲要比磁帶少很多。MAID的能耗成本也比磁帶小很多,但是從每單位比特的角度來看,磁盤驅動器要比磁帶貴許多。而且對于MAID來說,還有RAID問題,如果使用RAID 3+1而不是8+2的話,那么浪費在校驗盤上的空間比率就更大了。如果你有延遲問題,那么MAID是一個解決辦法,但是如果碰到在互聯網上恢復大型文件的問題呢?

由于每比特磁盤驅動器成本要比磁帶高,而且大型恢復的延遲問題可能被HSM預提升文件所隱藏,那么為什么還要在在線備份中使用磁盤呢?多花一分鐘時間來恢復你不小心的刪除的Aunt Sandy 60周歲生日中你媽媽的照片,或者壞了的Barry White歌曲,這會有什么影響嗎?不說綠色問題,將能源用于這種類型的應用確實值得嗎?如果磁帶也可以勝任這種任務,為什么還要為能源和磁盤驅動器花更多的錢呢?

除非這種問題是出于技術上的原因,否則我看不到合理性。我經常聽到說HSM很難使用,但是從我的經驗來看卻不是如此。HSM從1970年代就出現,此后被反復嘗試和試驗??赡軉栴}是其存儲技術對于人們來說過于復雜而無法實施HSM。無論障礙是什么,對我來說,我認為這是在線備份提供商應該重新考慮的問題。只要沒有其他問題,對于一些企業級在線備份商來說,通過使用成熟的磁帶架構能夠為他們帶來價格上的優勢。

未經允許不得轉載:存儲在線-存儲專業媒體 » DoSTOR專家觀點 給磁帶一個機會 也許會有收獲
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走