數據存儲產業服務平臺

去重產品新賣點 廠商在“時間”上做文章

在如今艱難的經濟形勢下,廠商必須做到兩件事:1)向支出謹慎的潛在客戶證明該廠商的產品在經濟上是合算的;2)表明為什么該廠商的產品優于競爭對手的產品。

重復數據刪除吸引眾多注意

過去幾年來,在企業客戶中獲得越來越大的市場成功的存儲相關領域之一便是基于磁盤的備份,尤其是附加虛擬磁帶庫(VTL)的磁盤備份。對于操作恢復和災難恢復來說,不間斷運行的業務關鍵型應用程序(看起來現在有越來越多的應用程序屬于這個類別)發生過長的宕機時間是不可接受的。比起磁帶(雖然磁帶目前還沒消亡),VTL具有性能和可靠性的優勢,因此VTL的使用越來越普遍。

對于基于磁盤的備份來說,一個關鍵的附加功能就是重復數據刪除。盡管大多數數據恢復請求是在24小時內創建的,但是企業可能希望將備份數據保持三周的在線,有的甚至要一個月甚至更長時間。一些企業甚至選擇將基于磁盤的備份保持一年以上的在線,以便滿足合規要求和其他規制要求。不過,在這么長的時間內每周存儲完全的備份在經濟上是難以承受的–特別是對于那些IT預算緊張的公司來說。

重復數據刪除為組織提供了一個刪減備份數據數量的解決方案。例如,4周的完全備份需要大約4X的數據,其中X是指一周的備份。不過,假如每周的數據變化率是中等的(對于許多組織來說是如此),大多數數據在每周備份中保持不變,因此原始數據的數量可能是完全備份的1.1X或1.2X(每天平均變化率在2%到4%之間)。重復數據刪除可以刪減這些冗余的數據"水分",使其不進入備份和存儲過程;也即,只備份那些新數據或非冗余數據。這樣就可以更加有效地利用磁盤資源,使存儲預算支出更加合理有效。

因此,重復數據刪除是基于磁盤備份的關鍵工具,而且也可以用于幫助活躍生產和活躍歸檔。廠商們"認識"到了該技術的價值。NetApp和EMC正在競購Data Domain:NetApp出價已經從15億美元增加到19億美元,EMC出價為18億美元。這兩家公司的競購體現了重復數據刪除的價值,同時也體現了Data Domain確實是一個良好的能夠適應多廠商環境的磁盤備份存儲重復數據刪除供應商。EMC和NetApp過往的收購記錄良好,它們往往能夠成功地消化被收購資產。

不過,NetApp并不是第一個在這個領域展開并購行動的廠商。EMC在2006年收購了Avamar,而且正在積極地將Avamar的技術擴展至EMC的各個解決方案的產品組合–EMC最近宣布將會在NetWorker上使用Avamar技術。就在一年前,IBM收購了Diligent Technologies,后者也有強大的重復數據刪除能力?;钴S在重復數據刪除領域其他廠商還包括:CommVault,FalconStor,惠普,Quantum和Sepaton。網絡存儲行業協會(SNIA)旗下數據管理論壇的數據保護行動工作組最近發布了《數據保護行動成員買方指南(2009年第五版)》。在這個《指南》中,提到了VTL和重復數據刪除。(SNIA同時也是重復數據刪除領域許多信息的重要來源)

FalconStor進行性能測試

現在,讓我們來看看重復數據刪除領域的領導廠商之一,FalconStor。FalconStor有強大的OEM(貼牌廠商)合作關系(此外還有直接銷售渠道),即使VTL領域還有其他的實力雄厚的廠商,FalconStor還是可以聲稱它在VTL領域有領先的市場份額。但是這個市場的競爭非常激烈,FalconStor的寶座位置也不是很穩。

實際上,該公司最近的一項宣布有可能攪動這個行業。FalconStor宣布,在虛擬磁帶庫(VTL)環境下,該公司的重復數據刪除解決方案可以提供最快的災難恢復(DR)總時間。DR總時間的計算是指如下時間的加總:備份給定數量存儲的時間,創建物理磁帶的時間(如果需要),將數據重復數據刪除到數據倉庫的時間(以及將重復數據刪除庫復制到遠程站點的時間,這個復制過程和重復數據刪除過程是同時進行的),從重復數據刪除庫恢復的時間。(見《昆騰NEC推出新品 de-dupe市場陷入混戰》

FalconStor認識到,雖然硬件行業有許多標桿,但是它感覺自己作為一家軟件公司,它需要一個參照點來證明其解決方案的能力。因此,FalconStor需要為客戶創建一個參考架構。FalconStor必須建立一個參考環境,在這個環境中可以進行各種測試來衡量FalconStor產品的在企業級數據中心環境下的性能特征。

FalconStor使用它最新的附帶重復數據刪除功能的VTL,同時這個VTL還附帶了使用賽門鐵克OpenStorage(OST)API(應用程序編程接口)的Symantec NetBackup。盡管FalconStor有時為了方便客戶會在設備中捆綁一些軟件,但是FalconStor主要還是一家軟件公司。在這個測試中,FalconStor只是簡單地使用開放系統服務器和商品的SATA存儲。測試數據集定為100TB。

衡量性能

FalconStor使用一個名為目標端重復數據刪除的過程,即備份被寫入磁盤,然后重復數據刪除過程在數據已經寫入磁盤后開始工作。接收速度(即,備份數據寫入磁盤的速度)是備份聲明周期的關鍵的第一步,即使現在,如何滿足備份窗口要求仍然是企業在備份上所面臨的第一大問題(同時,這也是磁盤備份在企業中越來越流行的根本原因之一)。

備份過程中寫入數據的磁盤可以被看做一個"暫存池",因為它只承載最新的備份(但也有可能被用于數據恢復)。在FalconStor的術語中,承載重復數據刪除后數據的實際存儲池是一個塊層次的單實例庫(SIR)。這里不要和單實例存儲(SIS)相混淆。SIS是一個數據縮減技術,這個技術可以在文件層次上保存單實例。SIR是在塊層次上保存單實例,也就是說重復數據刪除是作用在文件的下一個層級。

這就是執行目標端重復數據刪除而不是來源端重復數據刪除的好處。對于FalconStor的客戶和許多其他企業來說,它們很可能愿意使用目標端重復數據刪除。

FalconStor的參考環境使用的是配對的集群式VTL節點。每個節點都處理它自己的工作負荷,但是每個節點都有另一個節點與其形成主動-主動式的配置,這樣如果一個節點發生發生故障,另一個節點就可以接過工作負荷(雖然性能會有一定下滑)。FalconStor總共使用4個SIR節點,對來自暫存池的數據進行重復數據刪除,然后存入單實例庫。單實例庫到遠程站點的復制過程(這個過程可以和重復數據刪除過程同時進行)的速度是4GB/秒,也就是500MB/秒。FalconStor感覺這個過程中沒有瓶頸,因為FalconStor已經配置了足夠的資源來將創建好的數據復制過去。

FalconStor聲稱,在這次測試過程中,100TB數據的備份在不到10小時的時間里就完成了,而且這個100TB的數據池在14個小時的時間內得到了重復數據刪除。這里要注意的是,備份和重復數據刪除的這兩個時間是并行的,而不是一前一后的。重復數據刪除過程需要等待第一個虛擬磁帶庫被寫入磁盤,但是一旦寫入后,重復數據刪除便開始啟動。這里要指出的是,客戶還可以在重復數據刪除啟動前選擇將數據寫入物理磁帶。FalconStor提供的政策引擎還可以管理這些流程,比如將不適合重復數據刪除的備份工作(比如,視頻流)從重復數據刪除流程中剔除。

在重復數據刪除庫(無論是本地的還是在DR站點的),每個節點的數據恢復速度都是1.2GB/秒,或4.3TB/小時。通過兩個VTL節點,完全恢復100TB數據的時間為11.6小時(如果增加新的節點,還可以縮短恢復時間)。

雖然目前還沒有客觀的標桿(比如用于衡量服務器性能的SPEC標桿)來幫助評估FalconStor的測試,但是該公司的性能數據令人印象深刻。就在幾年前,人們還認為1TB/小時的備份速度非常先進。那么對于附重復數據刪除的VTL市場來說這意味著什么?首先,我們認為FalconStor公布性能數據應該值得肯定(雖然至少還有另一個廠商還做出了關于重復數據刪除解決方案的性能聲明)。

對于那些希望量化重復數據刪除技術價值和經濟價值的企業來說,這種性能聲明確實很有價值。不過,這有可能激起另一場"SPEC(標準性能評估機構)標桿"之爭。雖然標桿最終會變成一個正規的受認可的流程,但是目前在重復數據刪除上還沒有普遍認可的衡量流程,因此一些廠商可能認為FalconStor的測試是一個明顯的挑釁。其他廠商會如何反應?它們有可能:1)聲稱性能并不重要;2)聲稱FalconStor的測試不是按照真實情況下的設置;3)完全忽略FalconStor的舉動;4)聲稱它們的性能可與FalconStor媲美或比FalconStor更好。

重復數據刪除的現有客戶或潛在客戶對此會做何反應?如果聲稱性能并不重要,則顯然違反事實。如果忽略FalconStor的舉動,則會讓FalconStor獲得競爭優勢。挑測試過程的毛病是一個常見的策略(在SPEC測試中,有時也采用特殊設置,這種特殊設置有的在實際情況中是不現實的)。

那么競爭對手唯一的選擇就是對它們自己的產品進行類似的分析,然后以最真實的方式得出測試數據。這種爭論過程對于整個行業以及客戶來說都是有利的。這一點我們要感謝FalconStor。

未經允許不得轉載:存儲在線-存儲專業媒體 » 去重產品新賣點 廠商在“時間”上做文章
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走