數據存儲產業服務平臺

主存儲優化(PSO)的前世今生

在過去的兩年里,重復數據刪除(Date Deduplication)以驚人的速度從一個偏僻的存儲技術術語迅速成為了存儲系統中廣為人知的特性,幾乎所有主流存儲廠商都適時推出了自己的相關產品;類似的,高速硬件數據壓縮(Hardware Data Compression)應用也獲得了類似的市場機遇,在不到兩年的時間里,不但成為高端虛擬帶庫(VTL, Virtual Tape Library)的必選特性,也逐漸在歸檔(Data Archive)、備份(Backup)、持續數據保護(CDP, Continuous Data Protection)等次級存儲(Secondary Storage)中獲得了廣泛應用。

由于在系統功能上比較相似,都能顯著減少數據容量,提高系統的運行效率,業界又專門以數據縮減(Data Reduction)或容量優化(Capacity Optimization)來統稱重復數據刪除和數據壓縮技術這兩種技術。一般的,數據壓縮技術的應用可以帶來2:1~3:1的壓縮比,而重復數據刪除技術在備份應用中的壓縮比可達10:1~20:1,綜合應用兩種技術之后,數據量一般可減少到原來的3%左右。容量優化技術的廣泛應用,其背景是存儲系統中數據容量的急速增長:IDC報告顯示,2007年新增數據量(281 ExaByte)已經超過所有可用存儲介質總容量(264 ExaByte)約6%,并預計2011年數據總量將達到2006年的10倍!

數據縮減技術在次級存儲中的成熟使用和帶來的巨大好處促使人們認真研究并考慮將相關技術的應用進一步推廣到主存儲(Primary Storage)中,以應對主存儲所面臨的諸多問題:太高的容量需求、過多的空間和能源消耗等等。于是,我們有了一種新的應用:主存儲優化(PSO, Primary Storage Optimization)–毫無疑問,主存儲優化將以成熟的數據縮減技術為基礎。

盡管主存儲優化最近才進入我們的視野,但對IT業界,尤其是對那些技術和市場先驅而言,相關技術和應用倒并不是近幾年才出現的全新概念。

1994年2月23日,從美國加州聯邦法院傳出了一個驚人的消息:由于侵犯對方專利,軟件巨頭Microsoft被判賠償一家鮮為人知的小公司Stac總計一億二千萬美元,案件的核心是Microsoft當時新推出的操作系統MS-DOS 6.0中集成的Double Space軟件。在一般應用中,該軟件的使用可以使計算機的硬盤容量"加倍":數據會先經過壓縮再存儲到硬盤上,高效的壓縮算法可以提供約2:1的壓縮比。而Stac持有該壓縮算法的關鍵專利,并且其硬盤容量倍增軟件Stacker已經廣泛應用到IBM的OS/2、Apple的Macintosh、Unix和Microsoft MS-DOS的主要競爭對手Novell DOS等各主要操作系統中。在2003年IE瀏覽器侵權案件之前,這一直是Microsoft敗訴且涉案金額最大的知識產權案件,而且成為全球知識產權保護的經典案例。

在500GB硬盤只要不到400元人民幣的今天,能將PC硬盤容量加倍的技術大概并沒有多少吸引力,但在上世紀九十年代初,主存儲容量異常寶貴,1993年250MB的硬盤大約需要500美元!因此,Stac獨有的壓縮技術獲得了廣泛的應用,Stacker軟件的推出也使Stac公司成為主存儲優化的先驅。

在早期的主存儲優化應用中,使用的容量優化技術是數據壓縮,關鍵算法采用的都是壓縮效率和速度都非常好的LZS算法,其實現也主要是以軟件方式集成到系統中,利用主CPU來完成所有處理。隨著計算機應用的日益廣泛,各種不斷豐富和發展的應用對性能要求越來越高,系統處理能力逐漸成為瓶頸,基于軟件的數據壓縮因為需要消耗大量的CPU資源而被逐漸邊緣化;與此同時,硬盤技術取得了長足的進步,硬盤/主存儲的容量不斷增長的同時,價格也迅速下降。硬盤/主存儲優化應用也就逐漸淡出人們的視線,Microsoft也最終在Windows XP中取消對這項功能的支持。

在數據縮減技術在次級存儲優化(SSO, Secondary Storage Optimization)應用中大放異彩的時候,我們發現,盡管當前的技術還不能直接滿足主存儲的要求,但毫無疑問,這樣的技術同樣可以給主存儲帶來巨大的效用和好處。

隨著應用的不斷豐富,存儲系統對主存儲的容量需求一直在急速增長,其速度明顯超過磁盤系統的技術進步;另一方面,由于操作難度和應用對時延的較高要求,主存儲內有大量數據相對比較陳舊,并沒有遷移到次級存儲中去,調查顯示其比例甚至高達80%~90%。目前,數據中心主存儲容量的利用率一直維持在很高的水平,面對不斷提高的增長壓力,與購買新的存儲設備相比,通過主存儲優化挖掘現有存儲資源的潛力在目前較為嚴峻的經濟形勢下顯得尤為必要。

另一方面,存儲介質之外的支出越來越成為關注的重點。對很多數據中心而言,空間占用、電力消耗,還有散熱,可能比存儲容量更難以管理,有時候甚至不是僅僅增加支出就能解決的–主存儲優化是"綠色存儲"的一個重要選項。

而且,在前面的分析中我們都都沒有論及實際的存儲容量。在實際的存儲系統中,將50TB縮減為10TB所帶來的好處,遠非將5TB縮減為1TB所能比。隨著業務的發展,企業和數據中心管理的數據將迅速從數TB增長到數十TB,簡單增加存儲容量除了介質本身的支出外,還會給備份/歸檔等等日常管理帶來極大挑戰。

此外,有效減少主存儲的數據量后,系統I/O單元的利用率將明顯改善,從而提高系統性能;如果需要遠程數據傳輸,網絡帶寬的利用率也將顯著提高。

盡管主存儲優化有著非常誘人的前景,但要真正實現系統應用,還需要解決一系列的問題。與已經獲得廣泛應用的次級存儲優化相比,主存儲優化對性能(Performance)、可用性(Availability)、可靠性(Reliability)等各方面都有更高的要求。

與備份/歸檔等次級存儲應用不同,主存儲對性能的要求比容量更高,因此主存儲優化的應用不能以降低系統性能為代價。目前,主存儲的性能需求一般都在100 MB/s以上,而基于軟件的數據縮減技術僅能達到數十MB/s,因此主存儲優化應用的實施需要依靠相關硬件加速設備。目前,硬件數據壓縮產品已經比較成熟,性能最高已達到800MB/s,可以滿足大多數主存儲系統的需求;重復數據刪除的硬件加速則相對薄弱。

次級存儲優化針對的都是離線(near-line)或近線(off-line)應用,對其可用性的要求比主存儲要低得多;即使是對可用性要求較高的災備(Disaster Recovery)系統,其可用性要求也低于主存儲–主存儲的數據需要隨時在線,立即響應數據訪問,以滿足應用處理。類似的,硬件壓縮已經廣泛于網絡設備(如路由器、交換機等),長期的成熟應用顯示其可用性完全可以滿足主存儲優化的需求;經過最近幾年的發展,軟件重復數據刪除技術在次級存儲中已經比較成熟,但要進一步應用于主存儲優化,則相關硬件加速設備還有待市場進一步檢驗。

主存儲優化中所涉及的數據縮減技術和有關硬件加速產品已經有大量的實際應用,技術和產品本身應該沒有問題,但是高可靠性的實現依賴于良好的系統設計,主存儲優化產品要真正走向市場并被用戶接受,還需要存儲廠商的認真投入–當然,這樣的投入將會帶來非??捎^的回報。

另外,與面向備份等應用的次級存儲相比,主存儲的數據重復幾率要小得多,而且許多數據都已經在應用層面實現了壓縮,因此主存儲優化的效率很難達到一般次級存儲優化應用所宣稱的20:1~30:1的壓縮率。一般的,壓縮率為3:1~5:1是比較客觀的評估。

目前,已經有包括NetApp在內的多家廠商發布了主存儲優化的相關產品,其他如EMC、Riverbed等也都表示在積極關注,有市場報告顯示,主存儲優化將在2009年取得長足發展。

在關注主存儲優化的各廠家中,Hifn將目光集中在硬件加速單元而不是整個設備上,其Express DR系列數據縮減加速卡硬件在次級存儲優化中被EMC、HP、IBM等各主要存儲廠商廣泛采用。有趣的是,Hifn與15年前的專利大戰中最終獲勝的Stac有著直接的聯系:Stac的壓縮產品線于1996年剝離,成立Hifn公司,并于1998年在納斯達克上市–從原始主存儲優化的盛行到消失,再到存儲系統中再次引入主存儲優化,Hifn可算是引領了一項技術及其應用的輪回和新生吧!

未經允許不得轉載:存儲在線-存儲專業媒體 » 主存儲優化(PSO)的前世今生
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走