DELL DR4000

但這并未意味著DELL DR4000就毫無潛力可挖。就DR4000自身而言,重復數據刪除技術是其核心(與大多數D2D磁盤備份系統一樣,DR4000也是采用的標準X86架構服務器為硬件平臺),其集成的Ocarina技術到底有什么優勢,能夠為DR4000帶來哪些優勢?DR4000在戴爾的D2D磁盤備份系統產品線中又占有什么地位?DR4000除了是D2D磁盤備份系統之外,還蘊藏著哪些戴爾對Ocarina和DR產品線的期待?

為解答這些問題,在DR4000正式在中國發布之前,DOSTOR采訪了戴爾亞太及日本地區產品市場部高級產品經理林佑聲和戴爾大中華區消費及中小企業市場部高級產品經理馬軼霏,了解了戴爾推出DR4000的臺前幕后。

戴爾涉足D2D:DR4000初覽

作為一款D2D磁盤備份系統,重復數據刪除技術是DR4000的標配:DR4000的有效存儲容量共有35TB、70TB和130TB三種,支持在線重復數據刪除(inline deduplication)和壓縮、重刪數據復制(deduplicated replication)、高級數據保護和不中斷部署,當然,與主流備份軟件應用的認證已經基本都通過了。

而作為戴爾第一款D2D磁盤備份系統,戴爾給出的DR4000禮包當然不僅僅是這些,據林佑聲表示,DR4000中提供了完整的、無所不含的軟件許可模式——“值得一提的是,DR4000的軟件模式跟EqualLogic一樣,買了硬件設備以后,里面的軟件,OMC的功能、升級的功能都是全部包含的。”(事實上,在戴爾英文官網上,DR4000的正式名稱是:Dell DR4000 deduplication and compression backup appliance,Appliance顯然頗有深意。)

林佑聲表示,戴爾為DR4000提供了與EqualLogic相同的“軟硬件打包”的產品形態。戴爾支持客戶在無需支付額外許可費用的前提下充分利用DR4000當前及未來的所有產品功能,進而隨著時間的推移逐步降低存儲成本。

PowerEdge R510是DR4000的硬件基礎,作為一款支持英特爾至強5500處理器的雙插槽2U服務器,R510最大提供32GB內存,能夠為DR4000的在線重復數據刪除(inline deduplication)提供強勁的性能,而林佑聲表示,DR4000雖然目前沒有發布橫向擴展的功能,但是在未來,DR4000的升級很可能將包括橫向擴展的能力——當然,我們也不能夠排除DR4000未來推出更高端型號的可能,從DELL EqualLogic的4100產品線和6100產品線的發布情況來看,未來的產品被稱作DR6000的可能性極大。

DR4000的基本硬件規格

作為一款D2D磁盤備份系統,其核心當然是備份與恢復功能,當然,基于IP連接的DR4000同樣可以支持遠程備份恢復和災難恢復等功能,我們都知道,壓縮和重復數據刪除都是減小備份數據集的有效技術,因此結合了重復數據刪除技術的D2D磁盤備份系統是企業數據備份與恢復的良好載體。

據戴爾方面表示,DR4000擁有15:1的重復數據刪除比率,但林佑聲也表示,正如業界所普遍認可的,重復數據刪除比率是一個比較彈性的話題,自然還是與需要重刪的數據有關,但他表示,由于Ocarina的強勁技術,“DR4000的效果要比很多人想象的好”——這部分內容我們會在后面看到,現在還是繼續看看DR4000本身。

林佑聲表示,戴爾對于DR4000的功能,除了在中小企業和大型企業遠程辦公室進行數據備份與恢復,由于戴爾為DR4000的完全套裝的許可授權中提供了遠程復制軟件,因此“支持三臺DR4000設備的同步與數據的復制”,而且三臺設備之間的復制與同步都是可以“遠程實現的”。戴爾大中華區消費及中小企業市場部高級產品經理馬軼霏認為,DR4000的遠程同步與數據復制功能的提供,讓DR4000不僅限于辦公室或數據中心內的應用,而是可以實現“B2B2C”——Business(業務部門或遠程辦公室) to Business to Center(數據中心)——的功能,從而滿足多地中心和分中心的數據保護。不過,由于DR4000只是初始版本,還只能支持三臺設備,據林佑聲講,未來幾個季度,戴爾“還會有容量和功能上的更新”。

從競爭角度來看,DataDomain的DD160有一個標準的40TB邏輯容量,而DD620提供83TB的邏輯容量。在Boost的幫助下,利用Symantec的OST來用媒介服務器預先處理備份數據流,160的數據吞吐率為1.1TB/小時,如果不用Boost的話,速率是667GB/小時。620使用Boost的話,速度可以達到2.4TB/小時,如果不使用Boost的話,速度是1.1TB/小時。所有的軟件功能已經包含在基礎價格內。

Quantum的DXi4500針對的是中小企業客戶,它在NAS(網絡附加存儲)和賽門鐵克OpenStorage(OST)上的重復數據刪除速度都可以達到1.4TB/小時。DXi4510擁有2TB容量,而DXi4601的容量在4TB與12TB之間。

戴爾DR4000的速度比沒有使用Boost的DD160更快,速度相當于使用Boost的DD160和未使用Boost的DD620。DR4000沒有DXi5400那么快,不過它的基礎容量比4510更大,相當于4601產品。

總的來說,戴爾將不斷擴展DR4000產品(或是產品家族)的范圍,提高速度和容量,覆蓋規模更大的企業的要求,而且毫無疑問的是,支持遠程辦公室和分支辦公室。此外,進一步的功能將通過固件升級來添加,這樣現有用戶就不用進行跳躍式升級來獲得額外功能。

DR4000及其后續產品在整合災難恢復、無需重建的數據遷移、WAN(廣域網)優化功能上也應該會有更多建樹,以及多到1的復制功能也不需用戶花費很高的費用。DR4000還將有更多的ISV和合作伙伴整合,我們并不排除DR4000在Appliance方向上的進一步發展。

DR4000的靈魂:Ocarina重復數據刪除

重復數據刪除技術是D2D磁盤備份系統的靈魂所在,這一技術剛剛推出的時候,被認為主流是后處理技術——限于當時的處理器性能——這也無可非議,而在線處理(inline)被認為只屬于大中型企業或是具有一定規模和高性能的系統的用戶,但隨著多核處理器性能的不斷攀升,無論是DataDomain還是昆騰都開始涉足中小企業及遠程辦公室的D2D重復數據刪除磁盤備份系統。

這一技術的實現原理無需多言——對于大多數企業來說重刪原理并不是那么重要——但DR4000在線處理(inline)的方式很顯然更適合中小型企業:后處理方式仍然需要至少等同于多次全備份的存儲容量,而在線處理卻可以有更小的基礎容量可以選擇。而對于在線處理可能造成的網絡負載壓力瞬時過大的問題,對于DR4000所覆蓋的用戶群體來說或許并不存在,畢竟其面對的用戶的數據量不大,以太網的網絡速度也能夠達到10Gb,同時,磁盤備份系統多核處理器的在線處理性能也能夠達到很高的水平。

對于戴爾的DR4000來說,在重復數據刪除技術領域最大的用戶疑問或許是這樣的:戴爾的重刪技術和DataDomain、昆騰有什么不同(在線處理技術上DataDomain和昆騰采用的技術是相同)?戴爾又能夠在看起來業已成熟的重復數據刪除技術上有什么新的花樣?

回答這個問題,核心就在于Ocarina,它是戴爾DR4000的重復數據刪除技術的靈魂,也是DR4000的靈魂,未來或許也會成為戴爾存儲的靈魂。

Ocarina成立于2007年,戴爾于2010年7月將其收歸旗下,在收購時,Ocarina公司CEO Murli Thirumale表示:“Ocarina是不同的,是遠遠領先于其他供應商的。”林佑聲表示,Ocarina最大的特點,是“其對非結構化數據的處理能力。”

“我們非常希望從非結構化數據方面,能夠提供給用戶更優秀的產品,比如說我們基于EqualLogic的FS7500和PowerVault NX3500,Ocarina也是如此,都是面向非結構化數據的橫向擴展架構的產品。”林佑聲表示,Ocarina最大的特點,是對非結構化數據——不僅僅是文檔和郵件——而是對于視頻、圖像和WEB上的非結構化文檔,“都會提供不同處理方式下的壓縮以及重復數據刪除的能力”,因此可以幫助用戶達到更好的非結構化數據的數據保護需求。

Ocarina的重點在于對非結構化數據,尤其是視頻和圖像的處理能力,這對于戴爾正在將結構化數據和非結構化數據,塊存儲和文件存儲系統整合形成流動數據解決方案,在流動數據、大數據、互聯網市場上獲得優勢至關重要——總的來說,重復數據刪除在絕大多數情況下,都是面向塊數據——結構化數據的,非結構化數據則主要是文件級的重復數據刪除,而Ocarina正在突破這一界限。

雖然有關Ocarina技術的相關資料較少,但從公開獲得的資料來看,Ocarina技術具有內容識別(content-aware)功能,因此它在處理JPEG文件方面特別有效,除此以外,Ocarina主要面向3個類型的數據:

•Microsoft Office files (Powerpoint, Word, Excel)

•Images and Video (JPEG, MPEG, tiff, GIF, PNG,)

•Compound Documents (email, html, web pages, PDF, ZIP, RAR, TAR)

據Ocarina一位工程師向DOSTOR介紹,Ocarina能夠“對給出的文件以結構化的理解并使用100種不同算法來去處理”,而如果這一文件類型對于Ocarina是全新的,Ocarina會去推斷信息的結構和內容性質,選擇最有效的數據壓縮或是重刪算法。

而在被收購以前,Ocarina的數據精簡技術被稱為“Ocarina ECOsystem數據處理系統”,核心的組成部分不僅包括內容感知的數據壓縮與重復數據刪除算法,還包括為需要壓縮和重刪的數據制定最優運行時間效率的神經網絡模型。據上述工程師表示,Ocarina的設計初衷是“將數據作為一產品來消費,重復數據刪除的磁盤備份系統是有關數據的消費方式,而不是存儲方式。”即,DR4000的重點在于對數據的處理,而不是保存。也就是說,戴爾肯定為DR4000選擇了一個合理重刪比,而非過度重刪和壓縮——雖然所需要的磁盤容量大幅減少——但重刪數據在需要恢復時容易因此而出現的重建數據時間過長的問題。

戴爾流動數據架構重要一環:D2D磁盤備份

DR4000除了以最簡單的方式使用——作為一個中間的D2D短期備份區域,從DR4000的名稱上,實際上我們還能看出“DR”兩字所代表的是Data Replication或是Disaster Recovery,據馬軼霏表示,戴爾確實對DR4000有兩方面的考慮:一是Data Replication,DR4000有足夠的性能——在某些應用環境下——可能做數據復制甚至是當作二級存儲使用;二是災難恢復Disaster Recovery,這一功能與數據復制都是對現有戴爾流動數據解決方案的有益補充,讓其擁有了遠程數據復制和災難恢復的能力——企業不可能租用昂貴的光纖鏈路,DR4000基于IP技術通過以太網實現了更低成本的遠程災備。

而無論是否局限在備份存儲系統上,文件級重復數據刪除技術都是非常成熟的,但是塊級重復數據刪除,尤其是在線快存儲系統的重復數據刪除,其實還走在起步階段。而戴爾一直宣稱將會在在線主存儲系統上使用重復數據刪除系統。

DR4000管理界面

對于戴爾來說,在整個流動數據解決方案架構中,實現統一化的塊重復數據刪除是困難的。

不同的戴爾存儲平臺上的數據模塊的大小是不同的。在EqualLogic系統中,一個數據塊的大小是15MB,而在Compellent系統中,數據模塊的大小是不確定的。64位StorageCenter O/S將在模塊水平上跟蹤數據。一個數據塊并非一個完整的文件,存儲操作系統從原則上可以查出哪些文件是由哪些塊組成的。將文件分割存儲在磁盤中會增加數據的碎片程度。主存儲器的塊級重復數據刪除功能必須能夠解決這個問題。當然,塊越大,在其中發現重復數據的概率越高。

正如我們所知,你會從頁面上讀取數據,對數據進行重復數據刪除處理,然后將數據作為一個連續的數據流重新寫回磁盤,而一旦新的重復數據刪除檢測算法和空間恢復算法被開發出來,戴爾就可以將它整合到EqualLogic 和Compellent的操作系統之中。這樣一來,戴爾不僅在全系列存儲系統上實現了重復數據刪除,在某種意義上,當數據進入類似DR4000這樣的D2D磁盤備份系統之后,戴爾也統一了其多個主存儲系統后端備份恢復數據的結構。

這對于戴爾來說——如果以上想法得到實現——將會是顯著受益的:戴爾現在擁有復雜且全面的產品線,而戴爾存儲的核心價值觀就是“流動數據”——數據只有被更格式化的、標準化的存儲起來,才有可能順暢的流動起來,而DR4000及其后續產品則完成了這一工作:讓數據統一化、格式化和標準化,增強了戴爾流動數據架構的價值。

而據戴爾的工程師介紹,在2011年發布的戴爾流動數據規劃中,實際上已經包含了重復數據刪除技術和戴爾可擴展文件系統,并且會考慮應用在各個環節上,以及不同的設備上,也就是說,戴爾不僅會擴大統一存儲和文件存儲的產品線,同樣會將重復數據刪除加入到主存儲等其他區域,更重要的是重復數據刪除對數據的“格式化”作用將在戴爾得到體現——無論是私有云、公有云還是傳統的數據中心,重復數據刪除之后的數據,未來甚至有可能在不同的存儲系統之間彼此互相傳輸。

馬軼霏表示,戴爾已經看到,具有重復數據刪除技術的D2D磁盤備份系統,能夠提供更好可訪問性和可靠性以及“規范化的格式”,更理想的是對數據增長有帶來的成本增長所控制。因此,戴爾會在流動數據一環中逐步加強這一部分的實力:“現在DR4000的發布只是這個產品系列的第一個產品,也是一個重復數據刪除市場的入門級產品,但是使用的技術和算法是先進的,和未來我們將要推出的更高端產品一樣的。這樣的技術我們要逐步加載到整個系統的各個環節,我們的愿景是客戶今后能夠以重復數據刪除之后的文件格式通過文件存儲系統接口直接傳送到云端。”

未經允許不得轉載:存儲在線-存儲專業媒體 » 戴爾DR4000:數據保護的全新選擇
分享到

cuihao

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走