梅敏玲表示,2009年EMC中國區的增長點主要在固態硬盤、重復數據刪除和虛擬化方面,行業方面,除傳統的SMB、電信、政府、醫療、教育和交通外,EMC首次進入國家電網。目前,EMC在全國的二級渠道已經如愿以償的達到1200家,中國區仍然“保持了兩位數的增長。”

EMC產品線整合 部門調整

據EMC大中華區市場及渠道策略總監梅敏玲表示,在原英特爾高管帕特基辛格加盟EMC之后,EMC的組織架構進行了很大的調整,現在EMC包括管理Symmetrix和V-Max的高端存儲部門,管理Avamar、DataDomain產品、NetWorker和DL磁盤庫的備份恢復系統部門,以及整合現有磁盤系統CLARiiON、Celerra以及剛剛從BuRA解決方案中脫離出來的Centera產品的統一存儲部門。

在提及此前與昆騰、戴爾在重復數據刪除技術領域的合作時,梅敏玲提到,EMC與昆騰的合作已經停止,與戴爾公司則主要是OEM DataDomain存儲系統的合作關系。

此外,梅敏玲表示,在今年5月,EMC將發布更多的虛擬存儲產品,而存儲部門的正式調整屆時也會宣布。

BRS部門現在所負責的產品,看得出已經不包括Centera,EMC現在的理念認為,備份應該與主存儲更貼近,是“應急”而非“保護”,歸檔是面向長期查詢和BI的應用

蔡志剛表示,EMC BRS部門提供綜合數據保護解決方案,從重復數據刪除技術的文件系統、服務器恢復與災難恢復、遠程站點實時監控、重復數據刪除存儲系統、虛擬磁帶庫、快照持續數據保護和復制、磁盤與磁帶的保護以及云技術,都將圍繞BRS部門展開。

EMC備份恢復系統部大中華區總經理蔡志剛

備份變革:重復數據刪除定義Storage 4.0

蔡志剛在演講中表示,以磁盤為中心的備份與恢復架構正在大范圍取代傳統的以磁帶為中心的備份和容災管理,EMC的DataDomain、Avamar和Data Protection Advisor等結合,已經能夠更高級別的容災數據存儲。

他指出,隨著磁盤備份技術的普及和用戶對備份需求的改變,原有的備份概念已經從“保留數據,以防萬一”變成了主存儲之外的二級存儲,DataDomain作為一種“具有重復數據刪除的二級存儲”正在成為數據中心內一種不同以往的在線存儲系統,直接服務于企業的業務數據需求。

蔡志剛將備份恢復和歸檔基于磁盤實現,主存儲仍然使用昂貴的高速硬盤的存儲時代成為Storage 3.0,他認為,隨著重復數據刪除技術的成熟,和具有此功能的二級存儲系統性能的提升,這些系統完全有能力成為速度較慢的位居“二線”的在線系統,取代原有的昂貴的大規模的在線存儲,而原有的需要高速主存儲的一小部分數據,將存儲在采用閃存技術的主存儲系統中,“其余是均采用重復數據刪除磁盤技術”的“重復數據刪除二級存儲”。

顯然,在Storage 4.0中,重復數據刪除技術將是其中的重點,蔡志剛表示,結合EMC的源端重復數據刪除產品Avamar和目標段重復數據刪除產品DataDomain系列,EMC能夠大幅度的削減不同領域的用戶的冗余數據,“重復數據刪除需求仍然強勁, 這與這項技術為客戶帶來的顯著成本節約是一致的?!彼J為,兩項不同的重復數據刪除技術產品,能夠確保EMC BRS部門在重復數據刪除領域的領導地位,而這也就意味著,EMC將在Storage 4.0時代獲得明顯的領先優勢。

從Storage 1.0到Storage 4.0的演變

此外,蔡志剛在Storage 4.0的架構中,也徹底去掉了磁帶系統,他表示,在結合了EMC領先的重復數據刪除技術磁盤存儲技術之后,磁盤備份和歸檔將是不可阻擋的趨勢。

“確立在綜合備份與恢復解決方案方面更大的領先優勢?!辈讨緞偙硎?,EMC仍然在努力保持在備份與恢復領域的領先地位,包括重復數據刪除軟件和存儲系統、虛擬磁帶庫和備份軟件。BRS部門將在“為用戶提供最先進的備份與恢復解決方案?!?/p>

在媒體發布會上,EMC備份恢復系統部大中華區技術經理魏燕則詳細介紹了DataDomain產品的技術細節,以及在被收購后在EMC眾多產品和BRS部門的位置,當然,還包括相應的產品更新。

與備份軟件加強整合

在EMC的重復數據刪除技術藍圖中,Avamar和DataDomain被賦予不同的工作目標,Avamar更側重于源端,更偏向在VMware虛擬化環境、備份服務器、在線復制等應用領域,其最新的進展是EMC將Avamar推進到了桌面和移動辦公領域;DataDomain的工作則更多的側重在目標端,即業務系統后端所連接的存儲、備份和歸檔、容災設備。

魏燕表示,目前DataDomain已經能夠在包括EMC、賽門鐵克、CommVault、IBM Tivoli、BakBone和vizioncore的環境下滿足備份恢復到DataDomain系統時的重復數據刪除功能。

由于OST所帶來的出色性能,DataDomain對OST的支持十分積極,而對于新的GDA系統來說,全局重復數據刪除和命名空間,極大的提升了DataDomain在更大規模數據存儲環境下的競爭力。

不過,在談到DataDomain最新推出的全局重復數據刪除陣列GDA時,魏燕承認,目前GDA的全局重復數據刪除支持最好的仍然是賽門鐵克的NBU和BE,“在發布之前,Data Domain已經支持OST(賽門鐵克OpenStorage技術(OST))很長時間了。所以最開始做第一個合作肯定是選最成熟的?!彼硎?,由于OST的性能很好且設計初衷就是為了以高性能進行數據備份,因此,目前DataDomain全局重復數據刪除陣列GDA與賽門鐵克的OST技術配合,能夠提高LAN備份性能至少30%。

DataDomain三項技術亮點

在重復數據刪除技術中,有一個有關性能和重復數據刪除比率的博弈:如果數據段劃分得太大,找到相同數據段的概率低,則數據壓縮率不高。如果數據段劃分得太小,找到相同數據段的概率高,但是計算和比較的工作量比較大。

如圖所示,可變長能夠減少更多的重復數據。在大多數情況下,越小的數據塊和可變長,能夠盡可能地減少如上圖這樣只修改數據中很小部分所造成的重復存儲。

“經過研究,Data Domain提出可以智能化可變長,數據段長度越短,數據的重復率就越高,數據段越長重復率就越低。但重復段越短,管理的數據量就會呈現指數增加,會使系統性能增加,因此最后優化到4K-12K之間,作為可變長度。在這樣一些特定的例子里,把長度由原來的4K變成6K或者8K,使絕大多數數據具備相同的內容,這樣的內容就可以被忽略掉,因為是重復性的數據?!蔽貉嗾劦?/p>

得益于采用經過驗證的的可變長數據塊劃分技術,DataDomain的重復數據刪除性能效果已經得到了許多用戶的認可,而DataDomain也在數據壓縮率和系統的計算量之間找到了一個比較好的平衡點。

DataDomain的Inline模式,與傳統的Post Process方式相比,inline模式不需要完整的存儲備份,或是將每次備份的數據以完整的大小存入,這一點在進行全備份的時候尤其具有優勢,能夠大幅度減少存儲系統應對全備份時所需要的大容量

而對于如何減少重復數據刪除系統所需配置的存儲容量并加快重復數據刪除速度,魏燕表示,DataDomain利用的是“Inline”的模式:這是一種類似“帶內處理”的模式,備份數據流進入DataDomain的設備之后,進行可變長的分段、切割、計算,將重復的數據刪掉,而不是保存。這些步驟都在數據流進入系統,還沒有進入到盤上之前的進入過程中(邊處理邊保存)處理。

同時,基于SSL架構的Data Domain系統,通過特殊的算法,使得在內存中就能識別出99%的新數據段,只有對剩下的數據段才需要讀取磁盤,從而大大減少磁盤讀取次數??它讀取磁盤時,會根據特殊的算法,每次讀取一批數據緩存起來,這使得多數查找都能在緩存中進行。同時,它在寫磁盤時,就將相關的數據段和指紋封裝保存在一起。這樣,每次可以讀取更多數據,而且讀到的數據更有效,進一步減少磁盤讀取次數。

“一邊已經存了100個數據,現在進來第101個數據,我首先跟這100個數據比較,是否一樣,如果一樣這個數據我就不存了?!蔽貉嘈蜗蟮慕榻B了DataDomain的處理方式,他表示,當數據流入到DataDomain,inline的方式下處理器接管數據,但第一件事不是存儲數據到磁盤,而是利用可變長分段切分數據與內存中此前已經通過算法緩存出來的數據進行比較,檢測是否有所重復,“”如果不是重復數據,才會寫入系統。

但唯一的問題是,雖然重復數據刪除過程只有一次IO,但由于大量的處理,其在過程中異常耗費CPU??魏燕提到,這與DataDomain的團隊當初設計系統時的理念有關:從一開始,之前從事算法設計和優化的團隊就制定了以多核系統并行處理的架構,“高性能來自于以CPU為核心的技術手段”魏燕表示,而有關DataDomain在多核架構上的詳情,在此前采訪DataDomain創始人李凱時我們已詳盡報道。

七十二變:DataDomain的不同身份

針對市場上仍然對DataDomain系統所存在的誤解,魏燕表示,DataDomain的系統僅僅是一個重復數據刪除設備,同時擁有存儲容量,而非單一就是VTL、NAS或是別的什么。

“Data Domain的技術人員不是搞計算機的,而是搞高性能計算的。他們是基于哈希算法研發出的,所以它是業界做重復數據刪除的鼻祖,它的系統跟別人不一樣的地方是上來首先是做重復數據刪除,然后再說別的對象?!蔽貉嗾J為,因此Data Domain做了很長時間做算法,至于說包裝成什么樣的產品倒是件很容易的事情。

他指出,DataDomain首先推出NAS設備是由于NAS是最容易包裝,且接口簡單的設備,在系統方面無需作出太多變化,因此“成為業界第一個具備重復數據刪除功能的NAS”,而此后,基于此設計出了VTL,“VTL跟NAS只是表現形式的變化,Data Domain不在乎這個,只是延用別人的標準?!彼硎?,“之前大家誤認為,Data Domain的VTL具備重復數據刪除功能,(但其實)Data Domain是具備重復數據刪除的VTL?!?/p>

魏燕表示,無論是NAS、VTL、災備系統還是歸檔系統或是“重復數據刪除二級存儲”,都只是DataDomain設備的表象,“Data Domain的核心是做重復數據刪除”做成什么系統,其實都是其次。

此外,魏燕透露,DataDomain現在已經支持IBM主機和AS400系統,并推出了新的全局數據刪除系統GDA和新的高端型號DD880。

GDA相比DD880在邏輯容量、可用容量等方面都有了一倍的提升,但性能卻提升超過一倍,魏燕表示,“同一個作業進如DataDomain系統,分布在兩個不同的服務端進行重復數據刪除處理,其速度肯定是1+1>2,同時,等待隊列的時間更短。

其中,GDA是目前最大最快inline速度的重復數據刪除系統,支持全局重復數據刪除和全局命名空間,并如上文所說,支持賽門鐵克的NBU和BE OpenStorage技術(OST)。DD880則將此前DD690系統的最大容量從71TB增長到了142.5TB。此外,隨之發布的還有DataDomain的加密軟件選項、遠程復制拓撲(One-to-many Directory Replication)以及面向小型站點的遠程數據復制新特性低帶寬優化技術。

遠程復制拓撲(One-to-many Directory Replication)技術的發布使得DataDomain系統能夠在容災領域上獲得更好的利用,這是在原有的復制和備份功能上新增的選項,用戶能夠復制同一個目錄到多個遠程的DataDomain系統,同時支持多數據流優化,使得吞吐量達到最大化。

魏燕表示,這將幫助DataDomain在多個容災站點保留多份拷貝,進一步加強數據保護增加數據,同時允許數據分布在多個站點用于多種用途。此外,需要注意的是,當生產系統和備份、容災系統進行數據同步時,備份數據在傳輸過程中傳送的是Data Domain處理過的唯一數據段,即使被截獲,也無法辯知數據內容,安全性較好。Data Domain的數據防損架構可以貫穿備份點和容災點之間,確保數據的可靠性。

“備份的目的是發生故障或者異常情況的時候,保證系統的正常運行?!蔽貉啾硎?,雖然DataDomain的系統不是在線存儲,但是其地位卻同等重要,而這也就是備份和歸檔不同的地方,他表示,備份是要在需要時能夠馬上用得上,甚至頂上去的,但歸檔不同。

“歸檔是少花錢多辦事,要更充分地利用價格昂貴的存儲資源”,它的目標不是把東西扔在那兒就不管了,而是指需要在線查詢的時候都能查到,“歸檔的真正應用就是在線查詢,歷史數據查詢?!辈贿^,魏燕幽默的表示,DataDomain的設備也能夠做歸檔:“對于Data Domain來講,進到我這兒的東西無論是什么,都要進行重復數據刪除,所以叫‘全局重復數據刪除’?!?/p>

未經允許不得轉載:存儲在線-存儲專業媒體 » EMC推Storage4.0:全面認識DataDomain技術
分享到

cuihao

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走