中國惠普有限公司存儲解決方案架構師張楠

下午,中國惠普有限公司存儲解決方案架構師張楠系統介紹了閃存的發展和惠普的3PAR產品的特點。

首先張楠認為無論是在主機上的閃存加速卡還是叫閃存陣列,如果站在惠普產品的角度上剖析一下在產品上哪些技術幫助到了閃存。他認為可以從以下幾個方面來闡述:

第一是閃存市場與需求。大家都有自己對閃存的理解,我們每人心中都有自己對閃存的定位,這個東西好不好,哪些地方有用或者是沒有用。SSD確實能給用戶帶來很大的好處,它的性能是成倍增長。SSD是機械硬盤的十幾倍甚至幾十倍。是不是所有用戶都能用到呢,如果是壓力測試可以測試到2萬甚至4萬I/O,但是真實的狀況不是這樣。跟你的應用、服務器、網絡都息息相關。我們抓出來的數據跟大家說一下,通常抓出來的信息80%的客戶無論你是用全閃存陣列還是分層存儲,基本上你的I/O都在500到1000個板塊上,80%。有一些用戶會超過1000,會更高一些,這些用戶數量來說比較少。原因在哪?我們看到實際的業務當中,你在每單位,每GB上產生的數據量不會非常非常大。以前我們老說機械硬盤,機械硬盤確實他的能力是很有限的。到后來大家都覺得SSD,我們I/O要支持多少,除了I/O以外還有一個非常關鍵就是延遲,延遲很重要。我們以前講說存儲能夠做到多少I/O,很多廠商發布幾十萬、上百萬多少,這些I/O對真正的用戶來說意義不是非常大。因為延遲對用戶來說是很關鍵的一個內容。我們通常會講說閃存能夠降低延遲,提高I/O,怎么去做,哪些應用適合去做?一般來說我們從惠普角度來說看到三點,第一點是數據庫/BI加速。商業智能分析,你需要對數據進行一些挖掘,你需要在月末做月結的時候,需要讀取大量數據,這些數據對閃存非常適合。第二點我們會看到越來越多用戶把關鍵業務和核心業務放在虛擬機上,現在看到很多大型保險行業包括券商他們都會把核心業務放到虛擬機上。第三點就是虛擬桌面,用戶在三個層面上考慮采購閃存的時候,無論是全閃存還是混合陣列,第一就是成本。買一塊SSD成本是一塊機械硬盤的幾倍甚至十幾倍的概念。

我們在一個發布會上講到了其實很多人因為過多關注硬件的成本卻忽略了一個隱性成本,這是軟件成本。為什么這么講?這里舉一個例子,很多數據庫用戶是Oracle,無論是像Oracle還是數據備份軟件等等,他們的收費模式都是按照硬件,你服務器上的CPU數量來收費。你CPU數量越多,你CPU耗越多,你付出的代價越高。以前大家都用傳統的機械硬盤做磁盤陣列,那時候你的I/O的響應能力非常有限的。當你有大量的I/O進入到后端存儲的時候,這時候你的延遲很高,傳統的機械硬盤延遲3毫秒以上,一般4到5到10,擬主機的CPU到這個I/O,導致你CPU應用很差。說依舊要加內存,加CPU,解決這個問題。用戶加CPU,你的硬件成本并沒有減少太多。

什么樣的陣列比較適合閃存或者說閃存陣列應該具備哪些功能?首先你要更小化的避免重復性的切入。以前聽說有些廠商為了做重復數據刪除要損失大量的性能,可以看到第三方的一些舒暢公司,他們做重復數據刪除的時候,存儲壓力過大,把重刪功能關閉,然后閑時再打開。重刪是有很大的壓力,SSD很貴,Flash很貴,我們把重刪提升到1:3,1:4,你的投資回報率就回來了。還有一些空間回收這些技術,都可以降低你的前期的投資。另外就是你要最大化的利用你的存儲空間,現在惠普有一個硬盤,單盤1.92T的盤。為什么會有這樣的盤?這樣的盤好處在哪?真正把他用起來,后面會講到。另外盡量最大化的去降低這個硬盤的磨損,這里有很多的技術可以幫助閃存,你在控制器上幫助閃存完善這塊,來提升硬盤的壽命。

下面我重點講講具體一些細節,講這些細節之前先看產品,所有技術點都是基于這個產品。給大家說一下,我們的7450,90萬I/O,不是非常的高,在配48塊盤的時候就可以跑到90萬I/O。但在這個配置下,可以達到0.7毫秒的優勢。這是我們實測,任何用戶拿到我們產品都可以測到這個性能。如果你的I/O在80萬。另外是99.9999%,我們現在在我們的7450一個閃存陣列里面,我們也是99.9999%。重刪一會放在重點給大家講講,我們惠普的重刪技術怎么做,我們自己有很多的重刪技術,不知道大家有沒有了解到惠普有一個備份數據的重刪,那個重刪技術不太適用于這套系統。大家都知道備份的重刪對在線數據性能要求完全沒有,他不會擔心說我做了重刪會改變備份的性能。備份的性能相對來說沒有核心業務系統在線那么高,我們是用另外一種方式來做。另外就是SSD里面的保修,我們全部都是5年的原廠服務。

我們看一下具體能夠拿到這么高的I/O,這么低的延遲,我們是怎么做到的?首先看一我們在閃存做的優化,第一是讀操作的優化。讀優化這個跟陣列和主機之間的讀寫訪問是有很大的關系。主機上你可能用的是數據庫或者是文件或者是很小的商標圖片等等。不同的數據I/O過來的時候,他的塊是不一樣的。有可能這個圖是4K,這個圖是16K,但是對于傳統的存儲來說一般他里面的緩存頁面不固定,通常是16K或者是32K或者是64K,要看你具體的產品是怎么設計的。如果是傳統的陣列,你讀一個4K數據,需要到內存里面抓至少16K數據上來。這樣對你的讀的帶看的占用就是一個浪費,你其實只需要4K的數據,為什么讀出16K來。在閃存上,我們有一個很好的設計,我們只到后端的硬盤里抓4K,最小就是4K的大小抓你后端的數據,減少你讀帶寬的占用。同樣讀這個數據,1000I/O讀4K就系4兆帶寬,16K就是16兆帶寬。

第二就是寫,SSD的寫,相對來說比傳統的要復雜一些,他先要把數據讀出來,可能要擦掉,再復寫等等。同樣這個問題,因為你寫I/O大小也不一樣,有可能是4K、8K,16K。當你只有4K的時候,我們在4PAR存儲上還有這個優化,真正寫到后端的配置頁面里面,我只寫4K。不會把16K刪掉,把整個16K再重寫一遍進去,這樣減少你寫的帶寬的占用,第二減少你的寫的放大。這樣操作好處就是提升你磁盤的持久性,增加了SSD硬盤的壽命。

第三就是緩存優化的算法,大家知道存儲,無論是閃存陣列還是機械硬盤的陣列還是混合陣列,緩存對寫還是很有意義。緩存和后端硬盤的配合非常重要。怎么去配合?當你數據I/O不是很大的時候,你寫到緩存里,緩存只用10%、20%,沒問題,我們的陣列會定期比如64個I/O或者是200和300毫秒之后,我會把數據放到硬盤上去,這是常規的做法。但是如果你的陣列的I/O壓力非常大的時候,這個時候我們閃存陣列很智能,我會把我這個頻度加大,一開始是400毫秒、300毫秒,降到200毫秒,更低的時間點刷新我的閃存,來做你閃存的后端讀寫的加速。

另外是對于大塊數據的優化,大塊數據因為很多用戶很難區分出哪些數據應該放在閃存上,閃盤上,哪些應該放在機械硬盤上。所以經常有用戶他的數據會有大塊,比如128K、256K這些大數據會放到SSD上去。我們先講寫,對于寫的話,128K這種寫如果是很連續或者是256K進來的話,很影響你SSD的使用性能。我們會把你大塊分成很小的32K這樣的順序的I/O變成隨機I/O進行讀寫操作。這個就是我們在右邊這個例子,我們是這樣去做的。還有一種場景下用到就是你壞盤之后,這個盤壞了之后,一個新盤重新做的時候,你這些數據塊其實在恢復過程當中也是一個順序寫的操作。這種順序寫我們也會把他盡量變成隨機的小I/O,這樣來提升你整個閃存存儲的使用效率,這些都是優化了。

第二如何讓閃存真正的加速。

我們一直在講閃存很快,怎么樣能夠把它充分利用起來?,F在看到很多用戶利用閃存的時候,惠普賣閃存存儲很久了,都會有閃盤,這些閃盤上的I/O到底是多少個,我們從實際用戶抓出來很多信息。很簡單的例子,我們全球95%的高端和中端的存儲系統都會遠程連到我們惠普,會抓取用戶信息,會看到在你的I/O是多少。在機械硬盤上你的I/O是多少,這些信息都可以抓出來。中國有一些特例,政府原因包括一些涉秘原因,很多用戶不愿意把存儲接到公網。任何廠家從后面抓取信息不是你的數據信息,而是你的磁盤管理信息,你磁盤陣列的狀態,你磁盤的性能等等。

我們談到1.92T硬盤,別人為什么沒有。這是想到一個很好的思路,講這之前先說一下I/O知道,不知道大家有沒有用過惠普有一個老的EVA(音譯)的陣列,惠普老EVA是第一家真正做存儲內部虛擬化,可以跨越100塊、200塊硬盤,這是EVA先研制出來?;萜昭邪l了這樣的技術,這個技術帶來的好處是什么?傳統的陣列廠商,用戶買8塊,你至少要多買兩塊,要買10塊,你用的時候要用8塊,其他兩塊是熱備盤,這個等于是資源的浪費。這個技術的好處就是如果你是在4PAR上,你的硬盤,這十塊上會固定起來,你在你的每塊盤,最下邊的位置有一個空間給他做熱備,十塊盤的I/O會利用起來,資源充分使用起來。我們研發人員又想到一個事情,既然這個熱被空間,這個灰色區域,這是我們的熱備空間,其實在沒有壞盤的時候,這個空間就是沒用的。為什么我們不能想辦法把這些空間再利用起來?怎么利用起來?大家知道SSD有一個區域就是OP區域。這個區域做什么?是一個隱藏的區域,買企業級的硬盤,買100G硬盤,后端儲藏27%,這跟盤的類型、種類、廠家有關系。你藏的空間是一個交換區域,來做數據庫的交換,來提升你的硬盤的性能,提升你存儲的硬盤的壽命,OP是干這個。理論上這個OP區域最大的話,你的SSD壽命理論上應該越久,性能應該越好。但是這個東西OP區固定的話,不一定適用每個。如果你只有500個I/O跑在一個SSD上的話,你的OP區域設的很大沒有意義。我們跟我們合作這些SSD廠家談了一個合作,他們會把接口給我們,我們會跟硬盤這些直接對接。他的OP區開放給我,然后怎么辦?我們會把我們的Spares空間給你的OP。如果你的業務是非常重要的業務,一個I/O數據量很大,就證明你的熱備Spares空間區域很高,你的數據很重要,需要很大的熱備空間。當你把Spares空間會給到OP那邊。為什么會有1.92T的硬盤,可以在這點上做的比任何其他廠家都要好。直接的經濟效應就是對任何用戶來說你的采購成本是非常低的。機械硬盤現在小盤2.5寸盤300G現在市場價格很透明。300G要6到7塊才是1.92T的容量,我們現在的價格是6到7塊的硬盤的價格差距不大。你的性能卻是這6到7塊硬盤的十倍以上,你占用機房空間是他的1/6,你的能耗是他的1/10。這時候用戶為什么選擇機械硬盤而不選擇這個大容量的SSD,承諾5年保修硬盤。很多用戶愿意選擇后者,這也是我們在市場上非常有力度一個產品,可以幫助用戶在SSD上面將門檻降低很多,可以直接進入到SSD上面。

另外我剛才講到了很多的SSD的產品,大家可以去看其他的廠商,相對來說閃存陣列都是很獨立的一個品牌。這個獨立的產品意味著你的操作系統、管理界面、功能不相容。導致結果如果你買了一個SSD的存儲,你要做容災,你還要再買一個SSD存儲,這個成本非常高。對我們有一個好處我們在3PAR上對閃存進行了獨立的優化,可以買一個SSD純閃存陣列,你買一個很廉價的在那邊,機械硬盤做容災,其他廠商做不到。這對于用戶來說你的投資回報率提高了,這是題外話了。

我這里講的是因為3PAR具有很多的功能,我們在QoS做的非常好,可以針對你的每一個業務、每一個卷來設定一個。今年賣了很多閃存陣列和混合陣列給用戶,他們不會把一個業務放到陣列上,他們可能有十幾個業務在這上面跑。他確保核心業務系統不會被其他業務所侵占,通過這個功能很好的實現。傳統的陣列,一般的功能會做到這一點,我設三個級,高中低,優先級是12345。優先級最高1比2和3優先級高一些,獲得I/O高一些,這是粗放的配置方法。我們可以配置到每一I/O,非常精細的I/O或者是非常精細的帶寬。

第三就是重刪上做的細節,3PAR做重復數據刪除非常容易,因為3PAR現在很少有廠家在存儲里面有這個ASIC芯片,這個研發成本很高?,F在是融合時代,我們惠普也在談融合,我們為了提升你的存儲的效率、性能,降低存儲管理,我們在存儲上加了這個ASIC芯片。這個ASIC芯片本身就有一些功能,天然就有這樣的能力。我們在研發的時候可以很輕松把這些功能放到閃存里面去,比如我們在做重復數據刪除的時候,我們哈西算法,本身就是CRC的算法。理論上你這邊進來的數據16K的數據進來到ASIC上面,會產生一個獨立的哈西,只有32個Bt,很小的哈西碼。我會跟之前寫的數據進行對比,對比之后發現這次進來的數據和之前某一個16K產生的哈西是一樣的,他就很有可能這兩個數據都是一樣的內容。但是哈西算法在算法上哈西沖突是存在的。因為有再小的幾率,不同的數據進來,也有可能會產生同樣的哈西,這種情況是存在的,但是很小。任何用戶不希望他的數據被錯誤的刪掉。所以為了確保我們的哈西準確率,我們會把SSD上的數據讀出來,16K的數據讀出來,和你進來16K的數據進行一個對比,這個對比不會耗費你的資源。你的16K和那個16K完全一樣,你是重復的數據就會扔掉。通過這樣的方式可以百分之百的算出哪些數據是重復,哪些數據不是重復。他不會占用你主CPU資源,不會因為做重復數據刪除,使你整個數據存儲大幅上升。為了對比一下數據,把硬盤將數據讀出來,會有損耗,很小。第二我們做重刪,不是你的I/O進到一定要寫到硬盤上做完重刪之后返回給主機,我的重刪是寫到Cache里面,通過ASIC芯片算這個。所以這個重刪對于你的生產系統并沒有直接的影響。這也是為什么我們叫HP 3PAR上的數據重刪是無損的數據重刪。這也是我們百分之百做的在線存儲,這是我們非常好的一個地方。這里還有很細的功能,不介紹了,這里還有一些哈西的表,會加速,去查詢等等這些內容,不多說了。

3PAR有很多閃存的優化,有很多模塊,我們會對閃存進行特殊的管理,性能通過硬件和軟件提升,通過有效的管理來降低他的磨損,另外我們會對故障進行非常好的處理。在3PAR有單獨的硬件和軟件對他的進行設定,這里我們走的非常好。

第四是對于閃存系統有幫助的一些功能。這些功能往往都是傳統廠商提供的,大家知道傳統的磁盤陣列廠商都有很多軟件和硬件的功能,閃存上這些功能能不能用上,哪些功能能夠幫到閃存。我們預計明年的時候會把憶阻器memories的技術放到市場上去,一兩年之后這個就可以量產,這真正劃時代意義的一種存儲的介質。這種介質其實就像我們電腦里的這些memories一樣,你PC關機數據就會小時。我們會記錄你01到10變化,永久記在這些憶阻器的設備上。這樣做的好處是,這里面憶阻器的延遲比現在的SSD的延遲低幾十倍,他的能耗也是非常低,這點對用戶來說非常有幫助的。我看到網上有很好的例子,這種技術實現就好象你再一個水龍頭上加一個皮管子,你打開水龍頭之后一開始皮管子很細,后來變粗,這個變粗的管子就是從0變到1,通過電流改變他的阻值的變化。從1變成0,把水放掉,這是憶阻器形象的說法。這個技術,這是惠普的專利,我們在大概05年的時候變成了惠普的專利。我們惠普實驗室一直在持續的研發這個技術,預計在不久的將來會有這樣的產品進行面世。對于整個我們講磁盤介質的功能改變會有非常大的幫助。

未經允許不得轉載:存儲在線-存儲專業媒體 » 惠普3PAR:性能無損的全功能閃存技術
分享到

shaohaihong

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走