在下午的閃存分論壇上,賽門鐵克存儲及高可用解決方案資深首席架構師 黃昆發表了題目為《如何將Flash閃存技術運用在高性能、高可靠的企業核心系統》的演講。以下是文字實錄:

黃昆:我相信坐在閃存會場的應該是對閃存技術有一定了解的,希望運用閃存技術的客戶。但是閃存技術去年的市場不管是出國量,還是容量的比例來說,目前占整個存儲在全世界存儲的突破量,大概是在萬分之三左右,這個數字可能低于大家的想象。

但是大家又不可否認閃存技術是未來的一個趨勢,否則我們今天不會坐在這里。今天我想跟大家分享的就是如何將閃存技術運用到企業的核心系統里面。我們看一下前年的數據,ECT做的調查。企業調查基本上是有30%的五百強企業的IT,他們調查的大企業。在核心系統,核心系統跟企業業務是直接相關的系統,對于這些系統怎么應用,想怎么應用閃存技術,結果很有意思。我們可以看到有一半的企業,一半以上的企業想把閃存用在哪里?數據庫。也就是說有一半的企業會想把閃存用在數據庫,接下來還有什么?ERP,或者SAP的東西,還有什么?分析系統。還有一點很有意思,我想跟大家分享,提高效應速度,或者說像12306,他們為了響應海量的并發的請求,還有一些電子商務。大家看到很有意思,還有一些是什么?郵件,25%之前的基本上都是這樣一些傳統的業務。

但是是什么阻礙了?其實現在閃存作為不管從性能,比如說有各種算法,IOPS高了什么的,閃存其實并不貴,大家今天上午聽了很多了。

那么目前市場上我們假設,我們拋開互聯網企業,因為互聯企業有一個特點,他們自己做應用。我們平時做的客戶沒有做應用的定制化,比如百度用Flash技術,三年前就開始在用,在搜索引擎里用。比如臉書網用閃存技術,這些企業怎么用閃存技術,坦率說對我們的傳統的企業可以說沒有競爭價值。從技術角度上沒有競爭價值,我們可以從競爭趨勢上,我們覺得它是有一定的道理的,但是從技術的應用上沒有任何價值。那么企業怎么用閃存?很簡單。第一種用集成的軟硬件一體機,比如(英文),然后或者是SAP的,性能巨快,軟硬件一體。你不是要快嘛,可以。但是對不起,你不能自己去買。你得全部買我的打包的東西。第二個做法是什么呢?全閃存陣列,當然現在還有很多其他的。包括像EMC也好,像傳統廠商也好,他們都在做閃存陣列,他們會用到閃存優化的,存儲量很高,但是這個閃存陣列一個是貴,非常非常貴。而且全閃存陣列現在還有一個問題一直沒有得到很好的解決,就是全閃存陣列控制器雙核的問題一直沒有解決很好。還有傳統的,比如傳統陣列里插一個小存盤,這就是傳統的陣列廠商,這個在兩三年前就一直在推,但是推的不溫不火。還有就是融合架構,我其實是跟很多的比如說土豪一的企業客戶,比如中石油,國家電網、工商銀行和中國移動,這種土豪級的客戶,不差錢的客戶交流過,怎么考慮應用閃存。說閃存要不要用,好,這個東西的確好,企業需不需要,需要。為什么現在不考慮?一個字,貴。土豪級的客戶居然會覺得你的東西貴,貴到什么程度?

那我們現在看一下其實閃存貴不貴呢?從設備廠商角度來說,會說閃存一點都不貴,比如最貴的閃存卡3個TB十萬塊錢,貴嗎?不貴。一臺4C的X86服務器也接近20多萬,10萬的閃存卡貴嗎?不貴,對不對?那么我們再看一看,比如中國移動,所有的土豪里最土豪的一家,一個省里中等省份,不談大省,中等省份光一套系統的一年的維護費大概是2000萬。10萬塊錢買個卡算什么?但是為什么他們會覺得它貴?很簡單。不是說按照這個TB來算的。比如說一個成熟的CRM,大一點的,比如我說一個銀行的例子,工商的審計庫,最大的數據庫,除了后臺的不談,這是另外一個領域,前臺的開放系統最大的是14個TB,這就是最大的了。我們想我們用閃存去做,3TB換到閃存,5個閃存足夠了,加上保護6個閃存足夠了吧?真實情況是這樣嗎?其實不是,如果仔細一算存在幾個問題,的確現在的存儲是夠了,但是要為未來想。我的企業我要做這個寶,那個東西,各種各樣的業務,他們預計可能我的企業下一年,我的存儲容量就要翻番了,這個時候你能不能跟著我翻番?我一個PC里面就有8個TCIE的槽,一次性插滿了我以后怎么辦?東西是不貴,但是擴展性不行。

第二個問題是用了閃存之后,閃存的管理的方式以及閃存的生命周期等等,這樣都跟傳統的盤不一樣,閃存是一個塊設備,其他的是別的設備,管理什么都不一樣,增加了復雜性。再接下來還有第三個問題,管理的復雜性之后FA怎么去做?然后我現在我的數據都是有快照做保護的,用了閃存之后快照怎么做?然后接下來用了閃存之后,那么你的風險怎么做?你只是插進一個點的時候,用戶的第一個要求是你插的這個點可以適應現在的體系。如果不行就全得用,那意味著什么?意味著如果你不能融入用戶的系統,閃存的實際利用率是很低的,現在標準的企業快照5份,每兩小時一次,這個就有點難以接受了對不對?然后繼續往下走,同樣的再一雙倍就乘10了,還有你在內部使用如何把這個資源給大家共享,這個是一個問題。一下插了6個卡進去了,怎么用?這都是閃存所面臨的一些問題。它的真正用戶覺得貴的原因是說你對IO的提升值不了那個價,簡單說就是這個問題。

那么現在我們再回頭看我們目前企業客戶能用閃存的技術的4種方式。我把它形容很簡單,閃存是10塊錢的東西,你把它放在傳統陣列做混合存儲的確跟現有系統融合了,但是你只能是買到兩塊錢的(英文),你把它插到機器內部,的確你買到了8分錢的(英文),但是你要付出的是什么呢?是10倍的風險。你為了提高這個(英文)你鋌而走險用戶是不答應的。那全閃存陣列會怎么呢?我花了10塊錢,買了5塊錢的(英文)。它太貴了。所以種種因素阻礙了用戶在企業內部大規模的用全閃存技術,就像趨勢看到的,我們想到的趨勢從技術角度上,我們想到的是什么?未來的世界是閃存做在線的熱數據的一線的存儲,然后7200萬的大盤,足夠便宜的大盤去放數據,這世界多美好,但是事實是企業和我的要求不是這樣的。我需要快照,我需要容量,我的容量跟生產數據,我的真實的容量和業務數據的比率的關系不是像大家想象的,然后還要考慮風險等等。所以現在困擾企業大規模使用的我覺得就是這個原因,他找不到一個合適的模型或者架構來讓它放心的去在企業內部數據中心全面應用閃存技術。

所以總結起來在企業的核心系統中使用閃存技術需要解決幾個問題。如果你是用傳統的陣列的方式,然后在里面插閃存盤,你要真實的解決的問題其實是什么呢?其實是你要解決的問題是說解決問題的目標是解決數據熱點的問題,這個閃存盤不一定能提高太多的性能,可能提高一倍的性能,但是它可以做什么?可以消除數據熱點的問題,減少IO征用,所以我們真正如果在企業的數據中心里面用它,也要把它用對。當我們把它用對了的時候,我們在某一個核心系統里面,我們的閃存盤把熱點數據放在閃存盤,然后周期性的進行遷移,這個經濟效益就會很顯著,用戶覺得很值。如果說想讓他把閃存盤插進去就起到提升性能的作用,這個就跟他的期望值有點過高,放在不合適的位置上了。真正是如果企業有閃存,想把閃存放在陣列里面,想在陣列里運用閃存,我的想法就是優化SSD,就是跟應用配合起來,周期性的做成自動腳本也好,或者工具也好,就是要定位解決IO熱點,很簡單。

如果你是用全閃存陣列,非常高性能,然后也是可以在SAN里面擴展,擴展能力也很好,這個性能是非常好的。那么我們定位是什么呢?其實我們要解決的是瓶頸的一些問題,主要要解決一些什么問題呢?就是盡量不要占用傳統的,比如說(英文)或者起來的一些低延時的網絡傳輸系統,當然像現在更流行的特別是現在更流行的比如說英特爾的DPDK,就是高存儲的一些協議,我覺得這個是很重要的事情。

當然總的來說全閃存在做成陣列還是價格過于昂貴。還有一種是什么呢?是說把閃存放在(英文)里面做閃存,減少IO延遲,它的作用就是減少IO的延遲。這樣就像前面演講的人說的把閃存技術和傳統的SAN技術打通在一起,那么在這個運用模式下,我覺得關鍵技術是什么呢?關鍵技術其實就在于說你要支持讀寫Flash,真正影響企業最終核心系統里的真正影響交易完成的是寫那一下,你不(英文)是完全不了的。如果寫做不出(英文)來,你的(英文)的速度提不上去,速度提不上去你再多的(英文),多少的并發應用,你最后(英文)運行不了,交易完成不了。但是現在的問題就在于說讀很簡單,最后的數據都在后臺的共享上面,保證數據一致性或者什么,很容易的一件事情。但是企業(英文)就不一樣了,把這個(英文)寫上去就要有足夠的把握,如果壞了,或者主機檔了,那交易怎么繼續進行?這就是一個問題?,F在我們想了叫(英文)技術或者(英文)。

第三點就是什么呢?還有一種是目前比較接近的,或者比較新銳的,像我們公司,包括現在還出來一些(英文)的公司,像(英文)公司。他們強調的是,包括英特爾也是在強調說未來數據中心的架構是什么樣的呢?可以不要存儲了,全部用SSD,中間用(英文)。原理很簡單,數據離CPU是最近的,而且它的性能是最高的。高在哪一點?不一定是比前兩種方式的吞吐提高多少,但是IO的相應時間延遲是大大的提升了。

舉一個例子在SAN上面用全閃存的陣列來做的話,雖然是可以穩定在一毫秒到兩毫秒之間,如果在(英文)的情況下,全部在(英文)里面,這個通常也是監控不到的,如果進入系統內部跟蹤,大概是在50微妙左右,就是這個速度。所以它的響應速度基本上已經很接近內存的響應速度了,就是內存的(英文)響應速度,也就是對于計算機來說或者純粹對于計算來說這個區別已經不是太大了。

當我們把數據放在每一個節點上面,這種分布的一致性,非對稱的一致性的問題怎么解決?在科學計算或者設計領域,互聯網領域有一些分布式的技術,或者若一致性,通過弱一致性保證。數據倉庫ERT等等,郵件系統,這些不全是用弱一致性來保證的。當然了,哪怕強大的像阿里巴巴,雙十一創造如此的價值,但是他們的后臺架構還是強一致性,不是弱一致性,還是基于(英文),對于這個事情就有強一致性的問題。所以這個就需要我們底層技術做更多的突破。

前面談了各種閃存放在企業里面的拓撲,我們再看一下從縱向來看,我們看LNX的Stach怎么優化,那么閃存放在哪呢?我們應該在這里,這是閃存可以放在這個層面。但是這個層面是什么?是系統的(英文),它不是盤,要走到盤需要走很長的一段路。要首先經過(英文)的隊列,然后到設備的上層,然后你要到每一個設備的底層。舉一個簡單例子,如果你把一個閃存通過一個盤進來了,你走的IO通道是怎樣的?是這條路。你走的(英文)協議,一層層的影射上來,通過隊列再走,這個隊列為什么需要?因為以前有磁盤存在的時候需要有隊列,協調IO。閃存其實是一個層面的,不需要這樣,不是串性的東西。更高效率的辦法是不通過系統的隊列,直接走到設備上面,直接訪問閃存。閃存卡是這樣的IO通道,走盤是另外一條通道,如果把盤傳到(英文)里面再影射出去,相當于同樣的通道走了兩遍。所以盡管有不同的應用閃存盤的技術,但是這個閃存離你生產系統越近,性能越好,一定是這樣的。你想用閃存來提升性能其實有幾種區別。一種是閃存設備,這樣你可以達到多少的性能?基本上性能極限在600到800。如果單通道的,單塊卡單通道的,大概是1.2G,還有一種是當成LNX的(英文),這個在于什么呢?經過(英文)隊列稍微要降一點性能,這個性能降低不大,吞吐量是1.1G,但是這兩種技術之間還有一個差別是什么呢?是IO,這個是50微妙,這個的大概是在0.5毫秒左右,差不多多了七八倍。對于這個差別并不是特別大,對于設備廠商來制造設備來說,這兩種方式區別非常大。

所以綜合前面的,企業應用我們談純粹的企業應用,它的PCI8的閃存設備實際技術需求有幾個,第一是要實現閃存卡之間的數據共享,不然根本沒法用。那解決問題的辦法現在主流是用(英文)RDMA的方式,高速低延遲。第二個企業需要做讀寫的Flash,這是跟互聯網企業最大的不一樣。如果做企業Flash要做(英文),這個是必須要保證的?,F在市面上有很多這種用Flash做(英文)的技術,但是如果大家看(英文),第一句話就告訴你,對不起我不支持(英文)。所以你的數據庫一跑上去(英文),常出錯,各種古怪的問題都碰到過。前一段時間幫用戶做了不少這樣的系統。還有一個就是跟現有的SAN環境以及高可用保障系統結合起來。也要有快照,這個意味著什么?在遷移的過程中做到(英文),這個是非常難的事情,一致性的數據拷貝,而且是分布式的。

這是對性能優化的,這個圖今天時間不夠。簡單介紹一下RDMA,它是把計算和通訊整合在一起。所以數據傳輸效率很高,最好的地方是無需OS介入,所以在做IO是不需要開銷的,或者傳遞數據的時候,這個是很快的,快速過一下。這是沒有RDMA的方式,要放到記憶卡里封裝,傳到不同的協議層,每一步都要傳遞,通過物理電路打包成真傳過來,一層層的,時間非常長。然后有RDMA的方式很簡單,你這里有一個數據,然后你們形成了傳輸機制,封裝,到這邊不用解裝,直接進內存。所以它的效率是非常高的。

我舉一個例子,像(英文),它在兩種方法之間都用了RDMA,第一是數據庫節點,用的是傳遞同步,直接使用了RDMA協議。第二個是數據庫和(英文)單元之間,用的IDB協議,其實還是(英文)??傊ㄟ^這個,即使使用大量數據傳遞,一來有足夠的CPU和足夠內存,進行正常的數據處理。

(英文)也有自己的,Flash混合存儲解決方案。我們通過并行文件系統在兩個節點之間做了一個打通,兩個節點里面的Flash卡形成一個鏡像的關系,保證這兩個Flash卡之間是(英文)的關系。我們后臺的往下刷數據,但是這個異步刷數據的過程可以保證(英文),因為我們會對IO系統做一個標簽,有一個(英文)機制保證,而且多個快道之間去刷。最后給用戶呈現出的是一個統一的存儲,但是是比正常的讀寫的(英文)要高很多。這個特別在用在(英文)數據庫上面反應效果是非常不錯的。

第二個還有一個就是我們的PCIE的閃存卡共享解決方案,最大可以支持多少?支持8G,任意一個節點都可以訪問整個8個節點上的閃存的任何一個區域,這8個既是計算節點又是存儲節點。中間是用什么?是用(英文)進行互聯,我們經過測試在(英文)數據庫的情況下,隨即讀寫本地和遠程,比如數據在這一塊上,這一塊計算節點要進行讀寫的話,那么本地的速度跟遠程的速度是多少呢?是10:9,本地可以到2.4G,遠程差不多可以達到2G以上,這是非常接近的一個速度。

當然最大的好處就是我們所說的,我們支持用戶來定義融合性的靈活存儲解決方案,是什么呢?我們可以在主機內部,如果槽位多可以插全閃存,如果不夠可以混插。這兩個機器還可以外接做FC存儲,所有的數據都可以跟FC存儲發生,這個節點可以變成什么呢?輩分節點,存儲節點,可以跟上網點結合,甚至可以不插結合存儲,直接做結算節點,去訪問遠程的數據。整個都是在同一個管理體系下的。你可以把這邊的數據快照刷到外存儲上面,可以做鏡像到外存儲,鏡像一般不推薦,因為性能上不去了,快照比較有方法,還有連續拷貝,各種方面,甚至用備份方式到外路存儲上面。你快照用什么體系等等,還是用原來的體系,只不過環節變成兩步驟。所以整個對企業來說它的選擇是很靈活的,而且我們支持在線擴展和即插即用。比如原來是4個節點,或者最少一兩個節點,一個一個加上去,加上去的節點可以插盤可以不插盤,只要加進來了,整個存儲空間就是被共享了。這是賽門鐵克針對優化的靈活的解決方案。

我們公司最近正在招募大量的合作伙伴,因為閃存技術最重要落地要給用戶是一個解決方案,我們公司只能提供軟件,但是我們需要有閃存的盤,我們需要有主機,我們需要有應用,一系列的。整個給用戶提交的是一個完整解決方案,才是用戶真正感興趣的方案。所以如果有感興趣的合作伙伴可以跟我們聯系,我們可以一起推出符合中國特色的一體機或者融合系統。

未經允許不得轉載:存儲在線-存儲專業媒體 » 賽門鐵克黃昆:閃存技術用于企業核心系統
分享到

zhupb

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走