王彥飛:現在是處于數字化轉型的2.0階段,我們1.0的時代,各個組織和用戶在做自己的創新。2.0時代的到來,大家對于創新的共識,使得我們對于人工智能、物聯網、區塊鏈信息技術的使用急劇地膨脹。

五代存儲的演進

將來還有3.0階段,可能更多的是側重于創新的持續化和創新的制度化??匆幌卢F在所處的2.0階段的三大特征:

1、最主要的特征,數字化鴻溝已經形成,對于個人或者是企業來講,面前這條溝越來越深、越來越寬。對于企業來講,如果你能成功地跨過去,可能就會上一個新的發展階段。很多百年老店突然倒了,都是栽到這條溝里面了。把這個概念提出來,更多地引起大家對這個事實的認可和對這個事實的澄清。

2、規?;?。不管是數據量也好,還是用戶數也好,包括物聯網上的數據節點也好,都會爆炸式地增長。而爆炸式地增長所帶來的另外一個結果,就是所謂第三點。

3、創新速度越來越快,這是IDC總結的,中國互聯網每分鐘都會產生大量數據,都會產生大量的交易,而這種數據和交易,對于存儲來講,有了新的要求。這是我們第五代存儲引入的一個切合點。數字化轉型過渡到2.0階段,原有的一些存儲,可能的一些特性已經不足以滿足新的業務的要求。大家看一下,這個圖是我們幾代存儲迭代演進的過程。下面大家看到這三個大圈,是我們業務模式的更新迭代。我們認為,作為信息基礎架構最核心的基礎設施存儲來講,它的更新迭代主要來自于業務模式的推進。比如說,我們在所謂的第一平臺的時候,只有IBM的大機+終端模式的時候,存儲也很簡單,直聯就可以,因為服務器數量很少。隨著計算機網絡,應用過渡到第二平臺,存儲更多是向統一存儲角度過渡,強調共享。隨著移動互聯網技術、大數據發展,現在的應用基本上跨度到了第三平臺,對于存儲的要求進一步提升?,F在所有的存儲基本上都在講閃存,閃存是解決存儲性能問題的關鍵組件?,F在數字化轉型2.0階段,閃存已不足以應對現有的業務帶來的挑戰,有更新的一些特征的存儲會出現。這個存儲的主要特征,就是智能化,這是第五代存儲的主要的關鍵字。

第五代存儲的主要特征

在今年,我們和IDC聯合發布了關于第五代存儲助力數字化轉型的白皮書,大家可以從IDC網站上下載到。在白皮書里面,著重闡述了第五代存儲的一些概念,以及它的主要特征。我們認為第五代存儲是數字化經濟發展的一個必然產物。因為第五代存儲作為基礎架構的核心,作為數據資產的主要的附著點,應該幫助前端的業務,進行更多的轉型,所以它應該具有一些新的特征。這個新的特征,包括面向云的架構,能承載AI,能承載IOT,能承載5G這樣一些新興技術。

作為一個企業或者組織來講,當我們在選擇存儲平臺的時候,不管是集中存儲、分布式存儲,還是云存儲,大家可以根據第五存儲這5條具體特征來比較全面地考核存儲的前瞻性、對新興技術的適應性,給大家提供一個思路和框架。

第一個特征是敏捷高速,翻譯成簡單的字就是要“快”,因為現在的數據也好,應用模式也好,更新迭代地越來越快。衡量敏捷高速最主要的特點,就是要采用NVMe的技術?,F在閃存基本上已經跨度到NVMe,IDC認為2018年是NVMe的元年,不支持NVMe技術的設備,不管是存儲還是網絡設備,基本上已經落后了一代。

NVMe只是一個數據傳輸的協議,NVMe主要的價值在于檢索介質的性能,如果只是換了NVMe,而存儲介質沒有大的更新,性能的提升有限??梢岳斫鉃?,NVMe是一個信息的通道,而這個通道上面,跑什么樣的車,取決于采用什么樣的最新的介質技術。這個介質技術,我們論壇的主題就是SCM,SCM就是最應該跑在NVMe通道上的一個最極致的介質。各個廠商的技術發展應該都是圍繞著NVMe和SCM這兩項技術來展開。

NVMe給我們帶來的好處,就是一個持續的優化和敏捷的性能。關鍵點是NVMe如何發揮出NVMe最大的效率,關鍵在于SCM。我們相對于機械硬盤來講已經很快了,現在各個廠商都在把SCM引到存儲平臺的建設中,但思路不太一樣。因為SCM就是一個介質,可以存在存儲的各個位置,現在各個廠商把SCM放在Cache這一側。我們的PowerMAX,是唯一把SCM當做存儲層,當做磁盤這一層來用的產品,基本上都是當做 Cache 來用,設計思路不一樣,倒也無所謂,關鍵是要把SCM在現階段,讓它幫助我們解決什么樣的問題,我們把它當做盤來用的主要思路,因為SCM比SSD的性能要好很多,所以我要用一個比SSD盤性能好很多的東西,來彌補SSD盤性能的短板。

第二個特征是有效容量。我們之前推全閃的時候,數據不停地壓縮、解壓縮,對性能的延時一定有影響,尤其是當IO特別密集的時候,影響會放大。我們講第五代存儲的特征,有效容量,更多的強調性能無損。如果只是壓縮消除,第四代的閃存陣列里面,已經具有這個技術。

有效容量是什么?如果我們是一個20T的物理容量,消除掉了必要的冗余之后,可能變成17T。你開4倍的壓縮,它就變成68T,開5倍就變成了85T,只有20T的物理資產,承載了數倍于物理資產的容量。這個方式帶給我們最大的好處,除了性能的提升之外,機房空間、能耗、冷卻的費用降低?,F在數據爆炸式增長,我們解決爆炸式的方式,應該更智能一點。有效容量是幫助我們解決這個問題的最主要的一個方式。

我們第五代存儲有效容量的計劃,這是針對用戶推出的。這個計劃是為了促進用戶能使用有效容量。對于用戶來講,有兩個好處,一個好處是說你可以降低運營成本,因為不需要很多的機房空間。另外一個好處,可以間接地對于自然環境的保護,做一份貢獻。大家看比較量化的計算,如果100T的有效容量跟100T的物理容量,它的耗電量所產生的溫室氣體的排放,大概可以減少700多公斤二氧化碳的排放。一棵樹一年會消耗掉10公斤二氧化碳,我們相當于在環境里面種了700多棵樹。

第三個特征是無縫接云。數字化轉型兩大出發點:一個是以數據為核心,第二個是一定要依靠于云的力量。無縫接云,現在的設備,存儲平臺,不管是集中平臺、分布式平臺,一定要有一個對于云原生業務的支持能力,對于多云業務共存的配合能力。概括起來講就是云連接系統、云數據服務、云數據洞見。

云連接系統,要求現在的存儲不會成為一個新的信息孤島。因為我們在所有的組織當中,應該都有云設施,不管是私有云,還是公有云,不管是自建的,還是購買的。這個存儲平臺,如果不能跟現有云進行整合,進行關聯,它會變成一個新的信息孤島。將企業內部的設備連接到云當中,是我們第五代存儲所具備的一個最基本的要求。這個連接實現了之后,可以實現數據中心內部的數據跟各種云的資產數據之間自由流動,對于我們數據的維護來講,是非常重要的一點。

另外一個是云數據服務。以前提供的數據服務都是在設備內部自己的。我們希望這個數據服務能擴展到這個數據之外,最好能擴展到更加廉價、管理更加簡單的云資產之上。新的第五代存儲里面,應該具有一些和云數據服務做對接的一些新的解決方案。比如說做容災,以前需要一個對等的設備在災備中心,現在災備中心可以直接建在云上,當成一個虛擬的災備中心,或把核心資產的一些數據備份在云上,從云上快速恢復回來。

除了云連接和云服務之外,還有云數據洞見,要從云層有一個宏觀的自動化的、對數據和對于存儲運維管理的平臺。我們主要的工具就叫CloudIQ,可以對DELL EMC的存儲平臺進行云化管理,建構在自身的一個PaaS平臺上的云原生應用,可以把設備上面,可能希望得到的一些信息,如報警、容量的使用、健康管理的信息,下發到各個移動設備上,可以實時掌握數據情況。這個是我們認為第五代存儲,從云的自動化運維角度來講,應該具備的一些特點。

第四個特征是數據護航。數據的安全性,數據的可靠性是第一位的。數字經濟,數據作為企業的資產越來越成為第一生產力。存儲,不管如何地擴展它的一些額外的功能也好,一些新興的技術也好,數據資產的可靠性是存儲最應該具備的第一優先級的問題。

我們看存儲具備能力的最直接指標,應該提供6個9的可靠性,6個9是應該具備的最低要求。6個9是30秒,7個9是5秒鐘,對于一個故障,或者對于一個業務連續性來講,6個9和7個9、8個9差別不大,所以把6個9定義為最基本的門檻。

數據從邊緣到數據中心,到云里面都有流動,我們對處于各個階段的數據進行比較完善的保護,我們提供一個全面的數據保護的方案。這個金字塔里面,越往上對數據的連續性和重要級別,要求越高。越往下,要求的相對來講會低一點。除了歸檔數據備份和恢復之外,最重要的是提供基于復制的容災的技術,基于CDP連續數據保護的容災技術,可以實現RPO、RTO等于0的連續的可用性。就是常說的雙活系統或者是多活系統,這是整個數據資產保護的金字塔的塔尖。這個塔尖,現在越來越多的應用都需要這樣一個技術,因為我們以前絕大多數的業務都是5×9,大家去銀行辦業務的時候,銀行一關門,大家就都只能等到明天了?,F在銀行關門之后,還有很多用戶,通過互聯網,通過手機銀行去訪問它的系統。大家會發現,很多數據庫的業務基本上都是要7×24小時提供服務。我們前面講塔尖的這一部分應用得以大規模地去使用,而這一部分方案,恰恰是我們作為存儲廠商比較在意的,比較擅長的。

剛才講單機可靠性,就算是100%,對于大家來講,依然是遠遠不夠的。為什么要有容災系統,為什么要有雙活系統?因為單機系統100%,數據中心一定要有跨距離、跨空間的容災系統,這才是實現連續可用性關鍵的點。這個點考察的就是連續可用性的解決方案。

第五個特征是AI賦能。有的是通過更高的性能,比如說有的是通過AI來提高命中率,有的是通過AI實現數據正確擺放,也有的通過AI來實現自動化的運維,減少運維的復雜性。第五代存儲AI運維,不管用在哪個領域,希望這個設備是基于人工智能的技術來進行一些故障及運行趨勢的預測,一定要有預測的功能。因為機器學習、AI也好,最主要的功能就是做預測。

我們現在在存儲里面用得比較完善的一個機制,有一個機器學習的機制,是配合SCM來使用最新的技術。因為SCM雖然性能很好,但是它的價格依然很高。如果我們把它當做盤來用,一定要有一個分層的機制,我們是引入了機器學習的算法,主要的作用,就是通過對以往數據的分析進行統計和預測。我每一個數據塊在未來某一階段的冷熱程度,可以保證把熱的數據塊放在SCM上,一定是現在和未來一段時間,肯定會熱。這個分層的機制,相對于以前的分層機制來講,有了一個很大的本質不同,它可以預測未來數據塊的冷熱程度。以前所有的分層機制基本上都是事后統計的功能。大家發現每家都有分層,但實際上各個用戶用得非常少,分層的機制,對于優先介質的使用效率并不高,當統計到這個數據塊是熱的時候,把它遷移到SSD上,是有個時間的,大概是小時級,遷上去之后,可能已經不熱了,還要再遷下來。如果作為用戶,一定會發現,我們最簡單的使用SSD的方法,是直接固定到SSD上,不用分層。我們最新的機器學習引擎,可以幫助大家解決這個問題。通過預測,如果有一些周期性的業務特征,比如說每天早上8點鐘,有一些數據是需要進行大規模的訪問,這個機器學習引擎,通過一段時間的學習之后,會識別到特征,在每天8點之前,把要訪問的數據提前放在SCM上,這就是機器學習給整個分層帶來的最本質的變化。它可以預測數據的冷熱程度,把數據進行正確的實時的擺放。這也是把SCM當做盤來用的一個最重要的技術基礎,如果沒有這個技術,我們把SCM當做盤來用的效率也好、效果也好,就會大打折扣。

未經允許不得轉載:存儲在線-存儲專業媒體 » 戴爾科技集團顧問工程師王彥飛 :SCM在DELL EMC PowerMAX中的應用
分享到

zhangnn

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走