北京富通東方科技有限公司 技術總監(系統架構師)霍坤星。
 

今天挺榮幸能和黃昆黃總,還有我們的西瓜哥(我是他忠實粉絲)、跟大家在這里交流內容。我們的口號是“數存天下,普領云端”,我們國產存儲品牌及解決方案提供商。

“數據生態”這個理念是數普金通提出來的。今天上午領導談到的生態概念,但是他們講的生態是各個企業合作共贏的生態圈,我們提出的是“數據生態”理念。如果數據不加以控制,反復不斷衍生的話,相信我們地球就會形成霧霾。

預測2020年會有44ZB的數據產生,其實不是大家津津樂道的那樣,阿里云、亞馬遜都有數百萬服務器的規模,我們不談這些東西,談到的是這些數據里面有多少是骯臟的、垃圾的,包括重復,還有數據泄漏等等這些負面的東西,不得不考慮到。

一個最簡單的例子,我在過生日的時候,往往收到四五十條短信,各個信用卡公司,曾經注冊的賬號的地方,都會給我發信息,這些信息對我說就是無效的。

在做存儲陣列,做解決方案的時候,考慮到的是數據,真正給人類所帶來的是什么?到最后,反而形成一種數據災難。

在44ZB里面,我們利用數據的壓縮、個人應用數據、企業應用數據的時候,存儲的是有效的,精簡過的數據又會給我們帶來什么?包括張北云也好,像谷歌的數據中心一樣,他們真的環保嗎?大家并不知道,張北云的風力發電,擋到多少風刮到北京?是因為大的風力發電機擋住很多的風道。這么多服務器運轉的時候,給我們帶來的是什么。我們更需要潔凈、有效、精簡、有序的數據。所以說數據并不是像我們津津樂道的大數據越多越好不是這樣的。

數普金通公司的初衷是協助企業怎么做到精簡有效,讓數據越小越少,怎么做到這樣的過程。構筑數據生態,賦予數據生命與智慧,讓她們靈活、自由、愉快的生活在自己的家園。

數普金通致力于打造最可靠的數據存儲產品線,成為國內領先的數據生態基礎架構解決方案供應商。

看一下數普金通倡導的SCPDOC的方法論,就是數據生態向上的階梯。真正開始做數據中心的時候,一開始都是從存儲談起的,怎么把數據保護好,不同的數據存儲到不同的設備,探討數據是什么樣的類型,是結構化、非結構化、還是半結構化的數據,是虛擬化的等,做好深入研究以后,再幫助客戶選擇最適合的環境的存儲產品。

這些存儲做好以后,考慮整合,現在用戶的數據中心,磁盤陣列的異構化已經非常泛濫了。這個時候,如何打通異構的存儲平臺,讓他們基于這樣的底層基礎架構做好一個正常流動,所以這是一個數據整合的概念。

整合以后要考慮數據保護,這永遠是我們需要面臨的主題。數據保護完善以后,我們把數據中心延伸到第三個城市或者延伸到更遠的地方,這個時候就是容災,關注的就是數億級的容災層面。

一切做的比較好的時候,我們考慮性能是不是可以提升,功能是不是可以更加完善,所以這是優化的范疇。

最終要做的是一個存儲云的過程。按照這條線路,基本上就是SCPDOC。

我們跟用戶一起完善數據生態,完善數據中心的存儲。

我們關注的方向,研發中心的力量,產品的聚焦在可靠性上。因為我相信世界是平的,當有一個方面非常突出的時候,肯定會損失另外一些方面,當犧牲一些性能和功能的時候,我們希望設備更加可靠,讓數據更加安全。

數普生態圈產品系列有DS SAN存儲,US統一存儲,數據保護備份一體機,一體化的機房,這些比較傳統。

先說NS8000 8500 還有DFC500 SFS100,還有云存儲。

傳統的NS設備中間有一堵墻,數據不能共享。如何做好橫向的拓展,做好一個集群呢?用數普NS8000設備,通過多臺NS機頭把光纖磁盤陣列打通做成大的存儲池,統一的文件命名空間,實現全局的負載均衡和整合。

這個產品架構基本上是三個層面,SN的運算層上面4臺可以擴展到32個節點,性能可以線性提高,它是兩臺高性能光纖交換機,底層就是常規的基于SNA的磁盤陣列。目前可以接入數普公司DS3000、5000,也可以接入第三方的光纖磁盤陣列。全Active集群架構,某一個NS引擎出現問題的時候,其他的節點會自動的增加負載,然后替換它的一些性能,這臺節點修復以后又會把這些故障自動恢復。

全共享存儲空間,可以通過前端的這些NS頭,把一些熱的數據通過前端負載均衡的方式,通過更多的NS頭把性能提升到極致。

高可擴展性,這是兩個層面,一個是性能的線性擴展,還有容量的平滑擴展。性能線性擴展從2個開始,8個,12個??梢杂脭灯兆约旱拇疟P陣列,也可以用基于第三方的磁盤陣列。后端的容量通過全閃存陣列也可以擴像SAS和NL-SAS不同的磁盤介質,實現存儲的自動分層。

屬于經濟高端存儲保護一體化的跨陣列快照,有一個非常大的好處,用戶環境中有一些相對比較陳舊,用的時間比較久的一些陣列,完全可以讓它在后臺做一個只保護數據副本快照的陣列,跨平臺的陣列顯得非常有用,可以把系統測試統一分析等等這些數據全通過細粒度快照進行保護。通過這個平臺可以實現各種存儲陣列流行的功能,都可以在這里面體現。

NS8000具備高性能、易擴展和高效率,帶寬理論是100GB的吞吐能力,獨有的高速智能混存,讓性能優一個很好的提升。易擴展是全Active,現在可以擴到32個引擎,高效率是指在底層可以做到細粒度動態升級,還有獨有文件系統鏡像功能。

分享全閃存陣列FS之前,先談一下IT的速度之傷。先看一下CPU。我也是剛剛學習到,有一款PEZY,這是日本發明的一款CPU是千核處理器,運算達到3TFlops,有可能這一顆CPU可能替代我們幾百顆CPU的處理速度。以太網萬兆已經不是快的了,現在有10萬M,40萬M,還有100GB,FDR56Gb-EDR100Gb已經不快了,MXC硅光子1.6TB,雙向1.6TB單向是800GB。通信已經沒有什么可擔心的了,完全可以及時輸送給CPU大量的數據。

可以看CPU內存、總線、網絡,誰是最慢的?就是磁盤陣列,就是傳統的磁盤。怎么解決這個問題呢?磁盤非常慢,是因為它是先尋道,年齡大一點的可能見過5英寸的硬盤,286那時候是5.25英寸達到大的硬盤,每個盤片就像一塊鐵餅,大概有半厘米后的盤片,大概幾公斤重,那個時候這種機械硬盤到現在并沒有什么太大的飛躍,只是轉速更快了而已。普通的磁盤這么慢,我們都在考慮閃存,閃存有這些部署形態,把PCIe Flash插入進去,還有常規的磁盤陣列,插上SSD硬盤,讓它充當一臺閃存陣列,但是它的機頭,包括優化機制還是基于傳統的磁盤而不是閃存,所以性能不是太好。還有一種就是廣為流傳的全閃存陣列,IBM、EMC都有。還有一種就是數普公司的全閃存陣列產品,也是PCIe,但是是通過PCIe引出來的陣列,這個陣列有獨立的4塊SSD的盤。每塊都是通過PCIe線直連服務器的。閃存存儲成本最小化本地直連是最好的方式。因為可以提供跟在板載同樣PCIe的。

現在大家最關心的,閃存陣列的壽命到底是多少年,因為它有一個理論可擦寫次數的限制。認真計算完了以后會發現數普S100的壽命按照單快盤最小的3.2TB的可用容量、每天的寫入數據量按500GB來算,可以用87年,因此,不用擔心閃存的壽命,它遠遠高于磁盤的壽命,這是最低的估算值,有人估算出來都是一百多年的壽命。

很多用戶提閃存太貴了買不起了,如果買性能的話,閃存是最便宜的。

SFS1001U幾公斤重,相信不會超過10公斤。產品形態是1U的,容量是4TB-64TB。因為每個有4個規格,4、6、8、16TB,具有單一盤體容量16TB的特性,單一性能可以達到50萬IOPS,最大的寫入量是100PB,隨機讀寫速度是2GB/S,響應時延90微秒。英特爾是十幾個微秒或者幾個微秒,它唯一的特點就是快,靠推動在一個盤體多個顆粒,做多個顆粒之間的讀寫實現的。

下面要談的是相對高大上的CS系列,這款產品是我們跟以色列的一家公司合作的,坦白來講,我們是OEM以色列公司的產品。談到Server SAN的時候,有4個技術導致了Server SAN的飛速發展。之所以說飛速發展,是因為Server SAN從我聽到到現在現在已經在各個場合,包括在各大展會上廣泛出現,一是因為X86服務器飛速發展,二是類似于100GB還有56GB高速網絡的發展,還有Flash閃存。另外就是軟件定義一切,在一起上可以裝所有的軟件。之所以這樣談,就可以導致所有的基礎架構,以后多可以通過開放標準的、常規的X86服務器搭建出各種各樣的功能,所以導致Server SAN的飛速發展。

分布式存儲、集群存儲、超融合、Server SAN,我們要把它加以區分,個人認為分布式存儲可以把多臺機器的能力集合在一起,是一個集群的概念。集群存儲其實跟分布式存儲有異曲同工之處,只不過叫法不一樣,超融合在server集合了分布式存儲和集群的能力。我們和以色列公司合作的產品只提供存儲能力,因為本身都是X86,至于說是合在一起,還是拆開,都是高速網絡互聯,可能大家采取的技術路線不一樣?;A架構越來越智能、簡單、可靠、開放、包容,這樣讓這個生態更加完善更加完美。

Server SAN這個產品可以從兩個節點起步,通過一個網絡read1完成,然后用到read5,保護級別低一點,但是空間利用率更高了。通過數量增加,擴展整個的存儲池的空間。VPSA既可以支持傳統物理的Server也可以支持VMware的虛機。它最多可以擴展到一千個節點,這是一個理論值,我們建議不要超過它。再往上擴展,這樣形成現在所看到的單一的磁盤陣列,給我們前端的用戶去用。既可以支持物理機也可以支持虛擬機。有一些友商可能只支持虛擬機。我們建議至少通過10GB的以太后端互聯,在部署的時候,既放SSD高速盤做緩存,同時也要放一些像SAS和NL-SAS組成這樣的生態環境,不同的數據找到最適合的介質存放。

橫向擴展、性能和容量線性的增長,可以達到數千個存儲節點,百P級存儲能力。VPSA把底層建立好以后,可以通過漢化的管理界面分給前端的物理機或者虛擬機應用,點下拉菜單按紐選你需要的控制器計算能力,還有性能,包括后端磁盤的容量都可以去選擇?;旧习汛鎯Φ哪芰Τ橄蠡?,特別是像虛擬機,虛擬機就是把物理的機器抽象下來,把底層的一個大的存儲資源池抽象出若干個10G的磁盤陣列一樣。

如果需要大空間就分配成大的VPSA,如果是小空間就分配成小的VPSA,資源回收利用都非常的方便。每個VPSA基本上可以支持所有的協議。ISCSI、NFS、CIFS、REST,基于對象的,也可以支持docker的部署方式。docker比虛擬機包裝更細,它直接在這些linux的系統上,可以把一些應用和OS中間件的插件打成一個小的包裝,它的利用率和效率更高了。

應用案例比較豐富,我們找以色列的公司就是看中了他的應用環境,底層后端有大量的應用。

數普公司是一個國產的存儲品牌,所面向的就是數據生態這么一個環境,最終為用戶提供有價值的存儲解決方案。存儲產品基本上涵蓋了傳統的陣列,當然我們也是跟一些國際上的一些知名的企業合作做這些產品。在數據、整合、保護、容災、優化,云方面數普公司都有自己成熟的成形產品,主要是NS系列和FS系列和CS云列數普云陣,可以對接用戶云的計算環境。

謝謝大家!

(根據現場速記整理,未經本人審定)
 

未經允許不得轉載:存儲在線-存儲專業媒體 » 霍坤星:云時代數據生態基礎架構解決方案
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走