在下午的主題演講中來自上海天璣數據公司的董唯元發表了題為《閃存引爆X86進化革命》的演講,以下為演講實錄:
 
大家下午好,今天這個場合大家都是做廣告的,我至少在第一頁做一下廣告,天璣數據是做融合基礎架構產品的。上午大家主要給大家上計算機課、技術課,剛才TCO給大家上經濟課,我相信大家聽了很多的技術課以后,想聽點別的,我們先從生物課開始上。我們知道在生命整個的演化過程中,生命演化過程是非常不均勻的過程,如果我們把整個地球產生到現在46億年濃縮到24小時以后,我們對應的時間點可以看到,地球早上3點的時候地殼就已經形成了,早上4點的時候生命已經出現了,但是最早的生命是原核細胞生命,不是真核細胞,但是上午10點左右的時候,真核細胞就出現了,但是之后真核單細胞生物統治地球20年之久,下一個重要時刻一直到晚上9點,從早上10點一直到晚上9點才出現了多細胞生物,但是出現多細胞生物以后,在短短10分鐘以內就有了含武紀生命大爆發。真核細胞生物統治地球20年以后,寒武紀兩三萬年年今天地球上的東西都出現了,然后就迎來了各種各樣豐富多彩的動物,兩棲類大恐龍出現了,實際上比那還早,寒武紀生命大爆發初期就有比恐龍還大的小龍蝦。生命的進化大家可以感受到它是極嚴重的加速過程,特別像我們IT整個技術的發展過程。尤其是單細胞向多細胞進化的時間點上。
 
我介紹一下單細胞怎么進化成多細胞。弱小和無知不是生存的障礙,傲慢才是。細胞進化也是這樣的,單細胞在水里游來游去,碰到有機物就抓過來吞到自己的細胞里面就算吃,但是大細胞吞比較大的東西,小細胞就比較痛苦,碰到比自己大的東西自己吃不小,小細胞手拉手圍著一個大的東西,這就是消化腔,有了消化腔以后,一堆細胞發現,有一些細胞發現自己可以不用參與消化,就可以干別的了,真正的多細胞生物是有組織分化的,里面的DNA一樣,但是有的長成了細長的神經細胞,有的長成了脂肪細胞,不同的組織才形成了一個有機體。
 
我們看整個數據中心的進化,目前我們正在經歷的是從Sacle up到Scale at will。拿生物進化的概念類推的話就可以明顯預見到未來所謂集群、聚合,不管叫什么名字,應該不是簡單的消化腔,不是簡單的同質化的集群,一定是有異化特征的,一定是更像一個多細胞生命體一樣,有多種不同的共同基因,不同功能的組織有機整合在一起的整體的數據中心。
 
這個事跟我們今天的主題有什么關系?我們今天叫閃存峰會,我們認為閃存在進化過程當中起到了很重要的基因突變的作用?;蜻M化除了環境選擇,很重要的是基因突變,才會產生多樣性,通過外界選擇。今天閃存的應用,就讓這些X86生態里面出現了很多非常強烈的基因的突變,但是這個圖里面,同時還會看到說,多個X86組合在一起,他們要有化學協同,今天化學協同機制已經很成熟了,就是軟件定義技術和虛擬化技術,這些技術把一堆X86的資源拉通,可以自由流動,自由協同。閃存的突變帶來了X86整個生態的變化。具體有哪些變化呢?這個就特別多了,這個地方就更技術化一點。
 
我們具體是做產品的,具體做超融合一體機產品的時候碰到的很多問題,都需要完全換一個角度去看。今天有了閃存以后,傳統特別高大上的協議變屌絲了。大家如果接觸這些技術的話就特別的明顯。傳統一個機械磁盤的延遲時間是很長的,中間需要通過各種緩存,但是今天閃存的IO延長時間是亞毫秒級的,這個世界上最大的存儲公司,最核心的全閃存磁盤陣列,寫在首頁的參數,我的全閃存某某IO延遲時間能夠低達1毫秒,所有這屋子里的人都覺得這是可笑的數字,簡直不能接受。上來第一件事,你會發現現在很多做一體機,包括我們自己做一體機的時候,上來第一件事,把傳統的協議替換。大家看到包括我們在內很多做一體機的廠商,做低延長,就要把傳統的東西替換。一模一樣的硬件環境,一模一樣的閃存,跑數據庫等等。事實上至少在我們公司里面,研發測試產品的時候,告訴我IO延遲時間大于0.2毫秒,我們就認為這個不用考慮了,這就不是我們想要的東西了。傳統很高大上的鏈路協議,經常被顛覆掉,變成屌絲。傳統磁盤陣列,緩存說法特別多,怎么把隨機變成順序,面條帶寫,說法特別多。但是大家發現閃存不需要自作聰明,你把所有閃存中間層都拿層了,不需要你做隨機變順序。對閃存來說,隨機和順序,我的IO反應時間是一樣的,盡快把IO送下來就可以了,所有自作聰明的都是耽誤時間,都是額外的負擔。設計全閃存系統的時候,或者帶有閃存系統的時候,傳統IO的策略,基本出發點,基本邏輯就要重新考慮了。Linux訪問磁盤的時候,都得過一個設備驅動,最多幫你裝多少指令,隊列深度,我們測傳統磁盤的時候,設計16、32,最多到64就夠了,傳統的磁盤陣列沒有那么快,隊列深度32、64已經用不完了,實際上很多操作系統到上面都是假的。Linux就給你設到128,認為你可能有超過128個隊列深度。Linux里面的隊列深度128完全足夠用了。一個PCIe閃存卡不過任何設備,在本機里面有40萬個IOPS,但是拉到另外一個主機,通過鏈路管理,40萬個IOPS到這里就變20萬IOPS了。隊列深度上不去,改參數,這也不是小工程,這是大工程。
 
更有挑戰性的比如說中斷模式。國內、國外有一些廠商研究,NVME已經出來了,這是最快的閃存接口了,傳統的中斷處理模式可能對它造成麻煩。傳統處理中斷的時候,CPU該干什么就干什么。但是NVME快到什么程度?CPU一中斷再回來,和處理時間差不多在一個量級上。有人研究過,國內的公司的研究院研究過,把單獨核拿出來,單獨處理這個,不要中斷,我就專門處理IO中斷,什么時候扔處理請求我就處理。從模式的切換,讓一模一樣的閃存卡讓一個10萬的IOPS提升到20萬的IOPS。閃存帶來很多傳統處理機制的沖擊,至少在我們X86體系里面,產生的挑戰特別多,所以會帶來很多的多樣性。
 
在更大的尺度上來看存儲這件事,網絡是數據跨空間傳遞,存儲是數據跨時間傳遞。我們現在說大數據,實際上有點從牛頓力學轉到愛因斯坦相對論,把時間帶進去。以前我們關心的就是靜態數據,今天我們關心大數據的時候,要把時間軸帶進去。我們倒退回去看整個ID歷史的發展過程這點很容易理解。以前單機年代,我還很小的時候,那時候大家買計算機討論CPU,那時候大公司是微軟,后來有了網絡,大家就關心網絡的事,然后就數據關系就多了,然后專門處理數據之間的關系,這個關系主要是空間的數據關系。實際上早期也不是Oracle一統天下,最早也有最強數據庫,各種各樣的數據庫。后來又了一門專門研究關系數學,這個成為正宗體系,有了比較體系化的研究和論證以后,基于理論才有了關系型數據庫的產品。后來出現了存儲,實際存儲是一個數據跨時間傳遞,等于說在傳統網絡上加了一個維度。傳統的關系數學沒有時間維度。為什么我們今天看大數據,大家永遠覺得暈,大數據出一個hadoop,各種各樣大大小小的分門別類的東西,特別的亂,就算哪個公司站起來,我整理一下各種場景的商業版本,把它打包成商業化的東西,一看十幾個。大家感覺這個東西還沒有成型,這個東西還是模糊狀態。
 
早期數據庫不是光有關系型數據庫,還有其他的數據庫。大數據也是這樣的,缺理論,就是缺關系數學里面跟時間相關的那部分理論,至少在今天關系數學里面把時間帶上。今天關系數學從從空間學變成時間空間數學以后,大數據才能會成為產業的征兆或者局面,否則只是局部性的應用,很難做整體性的推廣。我們的閃存在存儲層面發揮著更大的作用,讓時間的顆粒度比原來細了很多。閃存提升了速度,提升的是時間密度。
 
還有外部環境,閃存是基因的突變,基因的突變讓X86有很多異化的可能,外部關系是什么?我們看到外部環境,互聯網的應用,尤其移動互聯的應用,很多需求都是倒推回去,3、5年都沒有聽說過的東西,都沒有看到那么極致化的要求。別說IT了,比如說現在的很多職業,互聯網領域新生的職業,我都沒有聽說過,至于我的父輩根本不理解,他們那個年代這個世界就360行,有了互聯網變成了3600行,移動互聯就變成了36000行,這個行當之多,每個人都有不同的行當,你一邊上班,一邊是Uber司機。每個場景都有不同的需求,需求都是極致化的,需修都是極變態的。尤其是我們人口大國,移動互聯的基數,上海說無線要覆蓋整個會場。一般的wifi設計,一個基站覆蓋多少點,他們說那個人口跟公共汽車一樣,相當于上百輛公共汽車堆在一起,讓每個人都要覆蓋。微信要處理幾億在線用戶的信息交互,及時性非常好,最后不光自己開發KV的文件系統,而且用全閃存做。很多極致化的需求,讓大家盡可能探討怎么極限化的滿足需求,就出現了類似像CAP原理這種框架性原理,在極限化需求推動下,大家突然發現有一些需求要想做到極致,那個東西就保證不了,就像測不準原理一樣。從外界環境來講,對IT應該長成什么樣,有了嚴重差異化的需求,不可能將來的數據中心都長成一個樣,用一種技術、一種形態滿足所有的需求。今天的需求和框架原理告訴你,這是不可能的,未來一定是多樣化的,環境是多樣化的,又有了突變的基因,我們就會看到未來的X86在整個生態里面的爆發增長,一定是可以預期的。事實上趨勢已經很明顯了,截止到2014年底的時候,unix小型機賣六七十億,存儲130億,X86服務器190億。今天已經是這樣的局面,今天已經是全中國的小機+存儲等于X86總額的一半。但是這個還不夠,X86自己內部會發生劇烈的分化,就像多細胞生物出現以后,單細胞生物還存在,但是在多細胞研究里面,單細胞生物完全可以忽略不計了,除了非典的時候大家關心它一下。
 
這是我們公司的產品,我們也是基于這樣的認識,一個數據中心大一統的方式也好,單一形態的方式也好,很難滿足所有的需求,所以我們的融合基礎架構的產品,現在分了三個形態,面對三個不同的典型場景,一個是替代傳統小機的PBdata,高性能、低延遲,運行傳統的關鍵業務,運營數據庫,上面沒有虛擬化的事。還有私有云Pridata,它要求性能沒有那么高,但是擴展能力和靈活性要求高一點。Phegdata是非結構化的數據。至少我們的理念不同的場景要給不同的東西,朝著不同的方向優化。我們也看到美國超融合的倡導者,他們倡導的比較極致,認為全世界的數據中心完完全全軟件定義,硬件都是同樣的磚塊,我們認為今天還沒有到這個時候,我也不認為未來有一天到這個時候。我們認為差異化永遠有軟件和硬件的差異。至今為止很多大一統的思想和出發點,幾乎最終一定面臨失敗,最近很典型的,今天你去北美、硅谷,跟業內的人員去探討openstac未來的時候,大部分的人對openstac的未來是非常悲觀的,甚至有人說還談這個干什么,那個不是已經是過去的東西了。理由很簡單,長期不穩定,長期沒有辦法成為可落地穩定的東西,它成為大家自己DIY東西的出發點,追求那么多,想把所有的東西納入到這個框架里面,大一統的思想給自己本身的穩定帶來很大的問題。
 
我們可以展望一下,整個X86的生態是非常多樣化的,未來的數據中心滿足的是各種各樣不同極致化的需求的話,從廠商角度來講,我認為會發生變化,今天的用戶會到大廠商買東西,一站式交互什么都有,既有網絡設備、服務器、存儲,還賣手機,這個方式決定了你不可能了解你的用戶想要什么,這個很像超級市場,你說超級市場了解你要什么嗎?其實不了解。其實盡可能把所有的東西擺帶那,你挑自己想要的就可以了,并不能給你提供一個為你量身訂作的完整的解決方案,雖然天天這么說,但是實際上沒有這個能力。不僅沒有這個能力,隨著極致化需求的推演,精品永遠不會出現在超市,只會出現在專賣店里。如果你是普通用戶,或者你是過日子的人去超市買日常所需就可以了,如果你是發燒友或者有更多追求的時候,你想喝一杯咖啡,體驗一種很悠閑的狀態不會去超市買速溶咖啡買杯子自己沖著喝,你一定會去shopmall,超市的業態不會下去,超市就是給普通過日子的人一個日常支撐。在這個業界里面,今天什么都賣的大公司,未來就是一個超市,賣的東西多,東西全,但是不能做最貼心的服務,真正給你最貼心的服務一定是專業的公司只做一件事。喬布斯說用戶不知道自己想要什么,做產品的人肯定比用戶更知道他想要什么。我從來就沒有認為喬布斯這句話說的對,雖然我也是喬布斯的粉絲,我很認同他個人也好、公司也好的成就,但是我從沒認為他說的是對的。在數據中心這個領域,用戶比廠商更明白他要什么。喬布斯說的是玩具邏輯,玩具用戶不知道想要什么,他期待廠商給他驚喜。蘋果出的產品,基本上都是更像一個玩具,為什么不是主流商用的東西呢?更多的玩具的成分大于了實用成分。數據中心理論,你是CIO,你經營企業應用,你不需要玩具成分,你需要的是扎扎實實的實用主義的成分,在這些成分上,沒有任何一個廠商敢說比用戶更了解用戶的需求,我是這么認為的。我們能做的只是說,盡可能把我們所了解的,所掌握的,盡可能提供給用戶而已,更多的跟用戶在一起,謝謝大家。
   
 
欲知更多關于2015中國閃存峰會的精彩內容請點擊查看閃存峰會全程直播報道專題。

未經允許不得轉載:存儲在線-存儲專業媒體 » 董唯元:閃存引爆X86進化革命
分享到

wangky

存儲在線(DOSTOR)高級編輯

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走