由DOIT主辦的中國存儲峰會是中國存儲產業界最為隆重的年度大會。十一年來緊貼存儲產業發展,豐富地記錄了存儲產業在各個歷史時期的變化發展,已成為存儲學術界、產業界和企業用戶不可錯過的歷史見證。
在當天下午舉行的“超融合分論壇”上,上海天璣數據技術有限公司總經理董唯元吐槽了當前超融合領域中的一些偽命題,如Scale-out與Scale -up,共享式集群與非共享集群,中心元數據與DHT無中心等等。
在談到互聯網基礎架構理念時,他對OpenStack進行了批判,他說:“很多人是OpenStack的擁護者。但我覺得OpenStack野心特別大,框架特別大,因為專注度不夠,所以,始終成熟穩定不下來。”
半年前,董唯元跟硅谷某一大牛談起OpenStack,那些人直接就是“呵呵”,很多人都覺得它是失敗。但是,OpenStack在國內還是很有生命力的,因為國內有廣泛的定制化需求。
以下為演講實錄。
董唯元:感謝大家,接下來這一段時間,就給大家介紹一下我們的理念,這個場合我是來吐槽的,順便做一下廣告。
首先,互聯網碾壓一切,不僅我們搞技術的,不僅搞數據中心的,搞金融應用的都能感受這一點。傳統數據中心建設,傳統的業務系統的支撐也在遭受著這種碾壓。道理自然也是很簡單。大家都看到,“雙11”1天900多億交易額,今年沒有人再懷疑這個事情了。在兩年以前,去年交易額過500億的時候,還有很多的人懷疑,這個不可能, 24小時500多億不可能。如果傳統的架構理念去感受、去預估,確實是有很多做不到的事情,但是互聯網可以做到。
新業務發展,讓互聯網真實的彈性的能力、快速的能力、迭代、靈活性,展現在傳統業務面前,傳統業務發現自己過時了。曾經,某一些傳統用戶數據中心負責人談起互聯網建設模式的時候,都是很不屑地講:“我們是正經單位,我們是跑正經業務的。”意思就是說那些東西不正經。今天他們的態度180度轉彎,還要學習互聯網的玩法,甚至互聯網淘汰的東西他們都是當寶貝抓在手里面。
在這種新的大背景之下,互聯網所有東西都是好的。Linux是開放的,Unix是不開放的;Scale-out取代了Scale –up;用橫向擴展取代縱向擴展;非共享集群一定好過共享集群。原來集群都是共享式的,都是共享同樣一個數據,現在都是非共享的理念,非共享就是把集群做的更大,這個是一個先進的理念。還有分布式存儲,無中心,無元數據存儲……
說一下細節一點的內容。比如說Scale-out跟Scale-up之爭,這個似乎是成了定論了,所有廠商都說Scale-out先進,Scale-up代表落后。但是,在某一些特定場景下或者針對特定應用,一定需要那么多擴展性嗎?這是一個我要吐槽的地方,如果最多5個機器就能滿足你的需求,你還需要一個Scale-out架構嗎?您不覺得搬一個機器,配負載均衡,這一大堆真的就更簡單嗎?您就加2個內存,加一點CPU,可以復雜到哪里去?
Scale-up真的就是落后?是說整個體系有天花板,這個邏輯單點有天花板、有上限。而且,在可預見的未來,看到業務沖到上線去,當業務依賴于系統架構的時候、業務超過所可以承載的上限的時候,你就沒有支撐點了。這個是Scale-up很麻煩的地方,但是您的業務其實遠達不到這個天花板的時候,它明顯需要一個更簡單的一個擴展方式。為什么一定要out呢?所以,這個是我要吐槽的,并不是所有的地方,所有的場景,所有的應用下面都是Scale-out更好,很多的傳統業務不見得需要那么多橫向擴展能力。
“去IOE“的時候,如果沒有其他方面的補償的能力,又不想損失可靠性、性能或者其他東西的話,其實我看到的很多傳統業務在升級擴展過程當中,”去I“、”去E“之后,”O“還是要保留的。所有大數據的家族體系都是拉出來,加在一起也沒有辦法替代,這個事情這么多年業界生態也好,形成了這樣一個局面。
DHT,聽上去挺高大上,動態哈西表或者分布式哈西表,就是一個技術,這個技術就是讓一個分布式系統(主要是存儲系統)沒有中心元數據。傳統的都是要有元數據服務器,相當于是整個集群里面所有服務節點的一個中心目錄。有了DHT以后,大家覺得這是一個未來的理念,非???,確實是這樣的。
事實上,任何技術在這個方面先進了,一定在另一個方面是落后的。DHT這種技術說白了,就是回避了到元服務器查找的過程,他自己要做計算,替代元數據查找過程。這個過程性能有可能會提升,前提就是計算不太復雜,再一個集群規模就是大于原來的基于元數據的。這個計算的額外附加代價到底多大?所以,并不是說DHT一定好過基于元數據服務器,里面還會有一些隱藏的問題,如果處理不好,可能還不如元數據服務器。
在座很多人是OpenStack的擁護者,我一直對OpenStack不是很樂觀。我覺得OpenStack野心特別大,框架特別大,但是因為專注度不夠,所以始終成熟穩定不了。
半年前,我跟硅谷某一大牛談起這個事情,那些人直接就是“呵呵”,很多人都覺得它是失敗。但是,OpenStack在國內還是很有生命力的,因為國內有廣泛的定制化需求。這種野心很大,企圖涵蓋所有需求、一統天下的架構實際上非常危險,因為移動互聯網帶來應用的多樣化,大于傳統PC的那些需求。
今天有很多做超融合的中心,就是這樣一個架構,就是這樣一個Box,數據中心都是靠這個BOX。但是裝滿了,剩下就是軟件的事情,這個就是軟件定義。
軟件可以定義所有的東西,不管是什么。硬件都是一樣的,就是靠軟件區隔開來,這個是互聯網毒害,這個不是互聯網精髓?;ヂ摼W業務相對于傳統業務來說永遠是單一的,淘寶,百度,主體業務是單一的,造成了基礎架構的需求、硬件需求、可靠性需求,都是相對來說單一的。所以,是可以一個磚塊鋪數據中心。
但是,銀行數據中心、政府數據中心,業務實在太復雜了,各種各樣的業務,各種各樣的應用。你可以用最高標準把最高東西鋪一遍,而不是簡單的一個磚塊鋪所有的數據中心。
這三個產品里面,又根據不同的場景和不同的特性再劃分不同的細節。核心關鍵數據場景下面又有V系列、H系列等等,面向不同的場景,不同的需求。
海量存儲也是一樣的,我們有塊級,有文件級,甚至還有支撐傳統架構的傳統的產品。
虛擬化這個平臺,在我們看來很快將會成為云的底層引擎之一。說白一點,如果將來數據中心是個大機器,虛擬化將是中間一個小驅動。這個小驅動不是不可替代,很快就是有一些新技術替代它。事實上,今年雙11的時候我們跟浙江移動聯合搞了一個整點快速促銷的活動,看了一下我們這個系統是不是可以承載一個快速的高并發,測試下來發現什么?靈活性也好,彈性部署也好,容器技術在這方面的能力遠大于虛擬化。
VM的靈活性只是比物理部署的靈活性高了一點點,如果我們考慮到移動互聯年代,可能這個業務壓力增長是原來的千倍、萬倍的時候,VM技術是不可能提供這個支撐的。在這些新的技術推動下,我們覺得整個未來的云,真正需要的就是上面的跟應用更相關、跟業務更相關的一些高層管理,不是資源部署資源管理。
從業務邏輯出發,你有一個ERP系統,這個對應到多少數據庫?選擇什么操作系統?是選擇虛機?或者用容器?用物理機?后面這一系列下來就是一整個模板,這個模板是什么?是以業務為核心的一個資源模板。這個都是業務支撐,以這種模板模式管理整個私有云,我們叫做服務目錄化,這個服務目錄化將存在我們未來私有云解決方案里面。
我這個里面有一個圖,大概介紹一下這些產品系列所覆蓋的不同領域。這個是一個傳統數據中心,基本上都是有關鍵業務跑在這個服務器上面,還有一些跑在虛擬化平臺上面,還有一些新興業務,比如說數據挖掘,還有一些新興業務,嘗試性的、測試性能等等。我們的產品和其它產品分別是對應著核心關鍵業務和周邊業務,就是兩大方向。我們不是去革新架構的,有一些用戶系統規模要求沒有那么高,SAN架構對他來說還是不錯的。還有一個全閃存傳統架構的產品,是在保留系統架構前提下,提高讀寫性能的一個產品。
謝謝大家。