以下內容根據速記整理,未經本人審定。

聽眾朋友大家好,我今天講的題目是“存儲技術發展的驅動力及生態系統”。

數字化的哲學奠基與科學奠基

首先我們從峰會的兩個關鍵詞講起,一個是數據,一個是存儲。講到數據我們首先看到6000年前伏羲提出了八卦圖,一長橫代表一,兩短橫代表零,所以上面一一就是代表天,下面零零代表地,這就是數字化的思想原點。

老子說“一生二,二生三,三生萬物?!边@就實際上表達了數字可以表達萬物的思想。在2500年前的希臘數學家、哲學家畢達哥拉斯說“萬物皆數”,也就是說宇宙的一切規律皆可以由數來表達,大家記住這個結論,就是萬物皆數,這就是數字化的哲學奠基。

2000多年過去了,我們的信息表達都還不是數字化,比如文字、聲音、電影、照相、電視、攝像這都不是數字化,我們還要等待幾位偉人的到來,這就是奠定了我們數字化科學基礎的四位大師,一個是萊布尼茨的二進制,一個是喬治·布爾的布爾代數,再就是香農的信息論還有開關電路理論以及圖靈的圖靈機。

這個圖靈機是一個理論能力極強的智能模型,他本來是為回答一個希爾伯特的世紀之問而提出的,希爾伯特在1900年世界數學家大會上提了一個問題,他說:“存不存在解決所有數學問題的一般算法?”,1936年圖靈發表了劃時代的論文,構建了一個圖靈機,就是一個無限長的帶子在一個紙簍上對帶子進行讀和寫,在有限的規則上把零變成一,一變成零,這個圖靈機就代表著一種智能自動化的實現手段就是計算,就是在有限的規則下對數據進行序列變換,就是這個可以解決一切數學問題,所以這個能力非常強大。

圖靈機實際上分為三個部分,第一個就是處理部分——對讀寫頭進行控制,第二就是存儲部分就是那個無限長的帶子,第三個就是傳出部分是帶子的移動,這個模型實際上能力特別強大,已經超出圖靈的想象,圖靈說“他可以解決一切數學問題!”但是實際上他是可以解決更多的問題。

元胞自動機領域的一位大師Stephen Wolfram寫了一本書叫《一種新科學》,里面說“300年來,科學建立在數學的基礎上,而今后的科學將建立在計算機程序的基礎上,計算機程序也就是計算,可以表達宇宙的一切規律!”

他構造了這樣一個元胞自動機,簡單的規則可以產生復雜的現象,而且我們可以從這個上理解我們的DNA上有人的這個簡單規則,但是按照順序生長下去,他就會把一個受精卵逐漸變成一個完整的人,而且從年輕到老去都可以用計算機模擬出來,這就是我們的數字生命。

其結論是計算程序也就是計算可以表達世間的一切規律!所以Wolfram是從元胞自動機得出了這個結論,但他的同事證明“元胞自動機和圖靈機是等效的!”所以圖靈機的理論能力極強叫表達世間一切規律!這個科學得到的結論和哲學得到的是一樣的,就是萬物皆數!宇宙的一切規律皆可以有數來表達,這就是科學給數字化定下的一個遙遠的終點,我們現在還在路上。

數字時代開始,我們目前才走了四步

從圖靈機開始,數字時代真正開始,我們目前才走了四步,而其重點是可以表達宇宙的一切規律,那還遠的很,所以存儲的第一個驅動力就是數字化進程步伐的加快,那么數字化1.0我稱其為多媒體驅動的,就是我們敲命令行到可以表達圖像、圖片、視頻就是信息形式多媒體化;

數字化2.0是互聯網推動的,那么有無線和有線互聯網,我們把社交這種關系通過網絡數字化我們就有微信,我們把商品交易通過網絡數字化就有了淘寶,這樣信息大量流動產生大量的數據,這是第二個數據爆發點;

數字化3.0是由是由物聯網推動的,他的特征是由人產生數據到物產生數據,那物比人多得多是不是,這樣數據量又會大爆發,這是第三個爆發點;

數字化4.0就是現在特別熱的元宇宙,元宇宙推動數字化更進一步向前發展,它的特征是我們信息空間本來只有物理空間一直過去,比如我們拍張照片,拍張視頻這是物理空間變成了數據,然后把它映射到信息空間,但元宇宙很多東西都是世界不存在,由我們人腦構想出來的虛擬空間,把這個思想構成數據以后映射到空間中去,這樣就形成我們數據的第四個爆發點。

很多人說數據化后面應該是智能化,那么智能化在哪里呢,實際上我認為智能化是包括在數據化之中的,剛開始比較弱而已,然后逐漸從弱智變成比較聰明到現在是很聰明,可以識別圖像人臉,最近由于深度學習算法的流行,所以大家對智能化看的比較重,實際上智能化這個步伐還在繼續深入,智能化是隱含在這個數字化之中的,元宇宙時間點提前了,因為各大公司現在都涌入元宇宙這個領域,其標志性事件就是Facebook把它的名字改成了Meta。

元宇宙時間點提前,將改寫IDC數據量增長預測

元宇宙是一種動態的交互式的、沉浸式的全景圖像,會引起數據量的大爆發,比高清視頻數據量大很多倍,所以存儲需求呈跳躍式增長,那么一個平行于人腦的獨立的虛擬空間將是元宇宙發展的高級階段。

我們這樣假設一個場景,你與元宇宙中的虛擬人自由的交談,他是具有智慧的,那么這種就是元宇宙一個高級階段,就是他不依賴于人腦,而自己在虛擬空間有他的智慧,這還有一段時間。

那存儲的驅動力二是主流介質的變更。硬盤從早期1956年的大硬盤到現在的高容量硬盤經歷了水平記錄,中間一個巨磁阻效應還得了諾貝爾獎,垂直記錄還有現在的瓦記錄還有即將出現的熱輔助磁記錄,容量提高了這個倍數是好幾個數量級。

1984年發明的NAND閃存目前成為手機、筆記本電腦的主流介質,而且金融數據中心固態盤,大量固態盤采用,到2026年固態盤每單位容量的成本就和硬盤持平,所以形成一類主流介質。第三類主流介質就是現在非易失的存儲器,那么現在有相變、磁變、阻變三種,大批量進入商業化的就是第一種叫 3D XPoint技術,現在已經開始進入市場,不過價格現在還比較貴。

新的介質具有帶來體系結構和軟件的改變。我們教科書上的老三樣,cache、DRAM、 硬盤,現在變成了多個層,固態盤和非易失固態盤也進來了,還有非易失內存,這樣存儲結構得到很大變革,而且介質變快,相對來說其軟件占比比較大,硬盤的軟件開銷只占0.3%,而NVM DIMM這個新介質,軟件開銷占到94%,這是UCSD的研究結果,所以我們現在由于介質的改變帶來整體軟件改變。

驅動力三是冷數據的挑戰。冷數據在過去還不覺得是個壓力,但是現在各大互聯網公司、數據中心感覺這個冷數據壓力越來越大。什么是冷數據,我們舉個例子就是我們每天微信朋友圈發照片,每天的騰訊那兒是10億張,10億張上去就有很多人點擊,訪問量就是百億次的,這是熱數據,但是第二天訪問量馬上下來就變冷了,一個星期以后就沒什么人看了,這就是冷數據。

但冷數據你不能丟,日積月累下來就是一個巨大的量,結果這些公司發現這個冷數據現在越來越承受不了,冷數據是Cold Data,他既是大數據(Big Data),又是保持時間很長的長數據(Long Data),帶來成本挑戰、能耗挑戰和壽命挑戰,我們現在大部分用的硬盤,一個數據中心可能有幾十萬個硬盤甚至上百萬的硬盤,這樣消耗巨大的能量,而且硬盤發熱,還要用很大的電力來冷卻,壽命也只有五年,隔五年就要換一批,所以這個成本,遷移成本非常非常大。

這種挑戰如何應對?我們現在一個是磁帶,但我們中國發展光存儲。新的光存儲有4種,一種是藍光技術上發展叫AD現在有300G和500G兩種,還有第二是全息光存儲。第三種是超分辨光存儲,就是把光點縮小到以前的1/10,這樣的容量就會大大提高,而且可以記多層,這個理論上可以達到500TB的容量。還有現在在玻璃上用多維的方式來記錄,他是用飛馬激光打上一個微小的微納結構,這樣每張盤可以存300個T,而壽命幾乎是無限的,這樣是一個永久保存技術,能很好解決冷數據問題。

如何構建完善的存儲技術生態系統?

我國存儲產業取得很大進步,國內市場已占據主導,但生態還比較脆弱,主要問題有三個。

第一完全沒有硬盤工業,硬盤全部依賴進口,大量數據一旦硬盤進口出問題是非常嚴重的,所以這是非常脆弱的一個點;

第二點我們在國際標準上基本沒有話語權,比如說NVMe這種標準我們是沒有話語權,我們在通訊領域有很多話語權,在存儲領域沒有,在評測領域也沒有,比如說我們的存儲大廠都想擠入Gartler的存儲魔力象限,企業要打榜存儲性能評測SPC-1才覺得我們得到承認,還有我們質量的檢測要通過美國的IOL交互器實驗室得到測試才能得到承認。

如何解決,第一我提出用光、電來代磁,我們要大力發展NAND固態盤產業和光存儲產業,因為我們現在長江存儲可以生產閃存芯片了,現在產能還非常小,但要擴大產能滿足國內需要,我們發展固態盤完全有能力的這是存熱數據。冷數據國外是磁帶,我們現在要發展剛才說的新一代光盤,用新一代光盤做成我們大容量的光盤庫,就可以解決冷數據問題。第三我們要建成自己的評測體系,形成權威第三方機構,至少我們自己的企業要認可我們的評測機構、評測的結果,最后是想要世界上的企業也認可我們的評測結果,這才是我們生態要完善的這樣一個局面。

結論

宇宙的一切皆可以由數來表達!這就是我們數字化一個非常終極的目標。我們存儲是數據的載體,因此,發展機會也是無限的。存儲技術有三種驅動力,第一是數字化進程的步伐加快;第二是主流存儲介質的更新換代;第三是冷數據的挑戰。

我們要完善我們存儲生態鏈三條措施。第一用電光代磁;第二加強引領性核心技術的研發,掌握標準領域的話語權;第三加強評測體系建設,爭取評測領域的話語權,我的報告到此為止,謝謝大家!

未經允許不得轉載:存儲在線-存儲專業媒體 » 謝長生教授:存儲技術發展的驅動力及生態系統
分享到

崔歡歡

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走