謝長生的演講從主流存儲演變的歷史視角,為聽眾盤點了自人類出現以來,各種主流存儲介質及其發展軌跡。從光存儲到現在的磁存儲,再到電存儲即閃存。閃存將在2020年左右成為主流,并有超過60%的信息都將存儲在閃存上。

他還指出,我們要正確認識閃存成為主流存儲介質即將遇到的挑戰和機遇,以及意識到閃存對技術架構和軟件生態的改變。謝長生建議,圍繞3D NAND芯片構建完整的產業鏈,只有上下有互動,才能促進核心技術發展,產學研用結合,前沿研究和技術開發結合,加強高校與企業的合作,建立針對閃存產業連的公共測試服務平臺,國家標準,在國際標準上取得話語權,中國有機會,有責任在閃存技術和產業上做出應有的貢獻。

以下為謝長生先生的演講實錄:

大家好,我來自華中科技大學信息存儲教育系統實驗室,我們的存儲實驗室有40年的歷史,是一個學術研究和人才培養的單位。我們研究各種存儲技術,如光存儲、閃存系統等研究。我們這個單位有50多位老師,300多位研究生組成,是一個具備國際水準的高校研究生團隊。我們的學校坐落在武漢,另外,有一個投資240億元的閃存基地也在武漢。

今天我演講題目是“迎接主流存儲的閃存時代”。主流存儲是在變的,我們要迎接閃存時代的到來,就需要了解什么時候是主流。這也是我今天主要闡述的問題。

我們看一下這個圖,這個河流有主流也有很多分支,河水的主要流量都集中在主流部分。那么,我們先來下一個定義,那就是什么主流存儲建設?那就是現有的條件,除人腦之類,人腦使用某種存儲介質保存信息的總量如果超過60%,那么這種存儲介質就稱為主流存儲介質?;仡櫄v史,出現過很多不同的主流存儲介質。

最早的主流存儲介質是石刻,大約出現在4萬年前的西班牙某個半島上,也是人類最早在石頭上留下的痕跡。在我國寧夏的大麥地,1萬多年前也有這種文字出現,石刻是人類最具價值的研究領域。我曾在盧浮宮見過非常有價值的,有幾百條法律的石刻,是300年前由石頭記錄下來。中國早期的主流介質就是竹簡,我們國家大概使用了800年。雖然在世界范圍內沒有很廣泛的流行,但是對我們中國非常重要。那個時期正好是老子、荀子、屈原那個時代,正好記錄了咱們國家思想的高峰。如果沒有竹簡,中國最高峰時期的思想沒有辦法被記錄下來,因此竹簡對我們中華民族做出了巨大貢獻。中華民族思想最高峰也就出現在這個時期,后面就沒有再出現。

早在5000年前的埃及就有莎草紙,古歐洲是羊皮紙,是將麻打成紙漿制成紙張,這也是中華民族對世界最大的貢獻。這個歷史我們稍微回顧一下,上面講石頭、紙、竹簡等等,可以在上面刻字和這個是一回事,這個是用光反射。其實這就是一個光存儲,現在看到的竹簡主要是在白的地方、黑的地方反射不一樣,才能辨識得出來?,F在的藍光技術也是一種技術突破,就是在最近幾年形成的,它屬于冷數據存儲。日本公司已經將其產業化,冷數據有很大的存儲量,能耗低。光存儲這幾年有很大突破,澳大利亞斯威本大學提出突破衍射極限的超分辨光存儲,可以把這種密度大大提高。突破衍射技術在2014年獲得諾貝爾獎,可以達到100TB的存儲容量。

第三個是英國南開普頓大學,實現通過玻璃介質永久保存數據。在1000度以下的實驗環境下,可以做到信息不丟失,做這個實驗的是我們學院的一個學生,并以此開始創業。

進入數字時代以后,當前的主流存儲是磁存儲,磁存儲發明很早,1878年就出現了。1920年德國把薄鋼片用于記錄聲音進行廣播,1956年IBM發明了第一個硬盤。實際上這個硬盤在我們個人電腦、服務器、大型數據中心中都在被大量使用。而且目前還是我們的主流存儲,我們來看一下第一臺硬盤,是這么大一個東西容量只有5MB,今天很小的一塊硬盤已經達到10TB容量,這是一個巨大的成就。1956-2006年,今年正好是硬盤發明60年,這個成就非常驚人。1956年是2000bit/in2,面積速度提高5億倍,“60年5億倍”這個成就是非常驚人的成就。據統計,80%的信息目前還存放在硬盤之中,硬盤仍是當前大數據時代的主力。2007年,諾貝爾物理學獎就是因為巨磁阻效應在硬盤中得到應用。而現在,磁存儲已經接近了物理極限,發展變得很艱難。面對這一問題,我們有三個解決方案:分別是能量輔助,瓦記錄和圖案化記錄。這三種技術單獨使用只能提高5倍,如果綜合使用可以提高10倍,但目前實現難度還很大。由于現在閃存發展太快,還等不到硬盤進入這個實踐,就已經被閃存超越了。而且,硬盤的機械延時不可消除。

下面我想為大家分享一下閃存成為主流存儲的三大驅動力,首先是新的應用已經爆發性增長,這種新的應用只能用閃存,不能用硬盤。比如我們的手機是不可能放硬盤進去的,目前世界上已經有40億部手機,到2020年還會增加20億。5G時代已經到來,下載視頻是非常容易的事情,那么以后5G手機下載視頻就非常容易?,F在手機最高容量已經是128G,馬上就要到512G,最后到1TB。試想一下,60億手機,就是6ZB。預計到2020年,全世界數據量將達到40ZB,手機就占到15%,這個應用是完全新增出來的。

再看現在的智能汽車,也能達到數百萬臺的新容量。還有無人機、智能機器人、物聯網,這些都不能用硬盤。而是被閃存行業壟斷。

第二個驅動力是大型數據中心對性能的要求越來越高。硬盤已經很難滿足大數據實時分析需求,更需要速度。數據中心對能耗的考慮也要求更換硬盤為固態盤。
第三個驅動就是價格,閃存價格持續下跌。2022年左右將與磁介質持平,并全面替代硬盤。

第一條綠線是閃存下降趨勢,第二線橘色的是硬盤下降趨勢,第三條藍色線是磁帶。這些下降趨勢應該都會提前,因為隨著工業的進步實際上的發展會快于預期,我個人的估計是2020年左右就會持平。

1

性能方面,閃存每年有40%的增加,硬盤在性能方面是具有劣勢的。如果要繼續降低閃存介質成本的話有三個途徑,制程升級、多級化、3D NAND技術。SLC、MLC、TLC、QLC技術相應提高,價格也慢慢降低了。3D NAND技術已經應用于很多產品,實驗室也在致力于128層堆疊的研究。
目前幾大主流廠商,如三星、東芝、海力士、美光。三星從2013年逐漸開始壯大,現在到64層,多級是TLC、現在是QLC馬上要出3D,價格就會下降很多。

下面我想跟各位分享一下閃存時代的技術挑戰和機遇。第一個問題是存儲顆粒層次,這個層次除了剛才說的三個措施以外,還需要很多的經驗積累,我們的實驗室曾測試過幾個不同廠家的顆粒,其顆粒內部每個塊的性能都是有差異的。

第二個是固態盤控制器層次,關鍵是控制器的設計,這個控制器的設計其實是一個非常復雜的事情,是一個需要動很多腦筋的事情。雖然從性價比來看,閃存顆粒是一個非常理想的存儲介質,但其存儲原理并不是一個簡潔優美的過程。因此,如果沒有很好的控制器設計彌補原理上缺陷,數據存儲將是不可靠的。

控制器設計是一個極具挑戰的工作,第一是介質管理/信號處理問題,解決顆粒的原理導致的耐磨性和耐久性問題。第二個是糾錯能力強的ECC算法,工藝越先進,誤碼率越高,需要更強大的糾錯編碼,解決數據存儲的可靠性問題。

有一些數據放置策略、管理調度算法研究與設計,解決與放大、性能抖動等問題。

我們測試過一些產品,具體過程是這樣的,先把盤寫滿,新盤的時候大家看不出來,但是寫滿的時候,只要垃圾回收一開始運作,就可以看出差別。慢慢有很多新的抖動,到這里下來,有時候下降的很快,很多時候資源占用下降很厲害。如果設計的好,這個性能下降就會很明顯。還有一些廠商設計的產品,這個延遲時間小于100微秒,有的甚至到毫秒。還有很多細節,如果這邊是11和10的時候,這時候寫的編碼也有很大的影響,這個細節實際是我們需要注意的。

第三個挑戰是全閃存陣列層面。我們會關注硬盤和固態硬盤的差別,陣列軟硬件設計需要充分考慮閃存介質特征。由于固態盤的失效預測比硬盤準確得多,可以采用預警遷移技術,使陣列的數據在失效前轉移到新的盤上或新的塊上,從損壞重構的模式變到預警遷移模式,會大大提高盤陣的可用性。再一個把計算放到閃存里面,這個可以克服瓶頸。
軟件層面來看,傳統的系統軟件如操作系統、文件系統、數據庫系統都是根據磁盤的特性設計的,改用固態盤后,特性很多都不一樣了,需要針對固態盤重新設計,否則會浪費固態盤的性能,有時還會帶來負面的影響。硬盤時代,協議棧的開銷與機械延遲開銷相比可以忽略,而閃存時代,協議棧的開銷就顯得比例過大,開發輕量級協議棧就顯得非常必要。

最后,我想講一下中國的閃存其實是有很大機會的,硬盤時期的機會已經錯過,閃存時代機會很大,因為集成電路、半導體、軟件、硬件經過長時間的積累已經非常不錯,特別是在陣列方面已經有十幾年的經驗積累。應該說這個基礎比較好了,缺的是閃存顆粒,現在中國的國力,使我們有能力投資閃存顆粒制造企業?,F在武漢新芯和長江存儲數百億美金的投入就是典型的案例,如果運營得當,有可能會成為世界第五家閃存芯片制造巨頭之一。閃存顆粒的國產化將刺激下游產業的大發展,我們建議圍繞芯片來部署全閃存產業鏈?,F在芯片出來,我們要根據它定制控制器,設計我們的全產業鏈,設計我們的數據中心,這樣我們就可以把這個產業鏈建立起來。

還有公共平臺的建設,比如測試平臺。我們這個單位希望為行業做一個公正性的第三方測試中心,可以為各個廠商的不同的設備和陣列做一個評測。

未經允許不得轉載:存儲在線-存儲專業媒體 » 華中科大謝長生:迎接主流存儲的閃存時代
分享到

sunk

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走