數據存儲產業服務平臺

IBM研發總容量120PB水冷陣列

IBM位于加利福尼亞州Almaden的研究實驗室正在進行一個新的項目:設計一個120PB容量的大型存儲設備,我們今天的任何一個數據資料庫與之相比都要相形見絀。這一新的存儲設備將由20萬塊硬盤驅動器組成,預計可容納約1萬億的文件或240億首單曲容量5MB的MP3文件。要知道,截止到2010年2月24日,蘋果只是售出了100億首歌曲,因此,你不僅可以將iTunes音樂商店出售的每首歌曲都存儲兩個拷貝,而且還會有剩余空間來干點別的!

更具體地說,Almaden實驗室的工程師設計了新的硬件和軟件技術,來將20萬塊硬盤放進水平推拉的抽屜,然后放置到機架進行安裝。為了能夠給硬盤降溫,IBM將抽屜設計的比我們平常見到的更寬以盡可能多的放進硬盤,并將配滿硬盤的抽屜塞進一個液態循環水冷的垂直機架中。在軟件方面,IBM精心設計了他們的磁盤奇偶校驗和鏡像算法,比如說,當某塊硬盤發生故障時,整臺計算機仍然可以以接近全速的效果進行工作。如果單塊硬盤發生故障,系統會從其它硬盤讀取備份數據并寫入到替換后的硬盤中,這就使得這臺超級計算機依然能夠處理數據。算法會控制數據重建的速度,并能夠處理多塊硬盤同時損壞的情況。

除了物理層面的數據分布,IBM還使用了一個新的文件系統來保護陣列中的所有文件。通過我們已經熟知的通用并行文件系統(GPFS),這一系統會將文件條帶化到多個磁盤上,以達到并發讀取,增大I/O的目的。此外,文件系統使用了一個新的索引方法,使其能夠保持跟蹤數十億份文件,而無需掃描每個內容。比特網此前報道過,GPFS曾經創造過43分鐘掃描百億文件的紀錄。(《IBM演示新固態存儲系統:43分鐘掃描百億文件》)

IBM存儲研究總監Bruce Hillsberg表示,他們的算法使存儲系統中的數據能夠做到“萬年不朽”,同時還不會對性能造成影像。Hillsberg進一步認為,盡管這個120 PB的存儲陣列上如今看起來有些“瘋狂”,不過對于云計算來說,存儲的作用正在愈發顯得重要。他透露說,只是跟蹤文件的名稱,類型和屬性就使用了約2 TB的存儲。

這一陣列目前正在搭建一個即將對外發布的客戶端,其有可能用于高性能計算(HPC)項目,來存儲大量的建模和仿真數據。包括全球氣候模型,地震圖形,大型強子對撞機(LHC)以及分子數據和模擬等項目將會從逐步增長的存儲空間中受益。

盡管受到設備發熱、數據錯誤、排列密度以及存儲介質等方面的限制,不過對于數據存儲的研究仍然正在以驚人的速度向前發展。盡管這臺由20萬塊硬盤組成的120PB容量的陣列除了國家財政或財富500強企業以外沒有人能買得起,不過這一技術本身絕對是有趣的,同時其在技術方面的成就也會眷顧到消費級產品中。

未經允許不得轉載:存儲在線-存儲專業媒體 » IBM研發總容量120PB水冷陣列
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走