數據存儲產業服務平臺

RAID的發展方向 控制器更智能校驗更強

自從David Patterson、Garth Gibson和Randy Katz在20多年前第一次提出數字存儲可靠性和性能概念的時候,RAID技術就已經存在了,而且它還將再發展數十年的時間。這項技術最大的問題是如何跟上每年以大約40%的速度遞增的磁盤增長速度。

Panasas Inc.的首席技術官、聯合創始人Gibson在企業存儲論壇上表示:"這個問題的核心在于讀取整塊硬盤所花的時間越來越長,每年大約會比上一年增加20%。磁盤數據讀取速度的增長速度比磁盤容量增長速度要慢得多,因此每年讀取比上一年容量更大的磁盤時所花的時間就會更多。"

Permabit Technology的創始人、首席執行官Jered Floyd聲稱,RAID廠商和大多數存儲廠商并不打算解決高容量磁盤的故障率問題。

Floyd說:"使用任何低于RAID 6的大容量磁盤幾乎肯定會出現數據丟失的問題,如果因為誤碼率問題而導致磁盤故障,那么甚至連RAID 6也會出現數據丟失問題。"

Floyd說,廠商們必須采用更高級的消除編碼技術,才能超越RAID 6。他特別推薦那種能夠保護磁盤不出現故障以及在更大系統中利用數據分布來解決單一整套磁盤重裝難題的解決方案。

Gibson指出,由于磁盤容量變大了,RAID系統就要花更長的時間來恢復出現故障的磁盤。傳統的RAID系統需要從頭到尾讀取所有的剩余磁盤,然后再從頭到尾將丟失的數據都寫到網絡備份磁盤。

因此RAID系統就需要花更長的時間來恢復整盤保護,這樣出現其他故障的概率就會上升,數據丟失的概率也就隨之上升了。

更智能的RAID控制器

然而,某些業內權威人士提出,磁盤密度以每年增長一倍的速度遞增,因此而引發的不可靠性正是許多問題出現的原因,而且磁盤重裝過程中出現兩個故障的概率也大幅上升。

Nexsan Technologies的首席技術官Gary Watson表示,許多故障信息與實際的技術進步是背道而馳的。

Watson說:"首先,磁盤性能在不斷持續提高,雖然它沒有跟上磁盤容量的增長速度,但是兩者之間的差距也并不是特別大。"

他說,RAID控制器正在從共享網絡如FC-AL和SCSI等轉向更現代化的網管結構如SAS。

Watson補充說:"另外,重裝計算的硬件級支持意味著一代一代的RAID控制器的重裝性能將完全緊跟磁盤容量增長的速度。"

LSI的DAS RAID架構與戰略規劃總監Luca Bert說,RAID控制器的部分問題是,大多數硬盤的利用率都是不足的,但是控制器并不知道系統現在正在使用什么和沒有使用什么。

Bert說:"更好地了解這方面的信息就可以讓系統只重裝使用過的區域。"

Luca說:"其中一種解決方案是使用自動精簡配置,這種技術可以讓系統只在它需要的受限數據集上工作,因此如果控制器知道那個數據集被提供的話,它就可以只重裝那一部分。"

Luca提到的另一個解決方案是當某個區停止使用的時候,讓每一個文件系統告訴RAID控制器,這樣系統就不用重裝那個區。

Luca說,IT人員可以利用RAID level 1或者10(而不是level 5或者6)將重裝的時間和傳輸的數據量降到最低水平。

Luca還指出,如果使用了高級數據布局算法,那么一個陣列就可以被分配到更多的設備,從而將需要重裝的組件數量降到最低。

縱向校驗,分塊

Gibson說,為了將性能下降的影響降到最低,某些RAID系統大幅調低了從磁盤故障中恢復的速度,這樣就大幅增加了出現數據丟失的概率。

解決這個問題的其中一個解決方案早在上個世紀九十年代就被提出了,那就是校驗分塊。

Gibson解釋說,它將RAID從一個控制器和一些磁盤的局部運算變成了利用所有控制器和磁盤的并行算法。

利用數十個到數百個獨立磁盤陣列組成的資源池,校驗分塊方案可以將恢復的速度加快數十倍到數百倍。而且,它將每個磁盤的工作劃分得如此之細以至于同步工作中的用戶幾乎不會感覺到他們的工作受到了恢復操作的干擾。

校驗分塊方案在RAID控制器產品中是非常少見的,但是Panasas的并行文件系統卻提供了這種方案。有趣的是,谷歌文件系統中也使用了這種方案。

但是磁盤容量增長還存在另一個問題,那就是不可讀取的扇區。所有的磁盤都是按照技術規范來生產的。 其中一項技術規范規定,不可讀取的扇區不應經常出現,通常每讀取10到100TB的數據出現不可讀取扇區的個數不應該超過1個。然而,隨著磁盤容量變得越來越大,恢復過程中需要讀取的扇區越來越多,至少出現一次不可讀取扇區的概率也就更大了。

Gibson說:"在普通陣列中,如果在磁盤恢復過程中有太多的扇區丟失,那么恢復就會失敗,整個卷就會離線并可能會丟失。"

其中一種可行的解決方案是讓冗余編碼變得更強,以及更加對癥。

例如,RAID 6可以處理同時出現的兩個磁盤故障或者一個磁盤故障與一個不可讀取磁盤扇區故障。同時出現兩個磁盤故障的話,幾乎肯定會出現不可讀取磁盤扇區的故障。

解決這種磁盤故障的其中一種方案是在每個磁盤上增加一個編碼層,這樣不可讀取扇區就可以在本地得到恢復,而不用使用RAID系統。

Gibson說,Panasas將這種方案稱作縱向校驗。利用縱向校驗方案可以讓RAID 5恢復一個出現故障的磁盤,哪怕同時出現不可讀取扇區也可以進行恢復;縱向校驗方案可以讓RAID 6恢復兩個出現故障的磁盤。

今后的磁盤容量將增長得更大,系統容量也將變得更大,將更加強調故障恢復的重要性。但是RAID完全可以應付這些問題。 RAID技術的未來在于針對具體故障實例更小心地編些代碼,實現丟失數據重建過程中的并行和負載均衡。

未經允許不得轉載:存儲在線-存儲專業媒體 » RAID的發展方向 控制器更智能校驗更強
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走