存儲知識大起底:企業級存儲測試技巧

大多數人以為硬驅的故障率就像澡盆曲線。首先,在早期故障期,你會看到許多驅動出現故障。過了這段時期,故障率便會降低。另一方面,驅動耗盡前故障率呈穩步上升的趨勢。沒有任何研究表明這種假設成立??傮w而言,人們認為驅動故障會隨著使用時間的延長而增加。

企業驅動可靠性

存儲知識大起底:企業級存儲測試技巧

對比兩個研究,就會發現100萬 MTBF Cheetah驅動與30萬小時MTBF數據表更為接近。這意味著企業和客戶驅動在年故障率方面很相似,特別是當二者的量相當時。據NetApp的技術策略總監透露,存儲數列控制驅動類型故障的方式讓顧客一直抱著這樣的想法:越貴的的驅動越可靠。存儲行業不可告人的秘密之一便是大多數企業級與用戶級驅動的大部分組件都相同。不過,他們的外部接口(FC, SCSI, SAS或SATA)以及固件設計的優先級別在實際使用有助于對二者進行區分。

數據安全性和RAID

Schroeder博士的研究覆蓋了最大的高性能計算實驗室中大型RAID系統中所使用的企業驅動。通常,我們主觀上認為這類數據在精選過的RAID模式中更安全,不過該研究的結果卻有點出人意料。

磁盤更換的時間分布顯示了正在下降的風險率,即磁盤更換前預期的使用時間隨時間增長。

這意味著數列中一個驅動出現故障會增加其他驅動出現故障的可能性。距離前次故障的時間越長就意味著距離下次更換的時間越長。當然,這關系到RAID的重建進程。經歷第一次故障之后,在一小時內出現另一次驅動故障的幾率增加了四倍。而在十小時內,出現故障的幾率就將下降到兩倍。

溫度

存儲知識大起底:企業級存儲測試技巧

存儲知識大起底:企業級存儲測試技巧

最離奇的報道之一來自谷歌。調查者從SMART——內置于大多數硬驅中的自我監控,分析和報告技術——中獲取溫度讀數,繼而發現較高的溫度與較高的故障率并無關聯。溫度似乎對較舊的驅動的影響并不大。

SMART足夠智能嘛?

答案是否定的。SMART旨在盡早捕獲磁盤錯誤,以便用戶可以備份數據。不過,據谷歌透露,出現故障的硬盤中有三分之一以上都沒有觸發SMART警報。這并不奇怪,許多業內人士早就料到了這一點。SMART被優化的目的是捕獲機械故障,可是很多磁盤仍然是電子的。這就是為什么在出現數據一致性問題的時候無法察覺一些操作和環境方面的故障。如果你正使用SMART來告知可能出現的故障,又想確保數據安全,恐怕要另外再部署冗余層。

原文鏈接:http://www.tomshardware.com/reviews/ssd-reliability-failure-rate,2923-2.html

未經允許不得轉載:存儲在線-存儲專業媒體 » 存儲知識大起底:企業級存儲測試技巧
分享到

dostor

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走