數據存儲產業服務平臺

存儲知識:如何提高磁盤存儲利用率

2011年年底,數據管理學會(Data Management Institute)研究了來自3000多家大型和中小型企業的調查數據,得出如下的結論:平均起來,這些企業正浪費高達70%的磁盤存儲容量,保存那些毋須保留在昂貴的磁盤基礎設施上的數據。由于重新引用率低,甚至修改率低,大約40%的數據是惰性的,可能適合歸檔。駐留了孤立數據、違禁數據或者重復數據和垃圾等另外30%的磁盤容量,可以運用數據保健(data hygiene)的方式全部從存儲中清除。

  那么,對創建存儲回收戰略(消除毋須駐留在磁盤的數據以便這些數據占用的大量空間可以被歸還至生產用途的步驟)鮮有指引的原因何在?部分的解釋可能是:廠商寧愿消費者依附于我所稱的多力多滋(Doritos)模式(還記得那句 “嚼碎所有你想嚼的。我們會獲得更多!”老廣告詞嗎?)

  然而,由于公司政治的原因,簡單的真相是:數據分類可能超出這些公司的權限;也許他們無法規定高薪的銷售人員可以使用空間的大小,或者他可以放置文件的時間的長短?;蛘咚麄冋J為這可能超出他們的技能范圍?;蛘咚麄兛赡苋鄙偃藛T、硬件、時間或者預算之類的資源來完成。

  無論如何,要解決浪費的磁盤存儲容量的問題,你需要至少做到以下其一:

  · 判斷重新引用率低的數據資產的戰略(因此可以安全地或者無干擾地從昂貴的存儲被移到便宜的、更高容量的存儲。)

  · 把較舊的數據資產遷移到容量存儲的戰略(或者,如果有重復數據和垃圾,把它們全部從存儲基礎設施移除。)

  我認為,選擇歸結為:進行數據資產的粒度分析(即第一個戰略,個人認為其更為有效),或者使用簡單的元數據把較舊的、不經常被引用的數據推向比較便宜的存儲介質。

  考慮到很多公司禁止刪除任何數據,致力于第二個戰略可能更有利。為了把不常被訪問的數據資產從生產存儲中遷出并移到歸檔磁盤存儲容量或者磁帶存儲,從而把昂貴的生產磁盤容量預留用于新的和活躍的數據,一個方法是部署簡單的分層存儲管理(HSM,hierarchical storage management)。通常很多廠商提供HSM只是作為一個軟件功能,要么是較大的存儲管理軟件套件的一部分,要么是獨立的工具軟件。IBM的Tivoli Storage Manager和EverStor的Hiarc HSM是套件部件方式的兩個例子,而Crossroads Systems的 FileStor-HSM是優秀工具的一個例子。最好使用與硬件無關的軟件,而不是使用某些陣列所交付的硬件的、增值的HSM功能,以避免昂貴的廠商鎖定限制了歸檔平臺的選擇。

  大多數軟件產品能夠設定數據應該何時被移動以及數據應該被移動至何處的策略。這些策略通常由元數據的變動來觸發。如果元數據域DATE LAST ACCESSED以及/或者DATE LAST MODIFIED超出設定的限制(即30、60或者90天之后),與元數據相關的文件自動地被移到它的目的地址。

  隨著線性磁帶文件系統(LTFS,Linear Tape File System)和分區磁帶介質(IBM、Oracle的磁帶以及LTO 5或以上)的出現,另外一個選擇是同時向磁盤以及使用LTFS的磁帶寫入文件。然后,當數據重新被引用率低于設定的限制的時候,就刪除磁盤上的拷貝,文件繼續留在LTFS磁帶上歸檔就可以了。

  這種戰略以占據容量的數據為重點,在毋須刪除數據的情況下提供緩解主存儲擁擠的方法。分層存儲管理一般優于壓縮和重復數據刪除等戰術性的容量管理技術,它們有時被用于把更多的存儲“硬塞”到同樣大小的磁盤中。HSM較優的原因在于它在本質上不改動數據(有些類型的數據涉及法律問題),使用所有數據(重復數據刪除忽略被加密或者已被壓縮的數據),不會由于壓縮或者重復數據刪除軟件的問題而將數據置于損失的風險之中。

  確保你的生產存儲避免惰性和違禁數據,也可以向鏡像和復制乃至備份的數據保護流程注入新的活力,因為只有生產數據才會接觸那些數據保護服務。已經被移動到容量存儲的數據以及不經常發生變化的數據通常更少被復制用于保護,而且復制并不影響生產的工作負載。

未經允許不得轉載:存儲在線-存儲專業媒體 » 存儲知識:如何提高磁盤存儲利用率
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走