圖 1) 不同類型固態介質和旋轉介質的隨機讀取效率對比(以對數刻度表示)。請注意,在每美元 IOPS 方面,不同 HDD 類型之間的差別相對較小。

自動存儲分層會嘗試識別熱數據并將其存儲在性能較高的存儲介質上,同時將冷數據存儲在速度較慢、成本較低的介質上,而不是將整個數據集永久地放置在昂貴的介質上。

為了構建最佳解決方案,NetApp 投入了大量時間和精力來了解 AST 必須解決的問題。

本文包括以下內容:

    ·評價 AST 技術所依據的標準

    ·基于遷移的 AST 方式與基于緩存的 AST 方式

    ·NetApp 虛擬存儲層 – 基于緩存的 AST 方式

評價 AST 技術

從 I/O 角度來看,AST 的主要目標是將隨機 I/O 盡可能多地轉移到高性能介質(閃存)上,以最大程度地減少 HDD 上的隨機 I/O 負荷,并減少平均延遲。隨機 I/O 和順序 I/O 之間的區分非常重要,因為對于連續讀寫,閃存與 HDD 相比性價比優勢并不明顯(原因在于 HDD 非常適于處理順序 I/O)。

圖 2) 不同類型固態介質和旋轉介質的連續吞吐效率對比。

以下幾個因素會影響 AST 解決方案實現上述目標的能力:

   ·數據存儲的粒度如何?處理的數據塊越小,用于存儲數據的系統和 HDD 資源的效率就越高,并且冷數據“跟隨”熱數據移動并毫無益處地耗用昂貴介質的可能性也越小。

   ·如何識別熱數據以及速度加快了多少?熱數據進入閃存的速度越快,錯過 I/O 活動中相對短暫的高峰期的可能性就越小,需要的 HDD I/O 就越少,并且平均延遲時間縮短的幅度就越大。

從操作角度來看,還需要考慮以下幾個因素:

部署和管理該解決方案的難度如何?如果部署 AST 解決方案需要進行重大的重新配置,或需要大量的監控和管理,那么可能會得不償失。

該解決方案如何與您使用的其他存儲技術(備份、重復數據刪除、精簡配置等)集成?您一定不希望在部署一個解決方案之后,發現備份不能執行,或者雖然能執行,但卻需要大量地移動數據。

實現 AST 的兩種不同方式:遷移與緩存

實現 AST 有兩種本質上不同的方式:遷移和緩存。

基于遷移的 AST 可自動化數據遷移的流程。當一個數據塊被確定為“熱”數據時,會將該數據塊移至速度較快的介質,當該數據塊變“冷”時,會將其移回速度較慢的介質。移入和移出閃存都需要訪問 HDD。

基于緩存的 AST 使用廣為人知的緩存方式將熱數據“提升”到高性能的介質中。由于 HDD 上仍保留有數據的副本,因此當數據變“冷”時,只需將其從緩存中釋放即可,而不需要額外的 HDD I/O。

圖 3) 基于緩存的自動存儲分層與基于遷移的自動存儲分層。

NetApp 虛擬存儲層

根據我們前面討論的評價標準,NetApp 考察了這兩種實現 AST 的方式,并得出以下結論:基于緩存的 AST 方式更符合這些標準的要求。

此外,NetApp 還能夠專注于優化讀取性能,因為 NetApp 任意位置寫入文件布局 (WAFL) 能夠有效地將寫入活動轉變成連續寫入,而 HDD 適于處理連續寫入(如圖 2 所示)。Mike Riley 和 Tech OnTap撰稿人 John Fullbright 最近發表的一篇博文中對此進行了詳細介紹。(這也是 NetApp 雙奇偶校驗 RAID [RAID-DP] 能夠提供良好的寫入性能,而其他 RAID 6 實施方案無法提供的原因。)

圖 4) NetApp 虛擬存儲層是基于緩存實現自動存儲分層的一種方式。

NetApp 虛擬存儲層將熱數據提升到緩存,同時將 HDD I/O 開銷保持在最低水平。無論何時接收到針對卷或 LUN 上某個數據塊的讀取請求,系統都將自動提升該數據塊。請注意,數據塊提升不是數據遷移,因為將數據塊復制到虛擬存儲層時,數據塊仍保留在 HDD 上。提升是直接在系統緩沖區緩存中發生的,所以不需要額外的 HDD I/O。

由于數據塊在第一次從磁盤讀取之后可以立即進行提升,因此也不需要額外的磁盤 I/O。相比之下,基于遷移的 AST 實施通常在多次從磁盤讀取熱數據之后或直到執行計劃的下一次遷移時,才會提升熱數據,并且還需要額外的磁盤 I/O,才能完成遷移流程。

NetApp 算法可將高價值數據與低價值數據區分開,并將高價值數據保留在虛擬存儲層中。例如,系統始終會在第一次讀取元數據時就將其提升到緩存中。相比之下,除非是專門啟用,否則在虛擬存儲層中一般不會緩存連續讀取,因為連續讀取往往會擠掉更有價值的數據的位置,而且如我們前面所看到的,HDD 更適于處理連續讀取。您可以更改此行為,以滿足具有不同服務級別要求或獨特數據訪問行為的應用的要求。

虛擬存儲層優勢

在精細粒度級別實時提升熱數據。數據塊通常在第一次從磁盤讀取時就進入虛擬存儲層。由于后續讀取在虛擬存儲層中即可完成,因此可以實時顯現性能優勢。系統會識別讀取行為模式并提前讀取可能需要的數據塊,但是虛擬存儲層絕不會將數據大量地從一個存儲層移至另一個存儲層。這樣可將 HDD I/O 以及其他系統資源的使用量保持在最低水平。該方式帶來的效率與在單個 4 KB 數據塊粒度級別上的操作能力相結合,可支持熱數據實時提升。

采用基于遷移的 AST,熱數據從一個存儲層遷移到另一個存儲層要通過后臺任務的方式,或者要安排在非高峰期執行,以最大限度地減少存儲系統上的額外負載。由于這些解決方案通常在至少高出虛擬存儲層 128 倍的粒度級別(從 0.5 MB 到 1 GB,甚至是整個卷或 LUN)上運作,因此數據移動會花費相當長的時間。如果活動的重要高峰期的持續時間少于識別和提升熱數據所需的時間,那么此類方式可能會錯過重要高峰期。

虛擬存儲層的 4 KB 粒度意味著它能非常高效地使用基于閃存的介質。具有較粗粒度的解決方案可能會隨每個熱數據塊包括大量“冷”數據,因而可能需要更多的昂貴閃存介質,才能達到相同的結果。

易于部署和管理。虛擬存儲層可作用于現有數據卷和 LUN。它不需要您對存儲環境進行復雜或者顛覆性的變革。您也無需為數據移動設置策略、閾值或時間窗口。您只需將閃存技術安裝在您的存儲系統中即可。完成安裝之后,虛擬存儲層將對存儲控制器所管理的所有卷發揮作用。如有需要,您隨后可以在虛擬存儲層中排除優先級較低的卷的用戶數據。

其他 AST 解決方案都需要設置增量策略、劃分數據類別以及對現有存儲基礎架構進行結構性更改,例如創建專用存儲池和遷移數據。

完全集成。虛擬存儲層與 NetApp 統一存儲架構完全集成,這意味著您可以將其用于任何 NAS 或 SAN 存儲協議,而無需任何更改。

此外,基于遷移的 AST 解決方案可能無法與存儲效率功能(如重復數據刪除)配合使用,而 NetApp 虛擬存儲層則可以與所有 NetApp 存儲效率功能(包括精簡配置、FlexClone 技術、重復數據刪除和壓縮)協同工作。此緊密集成可以增加您的優勢并增強虛擬存儲層的功能。

例如,當您對某卷進行重復數據刪除時,所帶來的好處在虛擬存儲層中也會體現出來。系統中可能有多個元數據指針指向虛擬存儲層中的某一數據塊,因而會增加該數據塊再次被讀取的概率,這使得提升該數據塊更有價值。借助此緩存擴增,虛擬存儲層中的單個塊可用作多個邏輯塊。這樣會給服務器和桌面虛擬化環境帶來顯著的性能優勢(如縮短啟動風暴持續時間),同時減少需要的閃存介質數量。

結論

與基于遷移的 AST 方式相比,我們基于緩存的 AST 方式為 NetApp 虛擬存儲層帶來了顯著的優勢。虛擬存儲層能夠實時提升數據,因此即使活動的高峰期非常短,也能從加速中受益。4 KB 粒度意味著我們可以非常高效地將冷數據從閃存中排除,因此獲得良好結果所需的閃存就更少。相比之下,基于遷移的 AST 方式的粒度比較粗、在提升數據之前會有較長時間的延遲、需要更多的 HDD I/O,并且使用基于閃存的昂貴介質時效率較低。

事實上,虛擬存儲層將 HDD 用作容量層,將閃存用作性能層。您可能擁有各種類型的磁盤驅動器,如 FC、SATA 和 SAS。其中任一種磁盤驅動器都可以用作容量層,虛擬存儲層則提供性能。我們相信,在將來,高性能層(基于虛擬存儲層)和單個磁盤驅動器層(基于 SATA 磁盤)的結合將會成為對大多數應用最行之有效的一種方式。

未經允許不得轉載:存儲在線-存儲專業媒體 » 自動存儲分層和NetApp 虛擬存儲層
分享到

zhuyu

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走