“如果你是一條航線,有人想預定一趟航班,那么讓對方快速查到航班時刻表并完成預定操作會讓客戶心情愉悅。”希捷公司高級產品營銷經理Teresa Worth說。 “航班預定一旦成功,航空公司也收到了機票費,那接下來航線數據就可以從 “熱”轉為“溫”了。如果客戶想換航班,查詢座位號或其他信息,客戶肯定還是希望速度夠快,但這時就不再是那么“熱”了,因為航空公司和該客戶的交易已經完成。航班飛過后,數據就可以變“冷”或近線存儲了。當然數據仍需保持在可以被查詢的狀態,因為客戶也許想在年末查詢當年的飛行里程,并確定他們的這次飛行拿到了積分,但這時候讓他們稍微等等也沒有什么大問題了”

就像做飯一樣,溫度就是一切?;蛟S還是跟做飯一樣,熱的材料最受關注,但做飯用到最多的還是那些冷的,放在冰箱冷藏和冷凍室里的材料。熱存儲一般都存在容量較低的驅動器中,而冷存儲驅動器通常存儲的數據則要多出好幾倍。這就形成了某種動態的平衡,你必須在設計分層存儲時考慮到這個因素。一個公司分層存儲時采用了何種方法對公司的經營收益會產生重要影響,甚至關乎著公司的存亡。

分層模型更新

分層存儲這個想法已經出現幾十年了,但因為存儲技術的不斷發展,這個想法的細節也在因此不停的更改。更改集中在中間層和存儲架構上。

這里說的中間層是指選用的存儲媒介。磁盤存儲,也就是硬盤驅動器以前既被用于交易型存儲(熱)也被用于近線存儲(溫),而磁帶則主要被用來歸檔(冷)這三種存儲的具體含義如下:

交易型存儲。指用于高速和大量商務交易的數據。交易型數據常常和產生利潤的業務直接掛鉤,對公司生計有著決定性的作用。

近線存儲。以上述航班的例子為例,近線數據就是指那些從即時讀取降級成快速讀取的信息。它就像是放在檔案柜的卷宗,而不再是擺在桌子上的棘手文件。你仍然能快速方便的找到它,但得稍微多花點時間。雖然時間成本增加了,但換回來的是存儲媒介成本的大幅下降。

歸檔存儲。不久,你的檔案柜存滿了。這時,企業常常會找出最老的文件,把它們裝箱然后放到像地下室或倉庫這樣的冷存儲室里。這就是歸檔。如果方法得當,所有的數據將仍然被有序存放,但很明顯,想找到具體某個箱子查找到其內容會花更長的時間。隨著每GB磁盤存儲價格的下降,磁盤在不斷入侵并占領磁帶的市場,結果就是近線和歸檔存儲之間的界限越來越模糊了,但磁帶在企業歸檔市場中,尤其是在備份/故障恢復應用方面仍然處于統治地位。這說明,在基于磁盤的系統當中,磁帶庫也能被虛擬化和使用。

隨著固態磁盤驅動器的普及,很多人正在注意到金字塔尖還有一個新的存儲層:Tier 0。

分層模型更新

“Tier 0是專屬于SSD的,它涉及到的工作任務最重,占空比、耐久力和性能穩定性最大” 希捷公司高級產品營銷經理Teresa Worth 說。 “ Tier 0上的信息都是和交易及IOPS相關的。更快地完成交易能讓公司掙更多錢,或者提升顧客的滿意度,進而增加公司的競爭力。”

如果想完整的解釋存儲架構,可能需要有一篇專門的文章。小企業用直連方式和網絡連接(DAS和NAS) 這兩種存儲可能就能很好的運作起來,這兩種存儲一般會分別選擇eSATA 或 USB 3.0再加以太網,我們知道這些就夠了。但是這些連接的性能和可擴展性都受到了某種程度的限制,因此不適用于較大的存儲。而事實上,在上世紀90年代及本世紀最初幾年里,存儲區域網(SANs)的光纖通道技術已經標準化了。光纖通道的成功在很大程度上是源于對協議的寬容性。IP, iSCSI, ATM和其它協議都能在該網絡中運行,效率也都一樣。

現在,作為一種網絡技術,光纖通道能產生的最大傳輸速度是8 Gb/s 或16 Gb/s,但驅動器接口的最大速度則僅為4 Gb/s。對于企業來說,這樣的帶寬夠用了,但以太網的潛在帶寬是10 Gb/s,而且以太網有價格優勢和更廣泛的使用范圍,因此光纖通道將很快面臨壓力。過去高速以太網的致命弱點是它的高價位以及由此對系統資源產生的影響,但網絡適配器中出現了TCP卸載引擎,它與更強有力的CPU結合后,高成本的問題已經基本得到了解決。這項技術加速了光纖通道在架構和存儲驅動器兩個層面的衰落,為以太網的iSCSI掃清了障礙,最近,因此受益的又變成了串行并列SCSI(SAS)。和光纖通道一樣,驅動連接器和存儲網絡互聯都在用SAS,SAS因此變成了現在最高性能分層存儲的最佳解決方案。我們很快將跟進一篇專門講述SAS的文章。

分層存儲服務器選擇

大多數分層存儲都會用到某種類型的存儲服務器。表現形式一般是:將單機服務器系統連在被稱為JBODs(“就是一摞盤”)的外接存儲箱上。這時,一個JBOD跟一個連在類似SAS接口上的裝有基架的磁盤柜差不太多。The JBOD attaches這個JBOD反過來又跟服務器相連,服務器里會包含一個存儲控制器,該控制器能進行RAID操作并將磁盤陣列連接到一個更大的SAN結構中。下圖展示的Xyratex RS-1600-FC2就是一個JBOD磁盤柜。

分層存儲服務器選擇

還有另外一種方法:有些企業喜歡把控制器/服務器和驅動器裝在同一個磁盤柜里。一種常見的設計是使用12個熱插拔的3.5”驅動器,配合一個服務器平臺和3 Gb/s 的SAS結構,然后把它們裝在一個3U的磁盤擴展柜。存儲器制造商們生產的磁盤柜有7U的,甚至還有能裝載超過60個3.5”驅動器的8U磁盤柜,見下圖所示的雙面STX XS62-2810。

分層存儲服務器選擇

很明顯,存儲服務器的性能如何以及能否找到正確的目標層取決于使用了哪種存儲處理方法和驅動技術。裝有6 Gb/s SSDs 的最先進的Xeon 5600平臺將被應用于Tier 0,而基于SATA的JBOD如果和三年前研發的單CPU相連之后,則更適用于Tier 2?,F在的分層技術中有一些模糊的地方,其中大部分都是和Tier 1有關的。Tier 0需要可觀的預算作支持,才能挖掘其性能的最大潛力,而Tier 2常常被用來平衡可靠性,容量和價格。前些年談到這個話題的時候,我們的選擇似乎還只局限于兩種:也就是只需要在最快的SCSI 3.5”硬盤驅動器和最大的PATA或 SATA 3.5”硬盤驅動器之間作權衡。而現在,需要考慮的因素增加了很多。

這篇文章中表達的想法是和頭三級驅動器存儲相關的,也就是從交易存儲到近線存儲。這里的討論中我們可以忽略磁帶,而把目光聚焦在兩種主要存儲類型,它們的形狀系數及其它一些需要考慮的問題上,這些因素在為分層存儲方案選擇驅動器時都需要考慮到。應用程序過去一直是被磁帶和光盤統治的,不過,我們應該注意到,把磁盤也納入考慮范疇將越來越有其必要性。一篇由企業存儲集團撰寫蘋果公司發起的題為“分層存儲藍圖”的論文說道:在磁盤,磁帶和虛擬磁帶解決方案之中,“故障恢復的失敗率平均為40%。” 究其原因,在部分程度上問題就出在企業所存的數據的量上,以及存儲大量數據時非磁帶不選。在Tier 3選擇相對更慢但更可靠的、又能保護RAID的硬盤存儲能顯著降低深層存儲器中數據毀壞的風險。

SSD 驅動器選擇:SSD

梯形存儲的頂層是SSD,它的形狀系數一般都是2.5”?,F在,SSD將NAND 閃存作為其存儲媒介而不是硬盤驅動器轉盤來使用,對此你肯定已經不再陌生了。不過,NAND 存儲器有兩種:單層式存儲(SLC) 和多層式存儲。單層和多層代表的是每個存儲單元里可放置的信息單元(bit)數。多層式存儲(MLC)的優點是每個單元能存儲更多數據,因此單個NAND芯片的總容量更高,但這是以犧牲速度和使用壽命(系統失效前閃存單元可執行的寫循環次數)為代價的。

通常來講,SLC的每個存儲單元里可進行約10萬次讀寫。2-bit MLC每個單元能接受的讀寫次數只有大約一萬次,而到了3-bit MLC就僅剩一千次了。不過請記住,SSD中能進行數據寫入的邏輯單元塊有上百萬個,而且,寫入算法一直在發展,因此寫入次數也在不斷增加。隨著容量,速度,讀寫次數的增加,基于MLC的SSD正在受到企業界越來越多的青睞,而且有望成為未來Tier 0市場的主力軍。不過,SLC技術仍然是Tier 0應用程序中的首選。

SSD 驅動器選擇:SSD

在企業存儲市場中,SSD是如何被使用的呢?通過希捷公司的Pulsar系列產品,我們可以對此有個更清晰的認識。目前有三種Pulsar 產品:Pulsar, Pulsar.2和 Pulsar XT.2。早先的Pulsar 驅動器使用的SLC NAND容量分別有50, 100和200 GB,它們使用的都是3 Gb/s的SATA接口。 Pulsar.2使用MLC,容量從100到800GB不等。接口既可以選擇6 Gb/s SAS 也可以用6 Gb/s SATA,并且希捷還提供了加密功能。對那些對數據安全要求較高,尤其是法律上對此有強制性要求的企業而言,加密功能是非常關鍵的。加密功能將確保所有寫入磁盤的文件都得到AES的保護,沒有特定權限的人都不能進入。Pulsar XT.2使用了容量為100, 200和400 GB 的SLC存儲器,接口則只能選用SAS 6 Gb/s,型號有加密和不加密兩種。

SSD 驅動器選擇:SSD

Tier 0目前使用的仍然是SLC SSD,因為交易型存儲系統每秒產生的數據請求可能會多達幾百,甚至幾千個,因此寫入次數在這一級至關重要。這也是為什么盡管SSD性能表現非常高,一些企業公司在遇到重要應用程序時,仍然依賴硬盤的原因,因為硬盤是業界公認的MTBF 評級標準較高的產品。一般說來,同樣花一美元,SSD可實現的IOPS是企業硬盤驅動器的20倍。 HDD大約是它的10倍。用哪個技術更好呢?答案不是固定的。不同的公司應該根據自身的需求和特點,對各項技術的優缺點進行權衡之后作出選擇。

驅動器選擇:3.5英寸機械硬盤

和Pulsar 系列產品一樣,企業硬盤驅動器市場上也有SAS和SATA兩種選擇。此外,還可根據規格尺寸(2.5英寸 或 3.5英寸)、容量和磁盤轉速來劃分硬盤驅動器。出于方便的考慮,我們來看一下最先應用于傳統的希捷3.5”企業驅動器系統時,這三項參數以及它們與各分層的結合情況。

希捷存儲棧的底層用的是Constellation系列,該系列包括Constellation ES和Constellation ES.2。兩種型號的轉速均為7200 RPM,且都有加密版本。Constellation ES的容量有500 GB, 1 TB和2 TB,并且可以選擇16, 32和64 MB三種高速緩存。用戶可以選擇購買3 Gb/s SATA, 6 Gb/s SATA或6 Gb/s SAS三種接口。Constellation ES.2有6Gb/s SAS 或 SATA兩種,并且以最高3 TB的容量配以 64 MB高速緩存為亮點。但Constellation ES 和 Constellation ES.2都標榜有120萬小時的MTBF評級(0.73%的年故障率),這也說明,盡管Constellation ES的容量較低,但傳輸速度能保持在147 MB/s,而Constellation ES.2最多也只有155 MB/s。這是源于兩種型號面密度的不同(數據存儲在磁盤上的密集程度):Constellation ES的324 Gb/in2 VS Constellation ES.2的444 Gb/in2。

很明顯,Constellation家族的性能和容量剛好契合Tier 2。

驅動器選擇:3.5英寸機械硬盤

Constellation家族里還有一款每分轉速為7200 RPM的2.5英寸產品,有1 TB, 500 GB和 250 GB三種容量。跟Pulsar SSDs,Savvio 15K和 10K高性能驅動器一樣,這個小巧驅動器也能放入2.5-inch的分層存儲設備中,這一優點讓Tier 2多了一個高容量又劃算的選擇。

說到Cheetah NS, 這個形狀系數3.5英寸轉速1萬的驅動器時,如何給它歸類就沒那么好預測了。關于這個驅動器,先撇開規格不說,你首先注意到的可能是它的托盤大小和一個2.5”驅動器是一樣的。它的小直徑讓它有了具備更高轉速的可能。NS 10K 的類型有300, 450和 600 GB三種。無加密功能,但用戶可以在4 Gb/s光纖通道和6 Gb/s SAS兩種接口之間進行選擇。

驅動器選擇:3.5英寸機械硬盤

可以預見到,Cheetah 15K也具備了上述功能,直徑尺寸依然很小,但它的轉速達到了15 000 RPM—目前為止最高的轉速。容量跨度從73.4 到600 GB不等,每種都帶有16 MB高速緩存。4 Gb/s光纖通道或6 Gb/s SAS有更高存儲容量的型號。

驅動器選擇:3.5英寸機械硬盤

SSD普及之前,最高層存儲都選擇像Cheetah 15K這樣的驅動器。而現在,你可以考慮更多的因素并評估過IOPS性能和額定功率后再做選擇。

HDD 驅動器選擇:2.5英寸機械硬盤

近幾年,2.5英寸驅動器(15mm高)越來越受企業存儲的青睞,部分原因是它們具有較高的存儲密度和能效。盡管單個2.5英寸驅動器的容量可能比3.5英寸的要低,但因為它身材小巧,所以相同的存儲空間中能配置更多驅動器。就像IBM在其存儲著作中所指出的,2.5英寸驅動器能“在在同樣大小的空間里幾乎多裝90%的驅動器”并“減少40%的存儲空間需求量”。因此,一樣大小的存儲空間中,可以存儲更多的數據,并實現更高的總體性能。

希捷的2.5英寸企業級HDD 最早用的是Constellation 和Constellation.2,其中Constellation.2尤其代表了最新一代的近線磁盤存儲技術。6 Gb/s SAS和SATA的容量都達到了1 TB,都可以選擇6Gb/s SAS和SATA兩種接口,并且驅動器轉速都是7200 RPM。該系列有具備加密功能的型號以及140萬小時的更高的MTBF。(0.62%的年故障率,超過了它的同門3.5英寸)。

HDD 驅動器選擇:2.5英寸機械硬盤

2.5英寸HDD圈的核心是我們的Savvio 10K系列產品,它提供了性能和容量的最佳結合,該系列產品中個個都具備了200萬小時的MTBF(0.44%的年故障率)以及10 000 RPM的轉速。最新的Savvio 10K.5的容量達到了300到900 GB,這要歸功于它506 Gb/in2 的面密度。 This also enables a 168 MB/s sustained transfer rate across the drives’ 6 Gb/s SAS interface. 這一特點也讓該驅動器的6 Gb/s SAS 接口具備了168 MB/s的持續傳輸率。

不過,希捷公司小型硬盤驅動器的制勝法寶還是Savvio 15K.3。這款驅動器有146 GB 和300 GB兩種型號,使用15 000 RPM轉速以及6 Gb/s SAS接口,持續傳輸率剛勉強達到200 MB/s。

HDD 驅動器選擇:2.5英寸機械硬盤

現在,Tier 1存儲實際上是由Savvio系列產品來定義的。它的存儲密度最大,同時還使用一款高速又便宜的SAS 接口。想要什么樣的性能可以根據預算來平衡,因為15K 驅動器具備了所有最好的優點,除了在Tier 0級移至SSD之外。這一概念總體適用于分層式存儲。拋開價格談性能是不現實的,因為分層式存儲的終極目標始終是:只要條件具備,就將使用率更低的數據存入成本更低的存儲媒介。

節能

隨著電力成本的上漲,各方對提高能效所施加壓力的增加,人們越來越關注存儲驅動器的耗電量。如果單拿一個來看,一個5W和8W 600 GB驅動器的區別可能只是這兩個數字的區別,但如果是1000個驅動器在隨著時針運轉,這3W的區別就是每年幾千美元的能耗差距了。

人們普遍認為SSD比硬盤驅動器更節能,如果是從每秒I/O操作數這個指標來看的話,這種想法當然沒錯。 但不是所有的應用程序都把IOPS 視作主要的衡量標準。400 GB Pulsar XT.2是現在最先進的型號,它的平均耗電是6.67W,而2.5” 500 GB Constellation.2是5.48W,也就是說每個驅動器容量高100GB的情況下還能節電近2W。是的,這兩種驅動器的性能和價格懸殊很大,但當預算和密度的優先級比性能更高的時候,比如以一般的Tier 2存儲為例,Constellation.2在綠色節能方面就是最佳選擇。

為了研發讓企業級驅動器能效實現最大化的技術,希捷公司已經花了幾年的時間。幾年前,Barracuda ES和Cheetah 15K 3.5英寸驅動器最先擁有了被稱為PowerTrim的功能,當驅動器的某些區塊沒有存取操作的時候,PowerTrim可降低這些區塊的耗電量。希捷公司現在已經采用了T10/T13委員會公布的標準,他們對該標準進行修訂后將其命名為PowerChoice,首先由Savvio 10K.4, Constellation和Constellation ES系列使用。

PowerChoice 理論上是非常適用于二級存儲的,因為驅動器的閑置時間最低從1秒起長短不等的時候,PowerChoice就派上用場了。如下圖所示,一小時的休止狀態將啟動Standy_Z 模式,將耗電量降到僅為1.29W,用電因此會節省54%。這將觸發大約8秒的起轉時間,但是我們需要強調的是,這是近線數據,如果需要等待8秒以上的話,最好是像5年前的航班記錄這樣的數據。

分層存儲帶來的節能效益

這四種閑置模式會在驅動器內觸發不同的程序。比如,模式A和B將保持磁盤以全速轉動,但A可以減少驅動器處理器的能耗,而B則會將磁頭移到驅動器斜面上。模式C 會降低RPM 率,而D會讓系統徹底停下來。請注意,管理員可以根據用戶需求定制這些驅動器的計時和電力過度狀態,從而將驅動器調整到最適合用戶系統環境的狀態,實現系統性能的最優化。

耗電量會直接影響總體運營成本,是評價一項完整分層式存儲技術的關鍵指標。

ILM和成本回收

企業或組織一旦確定了自身的存儲需求,并決定了使用哪種方法對不同的數據組進行分層以實現最佳性能和利潤后,接下來的任務就是如何讓數據在各層之間自動傳輸的問題了。下圖來自SNIA(全球網絡存儲工業協會)數據管理論壇,它對數據如何在不同層間流動給出了一個初步的想法,但很顯然,數據流的控制應該是自動化的。 因為這樣的管理極其繁瑣,所以除了那些非常小的公司之外,如果其他公司想用人工管理是很不現實的。

ILM和成本回收

存儲分層是信息生命周期管理(ILM)實踐中的一個分支。而分層式存儲則指如何排列數據,ILM是說明了信息如何從最初生成發展到最終處置的一組操作和規定。SNIA對ILM的具體定義是:“信息生命周期管理包括策略,處理,實踐和工具,最終處置信息的過程中會得到一些數據,信息生命周期管理能將這些數據的商業價值和最適合的價格最優惠的IT系統結合起來。把管理政策、服務質量和應用程序、元數據、信息及數據聯系起來,在此基礎上,實現信息和業務流程的完美聯合。”

ILM和成本回收

有一種簡化理解ILM的方法——將重心放在日期和頻率上。“ “飛機在X點起飛后,將該記錄從Tier 0 移動到Tier 1,” 或者“如果某項數據每周的訪問次數低于X次,就將它從Tier 1 移動到Tier 2”。有時,這就是一個完整的分層存儲技術實現穩固投資回報率(ROI)時需要做的全部工作。戴爾公司談論它的Compellent Fluid Data產品時指出,按照下面的原則,可以優化數據遷移:

減少驅動器數量和降低供電/冷卻成本的時候避免使用手動數據分級和遷移。

如果Tier 1存儲器中有經過性能優化的RAID,如RAID 10,就把活躍的數據塊寫入該Tier 1存儲器

把不活躍的數據塊自動移動到較低級的存儲器中,且該存儲器中要有保護功能強大的更貴的RAID 5或6

將SSD, FC, SAS和 SATA驅動器混在同一個系統中使用,而且同一個磁盤柜里SAS驅動器要有多種轉速。

優化寫入性能和數據讀取能力,以應對SSD中的關鍵應用程序

為任何一層增加容量的時候以及接到請求需要自動重新分布數據的時候不出現停機或系統崩潰

正如戴爾在下圖中所示,數據不會總是從熱移動到冷,注意到這一點很重要。很多情況下,數據可能需要從慢存儲層遷移到快存儲層,這也是為什么存儲架構必須要可靠和高效的部分原因所在。

ILM和成本回收

進一步調查研究ILM是很有必要的,因為如果沒有合適的ILM,也就是說它沒有得到你的IT團隊和管理層認可的話,就不會實現存儲投資的最佳回報,你的數據也可能存在更大的風險。

企業存儲的重要性不只是ILM。隨著虛擬系統——從存儲器到服務器到云再到客戶端——在復雜性和普及度上的持續增長,分層也開始逐步應用于這些領域。分層化存儲在業界普及的這一天肯定很快就會到來,如果現在還沒有的話。這也是為什么在構建分層存儲系統時,每一層都要用最好的驅動器會那么重要了。找到你的企業需要的存儲層,擬定一個高效可擴展的數據移動技術方案,并在這些存儲層中使用正確的驅動器,這樣就能形成穩定投資回報率了。

未經允許不得轉載:存儲在線-存儲專業媒體 » 詳解三級分層存儲的未來藍圖
分享到

jianglily

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走