數據存儲產業服務平臺

碎片可能是影響存儲網絡性能的潛在因素

碎片是否是影響存儲局域網(SAN)性能的大問題?一些人說不是,一些人說是,但是有意思的是雙方都斷然地堅持自己的觀點。那么SAN碎片究竟會有什么影響呢?

SAN專家解釋道RAID(獨立磁盤冗余陣列)、SAN算法、陣列控制器等要么會最小化碎片要么會排除SAN中的碎片。一些人則表示碎片甚至會干涉操作,從而影響整體的性能。

Compellent Technologies的技術解決方案總監Scott DesBles表示:"碎片整理的好處在DAS(直連式存儲)環境中體現得很明顯。但是在擁有虛擬化存儲(比如Compellent SAN)的數據中心,碎片整理能發揮的作用很小,實際上甚至有可能影響SAN,導致SAN不能按本來的效率來管理數據。"

在SAN OEM(貼牌廠商)群體中,這種觀點非常盛行。但是一些分析師和用戶有不同的觀點。

Storage IO Group的創始人兼高級分析師Greg Schulz表示:"從DAS到SAN附加存儲,碎片一直是最富有爭議的議題之一。我的觀點是碎片是個問題。"

Infrastructure Analytics Inc.的分析師Mike Karp表示:"文件碎片整理對于SAN數據來說是很有價值,但是它的價值會隨著訪問數據的類型的不同而不同。通常,對于寫入的數據來說,進行定期的碎片整理會帶來更多的價值,而靜態的數據則不然。"

用戶在碎片整理上的體驗

賓夕法尼亞州Allentown的Synectics Group的技術支持專員Ken Bucci正在使用Diskeeper Corp.的碎片整理軟件,其使用環境包括RAID 5,RAID 0,一個2TB惠普MSA1000 SAN和兩個戴爾EqualLogic SAN(一個4TB,一個3.5TB)。他表示定期碎片整理在所有陣列上都帶來了更高的SAN性能。

Bucci表示:"我們經常聽到說SAN的碎片整理是不必要的。但是如果有碎片,那么就需要碎片整理。當我們使用文件服務器數據存儲SAN的時候,我們經常聽到有人抱怨性能,直到我們使用Diskeeper以后才改觀。"

那么誰是正確的,誰是錯誤的呢?看起來,我們需要區分SAN的物理存儲和操作系統(尤其是Windows)所看到的邏輯存儲。讓我們來看看這兩個問題。

像Compellent和惠普這樣的OEM堅定地認為"不要對我的SAN進行碎片整理"。

DesBles認為碎片的重要性確實取決于SAN。他強調了Compellent的Dynamic Block Architecture(動態塊架構)–這個架構可以跟蹤數據的每個塊在陣列中的存儲、管理和訪問地址及方式。他表示,這就是為什么SAN中不需要碎片整理,因為SAN已經比操作系統更有效地管理數據的塊。SAN有一個全局的數據中心視圖,可以知曉所有連接到SAN的服務器數據訪問類型,并相應地管理數據塊。此外,Compellent還有一個Free Space Recovery(自由空間恢復)工具,可以為其他應用程序回收自由空間,從而避免了碎片整理的必要性。

惠普也支持"不要碎片整理"。根據惠普EVA高級架構師Rodger Daniels的說法,EVA虛擬化了跨磁盤組的數據。這使得EVA可以將數據分布在磁盤組中的所有磁盤上。當數據被寫入或讀取的時候,EVA可以利用整個磁盤組中的所有磁盤。這改善了數據訪問性能。

Daniels表示:"對EVA來說,由于有了虛擬化技術,數據碎片不成問題。但是如果有客戶對磁盤進行碎片整理,EVA也不會受到負面影響。"

他表示碎片整理程序將數據集中到LUN(邏輯單元號)或vdisk中更低的邏輯塊地址(LBA)。不過,由于這個數據仍然是均勻分布在存儲池中,因此還是可以保證存儲池所代表的磁盤池能夠帶來最高的性能?;萜毡硎綞VA不會受到碎片的影響,因為EVA將數據條帶化,處理的是分布在數個磁盤上的8MB分配塊。EVA一直在執行一個稱為水準測量(leveling)的進程,確保系統中所有磁盤都向分配好的池以及整體的陣列性能做出自己合理的貢獻。

Windows的問題

EMC也是類似的情況。通過將數據布局,比如說條帶到許多磁盤,以及在多個磁盤上的高性能,Symmetrix能夠最小化碎片。此外,元數據被保存在高速緩存中以保證不會出現元數據的碎片。通過像Celerra這樣的NAS(網絡附加存儲)設備和數據寫入布局的分配,碎片在很大程度上被避免了。

不過,和其他人不一樣,EMC的存儲事業部高級營銷總監Bob Wambach認為Windows服務器上的碎片確實會影響SAN,也就是說,無論SAN的物理布局技術有多先進,如果Windows看到數據邏輯上分布在30個碎片中,那么可能會影響到SAN的性能。

Wambach表示:"如果Windows看到數據有30個碎片,SAN也無法做什么。這超出了存儲所能做的范圍。"

Wambach抓住了引起人們困惑的核心問題。SAN運行并做它該做的事情。但是如果連接到Windows服務器,而且這些服務器在邏輯上又以非常碎片的方式來讀寫數據的話,那么性能會受到影響。SAN的高性能以及架構中的其他因素可能會緩解這個問題,但是系統還是有可能會受到影響。

Diskeeper的銷售工程師Mark Harrer解釋道:

"你用一個SAN控制器來管理多個磁盤。但是無論硬件是如何安裝的,在Windows看來,SAN就是一塊邏輯驅動器。在陣列中,數據的狀況可能看起來很好,但是在操作系統中,數據還是碎片的形式。"

Windows本身就非常碎片化。如果你不相信,你可以在一臺全新的機器上安裝Windows,并且什么也不做。然后使用碎片整理工具并運行分析。第一天Windows的碎片情況就很嚴重。同樣地,在任何一臺運行中的服務器或個人電腦上打開碎片整理工具,然后觀察有多少碎片,哪些文件的碎片情況最嚴重。如果你沒有運行碎片整理,那么你會發現文件有數千個碎片。因此,當Windows進行讀取的時候,它必須在邏輯上尋找到這數千個碎片,然后用數千個單獨的I/O操作來整合它們,然后再提供給用戶。這給性能帶來了很大的負擔–不過,誠然,SAN硬件的能力某種程度上掩蓋了這個問題。

Harrer表示:"SAN專家們擔心碎片整理程序會試圖告訴控制器應該將數據寫入到哪塊磁盤,但是無論是Windows還是碎片整理工具都和這個過程無關??刂破骺ê驮O備驅動程序是在不同的層中處理這個過程。碎片整理工具只在邏輯軟件層上進行操作。這并不是物理磁盤寫入問題。"

他表示碎片的隱性影響會導致存儲管理員必須為正在運行的應用程序購買更多的I/O帶寬和安裝更多的硬件。但如果這是一個軟件問題,那么他們瞄準的瓶頸就錯了。

Schulz表示:"例如,當發生碎片的時候,RAID一無所知。碎片發生的層是在RAID所運行的層的上兩層或上一層。不過,RAID可以提供性能上的提升,從而抵消碎片的影響。同樣地,RAID可能需要在IOPS(每秒輸入輸出)做更多的工作來抵消碎片問題所帶來的影響。"

他的建議不要相信兩邊的廠商,而是安排定期任務,比如在Windows上打開存儲在SAN上的數據的文件,然后進行碎片整理,然后再試。

在未來的文章中,我們將整理用戶在這個問題上的看法,報道不同的存儲管理員如何在不同的SAN環境中處理碎片。

未經允許不得轉載:存儲在線-存儲專業媒體 » 碎片可能是影響存儲網絡性能的潛在因素
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走