生活中三大必然要發生的事:稅收,死亡,硬盤故障

硬盤的質量越好——比如說SAS硬盤,或者光纖通道的硬盤——它們的URE率就越低。在你重建存儲系統時,這些硬盤能顯著減少災難性陣列故障的機會,而且還會讓你的陣列使用壽命延長。一個好的硬件RAID控制器可以在RAID6中應對URE,并在周圍做出標注。在RAID6中,在同一時刻,在兩個硬盤中,在兩個標注區域發生URE的幾率非常小。

這些高質量的硬盤只會為我們服務一定的時間,更長的重建時間和更多的硬盤故障相關的問題都需要解決。陣列中的硬盤使用時間相同,都進行同樣的工作,有相同的缺點,出現故障也會成組出現。閃存也有自己的問題,無法拯救RAID??磥砦覀儗AID的希望要放到接下來的10年里,那個時候或許會有設計完美的,用于企業級的RAID產品,也許還會有消費級的產品出現呢。

來自Sun的ZFS

ZFS感覺像是由瘋子設計出來的文件系統。它還被認為能取代RAID。它的真實的保證數據完整性的技術已經遠遠超出了本文所要討論的范圍,但是據說它能承受三倍的硬盤故障,更能與URE血戰到底。它那幾乎如同魔法般的數據完整性保障能力使人們在使用ZFS時只需要注意一點:在任何情況下,永遠永遠都不要對ZFS撒謊。

不要在虛擬磁盤(超級監管程序創建的,ISCSI或FCoE)上使用ZFS,也不要在硬件RAID上使用。ZFS必須完全透明地控制硬件??梢允褂孟馰Mware“原始設備映射”那樣的功能,但要保證你映射的是本地硬盤。

一些管理員在無論什么樣的硬件RAID上運行ZFS都禁止ZFS Intent Log,同時還配置硬件控制器忽略ZFS的刷新磁盤上數據的命令。這就可以讓RAID控制器決定硬盤的刷新,并且可以依靠電池來應對電力中斷。

這是一種提升性能的調試策略,最終以IOPS來衡量。這種做法很常見,主要用在混合使用ZFS,NFS的系統中,NFS會要求系統在每次寫入后都刷新數據,這和ZFS更高級的用于IOPS的算法和數據完整性平衡有沖突。其它的管理員——也包括我自己——并不贊同這種做法,因為它放棄了ZFS保持數據完整性的一些功能。如果對IPOS有要求,我更傾向于依賴使用了固態硬盤或NVRAM硬盤的混合存儲池。它可以更好地配置ZFS,也可以滿足NFS對數據寫入刷新的要求,同時,還能使ZFS的保護機制完整。

來自微軟的ReFS

微軟的ReFS被認為是對ZFS的回應。我在這里得說清楚:這絕不是指形狀或形式。ReFS相對于NTFS來說是個巨大的進步,但是還有許多不足。令人充滿期待的是,微軟的彈性存儲技術可以彌補不止一個硬盤故障的損失,但是目前來看,我個人認為它還僅僅是個技術展示。

ReFS和Storage Spaces需要整合在一起,積累一些用戶基礎,這樣它們再去正面挑戰ZFS。在目前的情況下,就在這個領域中,微軟的管理員在其服務器中使用本地存儲,最好還是使用硬件RAID。

來看看RAIN怎么樣

RAIN是一個冗余的(或可靠的)廉價節點陣列。簡而言之,RAIN可以跨越多個個人電腦復制你的數據從而進行冗余。

現在,有許多不同的RAIN的實現形式,這也是目前“大數據混戰”造成的結果。當你了解了HDFS,GlusterFS或是亞馬遜的S3之后,你再 討論RAIN。一般情況下,RAIN設備并不像傳統的文件系統那樣工作,而Gluster的團隊正在研發用在GlusterFS上的技術來改變其工作方 式。

對于大部分RAIN設備來說,操作系統并不會安裝它們,你不用創建NFS或SMB共享。如果你真的想去做這種類型的工作,你需要在RAIN陣列上使 用某種類似FUSE的東西來建立虛擬硬盤。這個時候你就不在正軌了,你需要重新評價你的整個工程了。如果,你仍然想這么做,那你可以借助一個NFS服務器 轉換器在Gluster上運行VMware虛擬機,不過這有點奇怪。

你可以減少RAIN設備頂層上轉化過來的層次,這樣可以使它看起來像是一個傳統的硬盤,RAIN通常用于對象存儲(不是文件)。最好還是把RAIN設備當成一個特別大的數據庫,而不是傳統的文件系統。

防彈的集群

當然,如果ZFS和RAID都加強了你的存儲層,那如果我攻擊你的存儲服務器呢?RAIN可以很有彈性地應對個人系統的損失,但是對于ZFS和RAID來說,沒有什么本地的東西能應對來自CPU的故障。

這就是集群出現的原因。對于容錯來說,理想的部署應該是有兩個服務器同步。在免費的軟件世界里你可以尋找采用Linux的DRBD和采用FreeBSD的HAST。

假如你有一個穩定的硬件RAID基礎,微軟的Server 2012實際上是可靠性很好的集群基礎。

Cluster Shared Volumes v2表明我是如何實現RAID 61的:在每個節點上都采用硬件RAID 6.同時采用鏡像(我把它們寫入緩存了,這樣即使一個節點出現問題,也可以保證我不會丟失數據,這很慢,但是更安全)。

把Server 2012新的NFS 4.1,ISCSI target或SMB 3.0(支持多渠道,透明的故障轉移和節點容錯)聯合起來,我對我的微軟服務器就放心了,不需要VMware集群(通過它們可以了解存儲的情況)。

說到VMware,它們提供vSphere存儲產品。這是一個可靠的技術,可用來創建存儲節點,但是在每個存儲設備上它只能擴展到3個物理系統。

現在你的大腦是不是一片混亂?

如果你現在感覺到了存儲產品功能可用性上的漏洞,那么恭喜你,你并不是一個人在戰斗,大家都感同身受。這就是為什么存儲產品生產商們都作為獨立的廠 商存在的原因。有開源工具的容錯存儲技術絕對是各大廠商追逐的對象,微軟也需要時間來把所有的技術梳理出來(在它真正成為一支重要力量之前,它需要把其3 個硬盤冗余的RdFS用在集群共享卷上,在擴展到成百上千個節點中),VMware有基本的技術,但是它需要好好發展自己的技術。

這就是為什么如此多的廠商出現在這里的原因,這也是為什么那些存儲巨頭們還在銷售大的,昂貴的SAN產品的原因。如今,在你計劃你的存儲部署的時候,即使你只有一個單一的服務器,你也要考慮許多東西,你10年前了解的東西現在已經過時了。

當然,這些技術并不僅僅用于容錯。容錯并不是備份。如果你的數據沒有存在至少兩個物理位置中,你的數據就相當于沒存。你要保證在你對容錯躍躍欲試時 你已經有了一個完美的備份計劃。另外你還要記?。阂粋€容錯系統(或者一個備份系統)如果未經過測試的話,那它就起不到任何形式的保護作用。

未經允許不得轉載:存儲在線-存儲專業媒體 » 你的存儲陣列能防止數據損失嗎?
分享到

huanghui

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走