計算和存儲虛擬化的前世今生

佚名 發表于:14年12月05日 10:46 [轉載] 賽迪網

  • 分享:
[導讀]虛擬化是個古老而又不失新潮的技術領域,這么多年來,其不斷地被賦予全新的含義。而計算、存儲、網絡這三大領域,也都有了各自的虛擬化技術。

虛擬化是個古老而又不失新潮的技術領域,這么多年來,其不斷地被賦予全新的含義。而計算、存儲、網絡這三大領域,也都有了各自的虛擬化技術。其中,存儲虛擬化的概念和技術更具多樣性。那么存儲系統都有哪些值得研究的虛擬化技術呢?本文將嘗試從不同的角度和層次來向大家全面介紹一下計算和存儲的虛擬化技術。

虛擬化邁出的第一步:服務器虛擬化

虛擬化這個詞經常出現在各類文章和文檔中。人們一般是從虛擬機技術開始逐漸了解虛擬化的。虛擬機技術很早便出現在大型主機中,由于大型主機的系統規模較大,所以有必要對資源做分區處理于是產生了硬分區,也就是從底層芯片和電路級別將系統內的CPU內存以及IO資源隔離開來,從而形成多個互相獨立的子系統,每個子系統運行各自的OS。但是整個大系統作為一個整體進行管理。

目前,IBM Power系列主機并未支持硬分區,其使用的PowerVM方案屬于軟虛擬化,富士通基于SPARC的小型機依然支持硬分區。一些基于x86體系的高端服務器可通過QPI支持這種硬分區。硬分區是服務器虛擬化的硬件實現最初形態。其好處是沒有性能損失,缺點是不夠靈活,分配粒度為芯片級,而做不到核心或者更細粒度。后來這些機器巨頭廠商比如IBM、HP、富士通等,在提供硬分區的基礎上,又提供了軟件模擬的虛擬化,將系統資源做了更細粒度的虛擬,這也就是x86平臺下的眾多虛擬機解決方案所使用的方法。而最近興起的Linux Container、Docker等輕量級資源虛擬化方案,獲得了廣泛歡迎。

傳統的基于Hypervisor+硬件指令加速(比如Intel VT以及AMD IOMMU技術)的虛擬機方案,過于厚重,同一臺物理機要運行多個OS實例,產生了極大的代碼執行效率的降低和存儲空間的浪費。

其實操作系統本身的責任本來就是將硬件資源虛擬成各種接口和服務,提供給應用程序使用,CPU提供了多線程、TLB加速硬件等等,就是為了充分滿足OS進程管理的需要,而每個進程,就是一個應用,多個應用共享同一臺物理機,靠時鐘中斷來讓CPU輪詢執行,這已經足夠平均了,而且每個進程的地址空間也都是虛擬的。其一個重要的不安全的因素就是黑客可以通過注入驅動程序來獲取Ring0權限從而影響甚至控制任意進程。

虛擬機方案同樣有這個問題,只不過觸犯幾率更低而已,比如bluepill等病毒,一樣可以讓虛擬機的安全壁壘蕩然無存。而如今比較火的LXC和Docker輕量級思路的回歸,是將來的一大趨勢。

從計算到存儲:存儲也得虛擬化

隨著存儲系統的不斷發展,存儲虛擬化的概念也逐漸被廣泛接受和使用。對于存儲系統來講,其虛擬化的概念與服務器虛擬化相比又有了新的擴展。存儲虛擬化目前看來共有三種類型,分別是設備級虛擬化、數據組織和布局虛擬化以及空間級虛擬化。

設備級虛擬化:與服務器虛擬化類似,存儲系統也可以支持硬分區或者軟虛擬化,其典型代表是2004年發布的HDS的USP高端存儲系統以及同時期的IBM的DS8000高端存儲系統。值得一提的是,唯一一個采用類似LXC和Docker方案進行設備級虛擬化的廠商是NetApp,其在2002年左右發布的vFiler軟件就可以在一臺物理存儲系統中虛擬出多個虛擬存儲系統。

當然,也有直接采用商用虛擬化層的存儲系統,比如EMC在2011年發布的VNXe便直接使用VMware在SAN控制器內部虛擬出一個NAS控制器,從而形成了統一存儲。

設備級的存儲虛擬化應用場景不是很多,畢竟存儲系統已經在數據層面實現了足夠的空間隔離,就算多個系統同時使用,其數據也不會相互影響。

數據組織和布局的虛擬化:對存儲虛擬化的另一種理解,是存儲系統對底層數據排布管理方式的虛擬化。2010年之前多數存儲系統使用的是Raid1.0的數據布局,其很不靈活,重構時間長,隨著單盤容量的增長,其已經無法滿足重構速度的要求。

2010年左右,不少Raid2.0思想的產品出現,比如XIV、3PAR等。Raid2.0技術便是存儲數據布局虛擬化的典型代表。Raid1.0的條帶分布和管理完全與硬盤綁定,需要全盤重構,而且重構數據只能寫到一塊盤上,嚴重制約了性能。Raid2.0嘗試讓條帶浮動了起來,不再與磁盤數量綁定,條帶可以在數百塊磁盤范圍內漂移,重構自然也就是見縫插針,多盤都可以寫入數據,極大降低了重構時間,而且只重構條帶所占用的塊,空閑塊不重構。

但這也有副作用:需要大量的元數據來追蹤記錄條帶的物理位置,需要耗費大量計算資源,以及保存元數據的存儲空間資源,元數據變大之后,嚴重影響性能,所以不得不后臺引入碎片整理機制。

Raid2.0已經不亞于一個文件系統當量了。圖1所示為一個Raid2.0的典型磁盤布局,可以看到邏輯卷的條帶可以以非常靈活的方式布局。

XIV和3PAR是業界第一個推出Raid2.0技術的產品,XIV屬于一種分布式Raid10,其條帶就是兩個鏡像塊,而且這兩個塊可以分布到系統內任何磁盤內;3PAR則是Raid5的Raid2.0,但是IBM和3PAR并沒有使用“Raid2.0”的概念術語,3PAR采用了“dynamic optimization”,這個詞別說技術屌絲,連技術專家恐怕第一眼也不知道是什么技術。后來有不少國內廠商實現了Raid5的Raid2.0,包括MacroSAN、Huawei等。

其實Raid5的Raid2.0的鼻祖是ZFS的zRaid,而ZFS的年頭已經很久了,可以追溯到20年前了,早期Sun還與NetApp針對數據布局的技術專利打過官司。“Raid2.0”后來被Huawei正式當作了一個數據并大肆宣傳,這才映入廣大業界屌絲的眼簾。

Raid2.0磁盤布局示意圖

空間級虛擬化:所謂空間級虛擬化,就是用一臺存儲設備,將其他存儲設備提供的空間整合起來,在其上實現各種附加功能或者實現數據遷移和異構容災解決方案。

存儲行業相對服務器行業來講是比較封閉和保守的,而“空間級虛擬化”為了打破牌局,在多年抗爭中逐漸脫穎而出,這些年來一直代表著存儲技術的先鋒,而隨著Server SAN等Scale Out技術的誕生和井噴,“空間級虛擬化”技術的吸引力卻依然高漲,就連傳統SAN存儲巨頭EMC也在近幾年發布了vPlex產品。

那么到底是什么吸引著用戶一直對存儲虛擬化技術情有獨鐘呢?

筆者感覺主要是以下幾個痛點一直讓用戶持續關注存儲虛擬化:統一整合,不被廠商鎖定、軟件定義,附加數據管理功能、數據遷移、異構容災、數據安全、應用配合及利舊。在企業IT存儲系統內,經常出現五類問題:

·統一整合

企業IT系統內經常存在多個不同廠商或者同一個廠商不同型號、檔次的存儲系統,屬于異構存儲環境,在這個異構存儲環境中,分配資源是個比較大的問題。首先,如果分配一個新的邏輯卷,需要登錄對應的存儲設備進行配置,如果讓應用主機連接到多個廠商的不同存儲設備,主機上需要安裝多個不同廠商的多路徑軟件,它們之間很有可能沖突,回導致在主機端重新掃盤時很有可能掃不到,必須重啟主機,這就需要中斷業務。其次,針對多種不同廠商和型號的設備,配制方法也都不同,平時運維成本非常高。如果可以使用一個集中的虛擬化設備,將這些存儲系統的空間池化,然后在一個統一的存儲池之上,做統一的管理和分配,相當于先從原來的存儲設備批發存儲空間,然后再向應用主機零售存儲空間,極大了節省了運維成本。

用戶都不愿意被廠商鎖定,系統內至少要有兩家以上的不同廠商的產品,這就形成了異構系統,給管理和資源調配帶來了額外的工作量和復雜的工作流。統一整合,其實核心在于用戶需要解決為了解除硬件鎖定而引入異構存儲之后帶來的問題,需要一種能夠凌駕于不同廠商陣列之上的基于軟件實現的數據橋梁,堅固、強韌、便于管理。這其實也是軟件定義存儲思想里的一個維度。

統一整合管理

·控制成本性能優化

隨著閃存介質使用比例的爆發性增長,一些閃存加速技術能夠合理使用閃存陣列等高成本高性能存儲介質,僅使用小部分的高性能存儲介質,即可有效提升原有存儲環境中的讀寫性能,而無需數據遷移,或高昂的成本投入,這也使得存儲虛擬化技術在高性能閃存陣列與傳統陣列之間為用戶提供了一條可行的,較低成本投入的性能優化之路。

我們來舉一個真實的項目案例:某客戶,生產中心4臺IBM小機,十余臺x86服務器。有多個廠商的SAN存儲數臺,存儲虛擬化網關一臺。災備中心,4臺小機,若干臺x86服務器+VMware虛擬化,采用虛擬機方式對生產中心的物理機進行容災。容災管理采用虛擬化網關廠商提供的容災管理工具,支持P2V容災管理。小機系統使用HACMP進行容災切換管理,災備中心的小機跑另一部分業務,分擔生產中心的壓力,算是雙活數據中心,但是不能并發訪問。目前遇到的問題:隨著業務壓力的增加,兩邊的存儲系統性能無法支撐,由于業務多為OLTP類型,要求低時延,但是如果分別將現有的存儲系統分別升級,比如更換控制器或者升級緩存、CPU,或者增加SSD+分層license的話,總體價格也不低,最重要的是需要同時維護多套SSD加速,運維成本也不低。

為此,考慮了另一種方式,在虛擬化網關處掛接一臺全閃存陣列,利用虛擬化網關上提供的加速功能,實現對后接存儲的總體加速,在節省了運維成本的同時,整體造價也在可接受范圍內,性能經過實測,不僅是緩解而且是徹底釋放了業務的性能。

·數據管理功能

在企業IT系統內會存在很多低端存儲設備,這些存儲設備多數只提供存儲空間,但并不提供額外的數據管理功能,比如快照、CDP、容災復制等等。又或者,不同高端存儲的數據管理功能無法互通,且都較為昂貴,用戶往往為此重復投資。

存儲虛擬化設備在統一整合的基礎上,還可以讓這些最原始的數據卷附加上快照/CDP以及遠程數據復制、卷鏡像、讀寫性能優化等高級功能,又例如VMware 的VAAI和SRM接口并不是所有存儲廠商都能夠支持,而存儲虛擬化系統則可以幫助用戶在不更換存儲的前提下,實現與上述接口的對接。

因此,最關鍵的就是支持異構存儲環境,幾乎所有廠商的存儲卷,經過虛擬化處理之后,都能對外表現出統一的高級數據管理功能。圖3所示的拓撲中,存儲虛擬化設備可以在保證源卷屬性不變的同時,為其附加幾乎所有數據管理功能。

附加數據管理功能

現在的企業用戶對存儲架構的期望不再僅限于空間、性能,而逐漸向可移動性,統一管理,數據安全、節約成本等維度發展。對于未來的存儲子系統而言,硬件越來越不重要,用戶正在逐漸接受這一現實,傳統硬件廠商功能重復,性能各異的各種存儲功能將被軟件定義存儲技術所替代,這是大勢所趨。

某客戶是一家大型綜合知識型IT公司,主要業務是呼叫中心業務外包,存儲子系統內存在多個廠商的不同設備,由于用戶業務復雜,經常需要開發和測試新的業務系統,這些業務系統對于存儲系統在空間的分配、使用、回收上有比較復雜的工作流,比如在一天之內可能需要新建和刪除十余個邏輯卷。而用戶對于存儲系統的使用本來就不專業,再加上異構存儲系統,這為其使用帶來了很大的不便利性。

其一表現為異構系統之間的存儲空間無法整合,導致A系統空間富余而B系統卻捉襟見肘的尷尬情況;其二表現為數據管理方面的支撐無力,比如某業務系統需要較大的臨時數據空間,否則便無法成功運行,而實際上它運行的時候卻根本產生不了那么多的數據,這就需要Thin技術來支撐;再有,一些測試系統希望在當前現有的生產數據之上進行試運行,而萬全復制一份生產數據則不僅占空間成本加倍,而且在數據復制速度上也不可行,而且系統測試完畢之后這些數據副本就變得不再需要了,這就需要快照技術來解決,而異構系統之間的快照又無法聯動,此時必須借助存儲虛擬化技術。

利用存儲虛擬化技術,極大的解放了用戶的生產力,提升了綜合數據服務能力,使得用戶能夠專注于其自身的業務系統建設,這對于企業核心存儲層有著至關重要的作用。

·數據遷移

數據遷移是企業存儲系統中最具挑戰的一種數據管理操作。由于種種原因,有時候不得不進行數據遷移,尤其是異構存儲系統之間的數據遷移。如何保證最小的系統停機時間是關鍵點。存儲虛擬化設備由于在整合其他廠商存儲設備方面久經考驗,讓其成為了數據遷移場景下最受歡迎和最具可靠性的手段。

異構存儲系統之間不能直接相互復制,必須依靠上層手段,虛擬化設備則可以完美擔任數據遷移的角色。虛擬化產品廠商一般都會提供數據遷移服務,有一套經過充分驗證的數據遷移步驟,只需要很少的停機時間便可以將數據在異構系統之間遷移完畢。

利用虛擬化設備進行數據遷移

·異構容災

與數據遷移場景類似,由于異構存儲系統之間無法實現直接的數據復制,但是異構存儲系統在經過虛擬化處理之后變成了同構存儲系統,兩臺相同的虛擬化設備之間可以完成遠程數據復制。有些虛擬化設備的遠程復制技術并不比原有設備的技術差,甚至更優。比如飛康在其遠程復制技術中支持MicroScan技術,能夠保證數據在被復制到對端之前經過充分的重刪處理,重刪識別粒度能細膩到一個扇區,這會在保證復制效率的同時,極大的節省帶寬資源。

成本控制是未來企業存儲底層架構發展的基本原則之一,企業在災備中心可以放置比生產中心第一個檔次的設備,而不管是相同廠商的不同型號設備之間,還是不同廠商的設備之間,都無法相互遠程復制數據,如果沒有存儲虛擬化技術,用戶就不得不付出額外的設備費用,而這些額外的付出卻很少得到回報,因為災難發生且需要切換的幾率還是很低的。其次,為了不被廠商鎖定,牽制住各家提供商,用戶可能最終選擇不同廠商的設備形成容災系統,為了解決數據復制問題,此時就需要借 助存儲虛擬化設備。

本地鏡像容災體系

此外,對于一個容災系統來講,統一管理才是最關鍵的要素。僅僅提供數據的遠程復制是遠遠不夠的,還必須依靠一套容災管理工具,來避免災難發生之后人為操作的失誤。比如飛康的RecoverTrac容災管理工具,可以實現多種拓撲架構之下的物理機和虛擬機混合結構的異構容災統一管理,實現容災管理的任務化、流程化、自動化。

統一容災管理

·數據安全

企業對數據安全也越來越重視,數據安全包含三個方面:閃速備份、常規備份、容災和加密。目前企業IT系統內整體是一個大的異構系統,除了給平時的資源分配和運維方面帶來了很多困難和問題之外,也給數據的保護、備份以及加密帶來了不少的問題。用戶不得不在多個孤島系統內分別執行各自的數據快照、容災以及加密任務,針對這些需求所開發的系統,也需要與這些不同的孤島分別實現各自的接口,異常復雜。

而存儲虛擬化設備可以將異構的系統不僅在管理上屏蔽掉差異性,而且還可以屏蔽實際的數據路徑差異,用戶可以在一個節點上,利用一套接口,管理整個系統的數據快照、備份、容災和加密,大大簡化了管理成本,提升了效率,甚至部分存儲虛擬化系統還能夠實現相對于快照技術更高效,保護粒度更高的持續數據保護能力,這在存儲陣列產品中是完全沒有的數據安全保護能力。

·應用結合

任何存儲系統技術、方案,都脫離不開應用系統單獨存在。只有更好的適配應用,與應用緊密耦合,產品才具有更強的生命力和粘性。然而,令人沮喪的是,不管是傳統存儲中的SAN、NAS產品,還是多數存儲虛擬化產品,在與應用結合方面幾乎都沒有什么拿得出手的方案,前者尤為明顯。傳統存儲系統,別看其高大上的外形,復雜的設計,其在主機OS內呈現的無非就是一個邏輯卷,別無他物,更別談與應用相結合了。這方面正是傳統存儲廠商應該好好自我反省的一點。

與之相比,存儲虛擬化產品就好得多。后者與應用結合緊密主要表現在:快照代理保護主流應用系統的數據一致性、與虛擬機平臺緊密集成,比如VMware SRM容災模塊集成、提供P2V/P2P/V2P等異機遷移解決方案、提供應用級容災管理工具等。比如飛康平臺下的RecoverTrac就是一個自動化異構容災管理工具,很好的將IPstor平臺上的遠程復制功能利用和管理了起來,其可以在一個界面中管理物理機、虛擬機全局的多數據中心容災切換,并且支持開機順序精細化調節,以滿足復雜應用容災場景。

·利舊

企業IT系統內經常存在一些老舊設備,這些設備性能較差,可靠性降低,已經不適合生產系統使用,但是直接淘汰掉比較可惜,如果能夠將多臺老設備上的空間整合起來形成一個存儲池,則不但可以重新利用起這些空間,而且通過做條帶化處理,還可以獲得不錯的性能。虛擬化產品可以從這個池中再次分配出多個虛擬卷給不同的主機使用.

·軟件定義存儲與存儲虛擬化

軟件定義存儲的概念最近被熱炒,筆者以為這個概念和云計算云存儲一樣,比較模糊,沒有一個清晰定義。筆者理解,軟件定義存儲的特質,應該是可虛擬一切存儲。也就是可以將不同類型的存儲空間虛擬化,然后再分配,使用軟件的方式表現出優良的兼容性,而不必將整個系統做成一個封閉的系統。這正是“軟件定義存儲”的本質思想。

綜上所述,存儲虛擬化技術能夠極大的降低管理成本,提升存儲系統的服務質量的效率。

存儲虛擬化產品分析

在這類存儲虛擬化產品中,國外產品當屬飛康NSS(IPStor),賽門鐵克Storage Foundation,IBM SVC,EMC vPlex,而飛康則是虛擬化方面的創始者,自2000年就已經開始相關技術的研發,現在依然是企業級存儲虛擬化產品中的佼佼者。IBM SVC則是2010年左右才推出了具備高級數據管理功能的版本,EMC 也是在2010年正式推出了VPLEX產品,但至今仍缺少豐富的數據管理能力和有限的存儲兼容性。國內則是以信核數據為代表的多家廠商有虛擬化產品。

有意思的是似乎多數虛擬化產品多少都有點飛康的影子在里面,作為第三方,獨立與存儲廠商的虛擬化產品,NSS也是為數不多廣泛支持國內品牌存儲的產品。

經過上面的闡述,大家應該能夠感受到,真正意義上的存儲虛擬化其實應該是獨立,第三方的軟件實現方式,任何傳統存儲廠商其實都不會真正意義上在存儲虛擬化上實現革命和解放,除非有一天他們不再以銷售磁盤為核心利潤實現。這也是目前諸多Server SAN小廠崛起的原因,存儲虛擬化廠商一直堅持打破硬件鎖定,軟件服務的原則至今。

傳統存儲技術,存儲虛擬化技術,Server SAN技術,短期內似乎有些魏蜀吳,三分天下的意思,誰也無法真正意義上替代誰,一切還是以應用,行業,場景,需求為最終導向。

如果一款存儲虛擬化產品只有存儲虛擬化基本功能的話,會略顯單薄。存儲虛擬化廠商一般都是將幾乎所有數據管理功能集成到了虛擬化網關里。

拿飛康的NSS產品舉例,NSS的各種功能,基本上與中高端檔次的SAN存儲系統控制器所支持的功能別無二致了,而且虛擬化網關設備也支持多控制器冗余負載均衡與橫向擴展能力。也就是說,不管用虛擬化網關直接連接JBOD,亦或是連接其他任意廠商存儲系統映射出來的邏輯卷,虛擬化網關設備加上后端所掛接的設備,對外表現出的其實就是一款雙控或多控冗余的SAN存儲系統,而其本身并不是一個封閉系統,而是在最優兼容性的軟件層之上來實現所有傳統存儲系統所具有的功能

綜合對比飛康NSS,IBM SVC、EMC vPlex,飛康NSS產品,幾乎囊括所有的主流存儲的數據管理技術,包括快照、CDP、自動精簡配置、Flash緩存加速分層、遠程容災復制、廣域網流量優化等,結合主機端提供的軟件比如RecoverTrac、HyperTrac、快照代理、VMware SRM接口等,可以形成數據存儲和管理的全系列解決方案。

飛康產品的定位在根本上與其他幾家不太相同,其定位于一個綜合數據服務平臺(IPStor平臺)和相關解決方案,不僅僅是銷售設備,更重要的是利用虛擬化設備來形成各種方案來應對各種應用場景,解決上述的一系列問題和痛點,比如數據遷移服務,用戶需要的不僅僅是一臺設備,更是整個遷移方案和實施。飛康更像是一個獨立的第三方軟硬件方案提供商。

IBM SVC在虛擬化的基礎上,提供快照和自動精簡配置以及遠程復制,屬于中規中矩類型的產品。而EMC vPlex則主打雙活數據中心,在本地存儲方面沒有太多可圈可點的差異化技術。其實IBM 現在很少單獨銷售SVC,而且將其打包成v7000/6000存儲系列銷售,似乎還是走不出傳統存儲的影子,而EMC VPLEX的低價策略,使其幾乎成為了打標利器,除了鏡像以外,其他相關數據服務能力都要靠它旗下的其它產品搭配實現,而存儲廠商之間的斗爭,也使得vPlex走上幫助EMC逐步趕走用戶端其他品牌存儲產品的道路,基辛格對vPlex傾注的一腔熱血,最終淪為這番下場,實在讓人感慨。

存儲虛擬化技術在這個新的IT時代之下,仍將持續發揮巨大作用。

[責任編輯:redsenlin]
作為硬盤,主要功能無非就是存儲數據,反復擦寫、連續寫入成績絕對是檢測一款硬盤產品的不二標準。
官方微信
weixin
精彩專題更多
華為OceanStor V3系列存儲系統是面向企業級應用的新一代統一存儲產品。在功能、性能、效率、可靠性和易用性上都達到業界領先水平,很好的滿足了大型數據庫OLTP/OLAP、文件共享、云計算等各種應用下的數據存儲需求。
12月15日,中國閃存聯盟成立,同時IBM Flash System卓越中心正式啟動
DOIT、DOSTOR、易會移動客戶端播報中國存儲峰會盛況。
 

公司簡介 | 媒體優勢 | 廣告服務 | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯系我們 | 會員注冊 | 訂閱中心

Copyright © 2013 DOIT Media, All rights Reserved.

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走