以下為速記整理(文字未經演講人審閱):

目前大家都知道容器越來越熱門,很多大型企業尤其是制造業和金融行業關注最多,已經向容器領域發展了。容器原來是物理記憶現在是虛擬化,毫無疑問馬上會成為一個新的虛擬化場景,最后進入到無服務器計算,我覺得在企業里面比較少,公有云比較多一些。

據Gartner統計,虛擬機已經在企業里大量采用,容器是下一個計算虛擬化的熱點,因為容器會比較敏捷一些,有22%的企業主要考慮用容器而不是虛擬機,27%的全球組織已經將容器用于生產,容器跑生產要解決一個問題,數據持久性問題。

如果有數據,要解決數據的存儲和備份問題,今天主要講備份的問題。容器怎么備份,首先看容器生態,Kubernetes已經成為容器編排的事實標準。存儲也是一樣的,原來開發很多私有接口,但是現在你會發現CSI也成為容器存儲接口的事實標準,容器跟存儲之間的接口也標準化了,這其實給數據保護廠商或備份廠商帶來一個好的機遇。

In-Tree存儲卷插件是容器編排器的一部分,有許多缺點:

  1. 存儲卷插件開發與Kubernetes版本緊密結合并依賴于Kubernetes版本。
  2. Kubernetes開發人員/社區負責測試和維護所有供應商的卷插件,而不僅僅是測試和維護標準插件API,
  3. 卷插件中的錯誤會影響Kubernetes的穩定性,因為它們以完全權限運行,4、存儲供應商被迫提供插件源代碼,并且不能僅發布二進制文件。

Flex Volume插件試圖通過為外部卷插件公開基于exec的API來解決這種痛苦。雖然它使第三方存儲供應商能夠在out-of-tree編寫驅動程序,但為了部署第三方驅動程序文件,它需要訪問節點和主機的根文件系統。

為解決這些問題,2018年,云原生計算基金會(CNCF)發布了Kubernetes 1.13,讓Container Storage Interface(CSI)普遍可用。CSI通過使用標準Kubernetes原語開發存儲插件,它是out-of-tree的,并且支持容器化部署,通過用戶熟悉和喜愛的Kubernetes存儲原語進行消費,從而解決所有這些問題。

主要利用K8S和CSI生態解決容器備份難題,我們可以看到在K8S認證里面,2020年11月7日統計:共有99個CSI Driver,有51個支持Snapshot。CNCF Landscape中K8s發行版,共68個K8s發行版。

收購新風口——K8s數據管理

相對來說,我覺得現在進入容器做備份是很好的,因為已經有基金會牽頭幫你把生態打造了一遍,主要是適配生態,生態會比原來虛擬機環境簡單。今天會講講幾個廠商怎么做的,我的標題叫做第二存儲新的風口,兩年前講第二存儲的時候就說第二存儲就是新風口,現在新風口就是容器的備份。

2020年9月,Pure Storage以3.7億美金高價收購Portworx,2020年10月,Veeam以1.5億美金高價收購Kasten。以后容器越來越多,產生一個新的獨角獸或未可知。

近期國外機構GigaOm發布了基于K8s數據保護的雷達圖,里面就是一些認為相對比較好的一些廠商,所以我們今天圍繞三個廠商講一下容器備份方案怎么做的,一個是數據存儲的代表就是Portworx,它是做容器出身,第二個講一下Commvault,它是做數據管理,數據備份這一塊,現在有新的版本把容器生態做起來了,備份廠商向新的平臺擴展的一個廠商代表,還有一個是Kasten,已經被Veeam收購,是做數據管理的,容器的廠商都會做備份這件事情。這三個廠商是目前K8s備份進步很快的,其他小的公司進入不到中國。

國內在制造業里已經有用戶在用了,所以Commvault在中國都有存在,大家有機會用到很多方案。這個第三方分析報告僅代表他的個人觀點,只是作為一個參考,并不代表真實的情況。

現在我講講自己的看法,Commvault,它認為容器備份不能僅僅備份數據,因為容器平臺里面除了存在PV里面,還有容器以外有應用的話,其實還有環境、配置,元數據是什么,只有數據的話,恢復不起來的,重新建這個環境是很費勁的。

我們看一下進展,其實Commvault很早就做容器備份了,但是2017年做docker,2018年是OpenShift,我們知道這個生態是比較多樣的,K8S沒有一統天下,到了2018年底,2019年開始,CSI可以看到一統天下了,今年下半年Commvault發布最新版本Commvault 11.20,已經支持標準原生K8s。

西瓜哥:第二存儲新風口:K8s/CSI容器應用備份

主要的原理很簡單,首先會由一個虛擬機裝到Access Node,上面有一個proxy軟件,它可以通過API跟服務器通信,去獲取整個容器平臺應用信息,自動發現應用,每個應用需要什么資源,用的資源是什么樣的,數據在哪里,以應用為單位進行備份。

它是一個自動化發現的問題,應用可以自動發現,根據標題搜索。說白了,它備份數據的時候,它就是通過API-Server數據,看一下應用了哪些PV(persistent volumes),通過CSI調取快照,如果不支持可能會需要agent做數據備份。

從界面上來看,它把整個K8S和虛擬化并列的兩個菜單,是兩個并列的入口,K8S也是虛擬化一種,但是它是虛機虛擬化,所以是并列兩個入口。因為一個大的企業不僅僅是容器的平臺,可能還有虛擬機平臺或者是物理機平臺。

K8s集群通訊機制類似VM的vCenter,恢復的話不僅僅恢復應用,恢復數據也可以,恢復元數據也可以,備份之后可以看到里面是什么樣的狀態?;謴偷脑捒梢曰謴偷搅硗庖粋€集群,比如說公有云,不僅僅完成備份工作,也可以完成遷移的工作,特別是老的K8S平臺要升級很麻煩,可能需要備份,然后上新的一套容器平臺,這樣的話原來手工做很麻煩,現在是可以全部統一回復。

支持應用自動篩選,通過標簽來篩選,你把所有開發應用前面打個標簽,你只備份生產應用就可以了,可以定義很多東西,這樣很方便可以做到自動化。

理論上來講肯定支持所有的CSI快照存儲,但是還是要實踐證明。前段時間XSKY驗證其CSI快照可以和CV對接,通過間接驗證都可以,大家都遵循K8S等等幾個規范,這樣就方便了備份軟件的生態,又便于備份虛擬機的時候,調取快照很麻煩的事情,你又要去對接接口等等很麻煩,但是現在不用了,標準通過CSI可以搞定。

但是目前Commvault一直在做,目前應用一致性備份主要是mysql和postgresql這兩個分布式數據庫,其他的應用一致性還沒有做,但是要做也很簡單,你熟悉應用的話可以自己寫腳本,它提供了一個腳本的入口,你可以寫一個腳本,快照前做什么腳本,刷一下內存就可以了,快照釋放一下鎖就可以了,擴展性很強。

小結一下,目前的優勢是三個方面,可以自動化備份,自動發現應用自動把應用機做備份,第二是沒有代理,大家知道容器那么多,每個容器裝個代理,每個應用裝一個代理備份不太現實,所以說它是沒有代理。還可以跨云,到公有云,備份云恢復到另外一個地方去。

容器的各種部署模式,這種生態都見的很多,在實際生產過程當中。你看某一個容器應用,除了數據除了PV以外,我們看到很多的組件,可能都需要備份,應用視角去看,光備PV是遠遠不夠的。

K10架構也是一樣的意思,通過標簽、篩選、自動發現應用進行備份,備份的話主要支持備份到對象存儲里面,其他存儲可能在做,好像快存儲暫時沒有看到支持,像Commvault沒有問題,可以本地做備份,更多應用備份作為存儲。

整個備份我們可以看到數據捕獲能力,Kasten這一塊是比Commvault有些優勢,它不僅可以調用CSI快照,它自己還可以調用應用的一些數據庫工具,但是到快照里面做不到邏輯備份,這也是它的優勢。

它的一致性,支持崩潰的一致性,應用一致性幫助你刷內存,數據庫的一致性可以做到數據庫的邏輯備份,系統一致性,全應用捕獲跨數據和存儲層的工具結合。

西瓜哥:第二存儲新風口:K8s/CSI容器應用備份

Kasten整個理念是關注完整的一致性備份。在容器化方面比較專業,我個人覺得,但只是容器,可能有些不會純IT化的企業,選擇它有一些困難,因為有一些企業一般只想選一個應用,所以現在被Veeam收購,把虛擬機做進來會好一點。

最后講一下Portworx,它是做存儲的,容器存儲公司,它認為做容器做備份問題跟虛擬機完全不一樣,因為虛擬機講的語言跟容器講的語言不一樣,VM和K8S的不同,原來以機器為單位的備份方式是不行的,傳統的備份方式在容器下失靈,傳統備份軟件聽不懂K8S的語言,不會自動發現應用,這是完全不一樣的東西。

西瓜哥:第二存儲新風口:K8s/CSI容器應用備份

PX-Backup就是解決備份的問題?;谌萜髁6榷际翘摂M機粒度,它會講K8S語言,可以一鍵備份namespace。二級這個比較難,因為這么多節點同時要殺內存控制它,理論上還是很麻煩的。

它雖然被Pure收購了,但是目前官網上通過CSI接口支持公有云,只有公有云,但是我相信其他廠商也能用,但可能更多是做Pure自己的生態為主。

總結

我最后給大家一個建議。傳統備份軟件無法支持容器應用的備份要求,Kubernetes/CSI一統天下,備份生態好于VM時代,分布式架構讓應用一致性更具挑戰。

推薦建議:選擇支持標準Kubernetes/CSI生態的備份廠商,避免鎖定;下載試用版本,評估產品兼容性和應用感知能力;產品版本迭代速度很快,關注廠商的路標和支持能力。

未經允許不得轉載:存儲在線-存儲專業媒體 » 西瓜哥:第二存儲新風口:K8s/CSI容器應用備份
分享到

崔歡歡

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走