存儲在線總編宋家雨(左一)與IBM副總裁、大中華區存儲及中國區Power業務總經理候淼(右一)新聞會客廳訪談

宋家雨最近IBM存儲在品牌方面有些調整,把原來IBM Spectrum調整為IBM Storage,這個動作的背后是怎樣的一個戰略布局?

侯淼IBM存儲剛剛調整了整個產品線命名,從IBM Spectrum調整為IBM Storage,精簡了。IBM存儲產品線比以前更加專注了,通過命名的改變,希望能夠使品牌更加突出,突出IBM+Storage。因為我們看到,數據增長變得越來越快,數據量越來越大,IBM Storage業務會成為重要的業務發展領域。

IBM存儲品牌戰略調整,跟IBM公司整體戰略是分不開的。

IBM在2019年收購了Red Hat,今年我們剛剛發布了watsonx, IBM整個公司戰略圍繞兩大主線來展開,一個代表混合云,一個代表人工智能。

混合云主要是圍繞紅帽OpenShift底座,為客戶打造一個端到端的混合云策略,上可以支持微服務,對下可以支持容器,這樣把客戶的硬件、軟件資源統一結合起來,這是IBM很重要的策略。

針對人工智能,特別是今年7月份IBM剛剛推出的watsonx,它分為watsonx.ai、watsonx.data和watsonx.governance。其中,watsonx.ai主要是作為AI開發平臺,為客戶生成模型提供相關的底座和支持,包括模型的訓練、驗證、調優和部署。watsonx.data是湖倉一體的結構,跟存儲也是緊密相關的。watsonx.governance為整個人工智能應用提供監管,包括管理的平臺。這三個產品會支撐IBM戰略的另外一個主線,也就是人工智能。

IBM現在有基礎架構和軟件業務,還有企業咨詢服務,所有這些部門的產品和解決方案都是圍繞以上兩個主線來展開,我們會比以前更加專注。圍繞這個主線,IBM對存儲整個產品線進行了調整,以前我們是以盤(閃盤)、帶(磁帶)、閃存這樣的語言進行描述,未來我們的產品線會圍繞三塊: 第一塊是人工智能存儲;第二塊是混合云存儲;第三塊是數據保護存儲。我們實際上把硬件、軟件結合,首先會有一個軟件的平臺和引擎作為關鍵的組成部分;然后是相關硬件,包括盤和帶,為客戶提供針對AI場景、混合云場景以及數據保護場景的解決方案。

宋家雨:您能否結合這兩個場景,介紹一下IBM存儲的一些獨特思考?

侯淼:如果把數據源的數據分成兩類,一類是結構化的,一類是非結構化的,實際上你會發現非結構化數據增長是非??斓?,這里包括像文件、對象、聲音、圖像等數據,對此,我們投入技術、研發力量幫助客戶去尋找這種這種非結構化數據的價值,提供相應的管理方案。

人工智能處理的數據大部分(80%-90%)都是非結構化數據,針對這些數據的管理和應用,IBM存儲的一個主要解決方案就是IBM Storage Scale的產品家族,來優化和簡化數據的訪問和存儲。

    還有一個角度是幫助客戶去實現數據的云化,這里最核心的就是容器化。所以我們的混合云存儲,特別是我們推出的閃存產品,針對容器化去支持紅帽OpenShift混合云平臺,滿足客戶在混合云和私有云構建。

現在混合云應用有一個比較大的變化,就是很多客戶開始逐漸將應用容器化,對于硬件來講,容器化的好處在于能夠大幅度地去提高硬件的利用率,因為以前一個機器支持幾百個虛機就可以了,但是容器化能支持上千規模,使利用率能夠大幅度提高,減少客戶在硬件上的購買成本,這是它的重要價值。

隨著軟件應用變得更加敏捷,部署也能夠越來越快,不需要花很多周期和時間。圍繞這樣一個改變,很多客戶使用容器化軟件去實現生產系統。對于生產系統,不可避免會談到備份、容災,包括恢復的功能,而這也是IBM最強的部分。

通過我們的軟件跟OpenShift相結合,能夠支持客戶實現生產系統的容器化,然后做容災備份一整套解決方案。換句話來講,我們是為企業客戶在做混合云時,提供端到端的架構,使它能夠不單單能滿足容器化帶來的好處,而且也能滿足生產系統所具有的可靠性、穩定性和安全性的要求。

宋家雨:圍繞watsonx,在AIGC領域,IBM存儲有哪些獨特的優勢和思考,能不能分享一下?

侯淼:實際上人工智能這幾年是一個高潮,GPU 被大量在 AI中使用。IBM在人工智能方面,倡導從+AI到AI+,就是以前是在原有系統上加一些人工智能的功能,今天要做的是用人工智能去替代原有的系統,使它更加自動化。

我們有一個基本的框架,這個框架就是數據、模型、算力和存力。針對基礎構架去支持大模型,通過生成式的大模型,支持數據的分析和提煉,其中基礎架構是最主要的平臺。它有兩個關鍵支柱,一個是算力,一個是存力,我覺得這個說法可能只在中國有,因為在國外都叫做computing、Storage,中國語言則體現出一個“力”。

存力包括兩部分:一是要有一個存儲平臺,是能夠進行數據的存??;二是“力”,代表一種能力,這個能力能夠支持人工智能的模型和算力能力的發揮,所以在人工智能存力里,對存儲有不一樣的要求。一方面是要求高性能,因為現在GPU會越來越快,而且GPU對存儲的要求是吞吐量越來越大,想要數據的話能及時提供 I/O。GPU資源越來越貴,存儲的價值就在于怎么能夠減少GPU的等待時間,減少GPU等待帶來的浪費,這很關鍵,所以人工智能存儲第一個特點就是要高性能。為了做到高性能,這類存儲要支持英偉達的GPU直連,通過支持DGS協議,使企業的數據和性能能夠提升一倍以上,這是第一個高性能。

第二個就能夠進行線性水平擴展,你很難能夠去預測未來的增長,所以所有這類系統都是分布式的。要求存儲也要是分布式,能夠線性擴展,但是分布式跟線性擴展是兩個概念。分布式是能夠擴展到上百、上千個節點,但是當你擴展到上百、上千個節點時,它的性能是否能跟得上?IBM Storage Scale軟件能解決分布式存儲擴展時的性能問題,實現線性水平擴展。

安全性、備份、可靠性則是第三個需求。我覺得這三個結合起來,這個存力就能夠支持企業在人工智能領域所需要的基礎存儲要求了。

 宋家雨:您能不能具體介紹一下IBM存儲和英偉達算力解決方案的合作?

侯淼: IBM跟英偉達公司的合作由來已久,就在近幾年,2018年IBM和英偉達一起聯合支持美國能源部的項目,當時是用IBM的Power CPU,采用英偉達NVLink總線進行互聯,英偉達選中了Tesla GPU加IBM Storage Scale System(下文簡稱為 SSS,原ESS)產品,這三款產品結合在一起。因為人工智能計算跟高性能計算是類似,都需要很強的算法,無論是浮點(運算)還是整型(運算)。英偉達在它的一些方案,包括DGX SuperPOD都是采用IBM的SSS產品作為存儲的存力。

    IBM現在所發布的SSS產品也拿到了英偉達的官方認證,支持DGX SuperPOD的GPU直連,而且有完整的測試,從兩個節點,到4~8個節點,我們推薦不同類型的產品組合。IBM單模塊能夠去支持125 GB/s的帶寬傳輸能力,這是現在業內最快的。同時我們能夠實現上百、上千個模塊的水平線性擴展,所以這個方案能滿足英偉達GPU對數據存儲的需要。

    回到剛才我談三個能力,有一個是高性能,包括剛才我談到支持GPU直連,包括最快速的單模塊125 GB/s傳輸能力。另外一個能力是線性擴展,IBM現在的一個主要解決方案是IBM Storage Scale存儲軟件,以前叫GPFS,這個軟件是分布式文件系統,客戶比較多,它的特點在于:第一,它是全域命名管理,能夠支持不同存儲協議的數據能夠交互,包括像云原生S3、NFS等,它有特殊的本地緩存的算法,能夠在你訪問遠程之前提前去預測這個數據是不是在遠程,能夠先拿到數據。通過這種方式,即使水平擴展上百個節點、上千個,它能夠通過預測提高性能,盡可能少衰減,這也是它非常大的優勢,也是國內包括國外很多分布式存儲用它作為核心數據底座的原因。

第三,很多客戶用人工智能進行訓練之后,特別是進行推理和使用,數據會越增長越快。這些增長的數據,要考慮歸檔和備份的問題。IBM較其他存儲的廠家,我們有比較深的、完整的一個存儲產品解決方案,我們通過IBM SSS 3500產品作為一級存儲,去跟英偉達的DGX 服務器配合使用。

同時,當數據變得越來越多,很多數據使用頻度降低時,數據開始從熱數據變成溫數據和冷數據,我們就開始考慮后面的歸檔,包括備份方案,這里包括文件歸檔、目標存儲的歸檔,還有系統通過自帶歸檔,我們有一整套的方案去滿足客戶對人工智能存力的要求。

宋家雨:在未來IBM存儲的規劃之中,生成式AI部分會更加依賴于Watson嗎?

 侯淼:我覺得您說了一個很好的題目,Watson這個名稱來自IBM的創始人老沃森,后來也成為了IBM研發實驗室的名稱——IBM Watson實驗室。今天,Watson已經成為IBM人工智能的統一品牌。

現在我們提出叫watsonx,之所以是X的話,是希望我們有各種不同的場景,不同的方案,能解決客戶更多的問題。圍繞watsonx它的三個組成部分,第一個是支持生成式AI的開發平臺,叫watsonx.ai,第二個是watsonx.data,把數據湖和數據倉庫,湖倉一體來結合。第三個是watsonx.governance,跟整個監管包括合規相關的。

跟存儲有比較大關系的是watsonx.data,這里牽扯到不單單是要解決人工智能對存儲的要求,而且也要解決數據的管理,數據的訪問,整套解決方案。圍繞這塊,用到了不單單是人工智能存儲,也會用到云,用到數據備份、數據保護。IBM watsonx希望針對企業級的人工智能應用提供端到端的技術支持和行業專長。

現在市面上有一些工具可能只是工具,用在企業的話,會有很多問題。包括這些工具的使用,數據的產生,數據的保護,包括維護以及監管的要求。

IBM的理念是,我們提供watsonx產品家族是滿足端到端的需要,特別是企業客戶,當你不具備那么強AI的研發能力,通過IBM產品組合,能夠從生成式的AI模型,到最后滿足監管的要求以及數據被保護等各個方面,這是我們提出watsonx整個的想法。

   watsonx是7月初剛剛開始上市的產品,國內現在在推廣階段,現在有一些國外的案例,主要是客戶通過生成式AI模型解決行業一些問題。比如:制造業生產線中缺陷的判別,醫療影像的識別,呼叫中心對客戶訴求的自動化應對和回復。我們現在看到針對這類行業應用,所有模型都有它的行業特點,發生很多交互關系,往往要跟客戶業務緊密結合,去產生一個合理、可落地的一個模型。

    關于數據,我們發現,不單單是企業對AI的使用要求,這些客戶本身的海量數據,比如,一個銀行的呼叫中心可能也有銀行帳戶的信息,包括信用的信息,而這些信息往往存在數據庫里,所以IBM watsonx.data面對的數據對象不單單是非結構化的,還有一些結構化的,對數據的保護要求也不一樣,可能你跟客戶的通話本身是敏感的,要保護。但是跟客戶銀行帳戶的信息相比,可能這里要求的保護級別更高。怎么樣把這些結合在一起,就變得非常重要了。

我們現在看到watsonx.data對存儲的要求,會比單一的系統來得要復雜,因為除了牽扯到模型所產生的,跟GPU配合所需要的存儲結構以外,還需要后臺其他的存儲連接,包括跟它的數據庫存儲,包括怎么樣整體上為客戶去做備份,做數據保護,所以我們針對人工智能AI的核心軟件Storage Scale,后臺既可以接閃存,也可以接對象存儲,也可以接磁帶,這樣跟客戶整個系統相結合,不單單是提供AI存儲的本身,而且提供湖倉一體的存儲架構。

宋家雨:最后一個問題想問一下侯總,除了目前我們講的混合云、AI存儲之外,安全也是一個特別需要關注的話題。IBM Storage也有一個產品叫Defender,這樣一個產品是不是能夠抵御勒索病毒攻擊呢?

侯淼:IBM有一類產品,我們叫它數據彈性存儲,這里核心軟件就是IBM Storage Defender。實際上是兩個層面的事情,一個叫做數據安全,一個叫數據保護,這兩個是不一樣的。

數據安全很大程度上是主動的,它要去防止被黑客所襲擊,怎么樣能夠進行主動探測,它是一個主動行為。數據保護相對來說是被動行為,怎樣能夠在同時情況下保護我的數據,能夠盡可能減少損失。IBM是把這兩塊結合在一起了,就是Defender所要解決的問題。

未經允許不得轉載:存儲在線-存儲專業媒體 » 相信“藍色巨人”,IBM存儲永遠在線
分享到

songjy

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走