螞蟻數字科技事業部云原生產品總監馬振雄

螞蟻數字科技事業部云原生產品總監馬振雄對當前數據智能時代企業面臨的三大趨勢以及螞蟻的對策進行了分析和解讀。

AI時代的三大趨勢與螞蟻的對策

趨勢之一:全面上云與多云多芯帶來的復雜管控

從天然云原生的互聯網,到傳統行業開始轉變觀念逐漸上云,如今,傳統行業進入全面上云階段,除了外圍系統上云,最重要的核心系統也在陸續上云。

在技術上,大量復雜的異構系統,包括資源的異構、應用架構的異構、云形態的異構,成為平滑統一上云的障礙。大型企業會采取多云戰略,把雞蛋分散在不同的籃子里,同時,隨著國產化信創改造過程的深入,業務應用也會面臨多芯的選擇。因此,多云多芯也成為企業IT發展的重要選擇。

在資金方面,從傳統應用架構走向云原生的應用架構,還要面對原有投資的巨大浪費與新增大量的改造成本需求。

這些挑戰嚴重阻礙上云進程。

在自身實踐經驗的基礎上,螞蟻定義了下一代的統一資源調度架構——打通虛擬化和容器層的資源池,將原有上下疊加的關系改變為共池關系,用統一的引擎去調度,通過屏蔽復雜異構的資源管理,同時讓應用能夠在統一的操作系統之上納管,使得性能得到更大提升,同時降低了碎片化,資源利用率更高。

同時,螞蟻也嘗試定義了一個新的應用的上云路徑,利用Service Mesh的能力,幫助企業在應用不改造的情況下,快速獲得云原生最佳姿勢的架構。

趨勢之二:AIGC大模型的火爆與算力緊缺

用AI的方式進一步提高企業在運營、運維、生產等各個業務環節的效能,尤其是用大規模AIGC結合上云提質提效,成為更多企業的選擇。

然而,大模型的應用也意味著對算力的需求。有調研數據顯示,AI的應用對于GPU算力的需求每三個半月翻番。盡管每個企業都會配備一些GPU卡,但其利用率通常不足30%,尤其是國外芯片限制對我國出口的情況下,充分發掘GPU資源的潛力非常重要。

螞蟻的對策就是探索進一步地把GPU資源進行池化,最大化利用GPU資源,同時針對在線應用、3D渲染類的應用進行CPU和GPU的混合調度,深度支持更復雜、更異構的業務的負載類型。

趨勢之三:降本的同時實現減排

后疫情時代,實體經濟發展有所下滑,但雙碳目標和壓力也越來越緊迫,企業普遍采取人員、資源以及成本結構等優化措施推進降本增效,在生產過程中關注原材料的選擇、能源的消耗以及產成品的回收利用等相關因素。

事實上,IT部門數據中心是一個主要的能耗存在。

螞蟻從科技布局的角度定義了自己的根技術,針對不用的應用環境采取相應的對策。

在線應用和離線應用有明顯的錯峰特征,白天主要面向在線類計算應用,晚上側重離線類大數據的應用。對此,螞蟻攻堅在離線混部技術,著手整合資源、提高部署密度,均衡有效地布局計算型與數據類應用的算力需求。

即使是在線應用,也存在錯峰情況。如早上起床后要搶螞蟻森林的能量,午餐支付用支付寶,下午股票收盤需要對基金行情查看和贖回,都會形成一陣新的高峰。螞蟻采取云原生分時調度技術,進行錯峰的資源削峰填谷。

由于市場需求難精準預測,特別是遇有雙11或618大促來不及擴容,很容易導致故障的發生。螞蟻利用AI對容量風險識別和智能彈性擴縮,資源利用率從9%提升了到近40%,每年節省超500萬度電,減少了1600多噸碳排放。

在離線混部技術、云原生分時調度、AI彈性容量這三個法寶,組成了螞蟻綠色計算的技術核心,讓SOFAStack變得更綠色。

持續深化人工智能技術的應用

除了應對上述三大趨勢,螞蟻還將人工智、大模型能深入應用到研發領域。

為了支持應用在上云之后能夠更平滑、穩定的運行,螞蟻正在借助AI技術推進云原生的應用實現“自動駕駛”。通過引入人工智能技術識別、對比基線,去禁入和限流,引導流量的壓力水位快速、自動下降到健康的區間。一旦流量異常情況危險警報得到解除,限流智能模塊將自動退出。整個過程對于運維人員和終端用戶是無感的。

馬振雄認為,大模型可以產生重復性、相似度比較高的代碼,顯著提升研發效能,并帶來顛覆性的重構機會。為此,螞蟻自研了340億參數的代碼大模型,支持Java、Python、C++等40多個主流的編程語言。對于開發人員,通過大模型支持一鍵生成代碼,自動介入、干預,推薦、補全背后的業務邏輯的增刪改查的重復度比較高的代碼并一鍵生成注釋,還能夠對代碼進行深度分析,提出優化建議,提高代碼質量;對于架構人員,通過自然語言的描述和交互生成業務領域與應用架構的建模,一鍵生成所需代碼模塊的初始代碼;對于測試人員,在設計階段可通過自然語言的描述快速生成測試的需求和案例,在開發階段生成單元測試案例和接口的測試案例,同時捕捉整個生產環境的流量進行完整的業務建模的還原;對于運維人員,從發現故障到定位原因,再到恢復故障提供智能監控、智能異常告警和智能的根因定位以及智能的自愈等能力,實現技術風險防控(SRE)全面的智能化升級。

SOFAStack5.0的內涵、成果與責任

通過完整的智能的大模型和AIGC的能力的升級,SOFAStack變得更智能;通過統一的下一代的資源調度的架構和Service Mesh,可幫助應用更好平滑的上云路徑;通過定義一個讓SOFA變得更多云的形態,增強計算環境、軟件供應安全和整個應用層面不同維度的安全能力,讓SOFAStack變得更可信,最終實現智能、綠色、可信和多云。

這4個關鍵詞組成SOFAStack5.0的內涵。

對SOFAStack缺乏了解的人,可以這么理解:如果企業是一臺計算機,那么SOFAStack就是這計算機上大規模、高性能、智能化應用的操作系統。它以性能、成本、效能、高可用、安全、可信的能力支撐起企業信息系統高效、安全地運轉。

2007年,在互聯網金融驅動業務增長的時代,螞蟻開始布局分布式云原生領域,并將長期積累的成果形成SOFAStack。它定位于一個統一的、跨云的PaaS平臺。這個跨云的PaaS平臺向下屏蔽異構IaaS,兼容物理機、虛擬機、OpenStack云、各種云以及國產主機、信創等不同類型的基礎資源,客戶無需關注底層資源,即可實現統一的納管支撐以及統一的調度;向上支持異構應用,無論是單體式應用還是分布式架構,無論采用何種開發語言編寫、用何種開發框架來進行組裝、用何種協議來進行通信,都可以在這個統一的PaaS上進行統一的管理和治理。

SOFAStack以一整套的技術產品成為當前布局最廣泛、最成熟和完善的技術平臺。

從業務的梳理、設計、建模到應用的架構設計、開發、測試、發布、運行、監控和運維以及容災過程,SOFAStack實現了完整的生命周期覆蓋,幫助企業構建更加綠色、智能的能力,提升上層業務的穩定性以及可能性。

這些能力也抽象出來了一套金融級云原生方法論。

螞蟻集團數字科技事業群云原生科技部總經理王磊

螞蟻集團數字科技事業群云原生科技部總經理王磊回顧了SOFAStack從誕生開始就不斷在金融支付交易等領域深入合作、探索,把技術能力賦能整個行業,支持關鍵領域和系統的全面上云、自主可控,降低成本,在金融行業從信息化、數字化到如今智能化的三次躍遷過程中展示自己的能力和價值。

時至今日,SOFAStack在金融行業市場占有率位居第一,客戶覆蓋了銀行、保險、證券、基金100多家重點領域,包括工農中建交等國有大行,8家股份制銀行中以及大量的城市商業銀行、農村信用社;其中典型案有交通銀行核心大機的x86遷移,富滇銀行的國產化替代,以及四川農信全面的數字化轉型,它們都是基于SOFAStack以及相關云基礎設施構建起一整套數字化的基礎平臺。

目前,SOFAStack也已經在能源、電力、交通、政務、運營商以及公共科技等關鍵的國家重點行業、重點領域發揮著重要的作用。

 “在過去的18年,螞蟻集團通過對上層顯著復雜性和多樣化的各樣業務不斷地進行技術鉆研和攻關,打造出了SOFAStack這個云原生分布式的技術平臺,成為面向未來最核心的根技術能力之一?!蓖趵谄诖齋OFAStack進一步能夠走向全行業,賦能更多的企業,完成云原生的升級和數字化的改造。

SOFAStack不僅僅簡單是一個金融行業的基礎設施,在未來也是整個中國機構數字化的關鍵核心力量。



未經允許不得轉載:存儲在線-存儲專業媒體 » 螞蟻發布SOFAStack5.0,四大能力支持企業在AI為先的時代建好云、用好云
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走