(圖片源于網絡)

ChatGPT的火爆,以及東數西算、數字化轉型等應用的強勁增長,使得全球算力呈現供應緊張的現象;坊間傳聞,英偉達(NVIDIA)的AI芯片供貨已經排隊到明年二季度,有人甚至把當下人工智能熱度降溫,歸結于算力的供不應求。

算力就是生產力,數字基礎設施的重要性也不言而喻。

那么,算力需求和缺口該如何填補?

其實,AI芯片主要分為圖形處理器(GPU)、現場可編程門陣列(FPGA)、專用集成電路(ASIC)、中央處理器(CPU)等類腦芯片四大類。面對強勁的算力需求,AI芯片作為算力的硬件基石,更需要多種AI芯片各司其職,共同協作。

今年6月份舉辦的“數據中心與AI技術首映”上,AMD在第四代EPYC(霄龍) CPU產品組合中增加兩款新的工作負載優化處理器——Bergamo和Genoa-X,以及適用于生成式AI的下一代 AMD Instinct 產品。這無疑將大大緩解算力緊缺的局面,同時也會顯著降低客戶的投資成本和最終用戶的使用成本。

AMD董事會主席及CEO蘇姿豐(Lisa Su)博士舉起的不僅僅是EPYC,也托起了人們對人工智能與計算領域新的希冀。

為什么這么說呢?兩年前,AMD曾宣布在2025年實現EPYC 處理器和AMD Instinct加速器能效提高30倍的目標,這些產品也將為運行在加速計算節點上的AI訓練和高性能計算應用提供算力支持。

這不是空話,很多事例已經證明了這一點。例如,唯一投入實用的百億億次超算——“Frontier”,就使用了AMD的第三代EPYC 處理器及Instinct MI250X加速卡這對好拍檔。EPYC、Instinct強強聯手的同時,它們也是開放的,可以搭檔友商的硬件來使用。

Frontier超級計算機(圖片源于網絡)

此外,峰值性能有望超過200億億次的超算預計將于明年在美國勞倫斯利弗莫爾國家實驗室亮相。這款名稱“EI Capitan”的超級計算機配備AMD第四代EPYC處理器(Genoa)和最新Instinct MI300A加速器。

2022年11月AMD推出了基于chiplet打造的EPYC第四代處理器Genoa,其以最快的運行速度、出色的每插槽性能和每核心性能、超強的安全性、豐富的解決方案生態系統,為不同的工作負載提供領先的能源效率和最佳的TCO。

2P SPECrate_2017_int_base、2P Enterprise Server-Side Java、2P VMmark 3.1.1、2P SAP Sales 8 Distribution等平臺提供的測試數據顯示AMD EPYC 9654對比英特爾最優至強8490H處理器的優勢。

“以更少的投資,獲取更多的價值?!盇MD EPYC的這種領先優勢一直延續至今。

如今,第四代EPYC處理器還擁有了新的系列,分別是“Genoa-X”和“Bergamo”,還有即將發布的“Siena”。

加載了AMD 3D V-Cache技術的“Genoa-X”,其采用的是5nm制程工藝的第四代Zen 4架構,比上一代Zen3架構能效高出62%,同等功耗下性能提升49%。通過3D V-Cache技術在每個CCD上額外堆疊64MB緩存,緩存總量高達1254MB,再輔以AMD Infinity、Guard安全性與更加豐富的解決方案生態,其性能大大提升,有效支持電子設計自動化相關的計算(EDA)、計算流體動力學(CFD)、有限元分析(FEA)和結構分析(SA)。

運行在Ansys基準測試上,AMD 96核的EPYC 9684X比英特爾60核Xeon Platinum 8490H的計算性能優勢超出1-2倍。

采用AMD 3D V-Cache的第四代AMD EPYC處理器Genoa-X 在Ansys CFX中每天可完成更多的設計任務,從而大幅加速產品開發;而運行ANSYS Fluent的性能最高達到了英特爾60核的Xeon Platinum 8490H處理器的2.9倍 有效模擬和優化產品外部空氣動力學特征,促進客戶改進產品外觀、提高工作效率、節省能源消耗;在OpenFOAM的測試中最高也達到英特爾Xeon Platinum 8490H的2.2倍,這意味著技術計算工作負載可在更少計算節點上獲得高性能表現,讓用戶可用更少的機器來獲得更好的負載性能表現。

EPYC 97X4(Bergamo)系列處理器采用了Zen4c架構,它是AMD專門為云計算場景打造的一款CPU核心,與Zen4架構保持了相同的IPC性能和ISA指令集,通過在設計上的多項優化,使得核心面積大幅縮小,功耗效率大幅提升。Zen4c EPYC處理器搭載128個核心256個線程,超過了Zen4的96個核心192個線程。Bergaomo提供了可擴展性、靈活性、抗壓性、速度、可視化,支持建模、簡化部署和管理,是支持云原生開發與應用的得力武器。

Bergamo有三個版本:9754、9754S、9734,核心從112到128個,三級緩存均為256MB。其中EPYC 9754的同步多線程技術(SMT)可以配置——開啟后可降低總體擁有成本。

AMD EPYC 9754 平均吞吐量性能提升2.9倍。比Ampere Altra Max 128C高出3.7倍,比英特爾Xeon Platinum8490H系列最少也高出了50%。

經過NGINX、Redis、Cassandra-test、Memcached、FFmpeg、MySQL TPROC-C、Server-side Java Max等平臺運行測試,EPYC 9754的平均吞吐量、性能均數倍于友商。

要實現每秒處理3.75億的實時需求,與128核的2P Ampere Altra相比,同核數的2P AMD EPYC 9754S可以節省55%的服務器數,年度節省39%的耗電量、39%的運營成本,最終減少19%的總體擁有成本。

最近,中國電子技術標準化研究院審查和公告后的2023年首輪CPUBench公開測試活動報告顯示,搭載AMD EPYC 9754處理器的新華三UniServer R5500 G6Typical分數拿到了572.8的最好成績。英特爾平臺最好成績排第四,基于Xeon Platinum 8490H處理器的新華三R6900G6成績為449.1,比AMD最好成績落后27.5%。

從第三代EPYC處理器開始,AMD的處理器產品線呈現出了多元化態勢,第四代EPYC處理器更是根據市場做了細分,除了保持傳統優勢的通用型產品,還針對云原生應用、計算技術以及面向電信與邊緣端演繹拓展,產品家族越來越豐富的同時,為客戶需求提供更加精準的解決方案和服務,也為目前的算力困境提出了多種不同的產品組合,助力算力突圍。

產品只是AMD面向從云端到邊緣再到端點的全面應用支持的舉措之一。AMD還在架構方面和生態系統合作伙伴攜手打造經驗證的開放式解決方案,應對全球算力面臨的嚴峻挑戰。

基于EPYC 9754、9684X與EPYC 9654在密度、能效、頻率等特性方面對比

AMD不僅開發了大量軟件及開源平臺,同時也與合作伙伴緊密牽手,以適配更多的應用,支持更多的業務需求。

在鞏固拓展EPYC處理器應用范圍的同時,AMD的生態圈在不斷擴大,目前已經擁有AWS、Oracle、ASUS、聯想、戴爾、HPE、Supermicro、思科、谷歌云、微軟Azure、騰訊云等大量的生態伙伴。

前不久,一家市場份額居國內前茅的服務器供應商,在其產品戰略發布會期間向筆者透露,該公司生產的服務器中,采用EPYC處理器的數量占比接近30%。這是一個很了不起出的數字——兩年前,這家公司的CEO親口告訴筆者,公司只選擇另外一家供應商的處理器。

看得出來,AMD EPYC已經成為當前市場上性能最為強勁的處理器,其以憑借先進的制程工藝、架構技術以及更多的核心、更高的頻率,在整體綜合性、多核整數性能、多核浮點性能都穩居前列;面向AI與未來計算領域,EPYC處理器用配置與測試結果說話, 方方面面“吊打”英特爾,也在AI算力競賽中取得了先機。伴隨AMD在技術、服務和生態等方面的不斷突破,筆者相信,AMD EPYC處理器將在未來眾多領域、尤其是AI算力領域,將扮演更為重要的角色。

AMD的成功之道,在于“創新”二字。要敢于創新,勇于創新。但創新并非易事,AMDEPYC的故事向我們展示:企業的成功并沒有捷徑,踏踏實實做產品才是王道。

未經允許不得轉載:存儲在線-存儲專業媒體 » 穩扎穩打、循序漸進!AMD EPYC 托起AI與計算領域新的希冀
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走