AMD執行副總裁及首席技術官 Mark Papermaster

來自Geekbench 5.4的基準測試數據顯示,Zen 5架構指令分派率實現翻番至每周期8條指令,為算術邏輯單元(ALUs)引入統一調度程序以提高效率,執行窗口至 40%,數據緩存增加50%以保持低延遲。

這些變化旨在更好地處理更大的指令集,并增強數據通過處理器的移動,特別是支持更大的矢量數據路徑和改進負載存儲操作,同時提高整體系統效率。當然,它們也都是眾所周知的微架構設計中最重要的元素。

Zen 5架構三大特點

Mark Papermaster總結出Zen 5架構的三大特點:一是采用更快、更小和更低功耗的晶體管,優化、節能和高性能,二是采用4nm甚至3nm領先制程技術,增強型金屬堆,并繼續深化與臺積電合作;三是模塊化設計,可應用到桌面、服務器、客戶端和嵌入式。

具體到產品層面,新一代的Zen 5架構包括Zen 5、Zen 5 V-Cache和Zen 5c三種設計,涵蓋銳龍9000 系列臺式機處理器、帶有銳龍AI NPU功能的AMD 第三代移動平臺第三代以及面向服務器平臺的第五代EPYC(代號“Turin”),均提供4nm和3nm版本。

Zen 5架構亮點令人矚目

一、革新異構計算。

Mark Papermaster介紹說,Zen 5架構創建了具有單個ISA實現的異構CPU集群的新穎方法,此舉允許在不同的核心類型之間進行無縫的軟件優化,代表著硬件和軟件創新相結合以實現最佳性能的重大進步。作為佐證,AMD與微軟強大而密切的合作證實了其高效的軟件調度能力,有效規避了在異構實現時可能遇到的許多陷阱。

二、AI、游戲和內容創作方面的重大改進。

IPC平均提升16%

IPC(Instructions Per Clock,每時鐘周期指令數)提升是衡量處理器性能進步的一個重要標志。數據顯示,Zen 5架構在各種工作負載上的IPC平均提升了16%,其中機器學習任務的單核代際提升高達32%,AES加密基準測試提高了35%。這些進步也展示了AVX-512和向量單元的強大功能。

三、深度協同優化 IP設計,實現高性能和高效率。

與代工廠和各類合作伙伴的合作凸顯在持續優化金屬堆棧以提高性能并降低電阻和電容,與鑄造廠進行的深度設計技術協同優化,與合作伙伴改善電子設計自動化,在完整的內核家族中使用一致的電路庫,并且還專注于模塊化配置方面更多的靈活性等方面。在Zen 5架構上,這些合作再一次得到驗證。因此,即將亮相的Epic處理器中,這些優化點將展現的淋漓盡致。

基于Zen 5架構的若干骨干產品

首先來聊聊第五代 EPYC 處理器——“Turlin”,亮點是高性能和增強的安全功能。被譽為“史詩級”的“Turlin”Zen 5c頂配版提供192核心與384線程、384MB L3緩存,最高TDP達到了500W,而基于Zen 5架構型號最多配備128核心與256線程,L3緩存為512MB,二者均提供4nm和3nm制程版本。

根據早些時候的信息,“Turin”至少提供20款采用Zen 5架構內核和Zen 5c架構內核的產品,均采用SP5插座。

安全是AMD始終關注的話題?!癟urlin”繼續擴展了AMD在機密計算、Trusted IO(可信I/O)、數據安全、內存加密、安全啟動和運行時保護等諸多領域的領導地位。

事實上,這些技術在第四代EPYC處理器中得到應用。但Mark Papermaster特別強調,可信IO可將數據保護從加密的CPU執行擴展到存儲和加速器是一個非常關鍵的補充,尤其在AI時它變得更加重要,原因在于人們不僅擁有大量常規的數據,而且還有比以往更需要保護的模型權重和訓練模型。

第五代EPYC處理器將于今年下半年亮相。畢竟不是“Turlin”的發布會,所以Mark Papermaster沒有透露更多的信息。

從第四代EPYC處理器開始,AMD發布聚焦電信及物聯網行業的9004系列Siena處理器,第五代以及未來EPYC是否會推出更多面向細分行業的處理器?針對筆者的好奇,被譽為“Zen架構之父”的Mark Clark以“快了”兩個字回應。

接下來是下一代Strix Point。Strix Point采用臺積電4nm工藝制造,TDP為45W,CPU部分包括了4個Zen 5架構的大核心及8個Zen 5c架構的小核心。

據介紹,Strix Point具有異構設計的智能調度能力,作為緊急工作負載設計的新性能基礎,具備兩個獨特的核心集群,一個針對峰值性能進行優化,另一個針對吞吐量進行優化,以此增強響應性和效率的增強靈敏度。當然,二者都是相同的ISA實現。因此程序員再也無需考慮不同的核心集群,從優化后的軟件角度,無論做什么工作都變得更加簡單。

關于代號為“Granite Ridge”的銳龍9000系列臺式機處理器,Mark Papermaster的此次演講中并未提及,筆者以后再做介紹。

Zen架構家族處理器系列中的最新成員、核顯架構RDNA 3.5。顯然,該架構并非首次推出。憑借頂級性能、全新統一計算單元、更快的芯片互連、高速緩存技術和全新顯示及媒體引擎等特性共同作用,結合噪音抑制功能、Smart Access Memory技術、FreeSync Premium Pro等技術的應用,不僅在游戲領域,在專業圖形處理和人工智能等領域也展現了AMD技術的領先地位。

移動端集顯和桌面端集顯的應用瓶頸分別是功耗和內存帶寬等。AMD與三星等移動合作伙伴深度合作,通過以下三大舉措來化解RDNA 3.5的能效瓶頸:一是優化每瓦特性能,無論是最常見的紋理采樣操作子集對比普通游戲紋理操作,還是多數用于插值和豐富矢量ISA對比常見著色器中的操作,都實現了兩倍速率的提升;二是優化每位性能,針對LP DDR 5內存進行改進,使得訪問內存的頻次更低但效率更高;三是專為更好的電池壽命設計,采取先進的GPU電源管理,最終實現RDNA 3.5在3D基準測試值(Timespy)提高了32%,DirectX基準測試(Night Raid)提高了19%,同時顯著降低了能耗。

嘆為觀止:第七代Zen技術已經在路上

展示Zen架構路線圖是備受AMD高管熱衷的操作,Mark Papermaster也不落“俗套”。他聲稱現在甚至已經具備第七代Zen技術。即將亮相的Zen 6將會采取什么制程?你也許可以猜得到。

上述所有成功的原因被Mark Papermaster歸結于AMD與臺積電(TSMC)以及眾多技術合作伙伴關系的強大合作的基礎。

歷次發布會上,AMD都會把友商的解決方案拿出來進行對比,但是這一次他們幾乎沒有這樣做。筆者畫蛇添足,做出如下不成熟的判斷:在創新微架構、大幅提升的IPC、能效優化、安全性特性、制造工藝、核心數量和多線程、內存和I/O支持、成本效益等方面,基于AMD Zen架構推出的新產品已經具備領先優勢,但不斷擴大的生態系統和軟件優化還需努力。

回顧7年前,當AMD推出Zen系列處理器時,吸引了業界許多人,他們與AMD一起同行至今。

“畢竟,這不僅僅是一個單一的產品,而是一個處理器家族?!盡ark Papermaster表示,Zen 5架構帶來的改進不會讓市場失望,它代表著一次巨大的飛躍,也勢必成為未來幾代人的一個基座;AMD也將始終如一地按照既定目標向前進,為x86處理器帶來更多性能。

未經允許不得轉載:存儲在線-存儲專業媒體 » Zen 5架構的知微見著:從CPU微架構到包羅萬象的人工智能
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走