AMD技術專家Silicon設計工程師Mike Clark

但差距無疑也是存在的,而且很大。

基于Zen 4c架構的EPYC 9754、9684X與基于Zen 4架構的EPYC 9654(代號Genoa)特性對比

如每CCD上核心數量從Zen 4架構的8個提升到了Zen 4c架構的16個(相當于每socket上的核心數量增加了33%),原因在于優化后的Zen 4 L3級Cache從4MB降低至2MB,使得每核面積從3.84平方毫米降低至2.48平方毫米,這種優化后的核心布局,最終導致單個EPYC處理器新品Bergamo實現了最高128個Zen 4c核,進而能夠支持更多的吞吐量,滿足高負載應用場景下對性能的需求。

另外,Zen 4核心最高主頻為6GHz,但因為Zen 4c作為云上數據中心應用,無需如此之高的主頻,所以AMD在Zen 4c上適度進行了降頻,達成較好的能效。

基于Zen 4c架構的 EPYC 97X4與EPYC 9004X系列

聊完Zen 4與Zen 4c的差別,再來看看同樣基于Zen 4c架構的處理器有哪些異同。

實際上,二者在內存、SP5平臺、集成IO-無芯片組以及安全方面的性能幾乎如出一轍,如都是12通道DDR5內存, ECC頻率同樣高達4800MHz,可選2/4/6/8/10/12通道存儲器交互,3DS RDIMM,一個2插槽系統可擴充至高達12TB (256GB 3DS RDIMM) 2個DIMM /通道容量;全新的Socket插槽提升了電力輸送和支持VR,都采用多達4條速度高達32Gbps的第三代AMD Infinity Fabric鏈路,多個服務器控制器集線器(USB、UART、SPI、I2C等);最多160條 I/O通道(2P)的第五代PCle接口,傳輸速度高達32Gbps,以及可以利用CXL協議擴展的內存尋址功能;增強的專用安全子系統、安全的引導與基于硬件的信任根,采用SME與SEV-ES以及SEV-SNP、AES-256-XTS以及更多加密的虛擬機技術。

“二者的不同之處,在計算方面表現尤為明顯?!盇MD服務器SOC Silicon設計工程師Kevin Lepak說。

盡管雙方在最多核心(達128個核心)、最高功耗(400W)、die-to-die帶寬等方面表現一致,但采用Zen4c架構的EPYC 97X4系列(最多8個CCD、256線程) 、每核提供1MB L2緩存、每個CCD提供2個 16MB L3緩存;而EPYC 9004X最多12個CCD / 6個內核/ 192線程、每核1MB L2緩存、每CCD 96MB L3級緩存,L3緩存提升至原先的3倍,總計可達1152MB。

L3緩存的顯著提升,進一步降低了內存延遲,同時也提升了大數據量計算時處理器的性能。這成為EPYC 9004系列的一大顯著特征。

AMD服務器SOC Silicon設計工程師Kevin Lepak強調,AMD作為芯片架構的領導者,推出了超越摩爾定律的模塊化、可配置設計,以領先的工藝節點、先進的包裝3D堆疊技術(3D V-Cache)來加速性能提升,降低電力和成本效率。

“事實上,我們不希望輕易改變I/O架構,不論是在SoC還是在I/O Die的大小,這樣OEM伙伴或者合作伙伴能基于我們的產品進行設計與部署?!盞evin Lepak說。

AMD 3D V-Cache技術:超越摩爾定律

當工藝演進到5nm甚至3nm節點,提升晶體管密度越來越難,由于集成度過高,功耗密度越來越大,供電和散熱也面臨著巨大的挑戰。

AMD高級副總裁、產品技術架構師Sam Naffziger研究員表示,通過改善封裝技術,可在同樣面積上匯集更多相同或者不同的工藝節點制造的小芯片(Chiplet),從而降低成本的同時獲得更高的集成度。

這一技術就是AMD津津樂道的3D堆疊(3D V-Cache)技術,堪稱后摩爾時代重要技術手段之一。

封裝的演進

回顧封裝的演進過程,從開始的2D多模塊銅封裝(MCM)、2.5D光封裝(Si INT,EFB)到如今先進的3D Chiplets,對應的分別是DDR內存、HBM以及On-die緩存;3D堆棧封裝這種設計技術,通過Cache容量的延展,達到了能效的巔峰。

想要在2D芯片上達到3D緩存的性能,基本上是不可實現的:除了其Die非常大,時延會非常長,功耗也非常之高。

3D V-Cache技術優勢

3D V-Cache技術比2D芯片封裝內部互聯密度大200倍,比微微凸起的3D內部互聯的密度要大15倍,跟小凸起的3D內部互聯的密度大3倍。這種架構,使得在處理EDA工作負載處理方面,Genoa-X比Genoa提升70%。

為什么在3D堆棧上能夠達到這么好的效能?一方面,它就正好在CCD之上,而且元器件之間的距離并不遠,加上優化后的緩存容量提升到了3倍,功耗也大大降低。

EPYC 9004X系列計算性能的提升,正是得益于3D V-Cache技術的應用,但3D V-Cache技術的價值遠不止于此。

展示無處不在的AI愿景

“基于AMD 3D V-Cache技術推出的顛覆性APU(Accelerated Processing Unit)架構,緊密集成領先的5nm GPU和CPU計算,完全共享內存,前所未有的計算密度?!盡ike Clark表示,這就是AMD的Instinct MI300系列加速器,它事實上就是GPU Die,是非常獨特的獨有的3D緩存的Die。

MI300作為異構計算的混合芯片,融合了CPU和GPU的核心,功耗非常低??梢钥闯葾MD把EPYC這個服務器處理器集成到一個GPU里面,共享內存,從而實現非常好的每瓦性能。

MI300分為MI300A和MI300X兩款。全球首款用于高性能計算和人工智能工作負載的APU加速器MI300A現已向客戶提供樣品,MI300X將于第三季度開始向主要客戶提供樣品。

AMD AI平臺戰略的發布,為客戶提供從云到邊緣再到終端的硬件產品組合。通過深入的行業軟件協作,開發可擴展且普適的 AI 解決方案。人工智能領域的競爭,序幕才剛剛拉開。

未經允許不得轉載:存儲在線-存儲專業媒體 » 深究AMD第四代EPYC處理器背后的那些技術細節
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走