深究AMD第四代EPYC處理器背后的那些技術細節-存儲在線-存儲專業媒體

AMD技術專家Silicon設計工程師Mike Clark

但差距無疑也是存在的，而且很大。

基于Zen 4c架構的EPYC 9754、9684X與基于Zen 4架構的EPYC 9654（代號Genoa）特性對比

如每CCD上核心數量從Zen 4架構的8個提升到了Zen 4c架構的16個（相當于每socket上的核心數量增加了33%），原因在于優化后的Zen 4 L3級Cache從4MB降低至2MB，使得每核面積從3.84平方毫米降低至2.48平方毫米，這種優化后的核心布局，最終導致單個EPYC處理器新品Bergamo實現了最高128個Zen 4c核，進而能夠支持更多的吞吐量，滿足高負載應用場景下對性能的需求。

另外，Zen 4核心最高主頻為6GHz，但因為Zen 4c作為云上數據中心應用，無需如此之高的主頻，所以AMD在Zen 4c上適度進行了降頻，達成較好的能效。

基于Zen 4c架構的 EPYC 97X4與EPYC 9004X系列

聊完Zen 4與Zen 4c的差別，再來看看同樣基于Zen 4c架構的處理器有哪些異同。

實際上，二者在內存、SP5平臺、集成IO-無芯片組以及安全方面的性能幾乎如出一轍，如都是12通道DDR5內存, ECC頻率同樣高達4800MHz，可選2/4/6/8/10/12通道存儲器交互，3DS RDIMM，一個2插槽系統可擴充至高達12TB (256GB 3DS RDIMM) 2個DIMM /通道容量；全新的Socket插槽提升了電力輸送和支持VR，都采用多達4條速度高達32Gbps的第三代AMD Infinity Fabric鏈路，多個服務器控制器集線器(USB、UART、SPI、I2C等)；最多160條 I/O通道(2P)的第五代PCle接口，傳輸速度高達32Gbps，以及可以利用CXL協議擴展的內存尋址功能；增強的專用安全子系統、安全的引導與基于硬件的信任根，采用SME與SEV-ES以及SEV-SNP、AES-256-XTS以及更多加密的虛擬機技術。

“二者的不同之處，在計算方面表現尤為明顯?！盇MD服務器SOC Silicon設計工程師Kevin Lepak說。

盡管雙方在最多核心（達128個核心）、最高功耗（400W）、die-to-die帶寬等方面表現一致，但采用Zen4c架構的EPYC 97X4系列（最多8個CCD、256線程) 、每核提供1MB L2緩存、每個CCD提供2個 16MB L3緩存；而EPYC 9004X最多12個CCD / 6個內核/ 192線程、每核1MB L2緩存、每CCD 96MB L3級緩存，L3緩存提升至原先的3倍，總計可達1152MB。

L3緩存的顯著提升，進一步降低了內存延遲，同時也提升了大數據量計算時處理器的性能。這成為EPYC 9004系列的一大顯著特征。

AMD服務器SOC Silicon設計工程師Kevin Lepak強調，AMD作為芯片架構的領導者，推出了超越摩爾定律的模塊化、可配置設計，以領先的工藝節點、先進的包裝3D堆疊技術（3D V-Cache）來加速性能提升，降低電力和成本效率。

“事實上，我們不希望輕易改變I/O架構，不論是在SoC還是在I/O Die的大小，這樣OEM伙伴或者合作伙伴能基于我們的產品進行設計與部署?！盞evin Lepak說。

AMD 3D V-Cache技術：超越摩爾定律

當工藝演進到5nm甚至3nm節點，提升晶體管密度越來越難，由于集成度過高，功耗密度越來越大，供電和散熱也面臨著巨大的挑戰。

AMD高級副總裁、產品技術架構師Sam Naffziger研究員表示，通過改善封裝技術，可在同樣面積上匯集更多相同或者不同的工藝節點制造的小芯片（Chiplet），從而降低成本的同時獲得更高的集成度。

這一技術就是AMD津津樂道的3D堆疊（3D V-Cache）技術，堪稱后摩爾時代重要技術手段之一。

封裝的演進

回顧封裝的演進過程，從開始的2D多模塊銅封裝（MCM）、2.5D光封裝（Si INT，EFB）到如今先進的3D Chiplets，對應的分別是DDR內存、HBM以及On-die緩存；3D堆棧封裝這種設計技術，通過Cache容量的延展，達到了能效的巔峰。

想要在2D芯片上達到3D緩存的性能，基本上是不可實現的：除了其Die非常大，時延會非常長，功耗也非常之高。

3D V-Cache技術優勢

3D V-Cache技術比2D芯片封裝內部互聯密度大200倍，比微微凸起的3D內部互聯的密度要大15倍，跟小凸起的3D內部互聯的密度大3倍。這種架構，使得在處理EDA工作負載處理方面，Genoa-X比Genoa提升70%。

為什么在3D堆棧上能夠達到這么好的效能？一方面，它就正好在CCD之上，而且元器件之間的距離并不遠，加上優化后的緩存容量提升到了3倍，功耗也大大降低。

EPYC 9004X系列計算性能的提升，正是得益于3D V-Cache技術的應用，但3D V-Cache技術的價值遠不止于此。

展示無處不在的AI愿景

“基于AMD 3D V-Cache技術推出的顛覆性APU（Accelerated Processing Unit）架構，緊密集成領先的5nm GPU和CPU計算，完全共享內存，前所未有的計算密度?！盡ike Clark表示，這就是AMD的Instinct MI300系列加速器，它事實上就是GPU Die，是非常獨特的獨有的3D緩存的Die。

MI300作為異構計算的混合芯片，融合了CPU和GPU的核心，功耗非常低?？梢钥闯葾MD把EPYC這個服務器處理器集成到一個GPU里面，共享內存，從而實現非常好的每瓦性能。

MI300分為MI300A和MI300X兩款。全球首款用于高性能計算和人工智能工作負載的APU加速器MI300A現已向客戶提供樣品，MI300X將于第三季度開始向主要客戶提供樣品。

AMD AI平臺戰略的發布，為客戶提供從云到邊緣再到終端的硬件產品組合。通過深入的行業軟件協作，開發可擴展且普適的 AI 解決方案。人工智能領域的競爭，序幕才剛剛拉開。

未經允許不得轉載：存儲在線-存儲專業媒體 » 深究AMD第四代EPYC處理器背后的那些技術細節

分享到

AMD EPYC 架構

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走