AMD自適應和嵌入式計算事業部(AECG)高級產品線經理Shyam Chander

“Versal FPGA與HBM解決了大數據和帶寬問題,不僅取代了DDR4或其他外部芯片,提升了安全性和靈活性,同時還支持多種協議,減少了功耗、占板面積,降低了時延,幫助用戶實現性能的最大化?!?月31日,AMD自適應和嵌入式計算事業部(AECG)高級產品線經理Shyam Chander先生宣布了Alveo V80計算加速卡的特征與行業應用實踐。

在推出Alveo V80加速卡的同時,AMD還推出了基于GitHub的設計示例,讓硬件的開發者更快上手并縮短產品上市時間,同時也使得之前熟練應用Vivado工具的Alveo硬件開發者能夠實現價值最大化。

Alveo V80關鍵特點與性能提升

AMD Versal HBM自適應SoC架構為系列家族最大的器件Aveo V80加速卡提供支持。

Aveo V80加速器總體架構概覽

觀察其總體架構可以發現,其特點之一是提供260萬個LUT的可編程邏輯,作為集成型高帶寬網絡核心與加密引擎,二是具備多達10890個DSP計算邏輯片,提供較之前代產品3倍的DSP性能提升,消除各類瓶頸;三是采用PCle Gen5接口,支持64G傳輸速率,擴展MCIO后提供超級通路,實現存儲卡的輕松集成與連接。

與上一代產品AMD Alveo U55C相比,AMD AlveoV80加速卡有了全面的提升:存儲器帶寬從200GB/s提高到820GB/s,邏輯密度從1.3M提升至2.6M,網絡帶寬從200GB/s升至800GB/s,PCle帶寬從32GB/s提升至64GB/s。

通常情況下,使用加速卡都離不開與本地的CPU進行連接,這將限制能夠使用到的GPU加速卡的數量。但是V80采取網絡附接加速卡方式避開了這一限制,相比傳統加速卡,首先是低時延處理傳入的網絡數據,其次它能避開CPU至加速器的PCle瓶頸,三是消除了分立式網絡接口卡(NIC),最終實現每服務器的卡數和計算密度的最大化。這些功能還實現了在線加密、數據包監控和傳感器處理。

HBM存儲相對DDR而言更為昂貴,但AMDAlveo V80采取靈活的存儲配置將HBM應對非常廣泛的工作負載,一個有效的對策就是在做PCB的封裝尺寸時權衡HBM包裝時的芯片占板面積大小,同時以正確地配置FPGA資源作為補充。Shyam強調,此次從UltraScale+U55C升級到AMD Versal V80,以性能的提升來對沖有限的成本增加,實現最高的性價比,而這也是推出Alveo V80的邏輯。

典型案例應用

新款Alveo V80加速卡已經在行業取得了一些成功案例。

在天文領域,聯邦科學與工業研究組織(CSIRO)是澳大利亞的一家國家級研究機構,它參與了世界最大的射電天文天線陣列的建設,通過處理無線電波來研究早期宇宙并探索信息演化。

這個最大的射電天文天線陣列項目采用13.1萬個天線來采集數據,以15Tb/s的速度持續傳輸數據,其工作負載主要是以DSP方式支持傳感器數據的實時傳輸與波束成型及連接,由420塊AMD AIveo U55C卡、21臺服務器和4個機架來提供支持。

在工作負載越來越復雜,而機架空間有限等情況下,CSIRO采用140張AMD AIveo 80計算加速卡與14臺的服務器進行下一代傳感器處理,通過4x200G網絡連接,實現了低時延內聯傳感器處理,強化的AMD Versal DSP計算邏輯片,每張卡的密集計算簡化了集成、擴展和集群,以幾乎相近的成本,在有限的空間內迅速將算力提升達3倍之多。數據顯示,該項目功耗從以前的年520千瓦時降低為年236千瓦時,加速器數量減少三分之二,服務器減少三分之一,功耗降低55%,總擁有成本也降低21%,而且功能靈活性極大提升。

建模和算法交易是金融科技企業采用加速卡趨之若鶩的場景。在建模仿真與回測方面,AMD Alveo V80加速卡支持密集計算的FPGA架構與DSP,大數據集與歷史定價數據由HBM支持;在低時延算法交易方面,Alveo V80可以加速交易策略和期權定價,另以752Mb的RAM用于定價數據、交易記錄,HBM則用于數據集與訂單信息。

由AMD AIveoV80推動的網絡安全

企業客戶普遍重視網絡安全問題,都希望能夠有非常堅硬堅固的網絡安全措施來防止網絡攻擊,保障數據安全,下一代防火墻也能在確保安全的同時,進一步提高能力。

Alveo V80能實現這樣的目標——Versal芯片因為能提供硬化的IP包括加密引擎,能實現800G的內嵌IPSec,HBM則用于緩沖和流量表存儲來加強安全性能,同時還能與數據有更好的連接,更好地實現流量管理。

造福傳統FPGA開發人員以及更多行業應用

AlveoV80特別面向傳統FPGA開發人員,以低時延、自定義數據類型、自定義數據遷移面向自定義工作負載,設計沿用開發者非常熟悉的AMD Vivado套件,簡化Alveo硬件設計框架硬件的開發,同時還支持定制和優化。所有的這些示例和使用方式,在GitHub上都有展示,用戶也可以直接從上面下載。

“傳統上,構建內部的PCle卡需要經過大量的RTL驗證,還有很多系統集成的任務。如果使用V80,就可以避開這種系統集成的任務,可以實現非??焖俚牟渴?,再加上基于Supermicro和AMD EPYC處理器的錨服務器支持,甚至可以即刻部署?!闭劶靶乱淮亩ㄖ苹阅?,Shyam Chander認為Alveo V80真的是“大放異彩”——它不僅能夠大幅降低時延,在實時處理方面表現也非常優秀。而這一切,都歸功于硬化硬件的處理與靈活應變的優勢。

事實上,快速上市始終是Alveo V80的優勢與非常重要的價值定位。AMD對于產品的全生命周期有非常重要的考慮和關照,通常不低于五年期的生命周期服務。

針對當今豐富的AI加速器卡市場,Shyam Chander表示Alveo系列產品側重內聯網絡、實時處理場景,這是FPGA的自適應SoC的優勢,Alveo V80不僅在計算和存儲器帶寬方面提供非常高的性價比,在工作負載方面也提供了非常高的價值,包括邏輯資源和低時延,以及各個節點的可擴展性。他相信,Alveo系列在未來還將繼續呈現強大的生命力。



未經允許不得轉載:存儲在線-存儲專業媒體 » 與上一代價格相近:AMD發布性能翻番的Alveo V80計算加速卡
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走