Catapult AI NN 集成了用于機器學習硬件加速的開源軟件包 hls4ml,以及用于高層次綜合的西門子 Catapult? HLS 軟件。Catapult AI NN 由西門子與美國能源部費米實驗室以及其他為 hls4ml 做出貢獻的機構合作開發,能滿足機器學習加速器設計對于定制芯片功耗、性能和面積 (PPA) 方面的獨特要求。

西門子數字化工業軟件副總裁兼高層次設計、驗證和功耗總經理 Mo Movahed 表示:“無論是神經網絡模型的交接過程,還是其向硬件實現的手動轉換,效率都非常很低,并且耗時、容易出錯,特別是在創建和驗證針對特定性能、功耗和面積定制的硬件加速器變體時。通過讓科學家和 AI 專家充分利用行業標準的 AI 框架 (例如神經網絡模型設計),并將這些模型無縫綜合到已經經過 PPA 優化的硬件設計中,我們能夠為 AI/ML 軟件工程師創造更多可能。使用西門子新的 Catapult AI NN 解決方案,開發人員能夠在軟件開發過程中自動實現神經網絡模型,同時進行 PPA 優化,有效提升 AI 的開發效率,并實現加速創新?!?

隨著 runtime AI 和機器學習任務從數據中心遷移至消費電器、醫療設備等領域,客戶對合適大小的 AI 硬件的需求也在快速增長,以減少功耗,降低成本,并實現終端產品差異化。然而,比起可綜合的 C++、Verilog 或 VHDL,多數機器學習專家更習慣使用 TensorFlow、PyTorch 或 Keras 等工具。過去,AI 專家要在合適大小的 ASIC 或 SoC 實現中加快機器學習應用,其實并沒有捷徑可走。hls4ml 計劃旨在將 TensorFlow、PyTorch 或 Keras 等 AI 框架中的神經網絡描述生成 C++ 代碼,幫助彌補這一缺陷。隨后即可部署這些 C++ 代碼,用于 FPGA、ASIC 或 SoC 實現。

Catapult AI NN 能夠將 hls4ml 的功能擴展到 ASIC 和 SoC 設計,它包括針對 ASIC 設計量身定制的專用 C++ 機器學習功能資源庫。使用這些功能,設計人員能夠在各個 C++ 代碼實現之間進行延時和資源方面的權衡,從而實現 PPA 的優化。此外,設計人員現在還能夠評估不同神經網絡設計的影響,以確定硬件的理想神經網絡結構。

“粒子探測器有非常嚴格的邊緣 AI 約束條件,”費米實驗室的新興技術主管 Panagiotis Spentzouris 表示,“我們與西門子合作開發 Catapult AI NN,這種綜合性框架充分利用了我們的科學家和 AI 專家的專業知識,即便他們并不是 ASIC 設計人員。此外,這種框架也非常適合經驗豐富的硬件專家使用?!?/p>

Catapult AI NN 目前已向早期采用者提供,并將于 2024 年第 4 季度向所有用戶開放。

未經允許不得轉載:存儲在線-存儲專業媒體 » 西門子推出Catapult AI NN以簡化先進芯片級系統設計中的AI加速器開發
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走