“我們已進入了一個機器可以實時理解人類語言的AI新時代。TensorRT 7使這成為可能,為世界各地的開發者提供工具,使他們能夠構建和部署更快、更智能的會話式AI服務,從而實現更自然的AI人機交互,” NVIDIA創始人兼首席執行官黃仁勛表示。

據官方介紹,TensorRT 7 可實現和語音代理、聊天機器人、推薦引擎等應用的實時互動。其內置新型深度學習編譯器,該編譯器能夠自動優化和加速遞歸神經網絡與基于轉換器的神經網絡。這些日益復雜的神經網絡是AI語音應用所必需的。與在CPU上運行時相比,會話式AI組件速度提高了10倍以上,從而將延遲降低到實時交互所需的300毫秒閾值以下。首批使用NVIDIA會話式AI加速能力的企業包括——阿里巴巴、百度、滴滴出行、美團、快手、平安、搜狗、騰訊和字節跳動等。

TensorRT 7加快了AI模型的領域擴展。這些模型被用于預測使用遞歸循環結構(RNN)的時間序列、數據情景。除了用于會話式 AI語音網絡之外,RNN還可以幫助規劃汽車或衛星到達時間、預測電子病歷中的異常情況預測金融資產和識別欺詐。

RNN配置和功能組合的爆炸式增長為快速部署可以滿足實時性能標準的生產代碼帶來了挑戰,開發者需要花費長達數月的時間創建手寫代碼優化,從而使得會話式AI僅局限于擁有必要專業人才的少數公司。通過TensorRT的新型深度學習編譯器,全球開發者能夠將這些網絡(例如定制的自動語音識別網絡以及用于文本-語音轉換的WaveRNN和Tacotron 2)實現自動化,并實現最佳的性能和最低的延遲。新的編譯器還能優化基于transformer的模型,例如用于自然語言處理的BERT等。

TensorRT 7可以快速優化、驗證并部署經過訓練的神經網絡,為超大型數據中心、嵌入式或汽車GPU平臺提供推理能力。NVIDIA的推理平臺,包括TensorRT和多個NVIDIA CUDA-X AI庫和NVIDIA GPU,不只能為會話式AI提供低延遲、高吞吐量的推理能力,也同樣能為包括圖像分類、欺詐識別、分割、目標檢測和推薦引擎在內的其它應用提供低延遲、高吞吐量的推理能力。該平臺各項能力已被阿里巴巴、美國運通(American Express)、百度、PayPal、Pinterest、Snap、騰訊和Twitter等使用。

據了解,TensorRT 7 將在未來幾天內開放訪問,以用于開發和部署。NVIDIA開發者計劃成員可通過 TensorRT 網頁免費獲得TensorRT 7。此外,新版本插件、語法分析器和樣本也將作為開放資源,通過TensorRT GitHub 庫提供。

未經允許不得轉載:存儲在線-存儲專業媒體 » NVIDIA第七代推理軟件開發套件TensorRT 7亮相,解決AI人機交互推理延遲問題
分享到

zhangnn

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走