相比去年云棲大會發布的版本,“聽悟”今年在技術和產品功能上進行了全方位升級,新增三大核心AI能力:中英文自由說,采用內嵌多語種專家模塊的“混合專家系統”,無需手動切換語種即可準確識別中英大篇幅混說的場景;會議實時翻譯,邊說邊翻譯,無需等待,讓跨國溝通更加高效順暢;QA問答對抽取,結合說話人特征、多階段訓練技術,自動提取問題,讓訪談整理更輕松。
同時,針對會議行業伙伴及企業用戶的多樣化需求,“聽悟”發布了PaaS產品形態,以簡單易調用的接口方式開放核心能力,并提供多種前沿創新算法,從而滿足企業在音視頻會議、培訓直播、招聘面試、智能客服等多種細分場景的不同需求。
阿里巴巴達摩院語音實驗室負責人鄢志杰表示,“過去十年‘人-機’交流是語音AI解鎖的核心場景,更復雜的‘人-人’交流是下一個高地,未來聽悟將在‘人-人’交流場景繼續深入探索,提供安全、保真、精準的AI識別、分析與理解能力,并基于內容為企業提供多種智能辦公服務,讓AI真正為人所用,替人分擔,協助處理重復繁瑣的工作事務?!?/p>