會議場景對語音轉文字產品有強需求。但因技術限制,傳統語音產品存在“聽不準、分不清、看不懂”等問題,往往在噪音下識別準確率較低,無法區分不同說話人,轉寫內容冗長難以閱讀和沉淀。針對痛點,達摩院語音實驗室打造了“聽悟”,通過讓AI深度參與,讓線上及線下會議更智能、高效、協同。

“聽悟”內置達摩院獨創聲紋融合方位算法,能對多達10位說話人進行角色分離;融入達摩院新一代端到端語音識別模型,中文識別準確率可達98%,支持14種方言及中英文“自由說”;可嵌入線上音視頻會議,實時出字幕及紀要。

除了聽力好,這位AI助理悟性也高。 “聽悟”能模仿人工整理,進行智能糾錯和分段,自動過濾語氣詞,讓生成文本更流暢。同時,“聽悟”擅長抓重點,可秒速生成關鍵詞、核心結論、重點內容和待辦,用戶能同屏編輯、標注摘要、一鍵分享、安全保存?!奥犖颉边€能對常用詞、用戶行為及歷史文檔進行自學習,越用越聰明。

此外,“聽悟”配置了智能麥克風,融入達摩院指向性差分麥克風陣列技術,可實現7米內遠距離360度高清收音,相比傳統麥克風收音距離、抗噪能力大為提升。

達摩院語音實驗室負責人鄢志杰表示,“語音技術的發展是不斷解鎖場景的歷史,會議作為當下組織協同的核心場景,是語音AI將變革的下一個重要場景?!?/p>

鄢志杰介紹,“聽悟”適用于企業會議、金融調研、媒體訪談、教育培訓等泛會議場景,目前面向企業客戶,已為多家頭部金融企業提供服務,且應用于釘釘新上線的“釘閃記”功能中。未來,“聽悟”還將探索與會議廠商合作。

IDC報告顯示,阿里AI近年在語音語義領域表現強勁,市場年增長率達96.6%,增速第一,總營收中國前二,已深入政務、金融、電商、法律等行業,應用于會議、客服、IoT、搜索、文本分析等場景。

未經允許不得轉載:存儲在線-存儲專業媒體 » 阿里推出會議AI助理“聽悟”,可秒速生成智能會議紀要
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走