ZeroCLUE是中文語言理解零樣本學習的權威榜單,在學術和工業界有著廣泛影響力,吸引了IDEA研究院、OpenBMB等眾多高水平科研單位和企業競相角逐。天翼云AI團隊以76.217的總分奪得榜單桂冠,成績大幅領先第二名。同時,天翼云AI團隊在榜單“BUSTM任務”中占據榜首,成為該任務中唯一突破90分的團隊。
零樣本學習(Zero-Shot Learning)是自然語言處理技術中重要的研究方向,旨在突破全監督學習范式,讓AI算法在數據稀缺、標注困難的場景中更好地發揮作用。
ZeroCLUE榜單包含EPRSTMT(電商評論情感分析)、CSLDCP(科學文獻學科分類)、TNEWSF(新聞分類)、IFLYTEKF(應用描述主題分類)、OCNLIF(自然語言推理)、BUSTM(對話短文本匹配)、CHIDF(成語閱讀理解)、CSLF(摘要判斷關鍵詞判別)、CLUEWSCF(代詞消歧)9大任務,涵蓋了當今自然語言處理技術的主流研究方向。參賽者的排名則由上述9個任務的平均得分決定。下圖展示了上述任務的具體數據細節。
本次打榜競賽中,天翼云AI團隊的算法核心之一是采用了“統一多項選擇”(Unified Multiple Choice)的思想,將不同范式的自然語言處理任務統一轉化為多項選擇任務,使得在訓練和微調階段,每個任務都能從其它數據與任務中獲益。
基于以上思想對每個任務進行范式的設計和統一,并結合開源模型進行算法優化和測試,最終不僅能夠增強模型在本任務中的性能,也提升了其處理不同任務的泛化能力。
本次天翼云AI團隊在競爭激烈的ZeroCLUE打榜中脫穎而出,源于其在認知智能領域的技術沉淀,以及對業務場景的深度理解和應用。
值得一提的是,天翼云的零樣本學習技術在實際業務中已獲得了廣泛應用。例如,在知識平臺中使用零樣本學習技術對大量非結構化數據進行知識挖掘和管理;在缺乏樣本的場景中使用零樣本學習技術提升底層算法的知識抽取能力,進而提高平臺上層智能搜索、推薦、問答等業務性能。
未來,天翼云將繼續推進人工智能技術的創新突破,加快打造原創技術策源地,以更多的數字技術應用,賦能千行百業數字化轉型。