【當前,北京正在加快推進國家新一代人工智能創新發展試驗區和國家人工智能創新應用先導區建設,打造具有全球影響力的人工智能創新策源地。北京市通用人工智能產業創新伙伴計劃,由北京市經信局聯合市科委中關村管委會、市發改委等共同發布,旨在搭建人工智能大模型的開放合作平臺,建立協同合作機制,通過持續優化產業鏈布局,大幅提升優質算力、高質量數據供給支撐能力,培養一批應用大模型技術實現突破性成長的標桿企業?!?/p>

● 率先布局生產式AI,構建全領先的大模型算力系統解決方案

作為最早布局大模型的企業之一,浪潮信息在業界率先推出了中文AI巨量模型“源1.0”,參數規模高達2457億?!霸?.0”在語言智能方面表現優異,獲得中文語言理解評測基準CLUE榜單的零樣本學習(zero-shot)和小樣本學習(few-shot)兩類總榜冠軍。 浪潮信息通過千億參數規模的大模型創新實踐,已在算力集群構建、算力調度部署、算法模型開發等方面,構建起全棧領先的大模型算力系統解決方案,助力大模型訓練開發。

算力集群構建上,基于大模型實測對比的集群規劃,提供包含數據中心、算力、網絡、存儲一體化產品陣列。其中最新一代融合架構的AI訓練服務器NF5688G7采用Hopper架構的GPU,較上代平臺大模型實測性能提升近7倍,同時支持最新的液冷解決方案,可實現更低的集群能耗比與運行成本,PUE小于1.15,以一個4000卡的智算中心為例,每年可節電620萬度、降碳1700噸。在集群高速互聯層面,基于原生RDMA實現整個集群的全線速組網,并對網絡拓撲進行優化,可以有效消除混合計算的計算瓶頸,確保集群在大模型訓練時始終處于最佳狀態。

在算力調度部署上,面對大模型系統級開發過程中所存在的調度難、部署慢、效率低、集群異常等問題,浪潮信息推出AIStation智能業務創新生產平臺,通過全生命周期的一體化監控及調度系統,構建起完備的模型訓練失效恢復持續方案,滿足大模型分布式訓練中高穩定、高穩健性等特性要求,實現訓練異常和故障診斷的自動處理,縮短斷點續訓時間90%。同時,自研分布式任務自適應系統,有效分配底層計算、存儲、網絡等資源,提升集群利用率與模型訓練效率。高效的集群優化調度策略,大幅簡化大模型訓練前大量的、環境配置、依賴庫適配和超參數調整工作。

在算法模型開發上,“源1.0”針對大模型的Attention層和前饋層的模型空間進行結構優化,改進注意力機制聚焦文章內部聯系的學習。千億大模型的創新實踐,使得浪潮信息具備從數據、訓練、部署到應用落地的全棧開發能力。在訓練數據處理上,通過自研海量數據過濾系統(MDFS),建立從數據采集、粗濾、質量分類、精濾的全自動化的端到端數據工作流程,通過清洗866TB海量數據,獲得5TB高質量中文數據集。

在助力大模型訓練開發方面,浪潮信息推出AI算力服務,提供經“源”清洗驗證過的語言或多模態的大模型數據、算法產品及模型訓練資源管理平臺,為AI創新研究團隊提供先進、開放、高性能、高質量的AI算力資源及配套服務,賦能AIGC創新發展。目前,浪潮信息AI算力服務已成功助力網易伏羲中文預訓練大模型“玉言”登頂中文語言理解權威測評基準CLUE分類任務榜單,并在多項任務上超過人類水平。

浪潮信息AI團隊將“源1.0”成功的系統工程經驗應用于智算中心算力系統,對集群架構、高速互聯、算力調度等進行全面優化,對分布式訓練策略進行了針對性優化,通過合理設計張量并行、流水并行和數據并行,精準調整模型結構和訓練過程的超參數,最終實現千億參數規模的大模型訓練算力效率達至53.5%。

● 強大穩健的基礎大模型,讓行業應用“順勢而為”

目前,浪潮信息“源1.0”已在眾多行業領域實現應用的快速落地,真正實現AIGC的產業普惠:通過構建強大穩健的基礎大模型,讓千行百業擁有“順勢而為”的大模型能力。浪潮信息推出的“源1.0”開源開放計劃,開放模型API、工具鏈、數據集,構建“開放、共贏”的開發者社區生態,助力開發者快速創新,目前“源開發者社區”已匯聚了近萬名高水平開發者,孵化出眾多創新應用。

在智能客服領域,通過將“源”大模型的智能力與復雜的服務場景進行深度融合,打造專家級數據中心智能客服大腦,憑借強大的學習能力,“源曉服”能夠對知識庫進行自主化學習,可覆蓋終端用戶92%的咨詢問題,將復雜技術咨詢的業務處理時長降低65%,整體服務效率達160%,榮獲評哈佛商業評論鼎革獎。

在智慧政務領域,基于源大模型打造的AI社區助理“臨小助“,可為基層社區工作者提供沉浸式、針對性的一對一群眾工作能力培訓,社區工作者通過手機載體與“臨小助”進行互動對話形式,讓社區小白“秒變”服務群眾的能人。目前,“臨小助”已投入使用,在某高頻場景中,社區工作人員培訓學習效率提升5倍,有效輔助問答建議達至75%。

在智慧文創領域,開發者開發出首個AI劇本殺;基于“源1.0”,開發并上線一個會“鬧情緒”的AI陪練,幫助心理咨詢師更專業及時地提供各種服務和治療方案。除此之外,“AI數字人魯迅”、數字演員、陪伴機器人、游戲NPC對話等極具創新的應用也在不斷地孵化落地。

“源1.0”作為新型的大模型算法基礎設施,正通過強大的通用智能和全的工具鏈服務能力,助力千行百業開發運行更多的智能應用。



未經允許不得轉載:存儲在線-存儲專業媒體 » 浪潮信息入選北京市通用人工智能產業創新伙伴, “源”大模型加速開放賦能
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走