張建鋒說:”在全球芯片領域,阿里巴巴是一個新人,玄鐵和含光800是平頭哥的萬里長征第一步,我們還有很長的路要走?!?/p>

含光為上古三大神劍之一,該劍含而不露,光而不耀,正如含光800帶來的無形卻強勁的算力。在杭州城市大腦的業務測試中,1顆含光800的算力相當于10顆GPU。

含光800性能的突破得益于軟硬件的協同創新:硬件層面采用自研芯片架構,通過推理加速等技術有效解決芯片性能瓶頸問題;軟件層面集成了達摩院先進算法,針對CNN及視覺類算法深度優化計算、存儲密度,可實現大網絡模型在一顆NPU上完成計算。  

含光800是一款AI芯片,偏重推理。由于人工智能芯片的差異化設計主要體現在硬件架構和軟件算法上,二者需要高度適配才能發揮芯片的最大價值。從目前來看,傳統CPU、GPU在深度學習推理任務上并沒有完全發揮硬件能力,例如GPU架構主要針對圖像處理設計,其硬件結構、軟件生態幾乎固化,因此對AI任務很難有深度優化。

——芯片架構方面,含光800采用創新的架構,針對深度學習中使用的大量權重參數和張量數據,在支持稀疏壓縮與量化處理的基礎上,通過獨特設計的數據訪存與流水線處理技術,大大減低了I/O需求和數據的搬移。NPU同時深度優化了卷積,矩陣乘,向量計算和各種激活函數,通過高有效的硬件資源調度和全并行的數據流處理,把AI運算的性能和能效雙雙推向極致。

——算法方面,阿里巴巴達摩院機器智能實驗室過去兩年構建了完整的算法體系,涵蓋語音智能、語言技術、機器視覺、決策智能等方向,并且取得多個世界領先水平的成果;硬件方面,阿里巴巴此前已在服務器、FPGA以及存儲等領域擁有多年研發經驗,此外,平頭哥團隊在體系結構、編譯技術等領域擁有深厚的技術儲備。

含光800已開始應用在阿里巴巴內部核心業務中。根據云棲大會的現場演示,在城市大腦中實時處理杭州主城區交通視頻,需要40顆傳統GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800后可縮減至5分鐘。

含光800將通過阿里云對外輸出AI算力?;诤?00的AI云服務當天正式上線,相比傳統GPU算力,性價比提升100%。  

過去半年,平頭哥先后發布玄鐵910、無劍SoC平臺。隨著含光800的發布,平頭哥端云一體全棧產品系列初步成型,涵蓋處理器IP、一站式芯片設計平臺和AI芯片,實現了芯片設計鏈路的全覆蓋。

未經允許不得轉載:存儲在線-存儲專業媒體 » 阿里巴巴第一顆自研芯片正式問世
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走