Horovod流行的背后是AI算力需求的急劇增加

  Horovod實質上是Uber開發并開源的一套先進的分布式系統,它并不依賴于某個框架,而是采用目前業界廣泛認可的基于環形All-reduce通信的同步SGD算法,通過計算與通信異步、梯度合并、梯度壓縮等設備間通信優化手段,完成allreduce、allgather等集體操作通信工作。這一特性使得Horovod可以非常方便地與主流深度學習框架TensorFlow、PyTorch、 MXNet等進行匹配,在大規模GPU集群上的訓練性能遠高于原生框架的訓練性能,提供非常高效的分布式訓練性能加速。Horovod的另一大優點在于其提供的接口極為簡單,用戶只需修改幾行代碼,就可實現顯著的訓練性能提升。

  Horovod之所以受到越來越多AI開發者與研究機構的青睞,其背后的原因在于越來越多的機器學習模型對數據和計算能力需求急劇增加。在大部分情況下,AI模型可以在單個或多GPU平臺的服務器上運行,但隨著數據集的增大和訓練時間的增長,有時訓練需要一周甚至更長時間。因此,AI開發者們不得不尋求分布式訓練方法來縮短模型訓練的時間。

  Uber分享Horovod的“獨家秘笈”

  Uber目前已經將深度學習應用到了很多公司業務中,從自動駕駛搜索路線到防御欺詐等。Uber深度學習平臺經理寧旭認為,訓練現代復雜的深度學習模型需要大量的計算。將計算擴展到多個GPU面臨兩大挑戰:低成本、高效的GPU間通信庫,以及用戶代碼可能會出現較大的更改。而Horovod成功地解決了這兩大難題。

  在AICC2019上,寧旭將帶來《利用Horovod進行分布式深度學習》的主題演講,不僅將現場分享如何通過Horovod在TensorFlow、Keras、PyTorch和MXNet中實現更快、更輕松的分布式訓練,講解Horovod的操作方法,同時也將披露Uber最近在橡樹嶺國家實驗室進行的一項案例研究,講述Horovod在世界上最快的超級計算機上實現百億億級計算。

  寧旭曾帶領Uber大數據和基礎設施領域的團隊負責一些開源項目,在機器學習、深度學習、大數據和大規模計算、網絡、存儲問題方面有豐富的經驗。在加入Uber之前,寧旭曾在Facebook、Akamai和Microsoft以及幾家初創公司工作。

  AICC2019精彩紛呈

  本屆AICC 2019可謂精彩紛呈,核心板塊為主論壇與自動駕駛、產業AI創新、AI計算與基準測試、AI+視覺計算、AI+創投五大主題論壇,其中主論壇嘉賓云集了來自中國工程院、英國皇家工程院、百度、中國新一代人工智能發展戰略研究院、浪潮、Facebook等機構的AI產學研頂尖專家學者,共聚一堂解讀AI產業趨勢,分享前沿AI計算技術。大會同期舉行的AI千人訓練營將邀請百度、平安科技、浪潮的資深AI工程師講解最新AI計算技術與應用,幫助學員從零入門AI。

  AICC 2019主論壇嘉賓陣容

  與此同時,AICC2019大會期間還將重磅發布《2019-2020中國AI計算力發展報告》,公布中國AI計算力城市榜單與熱力分布等重要研究成果,為AI投資、創業與就業提供科學指導。

  AICC大會由中國工程院信息與電子工程學部主辦,浪潮集團承辦,旨在圍繞人工智能的產業需求研討AI計算,促進AI技術創新、合作發展與人才培養。目前,AICC大會已成為AI計算領域最具分量的前沿技術交流平臺,每年都會吸引數千名AI產業與技術領袖、頂級AI專家和AI開發者等參與。

未經允許不得轉載:存儲在線-存儲專業媒體 » Horovod成就分布式深度學習金標準,Uber專家將在AI計算大會分享
分享到

zhangnn

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走