獨立顧問 James Reinders 剛剛在 NextPlatform.com 網站上發表了題為“CERN 采用英特爾深度學習加速技術和 oneAPI 在不影響準確度的情況下加快推理速度”的文章,詳細介紹了 CERN 如何使用深度學習和英特爾 oneAPI 加速蒙特卡洛模擬 (Monte Carlo simulation),推動大型強子對撞機研究。
為了幫助滿足全球最大的粒子加速器CERN的LHC(大型強子對撞機)的未來需求,CERN,SURFsara和英特爾的研究人員一直在研究提供全新高水平仿真的方法。
Reinders 寫到,CERN 研究人員“業已證明在不影響準確度的情況下,通過降低精度,成功將推理速度提升了近兩倍。”此項工作是英特爾通過 CERN openlab 與 CERN 長期合作的一部分。
CERN 研究人員發現,在名為“生成式對抗網絡 (GAN)”的特定神經網絡 (NN) 中,約一半的計算可以從 FP32 切換至 INT8 數值精度,英特爾 深度學習加速技術可以在不影響準確度的情況下直接支持這種切換。最終,GAN 性能提升了兩倍,且準確度絲毫不受影響。雖然這項工作由直接支持 INT8 的英特爾 至強 可擴展處理器完成,但 Reinders 還在文章中提出了下一個邏輯跳躍:
“INT 8 的廣泛支持得益于英特爾至強可擴展處理器,英特爾 Xe GPU 也支持 INT 8。FPGA 支持 INT8 和其他較低的精度格式。”
通過完全控制精度權衡來實現量化,從而為推理帶來了顯著的性能提升
此外,Reinders 還表示:
“執行并大幅改進此項工作的秘密武器是,oneAPI 支持輕松訪問英特爾深度學習加速和其他加速技術,無需將應用鎖定到單個廠商或設備中。”
值得一提的是,oneAPI 如何讓此類工作更具價值。所用工具的關鍵部分,包括 TensorFlow 和 Python 中隱藏的加速,都利用了支持 oneAPI 的庫。這意味著,它們是公開的,可隨時用于異構系統,不只針對于一家廠商或一種產品(比如 GPU)。
oneAPI 是跨行業、開放式、基于標準的統一編程模型,可在所有加速器架構中提供統一的開發體驗。英特爾幫助創建了 oneAPI,并為其提供各種開源編譯器、庫和其他工具的支持。編程后通過 oneAPI 使用 INT8,這樣文章所述的 CERN 執行的此類工作可以使用英特爾 Xe GPU、FPGA 或其他支持 INT8 或其他數值格式(可以量化)的設備來完成。
原文標題:神經網絡性能提升兩倍,英特爾?深度學習加速技術和oneAPI推動大型強子對撞機研究
文章出處:【微信公眾號:FPGA之家】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
FPGA
+關注
關注
1626文章
21665瀏覽量
601828 -
英特爾
+關注
關注
60文章
9880瀏覽量
171501 -
神經網絡
+關注
關注
42文章
4762瀏覽量
100535
原文標題:神經網絡性能提升兩倍,英特爾?深度學習加速技術和oneAPI推動大型強子對撞機研究
文章出處:【微信號:zhuyandz,微信公眾號:FPGA之家】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論