Imagination公司日前基于其神經網絡加速器(NNA)架構PowerVR 2NX推出了兩款全新的神經網絡內核AX2185和AX2145,其設計目的是在極小芯片面積上以極低功耗實現神經網絡高性能計算。
不同于CPU/GPU架構,PowerVR 2NX架構是Imagination專為神經網絡算法所設計的可擴展架構,支持16位到4位位寬。由于靈活的位寬可基于每一層去支持權重和數據,這意味著PowerVR Series2NX可以保持高推理精度,同時降低帶寬/功耗要求,能夠為移動和嵌入式平臺中的高效神經網絡推理提供硬件加速。
PowerVR 2NX NNA可調精度和低精度實例
神經網絡加速器將成SoC標準IP模塊
根據Gartner的預估,到2020年深度神經網絡(DNN)和機器學習應用將為半導體企業創造100億美元的市場商機,人工智能與機器學習將逐漸滲透所有事物,成為未來5年科技廠商的主要戰場。
“人工智能處理一直以來主要發生在云端,但由于延遲、隱私問題以及日益增長的可擴展性需求,邊緣人工智能處理已變得非常必要。”Imagination主管PowerVR視覺和人工智能業務的副總裁Russell James說,要將人工智能引入邊緣計算中,首當其沖面臨的挑戰,就是學會如何在電池壽命的限制下保證電力,管理安全性并提供合理的成本。其次,在終端側進行AI處理,實時響應、安全性和可靠性也是必須考慮的。
Imagination中國區區域市場和業務拓展總監柯川將AI產業分為四個階段:一是新技術來臨時有前沿院校和公司研究論證,找到產業化可能性;二是應用研究階段,探討解決實際問題;三是產業快速發展階段;四是進入成熟期,成為一個相對穩定的市場。目前來看,AI正處于第三階段的早期。
AI市場演進
Imagination方面認為NNA的用途非常多,所以是絕對不容忽視的。例如根據正在觀看的人和他們的年齡調整電視頻道的順序和訪問權限;識別混合現實場景中的物體,以確保在現實世界中沒有任何重要的東西被忽視(如樓梯或火災);實時增強電視、手機或視頻通話中的圖像;實現自主系統,如自動駕駛車輛等。
在此前的采訪中,Imagination市場傳播副總裁David Harold就曾表示,未來NNA一定會成為SoC中的標準IP模塊,就像CPU、GPU和視頻編解碼器一樣,因為“PowerVR 2NX NNA的邏輯比我們最小的GPU還小,但是卻大大節省了功耗和帶寬,提高了可用性。”根據柯川提供的數據,與最接近的競爭方案相比,PowerVR 2NX可以用25%的帶寬提供兩倍的性能。在位寬調整后,如將8位調整到4位,性能提升了60%,帶寬降至54%,功耗降至69%,但精度下降不到1%。
靈活的多精度支持優勢
兩個新成員
AX2185擁有8個全寬度計算引擎,每個時鐘周期可處理2048個MAC(每秒4.1兆次運算),以高端智能手機、智能監控和汽車市場中的圖像分類和駕駛輔助系統等應用為目標,據稱能夠代表市場上單位面積(每平方毫米)的最高性能。
AX2145針對成本敏感型設備進行了優化,以中檔智能手機、數字電視/機頂盒、智能相機和消費性安全市場中的圖像管理與基于視覺的應用為目標。其精簡型架構能夠為超低帶寬系統提供高性能的神經網絡推理功能,從而支持原始設備制造商(OEM)和原始設計制造商(ODM)在芯片面積預算有限的情況下開展工作。
當然,只有NNA是不夠的,還需要提供工具和軟件。兩款內核都完全支持安卓(Android)的神經網絡應用程序編程接口(Neural Networks API, NNAPI),開發人員使用NNAPI可以將神經網絡功能帶入基于Android的移動設備。為配合PowerVR Series2NX內核,Imagination還提供了一整套工具來簡化人工智能應用的開發、部署、調試和分析。
在Russell James看來,目前市場中三種主流的AI芯片架構(CPU/DSP/FPGA等通用型處理器、CPU/GPU+AI加速器、以及定制化ASIC)設計思路不同,各有優缺點,面對的應用也五花八門,在選擇時需加以謹慎。具體而言,第一類適合性能要求和精度要求不太高的應用,如人臉識別;第二類適合高性能應用,如智能手機、智能監控、自動駕駛等;第三類AISC芯片適合某些特定場景。例如在IoT領域中,很多應用要求在有限的功耗下完成相應的AI任務,且芯片出貨量大,此時性能功耗比高的ASIC就很值得關注。
-
神經網絡
+關注
關注
42文章
4765瀏覽量
100566 -
低功耗
+關注
關注
10文章
2362瀏覽量
103607
原文標題:王者歸來,這顆中國芯霸氣宣布帶來頂尖AI創新
文章出處:【微信號:gh_bee81f890fc1,微信公眾號:面包板社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論