Imagination Technologies發布了最新一代神經網絡加速器IP核IMG Series4 NNA,并將于12月份正式向廠商提供。
芯東西獨家獲悉,已有汽車領域廠商率先獲得IMG Series4 NNA IP授權。
作為NNA IP系列第四代產品,IMG Series4 NNA具備創新的多核架構、高擴展性&高靈活性、超高性能、超低延遲、節省帶寬、車規級安全性等功能及特性,可滿足汽車、移動設備、數據中心、PC等多種應用場景的AI加速要求。
在這背后,Imagination為IMG Series4 NNA融入了怎樣的設計巧思?在神經網絡加速成為各行各業普遍需求的當下,IMG Series4 NNA將為滿足這一需求拿出怎樣的解決方案?
為回答這些問題,芯東西獨家專訪Imagination人工智能業務高級總監Andrew Grant,以了解IMG Series4 NNA中蘊含的“黑科技”。
01
兩年打磨:成就五大核心性能亮點
我們了解到,Imagination第二代、第三代神經網絡加速器IP核Series2NX和Series3NX,分別于2017年和2018年推出,兩款產品的發布時間相隔一年。
相比之下,最新推出的Series4 IP核與前代產品的推出相隔兩年。Andrew Grant向我們透露,2018年以來,Imagination研發團隊從軟硬件兩方面出發,對Series4 IP進行了細致的產品設計。
在硬件層面,Imagination團隊在2018年啟動對Series4 IP核的研發工作,同步開始對多核(multi-core)技術(IMG 4NX-MC2、MC4、MC6、MC8)進行研發。
同時,Imagination推出其專利的Imagination Tensor Tiling(ITT)技術,可將工作負載分割以獲得最優效率。
實際應用時,昨日最新亮相的Series4 NNA IP可憑借多核多集群組合,提供600 TOPS甚至更高算力,同時可為大型神經網絡工作負載節省帶寬、降低延遲。
其性能優勢可概括為五個方面:
1、高度靈活的可擴展方案。
前兩代產品均采用單核架構,相比之下,最新推出的Series4 NNA采用多核架構,允許用戶集成2個、4個、6個或8個單核,提供靈活的可擴展方案。
2、超高性能。
基于Series4 NNA IP,一個8核集群可提供100 TOPS算力,那么,6個8核集群的解決方案就可以提供600 TOPS算力。
3、超低延遲。
所有內核可以并行處理一個任務,進而相應地降低延遲、縮短響應時間。舉例來說,相比單核獨立執行的情況,理想狀態下8核集群可以把延遲降低至前者的1/8。
4、節省帶寬。
Imagination Tensor Tiling技術(ITT),可利用本地數據的依賴性將中間數據保存在片上存儲器中,從而將帶寬降低多達90%。
5、車規級安全性。
Series4包含IP級別的安全功能且設計流程符合ISO 26262標準(解決汽車電子產品風險的行業安全標準)。
此外,IMG Series4 NNA可運行一系列AI框架,包括Caffe、PyTorch、TensorFlow、PaddlePaddle、Chainer、Cognitive Toolkit、mxnet和Open Neural Network Exchange (ONNX)等。
對神經網絡的支持方面,IMG Series4可為CNN、LSTM、RNN等多種神經網絡加速,同時支持YOLO v3、Kittiseg等。
02
亮劍四大領域:從PC到汽車都能用
在應用場景上,除了延續前兩代產品對移動設備、PC、數據中心等應用場景的支持,Series4 NNA IP特別針對自動駕駛領域、先進駕駛輔助系統(ADAS)等汽車領域應用進行了設計。
在與客戶溝通的過程中,Imagination團隊了解到,現有車載神經網絡加速器IP解決方案存在功耗高等方面的痛點,這正給Imagination提供了“用武之地”。 Andrew說:“我們注意到,現有的多數IP廠商提供的是數據中心、桌面級CPU等解決方案,這些方案功耗比較嚴重,對車載場景不友好。但Imagination有做移動應用的基因,我們在控制功耗方面有優勢。” 除了降低功耗以外,Imagination研發團隊還綜合考慮了自動駕駛等車載場景對能效、安全性等方面的需求。“(其中)最重要的是‘安全第一’的原則。”Andrew Grant強調。
Imagination研發團隊在Series4 NNA獨特的多核架構中加入控制器,以最大限度地提升使用效率。在保證功耗低、帶寬低的情況下,把算力擴展到業界最大水平。
安全性方面,Series4 NNA采用硬件安全機制,可以保護編譯后的網絡、網絡的執行和數據處理管道。
此外,Andrew Grant補充到,Series4 IP還能與Imagination的車用BXS GPU互補,以實現一個功能更加完善的異構計算平臺。Imagination創新的AI協同(AI Synergy)技術,可充分利用NNA和GPU的資源與優勢,使AI計算性能、效率再上新臺階。
03
未來4NX產品有望在更多領域落地
Andrew Grant向芯東西透露,目前已經有汽車領域的廠商率先獲得了IMG Series4 NNA IP的授權,并正推動產品落地。
談到Imagination三代NNA IP產品之間的關系,Imagination方面表示,前兩代神經網絡加速器IP已經達到了Imagination的市場預期,在移動、安防監控、IoT等對算力要求相對較低的應用場景中取得了較好成績。
比如,展銳(UNISOC)的虎賁T710芯片搭載了2NX,在諸多AI評測中名列前茅,目前已落地于海信F50 5G智能手機、酷派X10 5G手機等;3NX相比2NX,在架構上有很大改良,其功耗、性能、PPA、靈活性均有提升,目前已應用在展銳的T7520芯片里。
相比之下,Series4 NNA IP是一款“Next Level”的產品,適用于更加廣闊的場景。
三代產品形成矩陣,可提供不同層次的算力支持。“算力需求大的客戶可選擇多核心的4NX產品,對算力需求在10T以下的客戶可選擇3NX解決方案。”Andrew說。
同時,Andrew Grant稱:“我們期待能將其(4NX產品)推廣到云計算中心、移動邊緣計算(MEC)、桌面、安防攝像頭、工業自動化等應用領域。中國是一個非常大的市場,有許多芯片公司,我們期待能與這些公司一起有所作為,助力車載、數據中心等應用場景實現提升。”
04
結語:自動駕駛應用藍海下,車載AI芯片IP迎來利好
5G、AI……一波波浪潮奔涌下,自動駕駛、遠程醫療等應用逐漸從傳說變為現實,這一過程中,Imagination等先進技術玩家,承擔著助推產業浪潮奔涌的角色。
今年三月份,工信部網站公示《汽車駕駛自動化分級》推薦性國家標準報批稿。若該標準正式實施,將是我國第一份自動駕駛分級標準。這意味著國內自動駕駛發展將迎來政策性引導與保障。業內人士稱,新的分級標準給行業帶來利好,車聯網路網基建有望加速,將帶來十萬億級別的投資機會。
這一十萬億市場藍海中,車載AI芯片IP無疑成為一大重要組成部分。
自動駕駛解決方案中,應對數以百計的復雜場景、處理大量的傳感器數據、實現自動代客泊車等各類復雜功能,對車載AI芯片應用提出更高要求。 對此,Imagination最新發布的神經網絡加速器IP在算力、降低延遲、提升能效等方面具備優勢,或能助推自動駕駛應用快速落地。 有關Series4 NNA的更多信息, 請識別下方二維碼觀看 Imagination的主題會議。
原文標題:600 TOPS超高算力,2~8核靈活配置!Imagination新發布神經網絡加速器IP
文章出處:【微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
神經網絡
+關注
關注
42文章
4762瀏覽量
100541 -
AI
+關注
關注
87文章
30146瀏覽量
268421 -
自動駕駛
+關注
關注
783文章
13684瀏覽量
166147
原文標題:600 TOPS超高算力,2~8核靈活配置!Imagination新發布神經網絡加速器IP
文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論