總結一下,此次發布會Imagination發布了針對AI和視覺的神經網絡硬件加速器PowerVR 3NX NNA;同時還發布了三款新品GPU,分別是PowerVR 9XEP、9XMP、9XTP,基本上從低端到高端應用需求全覆蓋。
詳解3NX-NNA,升級5大核心帶來哪些改變?
2018年可以說是AI芯片的爆發之年,以手機市場為例,芯片廠商對于AI能力的宣傳力度已經逐漸超過了傳統的CPU和GPU性能。不少業內專家認為,在手機性能過剩的當下,未來手機芯片的競爭焦點將是AI功能。
目前包括高通、華為、聯發科、紫光展銳在內的手機芯片公司紛紛押寶AI功能,并在手機SOC中加入神經網絡計算的硬件加速器。業界最大的兩大知識產權(IP)供應商ARM和Imagination自然也不會缺席。
ARM此前就發布了其第一代機器學習處理器架構“Trillium”,將DeePhi神經網絡壓縮技術、FPGA的可編程性,以及DSP的低功耗處理能力聚合在一起。
而Imagination則在2017年就發布了全球第一款神經網絡加速器PowerVR?2NX NNA(簡稱2NX),這是一個專門做人工智能硬件加速的IP。作為獨立的神經網絡加速器,2NX不需要跟CPU、GPU綁定,既可以輔助加速,也可以獨立存在。
Imagination產品部資深總監Neal Forse透露,去年2NX發布后在業界反映非常好,目前已經有兩家中國手機廠商簽約采用這款IP。
從左到右依次為:
Kristof Beets, Imagination Technologies PowerVR產品管理和技術營銷高級總監
Neal Forse,Imagination Technologies視覺和人工智能產品管理高級總監
David McBrien,Imagination Technologies銷售和市場營銷執行副總裁
劉國軍(James Liu), Imagination Technologies副總裁兼中國區總經理
Graham Deacon,Imagination Technologies PowerVR圖形處理商務運營副總裁
2018年12月4日,Imagination在深圳舉行了一年一度的技術交流會。在此次交流會上,Imagination推出了幾款具有新特性的IP,其中就包括基于2NX基礎升級的PowerVR?3NX NNA(簡稱3NX)。以及三款新的GPU系列,包括PowerVR?9XEP、9XMP、9XTP。
據介紹,3NX主要針對四大應用市場,包括移動計算(手機、平板),智能安防,消費電子,汽車自動駕駛。其中自動駕駛將是3NX接下來發展的重點市場。
3NXAX3595的多核演進圖
相比2NX,3NX有哪些性能上的提升呢?筆者總結了幾點:
第一,IP核心數增加。相比2NX的AX2145和AX2185,3NX增加到了5個核,這帶來了強大的性能提升。
這5個核心包括AX3145、AX3385、AX3365、AX3595以及一個低端核。其中AX3145的單核算力達到1.2TOPS,AX3385為5 TOPS,AX3365為2.4 TOPS,AX3595為10 TOPS,最低端核為0.6TOPS。
3NX在PPA上的提升
如同CPU、GPU的多核方式,3NX支持多核方式,多核方式帶來的好處非常多。首先是性能上,通過多核方式,3NX最高可達到160TOPS的算力,如此高的算力將在汽車等高端應用上產生作用。
“和上一代相比,性能提升了70%,效率提升了40%。功耗降低了40%,帶寬降低了35%。”Imagination Technologies視覺和人工智能產品管理高級總監Neal Forse表示,之所以能做到這一點,主要是因為采用了新的無損壓縮算法。
3NX-F 可編程的擴展性
3NX系列另外一個關鍵特性是可編程的拓展性,因此這里叫3NX-F,F代表靈活性。通過增加可編程的擴展性來優化硬件,這樣做的目的是讓客戶實現差異化設計。比如可以讓客戶不斷加入新的技術,如神經網絡等,還可以構建一個Open CL的內核。
除了高性能之外,也別忘記了3NX還有一顆低端的0.6TOPS核,這顆核心使得3NX可以實現低功耗的物聯網應用。對于一些對功耗和成本比較低的應用,如簡單的人臉識別等。還有一些你可能想不到的應用,比如在國外有用3NX來檢測街上的流浪漢,避免在冬天這些人被凍死。Neal Forse表示,對于幀率要求較低的IOT市場,以及低功耗、廣域網的應用,功耗可以做到非常低,可以實現毫瓦級別的功耗。
作為獨立的神經網絡加速器,NNA也常被人拿來和寒武紀、地平線等提供XPU的算法公司進行比較。Neal Forse對此沒有正面回應,只是表示“我們喜歡這樣的競爭”。他同時認為,每家AI廠商的起點都不一樣,競爭對手可能用可編程的架構、DSP做神經網絡的方案,再加上指令集。而imagination的做法是通過計算優化的方案,看如何通過最優的計算引擎來把神經網絡映射到硬件上。“我們的優化是來自線下的編譯,而不是在線的執行?!?/p>
9X EP、9XMP、9XTP,不管玩什么游戲,總有一款GPU適合你
PowerVR?9XE9XM 9XT
前面說了這么多關于人工智能的新IP介紹,但不管怎么說Imagination畢竟以前專門給蘋果提供GPU,GPU還是其主打的拳頭產品。Imagination的GPU產品線包括PowerVR?XM、XE和XT系列,相比其他競爭對手,PowerVR?系列最大的優勢是性能高、功耗低。
PowerVR?9XE9XM 9XT主要特性
2017年,Imagination推出了兩款PowerVR?GPU產品Series 9XM與9XE,為價格低廉的產品也帶來了絕佳的圖像體驗。此次新品發布會上,Imagination PowerVR?業務部副總裁 Graham Deacon介紹了三款新IP,包括PowerVR?9XEP、9XMP、9XTP,分別對應不同市場。
9XEP主要關注在低端手機以及數字電視市場,為硬件設備上的GUI以及HMI提供最佳體驗,包括休閑游戲等應用。其特點是可在最小面積上提供最高的填充率。9XEP可以達到每個時鐘1-8個像素填充率, 每個時鐘16-64個FP32 OPS。
采用前代PowerVR?技術的數碼相框產品
這個行業更看重用戶界面而非游戲性能,要求更高的分辨率。另外數字電視也越來越多采用神經網絡來進行語音識別、面部識別、安全特性等應用。機頂盒市場比較看重成本,預計整機價格在40~50美金左右,對于SOC的成本要求很高。
采用前代PowerVR?技術的車載中控產品
此外,9XEP還可以廣泛應用于車載中控系統。現在高端汽車可能有5~6個顯示屏,除了車載顯示屏,在抬頭顯示、電子后視鏡等領域都將開始采用顯示屏。
采用前代PowerVR?技術的面部識別demo
以汽車中常見的應用為例,比如“車道偏離警示”大概需要10個GFLOPs,低性能GPU可以支持這樣的性能要求;但是“行人預測”就需要很寬的性能要求,至少需要100個GFLOPS,這些都對GPU提出了更高要求。
▲圖為采用9XMP與三星S9+以及華為Mate10 Pro游戲畫面的對比,可以看到細節和對比度的差異
9XMP主要是關注游戲以及中端手機市場。其特性是在最低的面積有最好的計算能力,同時還保證成本。主要是關注游戲的性能密度和加了相關的特殊特性,它的處理數量是每時鐘4-8個像素,128-256 FP32 Ops。和上一代相比,9XMP在性能密度方面提升了45%,通過增加性能密度的方式改善游戲性能,同時加入專用的紋理緩存以及視覺無損壓縮技術(PowerVR?PVRIC4),確保帶寬降低50%。
▲圖為9XEP、9XMP、9XTP的畫面細節對比
▲PowerVR?PVRIC4第四代視覺無損壓縮技術
9XTP可以說是這次發布的旗艦型產品,主要關注最高端的游戲體驗。9XTP每時鐘可以超過192FP32 Ops,架構可擴展,可以在最低的面積實現更好的算力。
9XTP聚焦于高功效和高性能,有50%配置方面的改進。9XTP同時采用PVRIC4的壓縮技術,可實現視覺無損壓縮,可以保證內存的帶寬降低50%。
9XEP和9XMP IP Core主要采用PowerVR?Rogue架構,這個架構在2010年推出,已經非常成熟和成功。
GPU需求和市場趨勢
Imagination PowerVR?業務部副總裁 Graham Deacon認為,除了高端的GPU,其實客戶對于低成本的嵌入式GPU需求量也很大。需要更高的性能和特性,但是要求系統成本更低,因此必須提供高密度、低帶寬、低功耗、低SOC芯片面積的產品。Imagination的一大優勢是可根據客戶需求來定制GPU,同時提供更好的靈活性、可擴展性等差異化因素。
AI沒想象中強大,GPU+AI更適合提升系統能力
值得一提的是,對于AI硬件加速器的需求增加,是否會對GPU的需求降低呢?Imagination如何在兩種IP之間取得平衡?
對于這個話題,Neal Forse認為這兩者是互補的,這也是為什么Imagination在發布GPU的同時也發布NNA。
比如一些低端的產品可能只需要通過GPU來進行一部分AI的計算,而一些高端的產品則采用專門的硬件加速器來做處理。
Neal Forse表示,在發展AI運算的過程中,異構性一直是Imagination擁抱的策略。他認為目前深度學習算法存在很大問題,只是做簡單的感測識別,無法進行進一步的推理。未來神經網絡的性能評價標準將不一定是計算效率的提升,而是機器學習效率的提升。
此外,傳感器融合也是未來人工智能的一個發展方向。未來可能每個傳感器都會對應一個NNA的引擎,再加上AI數據分析。這樣可以大大降低終端的數據處理壓力,進一步提升計算結果。
人工智能的未來將如何發展?其實從目前來看業界對于人工智能的關注度過高,但其實AI并沒有預想中的那么強大。真正的強人工智能——機器擁有意識,并能夠基于認知推理作出決策其實現在業界根本還沒摸到邊,并且未來技術發展有賴于5G等通信技術的普及。
那么現在的弱人工智能,其實最大的用處是進一步用來增強系統的能力,而非將其作為有一個核心賣點。在現有的芯片封裝密度下如何讓其獲得機器學習的能力?Imagination給出的方案顯得比較靠譜,那就是同時提供高性能的GPU和神經網絡加速器。
通過GPU來處理AI應用中的可視化操作,比如圖像識別和排序、手勢識別驅動接口以及實時視頻分析等。而神經網絡加速器NNA則用來為高級推理和邊緣數據處理提供硬件加速。如此一來,客戶可以根據自己的需求各取所需。
汽車行業“老司機”,Imagination能否對標Nvidia?
總結一下,此次發布會Imagination發布了針對AI和視覺的神經網絡硬件加速器PowerVR 3NX NNA;同時還發布了三款新品GPU,分別是PowerVR 9XEP、9XMP、9XTP,基本上從低端到高端應用需求全覆蓋。
另外,作為蘋果曾經的GPU供應商,Imagination在手機移動領域的市場地位非常高,目前采用Imagination相關IP的手機客戶每年發布上億顆芯片,可以說與ARM和高通三分天下。
不過隨著手機市場近些年的下滑趨勢,Imagination也在積極開拓新的市場,比如汽車市場。
Imagination Technologies銷售和市場營銷執行副總裁David McBrien表示,Imagination多年來一直在為汽車行業提供各種IP模塊,其實Imagination和TI、瑞薩等合作伙伴在汽車儀表盤領域已經占據50%的市場份額。
2018年PowerVR?的汽車硬件產品之一是PowerVR?8XT-A GPU,它支持SoC設計人員所需的增強恢復和可靠性功能,以獲得針對數字人機界面(HMI)和自動駕駛汽車的處理器的汽車安全認證(AVS)。Imagination打算通過量身定制的解決方案繼續擴展其PowerVR?汽車硬件IP產品組合,除了明年會推出另一款汽車級GPU IP之外,還將提供支持ASIL的NNA,而這又可以與PowerVR?8XT-A GPU和其他處理模塊混合搭配。
除此之外,Imagination還宣布推出PowerVR?Automotive完整產品套裝,以促進汽車半導體行業的增長和加速。PowerVR?Automotive結合了硬件知識產權(IP)、軟件、工具、文檔和長期支持五大基本要素,隨著汽車行業邁向全自動駕駛,其可支持市場中的現有客戶和新進入者以滿足行業的安全標準和性能要求。
很明顯,Imagination未來在汽車領域對標的是Nvidia,其未來目標是將GPU和NNA放入更多tear 1的汽車供應商采購列表中。
-
cpu
+關注
關注
68文章
10825瀏覽量
211151 -
神經網絡
+關注
關注
42文章
4762瀏覽量
100541 -
機器學習
+關注
關注
66文章
8377瀏覽量
132410
原文標題:弱AI時代,為什么Imagination的“GPU+NNA”方案更靠譜?
文章出處:【微信號:icsmart,微信公眾號:芯智訊】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論