開門見山,這一點就是:AI,準確講是Edge AI。這兩天,想必有關聯發科最新發布Helio P90的信息已經刷屏,電子發燒友也已在第一時間發布了這顆芯片的官方新聞。有關該芯片的基本信息下面會再簡單介紹一下,但這里要重點梳理的則是聯發科希望發力的Edge AI——邊緣計算,及其相關生態合作者們對于AI的觀點。
性能的關鍵
從聯發科這次以“AI不釋手”為主題進行發布不難看出,Helio P90最大亮點就是其升級了的AI內核——APU2.0,這個內核采用融合AI(fusion AI)架構,算力較前代提高了4倍,性能達到1127GMACs(2.25TOPs)。P90為12nm制程工藝,采用8核架構,集成了2個主頻2.2GHz的ARM A75處理器,和6個主頻2.0GHz的ARM A55處理器,GPU采用了Imagination的PowerVR GM 9446。這里不妨把競品華為麒麟980、高通驍龍855、和蘋果A12的關鍵配置也羅列一下,因為此次發布會現場的演示基本上是和這幾家公司的芯片在PK。
麒麟980采用的是7nm制程工藝,CPU采用4+4的8核架構,分別是4個主頻2.8GHz的ARM A76+4個主頻1.78GHz的ARM A55,GPU是華為的自主架構,支持GPU Turbo技術。在AI方面,麒麟980的NPU用的是寒武紀第二代NPU 1M(擁有2Tops、4Tops、8Tops 三種算力的內核)。
驍龍855采用了7nm制程工藝,CPU采用了新的1+3+4的8核架構,分別是1個主頻2.84GHz的ARM A76大核,3個主頻2.42GHz的ARM A76中核,還有4個主頻1.806GHz的ARM A55小核。GPU方面用的是Adreno 640。AI方面,驍龍855沒有獨立NPU,而是在DSP中內置了一枚張量處理器(張量處理器可以對復雜的圖形用更快的速度解析,并能夠更快速的深度學習)。AI算力為7TOPs。
A12的CPU采用了2個代號為“Vortex(旋風)的大內核和4個代號為“Tempest(暴風)”的小內核。A12在單大核滿載時的最高頻率分別為2.5GHz;雙大核滿載頻率為2.38GHz。而在小核心加入工作后,A12的大核頻率為2.38GHz。在單小核啟動時,為1.587GHz;啟動兩顆和三顆時為1.562GHz;而在四顆小核滿載時,為1.538GHz。GPU用的是自家內核,代號為“G11P”。AI方面,A12搭載了8核NPU(也是采用了張量處理器),AI算力是5TOPs。
這里可以注意一下算力單位,Helio P90突出的是GMACS,即每秒10億次的定點乘法累加運算(MACS是衡量計算機定點處理能力的量,這個量經常用在那些需要大量定點乘法累加運算的科學運算中),競品則是TOPs,即10萬億次操作/秒,是處理器性能指標。如果單從TOPs指標看,由于Helio P90用的是A75而非競品的A76,所以看起來并不具有優勢。但從現場演示場景應用的對比的綜合表現看,Helio P90都勝過上述競品(還要考慮工藝制程的不同),所以,APU2.0和聯發科最新的CorePilot技術才是關鍵,CorePilot技術下面還會提到。先來看聯發科發布的幾個對比資料。
圖:P90的綜合性能與競品的比較
圖:P90的跑分大幅領先競品
圖:針對AI算力的比較
圖:邊緣計算的挑戰
演示的對比
俗話說眼見為實,耳聽為虛。聯發科這次在發布現場準備的演示項目大都有和搭載競品芯片的手機來進行比較,直觀地展示了Helio P90在AI、ISP等核心能力上的優勢。下面我們就來看看它的具體表現。
圖:這張圖的潛臺詞是說專用AI核比無專用的在算力和功耗上要有很大優勢
圖:智能陽光屏
這是一個區域圖像處理功能,由純硬件方式實現,可以根據外部光線的強弱自動精準和平衡的對圖像的高光和暗場進行提升和抑制,這就節省了功耗和運算量。這個功能和HDR 10+類似,而目前多數設備還是采用的HDR 10,Helio P90的這個技術可以使HDR 10的設備具備類似HDR 10+的顯示效果。
圖:視頻增強功能
該功能也是純硬件方式實現,功耗可以很低。對比的競品(高通驍龍845,DSP處理),功耗是7.89mA,Helio P90則只有1.87mA。
圖:P90的ISP-AI引擎提供了出色的降噪性能
圖:杜比全景聲
杜比全景聲(Dolby Atmos)大家都比較熟悉了,現在的好萊塢電影中大部分都采用了這個影院音頻技術,所以線上視頻片源基本也都用的這個技術,三星、華為、聯想、中興等的最新產品也都已配置Dolby Atmos,P90這次也搭載了該技術。
圖:AI實時多物件識別
這個功能體現了P90的AI引擎APU2.0的算力,如果用CPU來處理,一般只能同時識別3-5種對象,而APU2.0可以同時框出10種以上對象。這個算法是MALONG(碼隆科技)提供,之前多用于云端處理,P90的搭載使之用于邊緣計算,從現場演示看,比云端處理(華為手機)快3-5秒。
AI實時虛擬化身。目前手機拍攝的虛擬效果基本上是采用雙攝或者ToF(景深相機)方法來實現,P90則是依靠APU2.0的算力,通過3D姿態識別算法來實現(單攝即可),可以實時結合AR場景,增強人機互動的效果。
圖:AI實時美體
美顏相機功能已是智能手機標配,P90利用APU2.0的算力,可以實時偵測22個骨骼追蹤點,達到美顏效果。這個算法是Face ++(曠視科技)提供的,從現場演示效果看,五短秒變修長,真是幸福來得太突然啊。
圖:AI 3D實時人體姿態追蹤
這個功能多用于體感游戲、3D試衣等對三維空間動作要求高的場景,難點在于3D骨骼點比2D骨骼點多一個深度維度的信息。P90這個技術是聯發科的數據集結合Face ++的深度算法一起來實現的(普通2D攝像頭即可)。從現場演示效果看,30FPS的圖像,模特和機器人(藍牙實時傳送數據)的動作完全同步,在手機設備上能實現這樣的功能,主要是得益于搭載了APU2.0,這個應用未來的想象空間很大。
圖:APU2.0較前一代在2D/3D成像性能上有很大提升
圖:AI人臉偵測
目前,這個功能大多數是通過第三方軟件的方式來實現。P90(支持超大的48MP攝像頭或24+16MP雙攝像頭)則是通過其全新的ISP-AI引擎的硬件方式實現這一功能,在功耗和響應速度上都有明顯優勢。從現場演示看,其偵測速度要快過搭載A12和一家7nm工藝芯片(高通曉龍855或華為麒麟980?)的手機。
P90在圖像處理上性能提升很多,其中ISP-AI引擎是專為提供AI拍攝體驗而設計的,能夠處理14位RAW和10位YUV,單次曝光就能充分保留影像動態范圍的信息。能夠在弱光和運動條件下實時準確地檢測人臉和場景。其三核ISP可同時開啟,支持三焦段光學變焦的無縫切換,目前還沒有其他ISP具有這種功能。
圖:AI人像留色
這個功能多用于直播之類的視頻,可以突出主體,減少資源消耗。由于有APU2.0,該功能需要的加速和浮點定點運算和實時留色得到了很好的支持。從現場演示效果看,FHD@30FPS實時圖像留色穩定,不掉幀。這個算法由商湯提供。
圖:P90在通信性能上也做了升級
除了在AI和ISP方面的性能大幅提升外,作為手機處理器,Helio P90在通信性能上也做了升級,包括支持雙4G SIM卡雙VoLTE,Cat-12(DL)/Cat-13(UL)LTE網絡標準,支持4x4MIMO和256QAM,集成2x2802.11ac和藍牙5.0。
觀點的觀照
從P60開始,聯發科就把AI作為戰略重心,這次發布P90,其AI生態的友商們也集體曝光站臺。通過梳理聯發科和其AI生態友商們的觀點,我們可以進一步了解AI和Edge AI目前所處的發展態勢。
聯發科技總經理陳冠州:毫無保留的擁抱新科技和追求永無止境的用戶體驗是聯發科的兩個理念,Helio P90的推出意味著,從此評價一個手機的性能不再僅僅是CPU、GPU兩個維度,APU將成為一個新的關鍵。
聯發科技資深副總經理兼技術長周漁君:不是所有的應用場景都適合云計算,邊緣計算才是更多場景應用所需要的,云計算結合邊緣計算是最好的方式。Edge AI的殺手級應用無處不在:小視頻、拍攝畫質的優化提升、圖像虛化的切片處理等等都需要AI算力的支持。
聯發科無線通訊事業部產品規劃暨營銷資深總監李彥輯:Helio P90的AI引擎APU2.0擁有強大的算力,在ISP部分也做了AI的優化,較之前代產品,CPU單核性能提升了30%,多核提升15%,GPU提升了50%,算力提升了4倍,功耗降了50%,總帶寬占用降低50%。在支持第三方Edge AI的開發上,聯發科的Neuro Pilot 2.0 SDK除了可以完全兼容谷歌Android Neural Networks API(Android NNAPI)的平臺,還提供完整的開發工具,開發者可以充分利用TensorFlow、TF Lite、Caffe和Caffe2等業界常用框架結合HelioP90研發AI創新應用程序。
圖:Neuro Pilot 2.0 提供完整的Edge AI開發環境
聯發科技無線通信事業部總經理李宗霖:聯發科技最新的CorePilot技術確保芯片能夠以最高效的方式在八核之間實現運算資源的最優配置,確保了HelioP90能夠充分發揮八核架構優勢,能夠以最低功耗為用戶提供最高性能,將電池壽命與隨需供電完美結合。
谷歌AI暨相機事業部產品群經理Brahim Elbouchikhi:智能設備的發展正在從移動優先向AI優先轉變。移動優先要考慮的是設備小型化、觸控、無處不在的連接性和低功耗;AI優先考慮的重點是自我學習能力、自適應、快速計算、能夠感知情境和高可靠性。過去幾年,AI的發展演進沿著學習-預測-自主判斷-自動決策這個方向進行。移動AI的的演進方向則是圖像識別轉文字,文字轉語音,字符段的判斷等。其中的難點在于數據模型要不斷迭代和優化。
圖:谷歌針對移動AI開發的平臺資源
該平臺包括底層平臺Android Neural Networks API(Android NNAPI),支撐上層的各種機器學習框架完成推理計算,構建和訓練模型;TensorFlow Lite,用于開發者在移動設備上部署人工智能;其Firebase移動開發平臺的跨平臺機器學習工具ML Kit。
微軟亞洲研究院副院長潘天佑:計算機視覺是十分艱巨的課題,直到2015年,微軟北京研究院才實現識別錯誤率在3.5%的水平,首次超過人類的準確率。語音技術也是一個艱巨的課題,今年微軟研究院實現了SQuAD語音測試88.5%的識別率,在翻譯上實現了一般翻譯員水平的級別。
據悉,搭載P90的終端產品預計將在2019年第一季度上市。而Edge AI作為聯發科面向未來的重要布局,其戰略意義和目標也絕不僅僅是手機這個市場,預計在2019年,聯發科會有其他方面的AI應用落地。
評論
查看更多