得芯片者得天下。我們可以把這句話再延伸一下說(shuō),得AI芯片者得未來(lái)的天下。
對(duì)于智能終端廠商來(lái)說(shuō),能夠自研SoC芯片似乎才是頂級(jí)實(shí)力的象征。眾所周知,盤(pán)踞全球智能手機(jī)前三甲的三星、華為、蘋(píng)果,無(wú)一例外都擁有自研的SoC芯片。
(2020智能手機(jī)芯片跑分?jǐn)?shù)據(jù)TOP10)
現(xiàn)在,經(jīng)歷了多年的輔助AI芯片的經(jīng)驗(yàn)積累之后,谷歌終于要入場(chǎng)智能終端的核心硬件——SoC處理器芯片了。
據(jù)外媒Axois報(bào)告,谷歌在自研處理器方面取得了顯著進(jìn)步,最近其自主研發(fā)的 SoC 芯片已經(jīng)成功流片。
據(jù)悉,該芯片是谷歌與三星聯(lián)合開(kāi)發(fā),采用5nm工藝制造,“2+2+4”三架構(gòu)設(shè)計(jì)的8核CPU集群,以及搭載全新ARM公版架構(gòu)的GPU,同時(shí)在ISP和NPU上集成了谷歌Visual Core AI視覺(jué)處理器。這讓谷歌的終端芯片能夠更好地支持AI技術(shù),比如大幅提升谷歌助手的交互體驗(yàn)。
在上市計(jì)劃上,谷歌的這一SoC處理器芯片預(yù)計(jì)將于率先部署在下一代Pixel手機(jī)以及谷歌筆記本Chromebook中。
谷歌的這一舉動(dòng)被視為對(duì)蘋(píng)果自研處理器模式的靠攏,從“原生系統(tǒng)+最主流旗艦芯片”變?yōu)椤霸到y(tǒng)+自研芯片”,谷歌的用意肯定不僅是想擺脫高通芯片的鉗制,更重要的是想通過(guò)自研芯片實(shí)現(xiàn)更好的軟硬件結(jié)合,使得安卓系統(tǒng)在自家硬件上發(fā)揮更大的性能優(yōu)勢(shì)。
我們其實(shí)知道,自研芯片并不能在硬件利潤(rùn)上帶給谷歌更多的價(jià)值,其中最有價(jià)值的地方在于將谷歌AI上面的優(yōu)勢(shì)通過(guò)軟硬件的結(jié)合,在智能終端上得到更好的應(yīng)用。
我們也都知道,谷歌在AI芯片上入局最早,實(shí)力強(qiáng)勁。然而AI芯片的技術(shù)有多強(qiáng),AI技術(shù)和芯片研發(fā)有哪些相互促進(jìn)的關(guān)系?相信很多人還是不明就里的,而這正是我們接下來(lái)要去深入探究的。
從云端到終邊端,谷歌AI芯片的進(jìn)階之路
在谷歌的TPU(Tensor Processing Unit,張量處理單元)處理器推出之前,大部分的機(jī)器學(xué)習(xí)以及圖像處理算法一直都是跑在GPU與FPGA這兩種通用芯片上面的。而提出了深度學(xué)習(xí)開(kāi)源框架TensorFlow的谷歌則專(zhuān)門(mén)做出這樣一款為T(mén)ensorFlow算法設(shè)計(jì)的專(zhuān)用芯片。
TPU就這樣誕生了,然而讓TPU的聲名遠(yuǎn)播卻是在AlphaGo大戰(zhàn)李世石的人機(jī)圍棋賽。據(jù)說(shuō),當(dāng)時(shí)谷歌為T(mén)PU其實(shí)下了另一盤(pán)大棋的。因?yàn)樵谔魬?zhàn)李世石之前,AlphaGo是跑在1202個(gè)CPU和176個(gè)GPU上面與棋手樊麾比賽的。這讓看過(guò)對(duì)弈過(guò)程的李世石很有信心。然而在比賽前幾個(gè)月,AlphaGo的硬件平臺(tái)換上了TPU,這讓AlphaGo的實(shí)力很快得到成長(zhǎng),后面的對(duì)戰(zhàn)局勢(shì)讓李世石就吃盡了苦頭。
(谷歌TPU芯片)
TPU是一種專(zhuān)用集成電路(ASIC),作為專(zhuān)門(mén)在谷歌云使用的AI芯片,其使命就在于加速谷歌人工智能落地的速度。在2017年谷歌公布的第二代TPU上,其浮點(diǎn)運(yùn)算能力高達(dá)每秒180萬(wàn)億次,既可以用于推理,也可以用做訓(xùn)練。而到了2018年的TPU3.0版本,其計(jì)算性能相比TPU 2.0提升八倍,可達(dá)每秒 1000 萬(wàn)億次浮點(diǎn)計(jì)算。
此后,谷歌的AI布局逐漸走向邊緣側(cè)。在2017年的谷歌云服務(wù)年會(huì)上,正式發(fā)布其邊緣技術(shù),并推出了Google Edge TPU。
Edge TPU是谷歌專(zhuān)為在邊緣運(yùn)行TensorFlow Lite ML模型而設(shè)計(jì)的ASIC芯片。Edge TPU 可用于越來(lái)越多的工業(yè)使用場(chǎng)景,如預(yù)測(cè)性維護(hù)、異常檢測(cè)、機(jī)器視覺(jué)、機(jī)器人學(xué)、語(yǔ)音識(shí)別,也可以應(yīng)用于本地部署、醫(yī)療保健、零售、智能空間、交通運(yùn)輸?shù)雀鱾€(gè)領(lǐng)域。
Edge TPU體型小、能耗低,因此只負(fù)責(zé)AI加速判別、加速推算,僅為加速器、輔助處理器的角色,可以在邊緣部署高精度AI,是對(duì)CPU、GPU、FPGA 以及其他在邊緣運(yùn)行AI的ASIC解決方案的補(bǔ)充。
谷歌還在去年推出了基于Edge TPU芯片的等一系列開(kāi)發(fā)硬件,以及本地化AI平臺(tái)Coral,為邊緣側(cè)提供優(yōu)質(zhì)、易部署的AI解決方案。
盡管TPU和Edge TPU主要是對(duì)深度學(xué)習(xí)起到運(yùn)算推理加速的輔助服務(wù)器,但我們?nèi)匀荒軌蚩吹焦雀柙贏I芯片上的布局野心。從云端,到邊緣端和手機(jī)智能終端,正是理解谷歌AI芯片的內(nèi)在邏輯。
(Pixel Visual Core)
從2017年開(kāi)始,谷歌就在智能手機(jī)上陸續(xù)推出了定制的攝像頭芯片“Pixel Visual Core”和“Pixel Neuro Core”,并用在了 Pixel 2、Pixel 3 和 Pixel 4上。
Pixel Visual Core,是一種圖像處理單元(IPU),也是谷歌自研的第一款移動(dòng)芯片,專(zhuān)門(mén)用于加速相機(jī)的HDR+計(jì)算,其使用了機(jī)器學(xué)習(xí)和計(jì)算攝影,可以智能地修補(bǔ)照片不完美的部分,也使圖像處理更加流暢和快速。這也是很多人說(shuō)的谷歌手機(jī)的照片不是拍出來(lái)的,而是算出來(lái)的原因。
而到了去年,谷歌在Pixel 4上使用了Pixel Neural Core專(zhuān)用處理器來(lái)代替Pixel VIsual Core。神經(jīng)網(wǎng)絡(luò)算法可以使谷歌手機(jī)的相機(jī)鏡頭識(shí)別所拍攝的物體,然后既可以將數(shù)據(jù)交給圖像處理算法去優(yōu)化,也可以將數(shù)據(jù)輸出給谷歌助手進(jìn)行識(shí)別。同時(shí),Pixel Neural Core也可以讓谷歌助手進(jìn)行更復(fù)雜的人機(jī)對(duì)話,還有進(jìn)行離線的語(yǔ)音文本翻譯。
如果谷歌不是有著TensorFlow、Halide以及編譯器等AI算法和開(kāi)發(fā)軟件,谷歌的AI芯片的很多設(shè)計(jì)顯然是無(wú)法發(fā)揮太大作用的。軟硬件結(jié)合,才讓谷歌的芯片設(shè)計(jì)走得更為徹底和硬氣。
軟硬兼融,谷歌AI芯片快速迭代的硬氣底色
在互聯(lián)網(wǎng)公司的造芯賽道上,谷歌無(wú)疑是跑在最前面的一家。
據(jù)報(bào)道,早在2006年,谷歌就考慮在其數(shù)據(jù)中心部署 GPU或者 FPGA,或?qū)S眉呻娐贰6捎诋?dāng)時(shí)沒(méi)有多少要在專(zhuān)門(mén)硬件上運(yùn)行的應(yīng)用,因此使用谷歌大型數(shù)據(jù)中心的富余計(jì)算能力就能滿足算力要求。
而一直到2013年,谷歌已經(jīng)開(kāi)始推出基于DNN的語(yǔ)音識(shí)別的語(yǔ)音搜索技術(shù),用戶的需求使得谷歌數(shù)據(jù)中心的計(jì)算需求增加了一倍,這讓基于CPU的計(jì)算變得特別昂貴。因此,谷歌計(jì)劃使用現(xiàn)成的GPU用于模型訓(xùn)練,而快速開(kāi)發(fā)一款專(zhuān)用的集成電路芯片用于推理。
后來(lái)我們知道這一專(zhuān)用定制芯片就是TPU,而這一快速開(kāi)發(fā)的周期僅僅是15個(gè)月。基于軟件造芯,谷歌并非獨(dú)一家,但相比亞馬遜、Facebook來(lái)說(shuō),谷歌則一直有持續(xù)的芯片產(chǎn)品推出。谷歌能夠如此快速且高頻地進(jìn)行“硬件”輸出,那自然是有其“硬氣”的原因的。
首先一定是戰(zhàn)略上的重視。此前谷歌CEO皮猜就曾強(qiáng)調(diào),谷歌從來(lái)不是為硬件而硬件,背后的邏輯一定是AI、軟件和硬件一體,真正解決問(wèn)題要靠這三位一體。
其次就是人才的重視。以當(dāng)前谷歌這一消費(fèi)端的SoC芯片為例。此前這一項(xiàng)目對(duì)外界來(lái)說(shuō)早已是公開(kāi)的“秘密”。從2017年底,谷歌就開(kāi)始從蘋(píng)果、高通、英偉達(dá)等公司高薪挖“角”,其中包括蘋(píng)果A系列處理器著名的研發(fā)工程師John Bruno。但直到去年2月,谷歌才正式宣布在印度班加羅爾的組建了一支“gChips”芯片設(shè)計(jì)團(tuán)隊(duì),致力于谷歌智能手機(jī)和數(shù)據(jù)中心芯片業(yè)務(wù),未來(lái)還會(huì)在該地辦新的半導(dǎo)體工廠。消費(fèi)級(jí)芯片似乎只差臨門(mén)一腳了。
當(dāng)然,最重要的因素還在于谷歌在AI芯片上的創(chuàng)新優(yōu)勢(shì)。我們知道,AI芯片的研發(fā),本身是一個(gè)周期長(zhǎng)且耗費(fèi)巨大資金的項(xiàng)目。芯片設(shè)計(jì)到成品的周期可能趕不上AI算法的發(fā)展進(jìn)程。如何實(shí)現(xiàn)AI芯片的硬件設(shè)計(jì)與算法、軟件的平衡,成為谷歌設(shè)計(jì)芯片的關(guān)鍵優(yōu)勢(shì)。
而谷歌提出的解決方案則更值得稱(chēng)道,那就是用AI算法設(shè)計(jì)AI芯片。
具體來(lái)說(shuō),AI芯片設(shè)計(jì)存在著以下難題。首先是,3D芯片的放置,在受限區(qū)域中跨層級(jí)配置數(shù)百到上千的組件,工程師們需要手動(dòng)設(shè)計(jì)來(lái)進(jìn)行配置,并通過(guò)自動(dòng)化軟件進(jìn)行模擬和性能驗(yàn)證,這通常需要花費(fèi)大量時(shí)間。其次是,芯片的設(shè)計(jì)架構(gòu)趕不上機(jī)器學(xué)習(xí)算法或神經(jīng)網(wǎng)絡(luò)架構(gòu)的發(fā)展速度,導(dǎo)致這些算法架構(gòu)在現(xiàn)有的AI加速器上效果不佳。另外,盡管芯片的布局規(guī)劃的設(shè)計(jì)進(jìn)程在加快,但在包括芯片功耗、計(jì)算性能和面積等多個(gè)目標(biāo)的優(yōu)化能力上仍然存在限制。
為應(yīng)對(duì)這些挑戰(zhàn),谷歌的高級(jí)研究科學(xué)家Mirhoseini和團(tuán)隊(duì)研究人員Anna Goldie提出了一種神經(jīng)網(wǎng)絡(luò),即將芯片布局建模轉(zhuǎn)化為強(qiáng)化學(xué)習(xí)問(wèn)題。
與典型的深度學(xué)習(xí)不同,強(qiáng)化學(xué)習(xí)系統(tǒng)不會(huì)使用大量標(biāo)記的數(shù)據(jù)進(jìn)行訓(xùn)練。相反,神經(jīng)網(wǎng)絡(luò)會(huì)邊做邊學(xué),并在成功時(shí)根據(jù)有效信號(hào)調(diào)整網(wǎng)絡(luò)中的參數(shù)。在這種情況下,有效信號(hào)成為降低功率、改善性能和減少面積組合的替代指標(biāo)。結(jié)果就是,系統(tǒng)執(zhí)行的設(shè)計(jì)越多,其效果就會(huì)越好。
在對(duì)芯片設(shè)計(jì)進(jìn)行了足夠長(zhǎng)時(shí)間的學(xué)習(xí)之后,它可以在不到24小時(shí)的時(shí)間內(nèi)為谷歌Tensor處理單元完成設(shè)計(jì),而且在功耗、性能、面積都超過(guò)了人類(lèi)專(zhuān)家數(shù)周的設(shè)計(jì)成果。研究人員說(shuō),這一系統(tǒng)還向人類(lèi)同行教授了一些新技巧。
最終,谷歌團(tuán)隊(duì)希望像這一AI系統(tǒng)能達(dá)到“在同一時(shí)間段內(nèi)設(shè)計(jì)更多的芯片,以及運(yùn)行速度更快,功耗更低,制造成本更低,外形體積更小的芯片”這一目標(biāo)。
意在未來(lái),谷歌SoC芯片集成的AI野心
這一次谷歌自研的終端處理器SoC芯片,其本質(zhì)上還是谷歌AI芯片的延伸。
細(xì)心的人們應(yīng)該已經(jīng)發(fā)現(xiàn),這次的SoC芯片并不是完全出自谷歌研發(fā)團(tuán)隊(duì),而是選擇了與三星展開(kāi)了合作。從媒體的曝光看,谷歌這次的手機(jī)主控會(huì)采用5nm制程、Cortex-A78大核、核心數(shù)多達(dá)20個(gè)的新GPU,而這些恰好就是三星Exynos 1000的特征。所以,這款三星堆料的芯片,最主要的“谷歌元素”就是在ISP和NPU上應(yīng)用了谷歌自家設(shè)計(jì)的AI芯片。
這一選擇自然有著谷歌充分的考慮和一些明顯的優(yōu)勢(shì),但也存在著一些不利的影響。
最直觀的好處就是加快了谷歌的手機(jī)端SoC芯片的研制速度,降低對(duì)高通處理器的依賴(lài),并可以迅速應(yīng)用到下一代谷歌pixel手機(jī)上。
另外一個(gè)好處是,谷歌主導(dǎo)的芯片設(shè)計(jì)將使得谷歌像蘋(píng)果一樣建成自己的封閉系統(tǒng)。谷歌最硬核之處就在于擁有龐大的數(shù)據(jù)和AI算法。伴隨著應(yīng)用層面不斷豐富的數(shù)據(jù)體驗(yàn)和AI體驗(yàn),比如在飛行模式下實(shí)現(xiàn)語(yǔ)音實(shí)時(shí)轉(zhuǎn)錄文字的功能,手機(jī)的硬件性能以及系統(tǒng)的兼容支撐就可能成為智能手機(jī)的性能天花板。如何在安卓系統(tǒng)中將處理器性能發(fā)揮到最大,可能沒(méi)有誰(shuí)比谷歌更清楚了。
畢竟前面幾款谷歌Pixel手機(jī)的市場(chǎng)表現(xiàn)都不溫不火,盡管其在拍攝算法和AI助手等應(yīng)用上面極具優(yōu)勢(shì),但在終端的外觀設(shè)計(jì)、屏幕、攝像頭、電池等硬件配置上一直存在“短板”,難以和全球幾家主流終端玩家的旗艦機(jī)型媲美。想必應(yīng)用了最新一代的SoC芯片的新款Pixel機(jī)型的定價(jià)也將非常“高端”,但在硬件上的“偏科”,可能仍然會(huì)影響其整體的市場(chǎng)表現(xiàn)。
此外,由于這是一款全新的“非主流”芯片,也會(huì)對(duì)游戲、軟件開(kāi)發(fā)者而言,不再成為“軟件開(kāi)發(fā)樣板機(jī)”的首選測(cè)試機(jī)型。
無(wú)論如何,這一集成了深度學(xué)習(xí)性能的SoC芯片,將為谷歌爭(zhēng)奪未來(lái)的AI市場(chǎng)做好準(zhǔn)備,幫助谷歌、在移動(dòng)終端上將語(yǔ)音識(shí)別、圖像處理等AI應(yīng)用的性能發(fā)揮到極致,提早一步占領(lǐng)真正的智能終端的領(lǐng)導(dǎo)者位置。
無(wú)論怎樣,谷歌的造“芯”舉動(dòng),一定會(huì)對(duì)上游芯片廠商以及智能終端廠商帶來(lái)正面沖擊。如果通過(guò)“Whitechapel”證明了谷歌的“造芯”戰(zhàn)略的成功,那么谷歌距離蘋(píng)果的差距還有多少呢?
自研芯片、安卓系統(tǒng)疊加最新AI計(jì)算能力,如果再補(bǔ)足硬件配置的短板,那么谷歌極有可能打造一個(gè)安卓生態(tài)圈的軟硬件完美適配的閉環(huán)系統(tǒng)。
最后,我們發(fā)現(xiàn)一個(gè)比較令人疑惑的細(xì)節(jié)。此次芯片的代號(hào)為“Whitechapel”,名為“白教堂”。如果熟悉英美劇的讀者們,可能會(huì)看過(guò)一部名為《白教堂血案》的英劇。如果不是非要過(guò)度解讀的話,我們可以理解為某位重要研發(fā)者喜歡這部驚悚懸疑劇,所以以此來(lái)命名。如果非要“過(guò)度”解讀一下的話,谷歌可能是想用一個(gè)百年未解的“謎團(tuán)”來(lái)預(yù)示著智能終端的AI應(yīng)用的紛爭(zhēng)的開(kāi)場(chǎng)。
當(dāng)然,這個(gè)答案也許還得等谷歌的新的Pixel手機(jī)上市才能揭曉。
-
谷歌
+關(guān)注
關(guān)注
27文章
6142瀏覽量
105115 -
視覺(jué)處理器
+關(guān)注
關(guān)注
0文章
54瀏覽量
17107 -
AI芯片
+關(guān)注
關(guān)注
17文章
1860瀏覽量
34919
原文標(biāo)題:從云到端,谷歌的AI芯片2.0
文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論