如今生成式AI帶火了整個(gè)AI產(chǎn)業(yè),尤其是各大廠商扎堆于大模型的AI訓(xùn)練,不過(guò)很多AI應(yīng)用的落地則在邊緣端。換句話說(shuō),移動(dòng)設(shè)備的AI如何實(shí)現(xiàn),是非常關(guān)鍵的問(wèn)題。Arm前不久推出了全新的2023 全面計(jì)算解決方案 (TCS23)持續(xù)引領(lǐng)這樣的應(yīng)用趨勢(shì)。在最近,Arm高級(jí)副總裁兼終端事業(yè)部總經(jīng)理Chris Bergey接受媒體采訪,分享了Arm對(duì)移動(dòng)AI發(fā)展的看法以及Arm如何賦能等話題。
Arm成立于1990年,是由Acorn Computers、蘋(píng)果和VLSI Technology這三家公司共同成立的一家合資企業(yè),從一開(kāi)始就聚焦于高能效的計(jì)算,致力于未來(lái)的移動(dòng)發(fā)展和演進(jìn),最早采用Arm技術(shù)的是 Apple Newton,自此移動(dòng)已經(jīng)發(fā)生了翻天覆地的變化,這也使得Arm架構(gòu)成為當(dāng)今全球應(yīng)用最廣泛的移動(dòng)計(jì)算平臺(tái)基礎(chǔ)架構(gòu)。
今天,全球已有 70% 的人群正使用基于Arm架構(gòu)的產(chǎn)品和服務(wù)。 迄今為止,Arm的合作伙伴已經(jīng)交付了超過(guò) 2500 億顆基于 Arm架構(gòu)的芯片。
TCS23助力移動(dòng)AI克服應(yīng)用挑戰(zhàn)
在Arm 2023全面計(jì)算解決方案(TCS23)中,全新Armv9 Cortex計(jì)算集群已連續(xù)三年實(shí)現(xiàn)兩位數(shù)的性能提升。其中,新的 Cortex-X4 是第四代 Cortex-X 內(nèi)核,是 Arm迄今為止打造的最快速的 CPU,與 Cortex-X3 相比,其性能提高 15%,基于相同工藝的全新高能效微架構(gòu)可降低功耗達(dá) 40%。
在我們此前的報(bào)道中也介紹過(guò),TCS23方案在GPU、總線、DSU等都實(shí)現(xiàn)了性能和能效的大幅提升。值得一提的是,正是因?yàn)槿嬗?jì)算性能的提升,才能夠更好地支持移動(dòng)設(shè)備的AI應(yīng)用,實(shí)際上很多AI的運(yùn)算都需要CPU或者GPU的配合才可以更好地實(shí)現(xiàn)。
在談到移動(dòng)AI體驗(yàn)需要克服哪些挑戰(zhàn)時(shí),Chris Bergey分析說(shuō)主要有三方面。即如何實(shí)現(xiàn)高能效計(jì)算,內(nèi)存帶寬以及如何高效支持AI 的軟件棧。在過(guò)去的兩年,Arm處理器和 GPU 的性能提升讓 AI處理能力翻了一番,這主要是通過(guò)對(duì) AI 專用的數(shù)據(jù)集的指令優(yōu)化與支持。
在內(nèi)存帶寬方面,Arm大幅增加了在支持架構(gòu)中的緩存大小,并且通過(guò)縮小芯片的面積來(lái)減少延遲、強(qiáng)化互聯(lián)。
多年來(lái),Arm傾力打造了繁榮的軟件生態(tài)系統(tǒng),基于 Arm 架構(gòu)、為Arm 架構(gòu)應(yīng)用進(jìn)行開(kāi)發(fā)的開(kāi)發(fā)者已達(dá)到1500萬(wàn)名。通過(guò)持續(xù)與行業(yè)領(lǐng)先廠商,比如,谷歌、騰訊等公司進(jìn)行合作,共同賦能高效的技術(shù)庫(kù),藉由開(kāi)源形式,讓這些軟件技術(shù)庫(kù)能觸及更廣泛的生態(tài)系統(tǒng),特別是國(guó)內(nèi)垂直領(lǐng)域的一些公司,可以獲得收益。這一生態(tài)系統(tǒng)為更廣泛的社區(qū)提供平臺(tái),可以通過(guò)基于Arm 的硬件一起打造AI 解決方案。
移動(dòng)設(shè)備部署機(jī)器學(xué)習(xí)越來(lái)越廣泛
手機(jī)上部署的機(jī)器學(xué)習(xí)往往應(yīng)用于AI邊緣推理,比如手機(jī)的面部識(shí)別、圖像增強(qiáng)、濾鏡、AR 等等,都是AI 推理應(yīng)用在終端上的體現(xiàn)。正如Chris Bergey所言,一些大型的模型訓(xùn)練會(huì)在云端進(jìn)行,但是出于功率、隱私保護(hù)和延遲等多方面的考量,更多的AI 應(yīng)用和訓(xùn)練都將在數(shù)據(jù)存在之處進(jìn)行,也就是傳感器獲取數(shù)據(jù)的地方。
AI 和傳感器結(jié)合可以發(fā)揮非常強(qiáng)大的作用。例如,攝像頭+AI通過(guò)觀察用戶走路或者說(shuō)話的行為在早期預(yù)判未來(lái)可能出現(xiàn)的疾病。
再比如,從智能手機(jī)(Google Pixel 7的實(shí)時(shí)字幕、虛擬助手)到家用自動(dòng)化設(shè)備,包括AmazonEcho的語(yǔ)音助手、集成 AI 功能的冰箱等,既能實(shí)現(xiàn)智能化,又可達(dá)到節(jié)能目標(biāo),另外還有應(yīng)用于智慧城市的交通管理,可以減少交通擁堵,讓整個(gè)城市更加安全,降低更多能耗。
與中國(guó)廠商保持生態(tài)系統(tǒng)的共建
Chris Bergey認(rèn)為,隨著處理器性能的越發(fā)提升,更多類似的應(yīng)用會(huì)應(yīng)運(yùn)而生,而中國(guó)則是產(chǎn)生下一代應(yīng)用最具有創(chuàng)新性的地方。因此Arm一直與中國(guó)的生態(tài)系統(tǒng)保持緊密的合作。
據(jù)介紹,在人才培養(yǎng)方面,Arm與很多大學(xué)以及行業(yè)、合作伙伴主導(dǎo)的一些產(chǎn)業(yè)聯(lián)盟等機(jī)構(gòu)合作,開(kāi)展了很多人才聯(lián)合培養(yǎng)的項(xiàng)目,比如2023 年的AICAS 挑戰(zhàn)賽、開(kāi)源之夏、百度飛槳黑客松。
Arm還參與了很多本地的開(kāi)源社區(qū)和項(xiàng)目,比如TARS 項(xiàng)目和龍蜥社區(qū) (OpenAnolis)等,通過(guò)自身參與全球開(kāi)源社區(qū)的專業(yè)知識(shí),推動(dòng)本土的生態(tài)系統(tǒng)。
此外,還將一些全球的技術(shù)進(jìn)行本地化,讓中國(guó)的生態(tài)系統(tǒng)更易于采用。比如把Arm虛擬硬件(Arm Virtual Hardware, AVH)整合到百度飛槳的PaddlePaddle模型中。
Arm不斷賦能本地的創(chuàng)新能力。就在MWC上海展期間,Arm宣布與聯(lián)想合作成立在中國(guó)第一個(gè)5G 解決方案實(shí)驗(yàn)室;并與本土電信運(yùn)營(yíng)商等生態(tài)系統(tǒng)合作伙伴一起開(kāi)展 PoC 項(xiàng)目。
小結(jié):
作為全球領(lǐng)先的IP提供商,Arm已經(jīng)看到智能計(jì)算在邊緣端勢(shì)不可擋的應(yīng)用趨勢(shì),Arm 2023全面計(jì)算解決方案(TCS23)已經(jīng)前瞻性地以高性能助推AI應(yīng)用的普及,令更多AI 的應(yīng)用成功高效運(yùn)行在Arm架構(gòu)之上。
-
ARM
+關(guān)注
關(guān)注
134文章
9046瀏覽量
366815 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8377瀏覽量
132407
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論