電子發(fā)燒友網(wǎng)報道(文/黃晶晶)邊緣AI應(yīng)用需要更多的高性能計算和算力的支持,AMD的Versal和Zynq系列產(chǎn)品一直支持醫(yī)療、交通、智能零售、智能工廠、智能城市等領(lǐng)域的邊緣AI落地。最近,AMD宣布擴展 AMD Versal? 自適應(yīng)片上系統(tǒng)( SoC)產(chǎn)品組合,推出全新第二代 VersalAI Edge系列和第二代 VersalPrime系列自適應(yīng) SoC,其將預(yù)處理、AI 推理與后處理集成于單器件中,能夠為 AI 驅(qū)動型嵌入式系統(tǒng)提供端到端加速。
AI驅(qū)動型嵌入式系統(tǒng)的三個階段
在嵌入式系統(tǒng)中,預(yù)處理、AI推理、后處理是AI驅(qū)動型嵌入式系統(tǒng)的三個重要階段。
在預(yù)處理器部分,主要是各類傳感器包括毫米波雷達、激光雷達、攝像頭等進行處理與融合、數(shù)據(jù)調(diào)節(jié)等等。可編程邏輯能夠非常靈活,實時地支持各類傳感器接口,保證低延時、穩(wěn)定運算,并且在現(xiàn)場部署之后還能夠升級。
在推理過程當(dāng)中一般使用矢量處理器,市場上已有很多類型。在后處理階段,通常使用高性能的嵌入式CPU。
另外,也可以通過第一代Versal AI Edge系列產(chǎn)品當(dāng)中的可編程邏輯來做預(yù)處理,用矢量處理或者人工智能引擎來做推理。但是在后處理過程需要加上外部的處理器。無論如何,此前還沒有哪一類處理器能夠針對這三個階段進行優(yōu)化。
AMD自適應(yīng)與嵌入式計算事業(yè)部( AECG) Versal產(chǎn)品營銷總監(jiān)Manuel Uhm分析,采用多顆芯片會給整個嵌入式系統(tǒng)帶來諸多限制。例如更高的功率、供電復(fù)雜性、更高的占板面積和終端系統(tǒng)尺寸,以及更高的內(nèi)存要求,芯片間通信帶來的時延,更多安全漏洞和故障點,還有板卡設(shè)計的工作量等。
此次,AMD嵌入式系統(tǒng)的單芯片智能性方案推出兩個系列的產(chǎn)品,第二代Versal AI Edge系列,面向AI驅(qū)動型嵌入式系統(tǒng);以及第二代Versal Prime系列,面向經(jīng)典嵌入式系統(tǒng)。較上一代產(chǎn)品,采用下一代AI引擎帶來高達3倍的每瓦TOPS,采用全新高性能集成CPU帶來高達10標的標量計算。通過AMD可編程邏輯實現(xiàn)世界領(lǐng)先的自適應(yīng)計算。
第二代Versal自適應(yīng)SoC——單芯片智能性
第二代Versal自適應(yīng)SoC單芯片就能實現(xiàn)三個階段的加速。具體來看,預(yù)處理階段,AMD可編程邏輯進行傳感器融合和數(shù)據(jù)調(diào)節(jié)。此外還加入新的硬圖像和視頻處理,無需可編程邏輯進行處理。
下一代AI引擎AIE-ML v2可以實現(xiàn)高達3倍的每瓦TOPS,實現(xiàn)高效AI推理。基于AMD的VitisAI開發(fā)環(huán)境進行快速部署,開發(fā)者可以使用他們原本非常熟悉的開源工具,比如說PyTorch、TensorFlow等等在Vitis中進行優(yōu)化、推理。
有了AI引擎的加持,可以支持更多的數(shù)據(jù)類型,支持不同的精度和吞吐量,比如支持共享指數(shù)數(shù)據(jù)類型,可以在提高吞吐量的情況下不減損它的精準度。
AMD自適應(yīng)與嵌入式計算事業(yè)部 Versal AI Edge系列高級產(chǎn)品線經(jīng)理Steph Gauthie分析,二代Versal AI Edge系列器件中的DenseTOPS,以數(shù)據(jù)類型MX6來看,算力最高達到370TFLOPS。如果采用稀疏度計算,性能可以翻番,同時它還可以達到370TFLOPS。以INT8來看最高端可以做到184TOPS。另外,采用AIE-MLv2,還能夠做一些數(shù)據(jù)信號的處理,比如說FIR、FFT等等。
CPU性能大幅提升,實現(xiàn)高達10倍的標量計算。集成2-8個CortexA78AE內(nèi)核,每核心最高頻率高達2.2GHz,以及高達200.3K的DMIPS算力。10個ArmCortex-R52實時處理器。每核心最高頻率高達1.05GHz,高達28.5K的DMIPS算力。
考慮到邊緣計算對于信息安全和功能安全的要求,還能夠支持ASIL D、SIL 3等級規(guī)格,可應(yīng)用于自動駕駛和工業(yè)領(lǐng)域。
Steph Gauthie舉例,在高級自動駕駛輔助系統(tǒng)L2和L3中,作為單芯片域控制器與前一代AIEdge相比在相近的功率資源下圖像處理能力增加4倍。
此外,智慧城市的攝像頭系統(tǒng)中,與前一代AIEdge相比每路視頻流占板面板縮小65%。應(yīng)用于專業(yè)的音視頻和廣播的視頻流,與Zyng MPSoC相比,能夠提供2倍的視頻處理能力,每路視頻流占板面積縮小35%。
總之,第二代Versal系列產(chǎn)品面向AI驅(qū)動型及經(jīng)典嵌入式系統(tǒng)的中央計算。
已應(yīng)用于汽車視覺系統(tǒng)等
在基于攝像頭的3D感知視覺案例中,我們可以看到數(shù)據(jù)預(yù)處理完成后被傳輸?shù)紸I引擎,利用3D模型比如BEVFormer俯瞰視覺模型進行處理,再到應(yīng)用處理單元進行行為模式的規(guī)劃或?qū)崟r傳感。
目前第二代VersalAI Edge系列產(chǎn)品已經(jīng)應(yīng)用于汽車廠商斯巴魯?shù)腅yeSight視覺系統(tǒng),可以支持碰撞前制動、車道偏離預(yù)警、自適應(yīng)巡航控制和車道保持輔助。
第二代VersalAI Edge系列產(chǎn)品能夠支持先進的數(shù)據(jù)類型、確保處理的低時延、高吞吐量以及高精度,還支持ISO26262功能安全等。利用可編程邏輯的靈活性,斯巴魯?shù)南乱淮鶨yeSight系統(tǒng)可以實時修改攝像頭的傳感器參數(shù),從而助力斯巴魯強化車輛的安全性,并力爭實現(xiàn)2030年沒有致命道路事故的安全目標。
據(jù)悉,客戶現(xiàn)在就可以采用第一代評估板和設(shè)計工具展開設(shè)計。第二代VersalAI Edge系列和第二代Versal Prime系列產(chǎn)品的芯片樣片將于2025年上半年發(fā)布,評估套件和系統(tǒng)模塊將于2025年年中推出,量產(chǎn)芯片將于2025年末面世。
小結(jié):
以汽車領(lǐng)域來看,汽車電子電氣架構(gòu)的演進突顯了中央計算平臺的重要性。當(dāng)前業(yè)內(nèi)不少企業(yè)也推出了車載中央計算芯片,不過相比之下,AMD第二代Versal AI Edge系列產(chǎn)品,是一顆芯片覆蓋了預(yù)處理、AI推理以及后處理這三個階段,AMD也是全球少數(shù)幾家擁有預(yù)處理可編程邏輯能力的公司,從而能夠把可編程邏輯的優(yōu)勢去融合到一個芯片當(dāng)中。
Manuel Uhm表示,AMD第二代Versal自適應(yīng)SoC平臺的設(shè)計考慮到未來五年的需求恐將飛速變化,具有較好的靈活性和伸縮性,提供廣泛的性能和算力支持,如此才能應(yīng)對不斷變化的市場應(yīng)用。
-
amd
+關(guān)注
關(guān)注
25文章
5449瀏覽量
133958 -
AI
+關(guān)注
關(guān)注
87文章
30239瀏覽量
268472
發(fā)布評論請先 登錄
相關(guān)推薦
評論