作者:Kenton Williston
人工智能 (AI)、機器學習 (ML) 和其他計算密集型工作負載在物聯網(IoT) 網絡邊緣的興起,給微控制器 (MCU) 帶來了額外的處理負載。處理這些新的工作負載會增加功耗,盡管要求設計人員盡量降低功耗并加快產品上市時間。
設計人員需要一個計算選項,既能保持 MCU 的效率,又能增加專為低功耗應用定制的高性能功能。這一選項還應保留與傳統 MCU 相關的簡單部署模式,同時增加足夠的功能,以支持 AI 和 ML 帶來的復雜應用,如語音控制和預見性維護。
本文討論了推動 AI 和 ML 需求的因素,解釋了為什么需要新型處理器架構來高效地實現這些功能。然后介紹 Renesas 的 RA8M1 系列 MCU,并說明如何利用其來滿足這些要求。
邊緣 AI 和 ML 的要求
從樓宇自動化、工業設備到家用電器,邊緣物聯網應用對 AI 和 ML 的需求與日俱增。現在,即使是相對較小、功耗較低的嵌入式系統,也要承擔關鍵詞識別、語音命令控制和音頻/圖像處理等工作任務。目標應用包括傳感器中樞、無人機導航和控制、增強現實 (AR)、虛擬現實 (VR) 和通信設備。
為了最大限度地減少能耗、開銷和延遲,同時確保隱私,在邊緣處理數據通常比將數據發送到云更可行。這對設計人員來說具有挑戰性,因為邊緣設備往往資源有限,特別是在采用電池供電的情況下。
用于邊緣計算的增強型 MCU
AI 和 ML 工作負載通常包含在大型數據集中重復執行相同的數學運算。這些工作負載適合使用單指令、多數據 (SIMD) 處理進行加速。SIMD 可并行執行多個數學運算,與傳統處理方式相比,吞吐量更多,能效更高。
由于傳統 MCU 缺乏 SIMD 功能,因此無法獨立執行 AI 和 ML 工作負載。一種解決方案是同時使用 MCU 和數字信號處理器 (DSP) 或其他 SIMD 加速器。然而,這種多處理器方法會使系統設計變得復雜。
另一種方法是使用具有 SIMD 功能且性能更高的微處理器單元 (MPU)。這可以在單處理器設置中提供必要的性能,但 MPU 在功耗和功能集方面需要進行權衡。例如,并非所有 MPU 都具有面向 MCU 應用所需的確定性、低延遲計算。
在 MCU 中實現 AI 和 ML
Renesas 意識到需要一套優化型 MCU 來支持 AI 和 ML 工作負載,因此推出了 RA8M1 系列 MCU(圖 1)。該系列基于帶有 Helium 和 TrustZone 的 Arm?Cortex?-M85 架構,其運行頻率為 480 MHz,典型功耗為 225μA/MHz。
圖 1:Renesas 的 RA8M1 MCU 基于 Arm Cortex-M85,包含可加速 AI 和 ML 處理功能的 Helium 技術。(圖片來源:Renesas)
RA8M1 MCU 專為實現高效性能和低功耗而設計,具有確定性、中斷時間短和最先進的電源管理支持等特性。該處理器的性能效率達到每兆赫 6.39 CoreMark (CoreMark/MHz)。
Helium 是一種 SIMD M-Profile 矢量擴展 (MVE),可顯著加快信號處理和 ML 的速度。它增加了 150 條標量和矢量指令,可處理 128 位寄存器(圖 2)。它針對資源有限、功耗較低的微控制器進行了優化。例如,Helium 重新使用浮點單元 (FPU) 寄存器,而不是引入新的 SIMD 寄存器。這有助于降低處理器功耗,減少設計復雜性。
圖 2:Helium 重新利用 FPU 寄存器組進行矢量處理。(圖片來源:Image source: Arm)
如圖 3 所示,RA8M1 的 Cortex-M85 包含了 Arm 的 TrustZone 技術。TrustZone 為關鍵固件、資產和私人信息提供硬件隔離。Cortex-M85 還增加了新的安全保障功能,如指針驗證和分支目標識別 (PACBTI) 擴展。在 AI 環境下,設備可能會與個人數據進行交互,因此這些安全功能尤為重要。
圖 3:Cortex-M85 的 TrustZone 為關鍵固件、資產和私人信息提供硬件隔離。(圖片來源:Image source: Arm)
具備 AI 功能的 MCU 應具備的硬件特性
MCU 應將高效性與強大的功能集相結合,以支持人工智能應用。RA8M1 可用于電機控制、可編程邏輯控制 (PLC)、計量以及其他工業和物聯網應用。
例如,人工智能算法需要大量存儲器。RA8M1 系統存儲器包括高達 2 MB 的閃存和 1 MB 的 SRAM。SRAM 包括 128 KB 的緊耦合內存 (TCM),可實現高性能計算的快速存儲訪問。
為確保可靠運行,384 KB 的用戶 SRAM 和整個 128 KB 的 TCM 均配置為糾錯碼 (ECC) 存儲器。32 KB 指令和數據高速緩存也受 ECC 保護。
RA8M1 除包含 Arm 內核的功能外,還集成了多種安全功能。其中包括用于安全數據處理的可重復編程安全知識產權 (RSIP) 加密引擎、用于關鍵數據保護的不可變存儲以及篡改保護機制。
在通信接口方面,MCU 配備了用于網絡連接的以太網、用于汽車和工業應用的控制器區域網靈活數據速率 (CAN FD) 以及用于通用連接的USB高速/全速接口。該器件還集成了攝像頭接口和八進制串行外設接口 (SPI),可為外部存儲器進行即時解密。
模擬接口包括 12 位模數轉換器 (ADC) 和數模轉換器 (DAC)、高速模擬比較器以及三個采樣和保持電路。RA8M1 支持多種串行通信協議,包括帶 SPI 的串行通信接口 (SCI)、通用異步接收器/發射器 (UART) 和內部集成電路間 (I2C) 模式。該 MCU 還提供改進型內部集成電路 (I3C),以提高數據傳輸速率和效率。
對于需要全面訪問這些輸入/輸出 (I/O) 功能的開發人員,可使用像 224 引腳 R7FA8M1AHECBD#UC0 這樣的球柵陣列 (BGA) 封裝。那些希望印刷電路板(PC 板)設計和組裝流程更加簡化的用戶,可考慮選用外形扁平的扁平封裝 (LQFP),如 144 引腳 R7FA8M1AHECFB#AA0。
AI 應用的開發環境
對 RA8M1 系列感興趣的設計人員可以從 EK-RA8M1 R7FA8M 評估板開始(圖 4)。該評估板包括一個 RJ45 RMII 以太網接口、一個 USB 高速主機和設備接口以及一個三針 CAN FD 插座。在內存方面,該評估板配備 64 MB 的八進制 SPI 存儲器。
圖 4:EK-RA8M1 評估板具有強大的 I/O 支持功能,可用于 RA8M1 MCU。(圖片來源:Renesas)
RA8M1 由 Renesas Flexible Software Package (FSP) 提供支持,FSP 是一種綜合框架,旨在為嵌入式系統設計提供可擴展、高質量的用戶友好型軟件基礎。
該軟件包提供開發工具,包括基于流行的 Eclipse IDE 的 e2 studio 集成開發環境 (IDE)。該軟件包還包含兩個著名的免費實時操作系統:Azure RTOS 和 FreeRTOS。
該軟件包包括了支持嵌入式系統常見用例的輕型生產就緒型驅動程序。這些驅動程序與評估板相結合,成為開發人員使用 RA8M1 I/O 進行實驗的捷徑。
結語
RA8M1 為開發人員在邊緣物聯網應用中實施 AI 和 ML 工作負載提供了新的選擇,它可以節省功耗、提高性能、降低復雜性并縮短上市時間。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30106瀏覽量
268399 -
Renesas
+關注
關注
0文章
1757瀏覽量
22622 -
ML
+關注
關注
0文章
145瀏覽量
34603
發布評論請先 登錄
相關推薦
評論