免费国产高清在线精品_日韩久久精品电影_成人a级视频在线观看_国产成人精品A级毛片在线看_717YY电影夜夜福利_亚洲不卡永远在线_国产精品无码无卡有毛在线播放_一级真人片私人影院_亚洲中文无码av永久不收费

學習如何在 MYIR 的 ZU3EG FPGA 開發(fā)板上部署 Tiny YOLO v4，對比 FPGA、GPU、CPU 的性能，助力 AIoT 邊緣計算應用。

一、為什么選擇 FPGA：應對 7nm 制程與 AI 限制

在全球半導體制程限制和高端 GPU 受限的大環(huán)境下，F(xiàn)PGA 成為了中國企業(yè)發(fā)展的重要路徑之一。它可支持靈活的 AIoT 應用，其靈活性與可編程性使其可以在國內(nèi)成熟的 28nm 工藝甚至更低節(jié)點的制程下實現(xiàn)高效的硬件加速。

米爾的 ZU3EG 開發(fā)板憑借其可重構(gòu)架構(gòu)為 AI 和計算密集型任務提供了支持，同時避免了 7nm 工藝對國產(chǎn)芯片設計的制約。通過在 ZU3EG 上部署 Tiny YOLO V4，我們可以為智能家居、智慧城市等 AIoT 應用提供高效的解決方案。

CPU GPU FPGA 架構(gòu)對比

二、了解 Tiny YOLO 模型及其適用性

YOLO（You Only Look Once）是一種實時物體檢測模型，它通過一次性掃描整個圖像，實現(xiàn)高效的對象識別。

而其簡化版 Tiny YOLO V4 更適合嵌入式設備，具有較少的層數(shù)和參數(shù)。其輕量化特性更適合在資源受限的設備上運行，尤其在低功耗、實時檢測的邊緣計算設備中表現(xiàn)出色。

相比傳統(tǒng) GPU，F(xiàn)PGA 能在小面積和低功耗下實現(xiàn)類似的推理性能，非常契合 AIoT 應用。像米爾 ZU3EG 這樣的 FPGA 開發(fā)板，通過底板和豐富接口的載板設計，非常適合高效的嵌入式低功耗數(shù)據(jù)處理。

Yolo V4 網(wǎng)絡結(jié)構(gòu)圖

Tiny Yolo V4 網(wǎng)絡結(jié)構(gòu)圖

（通過優(yōu)化網(wǎng)絡結(jié)構(gòu)和參數(shù)，保持較高檢測精度的同時，降低模型的計算量和內(nèi)存占用）

三、獲取數(shù)據(jù)集和模型

可下載開源訓練集或預訓練模型。為了確保兼容性，建議將模型轉(zhuǎn)換為 ONNX 格式，以便后續(xù)能在 FPGA 上完成優(yōu)化。

1.下載 Tiny YOLO V4 模型：從Darknet 的 GitHub 倉庫獲取 Tiny YOLO 的預訓練權重，或者在 COCO 等數(shù)據(jù)集上自行訓練模型。自定義的模型適用于特定應用場景（如車輛檢測、人臉檢測等）。

2.數(shù)據(jù)準備：若要自定義模型，可使用 LabelImg 等工具對數(shù)據(jù)集進行標注，將數(shù)據(jù)轉(zhuǎn)為 YOLO 格式。之后，可將 YOLO 格式轉(zhuǎn)換為 ONNX 格式，以便兼容 FPGA 優(yōu)化工具鏈。

Tiny YOLO 在 Darknet 上訓練的截圖

四、通過 Vivado HLS 為 FPGA 準備模型

要將模型部署到 FPGA，需要將神經(jīng)網(wǎng)絡操作轉(zhuǎn)換為硬件級描述。使用 Xilinx 的 Vitis HLS（高級綜合）可以將 Tiny YOLO v4 的 C++ 模型代碼的轉(zhuǎn)化為 Verilog RTL（寄存器傳輸級）代碼，從而將模型從軟件世界帶入硬件實現(xiàn)。

詳細步驟：

1.模型層映射和優(yōu)化：

將 YOLO 的每一層（如卷積層、池化層）映射為硬件友好的 C/C++ 結(jié)構(gòu)。例如，將卷積映射為乘累加（MAC）數(shù)組，通過流水線實現(xiàn)并行化。

2.算子加速與指令優(yōu)化：

流水線（Pipelining）：利用流水線來處理多項操作并行，減少延遲。

循環(huán)展開（Loop Unrolling）：展開循環(huán)，以每周期處理更多數(shù)據(jù)，尤其在卷積操作中有效。

設置 DATAFLOW指令，使層間獨立處理。

3.量化與位寬調(diào)整：

將激活值和權重量化為定點精度（例如 INT8），而非浮點數(shù)。這在維持準確度的同時顯著降低計算量，尤其適合 FPGA 的固定點運算支持。

Tiny YOLO 模型在 Vivado HLS 中的層層轉(zhuǎn)化流程圖

五、使用 Vivado 綜合與部署 Verilog 到米爾的ZU3EG FPGA開發(fā)板

當 HLS 生成的 RTL 代碼準備就緒后，可以使用 Vivado 將模型部署到 FPGA。

1.Vivado 中的設置：

將 HLS 輸出的 RTL 文件導入 Vivado。

在 Vivado 中創(chuàng)建模塊設計，包括連接AXI 接口與 ZU3EG 的 ARM 核連接。

2.I/O 約束與時序：

定義 FPGA 的 I/O 引腳約束，以匹配 ZU3EG 板的特定管腳配置。配置時鐘約束以滿足合適的數(shù)據(jù)速率（如視頻數(shù)據(jù) 100-200 MHz）。

進行時序分析，確保延遲和響應速度達到實時要求。

3.生成比特流并下載到 ZU3EG：

生成的比特流可以直接通過 JTAG 或以太網(wǎng)接口下載到 ZU3EG。

將 Tiny YOLO 處理模塊連接到米爾ZU3EG開發(fā)板的外設和接口

六、在 FPGA 上測試并運行推理

現(xiàn)在 Tiny YOLO 已部署，可以驗證其實時對象檢測性能。

1.數(shù)據(jù)采集：

通過連接的相機模塊捕捉圖像或視頻幀，或者使用存儲的測試視頻。

使用 ZU3EG 的 ARM 核上的 OpenCV 對幀進行預處理，再將它們傳入 FPGA 預處理后進行推理。

2.后處理與顯示：

模型檢測對象后，輸出邊框和類別標簽。使用 OpenCV 將邊框映射回原始幀，并在每個檢測到的對象周圍顯示類別和置信度。

3.性能測試：

測量幀速率（FPS）和檢測準確度。微調(diào)量化位寬或數(shù)據(jù)流參數(shù)，以優(yōu)化實時需求。

Tiny YOLO 模型在 ZU3EG 上顯示檢測結(jié)果的實時輸出，視頻幀中標注了檢測到的對象

七、性能優(yōu)化與調(diào)試技巧

為提高性能，可以進行以下調(diào)整：

內(nèi)存訪問：設計數(shù)據(jù)存儲方式，最大限度利用緩存并減少數(shù)據(jù)傳輸，降低內(nèi)存瓶頸。

降低延遲：重新評估關鍵路徑延遲。若延遲過高，調(diào)整 Vitis HLS 中的流水線深度，并驗證層間的數(shù)據(jù)依賴性。

量化改進：嘗試 INT8 量化。Xilinx 的 Vitis AI 可幫助微調(diào)量化參數(shù)，以平衡準確性與速度。

不同優(yōu)化配置對資源使用的影響

米爾MYC-CZU3EG/4EV/5EV-V2核心板及開發(fā)板

在MYIR 的 ZU3EG 開發(fā)平臺上提供了一種高效的解決方案。利用 FPGA 獨特的靈活性和低功耗優(yōu)勢，助力未來 AIoT 設備的普及和智能升級。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

FPGA

FPGA

+關注

關注
1626

文章
21678

瀏覽量
602004
AIoT

AIoT

+關注

關注
8

文章
1392

瀏覽量
30578
米爾電子

米爾電子

+關注

關注
0

文章
106

瀏覽量
439

《DNK210使用指南 -CanMV版 V1.0》第四十一章 YOLO2物體檢測實驗

YOLO2網(wǎng)絡的物體檢測應用在CanMV上的實現(xiàn)。本章分為如下幾個小節(jié)：41.1 maix.KPU模塊介紹41.2 硬件設計41.3 程序設計41.4 運行驗證 41.1 maix.KPU模塊介紹

發(fā)表于 11-14 09:22

《DNK210使用指南 -CanMV版 V1.0》第四十章 YOLO2人手檢測實驗

中進行運算，然后再進行YOLO2網(wǎng)絡運算，最后便得到網(wǎng)絡識別出人手在輸入圖像上的一些信息，將這些信息繪制到圖像上后，

發(fā)表于 11-14 09:20

《DNK210使用指南 -CanMV版 V1.0》第三十九章 YOLO2人臉檢測實驗

KPU中進行運算，然后再進行YOLO2網(wǎng)絡運算，最后便得到網(wǎng)絡識別出人臉在輸入圖像上的一些信息，將這些信息繪制到圖像上后，

發(fā)表于 11-13 09:37

摩爾斯微電子榮獲2024年WBA行業(yè)大獎最佳Wi-Fi創(chuàng)新獎等多項殊榮

1000倍。頒獎評委們評價道：“摩爾斯微電子在穩(wěn)定、低功耗的物聯(lián)網(wǎng)連接方面的開創(chuàng)性工作，使其穩(wěn)居行業(yè)領先地位。該公司正在真正推動創(chuàng)新，這將對物聯(lián)網(wǎng)的未來起到關鍵作用，并重新定義下一代Wi-Fi。”顛覆性

發(fā)表于 11-01 14:41

高密度互連，引爆后摩爾技術革命

領域中正成為新的創(chuàng)新焦點，引領著超集成高密度互連技術的飛躍。通過持續(xù)的技術創(chuàng)新實現(xiàn)高密度互連，將是推動先進封裝技術在后摩爾時代跨越發(fā)展的關鍵所在。

發(fā)表于 10-18 17:57 ?217次閱讀

高密度互連，引爆<b class='flag-5'>后</b><b class='flag-5'>摩爾</b>技術革命

使用OpenVINO C# API部署YOLO-World實現(xiàn)實時開放詞匯對象檢測

YOLO-World是一個融合了實時目標檢測與增強現(xiàn)實（AR）技術的創(chuàng)新平臺，旨在將現(xiàn)實世界與數(shù)字世界無縫對接。該平臺以YOLO（You Only Look Once）算法為核心，實現(xiàn)

發(fā)表于 08-30 16:27 ?566次閱讀

使用OpenVINO C# API部署<b class='flag-5'>YOLO</b>-World<b class='flag-5'>實現(xiàn)</b>實時開放詞匯對象檢測

特斯拉正積極測試其V4超級充電樁

近日，特斯拉在快速充電技術領域的最新動態(tài)引發(fā)了廣泛關注。據(jù)悉，特斯拉正積極測試其現(xiàn)有的V4超級充電樁（基于V3充電柜構(gòu)建）的潛力，旨在突破300千瓦的充電功率上限，這一舉措標志著特斯拉在

發(fā)表于 08-06 16:52 ?787次閱讀

在多FPGA集群上實現(xiàn)高級并行編程

今天我們看的這篇論文介紹了在多FPGA集群上實現(xiàn)高級并行編程的研究，其主要目標是為非FPGA專家提供一個成熟且易于使用的環(huán)境，以便在多個并行

發(fā)表于 07-24 14:54 ?1143次閱讀

“自我實現(xiàn)的預言”摩爾定律，如何繼續(xù)引領創(chuàng)新

未來的自己制定了一個遠大但切實可行的目標一樣，摩爾定律是半導體行業(yè)的自我實現(xiàn) 。雖然被譽為技術創(chuàng)新的“黃金法則”，但一些事情尚未廣為人知……. 1.?戈登·摩爾完善過

發(fā)表于 07-05 15:02 ?245次閱讀

X-CUBE-CRYPTOLIB V4庫文件無法添加，鏈接錯誤的原因？

看官方介紹，V4版本的靜態(tài)庫是支持多個編譯器的，芯片是stm32h743，我用的是arm-none-eabi-gcc，版本是gcc version 13.2.1 20231009 (Arm GNU

發(fā)表于 05-31 07:54

STM32 x 米爾共同推動工業(yè)行業(yè)應用創(chuàng)新

STM32 x 米爾共同推動工業(yè)行業(yè)應用創(chuàng)新

發(fā)表于 05-30 08:01 ?512次閱讀

高精度納米級壓電位移平臺“PIEZOCONCEPT”！

高精度納米級壓電位移平臺“PIEZOCONCEPT”半導體界后摩爾時代的手術刀！第三代半導體是后摩爾時代實現(xiàn)芯片性能突破的核心技術之一，優(yōu)越

發(fā)表于 01-26 08:16 ?674次閱讀

后摩爾定律時代，Chiplet落地進展和重點企業(yè)布局

電子發(fā)燒友網(wǎng)報道（文/吳子鵬）幾年前，全球半導體產(chǎn)業(yè)的重心還是如何延續(xù)摩爾定律，在材料和設備端進行了大量的創(chuàng)新。然而，受限于工藝、制程和材料的瓶頸，當前摩爾定律發(fā)展出現(xiàn)疲態(tài)，產(chǎn)業(yè)的重點

發(fā)表于 12-21 00:30 ?1484次閱讀

基于YOLO技術的植物檢測與計數(shù)

利用Roboflow平臺對數(shù)據(jù)進行有效的管理和標注。對于植物檢測，使用實時目標檢測能力強的YOLO方法。YOLO通過將輸入圖像劃分為網(wǎng)格并預測每個網(wǎng)格單元的邊界框和類別概率，在不犧牲精度的情況下

發(fā)表于 12-12 09:41 ?810次閱讀

三錳銅表ADC芯片RN8207D V4用戶手冊

電子發(fā)燒友網(wǎng)站提供《三錳銅表ADC芯片RN8207D V4用戶手冊.pdf》資料免費下載

發(fā)表于 12-06 09:28 ?11次下載

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

后摩爾時代的創(chuàng)新：在米爾FPGA上實現(xiàn)Tiny YOLO V4，助力AIoT應用

一、為什么選擇 FPGA：應對 7nm 制程與 AI 限制

二、了解 Tiny YOLO 模型及其適用性

三、獲取數(shù)據(jù)集和模型

四、通過 Vivado HLS 為 FPGA 準備模型

五、使用 Vivado 綜合與部署 Verilog 到米爾的ZU3EG FPGA開發(fā)板

六、在 FPGA 上測試并運行推理

七、性能優(yōu)化與調(diào)試技巧

評論

《DNK210使用指南 -CanMV版 V1.0》第四十一章 YOLO2物體檢測實驗

《DNK210使用指南 -CanMV版 V1.0》第四十章 YOLO2人手檢測實驗

《DNK210使用指南 -CanMV版 V1.0》第三十九章 YOLO2人臉檢測實驗

摩爾斯微電子榮獲2024年WBA行業(yè)大獎最佳Wi-Fi創(chuàng)新獎等多項殊榮

高密度互連，引爆后摩爾技術革命

使用OpenVINO C# API部署YOLO-World實現(xiàn)實時開放詞匯對象檢測

特斯拉正積極測試其V4超級充電樁

在多FPGA集群上實現(xiàn)高級并行編程

“自我實現(xiàn)的預言”摩爾定律，如何繼續(xù)引領創(chuàng)新

X-CUBE-CRYPTOLIB V4庫文件無法添加，鏈接錯誤的原因？

STM32 x 米爾共同推動工業(yè)行業(yè)應用創(chuàng)新

高精度納米級壓電位移平臺“PIEZOCONCEPT”！

后摩爾定律時代，Chiplet落地進展和重點企業(yè)布局

基于YOLO技術的植物檢測與計數(shù)

三錳銅表ADC芯片RN8207D V4用戶手冊

搜索歷史

后摩爾時代的創(chuàng)新：在米爾FPGA上實現(xiàn)Tiny YOLO V4，助力AIoT應用

一、為什么選擇 FPGA：應對 7nm 制程與 AI 限制

二、了解 Tiny YOLO 模型及其適用性

三、獲取數(shù)據(jù)集和模型

四、通過 Vivado HLS 為 FPGA 準備模型

五、使用 Vivado 綜合與部署 Verilog 到 米爾的ZU3EG FPGA開發(fā)板

六、在 FPGA 上測試并運行推理

七、性能優(yōu)化與調(diào)試技巧

評論

五、使用 Vivado 綜合與部署 Verilog 到米爾的ZU3EG FPGA開發(fā)板