精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

靈活應變的計算平臺才能滿足運行卷積神經網絡的嵌入式 AI 的要求

Xilinx賽靈思官微 ? 來源:djl ? 作者:賽靈思Dale Hitt ? 2019-07-26 16:42 ? 次閱讀

人工智能新興應用通過帶可配置加速的片上系統器件來滿足日益嚴格的性能和效率需求

隨著智能安全、機器人無人駕駛汽車等應用越來越依靠嵌入式人工智能技術來提高性能,交付全新的用戶體驗,傳統計算平臺上的推斷引擎很難在有限的功耗、時延和物理尺寸限制下滿足實際要求。推斷引擎必須滿足嚴格定義的推斷精度,還受限于總線寬度,而且存儲器難以為最佳速度、效率和芯片面積進行調整優化。我們需要靈活應變的計算平臺來滿足運行一流卷積神經網絡 (CNN) 的嵌入式 AI 的要求。

放眼未來,適應于更多前沿神經網絡的靈活性是我們的主要關注點。今天廣受歡迎的 CNN 正加速被新型的先進架構所取代。然而,傳統的 SoC 設計要使用當前的神經網絡架構知識,從開發開始到未來部署通常需要大約三年時間。RNN 或 Capsule Network 等新型神經網絡可能會讓傳統 SoC 變得低效,也難以提供保持競爭力所需的性能。

嵌入式 AI 要滿足最終用戶期望,特別是要跟上可預見的未來不斷提升的需求,就必須采用更加靈活的自適應計算平臺。我們可利用用戶可配置的多核片上系統 (MPSoC) 器件,整合主應用處理器和可擴展的可編程邏輯結構,包含可配置的存儲器架構和滿足可變精度推斷所需的信號處理技術,從而滿足上述要求。

推 斷 精 度

在傳統的 SoC 中,決定性能的特性如存儲器架構和計算精確度等是固定的。最小值通常為 8 位,由核心 CPU 定義,不過就給定的算法而言最佳精度可能更低。MPSoC 支持可編程邏輯優化至晶體管層面,這就能根據需要讓推斷精度降低到 1 位。此外,這類器件還包含成千上萬可配置的 DSP slice,能高效處理乘積累加 (MAC) 計算。

能自由優化推斷精度,根據平方律提供剛好滿足需求的計算效率,也就是說單位的運算用 1 位核心執行,相對于用 8 位核心完成相同計算而言,所需的邏輯僅為 1/64。此外,MPSoC 能讓推斷精度針對神經網絡的每層做出不同優化,從而以最大的效率提供所需的性能。

存 儲 器 架 構

除了通過改變推斷精度來提高計算效率之外,配置可編程片上存儲器的帶寬和結構能進一步提高嵌入式 AI 的性能和效率。定制 MPSoC 相對于運行相同推斷引擎的傳統計算平臺而言,片上存儲器可能達到 4 倍多,存儲器—接口帶寬可能達到 6 倍。存儲器的可配置性使得用戶能減少瓶頸,并優化芯片資源的利用率。此外,典型的子系統只有有限的片上集成高速緩存,必須與片外存儲設備頻繁交互,這就會增加時延和功耗。在 MPSoC 中,大多數存儲器交換都在片上進行,這就會大幅提高速度,而且相對于片外存儲器交互而言功耗降低超過 99%。

芯 片 面 積

解決方案的尺寸也越來越重要,特別就采用移動 AI 的無人機、機器人或無人/自動駕駛汽車而言尤其如此。MPSoC 的 FPGA 結構上實現的推斷引擎可能僅占用傳統 SoC 八分之一的芯片面積,這就能讓開發人員在更小的器件中構建功能更強大的引擎。

此外,MPSoC 器件系列為設計人員提供了實現推斷引擎的豐富選擇,能支持最節能、成本效率最高、面積占用最小的方案,從而滿足系統性能要求。一些通過汽車應用認證的部件具備硬件功能安全特性,達到業界標準的 ISO 26262 ASIL-C 安全規范,這對自動駕駛應用而言至關重要。比如賽靈思的 Automotive XA Zynq UltraScale+ 系列采用 64 位四核 ARM Cortex-A53 和雙核 ARM Cortex-R5 處理系統以及可擴展的可編程邏輯結構,這就能在單個芯片上整合控制處理、機器學習算法和安全電路,同時提供故障容錯功能。

今天,嵌入式推斷引擎可用單個 MPSoC 器件實現,功耗低至 2 瓦,這對移動機器人或自動駕駛汽車而言都是比較合適的功耗水平。傳統計算平臺即便現在也無法用這么低的功耗運行實時 CNN 應用,未來也不太可能在更嚴格的功耗限制條件下滿足更快響應和更復雜功能的日益嚴格的要求。基于可編程 MPSoC 的平臺能夠提供更高的計算性能,更高的效率,也能在 15瓦以上的功率水平下減小面積和減輕重量。

如果開發人員不能在自己的項目中輕松地實現這些優勢,那么這種可配置型多平行計算架構的優勢就僅限于學術領域。成功需要適當的工具來幫助開發人員優化目標推斷引擎的實現。為了滿足有關需求,賽靈思不斷擴展開發工具生態系統和機器學習軟件堆棧,并與專業合作伙伴合作,一起簡化和加速計算機視覺和視頻監控等應用的實現。

面 向 未 來 的 靈 活 性

利用 SoC 的可配置性為手頭應用創建最佳平臺,也使得 AI 開發人員能夠靈活地跟上神經網絡架構快速發展演進的要求。業界可能遷移到新型神經網絡的可能性,對于平臺開發人員來說是一個巨大的風險。可重配置的 MPSoC 通過重配置并用當前最先進的策略來構建最高效的處理引擎,能夠讓開發人員靈活地響應神經網絡架構方式的變化。

AI 越來越多地嵌入到各種設備中,包括工業控制、醫療設備、安全系統、機器人和自動駕駛汽車等。利用可編程邏輯結構的 MPSoC 器件的靈活應變加速技術,是提供保持競爭力所需的快速響應和高級功能的關鍵。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 嵌入式
    +關注

    關注

    5068

    文章

    19020

    瀏覽量

    303308
  • 存儲器
    +關注

    關注

    38

    文章

    7452

    瀏覽量

    163608
  • 賽靈思
    +關注

    關注

    32

    文章

    1794

    瀏覽量

    131166
收藏 人收藏

    評論

    相關推薦

    神經網絡解決方案讓自動駕駛成為現實

    、成本及功耗的要求。輕型嵌入式神經網絡卷積神經網絡 (CNN) 的應用可分為三個階段:訓練、轉
    發表于 12-21 17:11

    卷積神經網絡如何使用

    卷積神經網絡(CNN)究竟是什么,鑒于神經網絡在工程上經歷了曲折的歷史,您為什么還會在意它呢? 對于這些非常中肯的問題,我們似乎可以給出相對簡明的答案。
    發表于 07-17 07:21

    什么是圖卷積神經網絡

    卷積神經網絡
    發表于 08-20 12:05

    卷積神經網絡的優點是什么

    卷積神經網絡的優點
    發表于 05-05 18:12

    嵌入式神經網絡有哪些挑戰

    能。  這些挑戰如果處理不當,將構成重大威脅。一方面,必須要克服硬件限制條件,以在嵌入式平臺上執行NN。另一方面,必須要克服挑戰的第二部分,以便快速達成解決方案,因為上市時間是關鍵。還原至硬件解決方案以加速上市時間也不是一個明智選擇,因為它無法提供
    發表于 06-30 11:01

    可分離卷積神經網絡在 Cortex-M 處理器上實現關鍵詞識別

    我們可以對神經網絡架構進行優化,使之適配微控制器的內存和計算限制范圍,并且不會影響精度。我們將在本文中解釋和探討深度可分離卷積神經網絡在 Cortex-M 處理器上實現關鍵詞識別的潛力
    發表于 07-26 09:46

    嵌入式AI平臺有哪些?

    11.2.2 修剪神經網絡 21.2.3 嵌入式終端優化 21.3 GPU 21.4 ARM 31.5 FPGA結構的并行計算 41.5.1 介紹 41.5.2 流水線計算 41.5
    發表于 10-27 06:45

    嵌入式中的人工神經網絡的相關資料分享

    人工神經網絡AI中具有舉足輕重的地位,除了找到最好的神經網絡模型和訓練數據集之外,人工神經網絡的另一個挑戰是如何在嵌入式設備上實現它,同時
    發表于 11-09 08:06

    輕量化神經網絡的相關資料下載

    視覺任務中,并取得了巨大成功。然而,由于存儲空間和功耗的限制,神經網絡模型在嵌入式設備上的存儲與計算仍然是一個巨大的挑戰。前面幾篇介紹了如何在嵌入式
    發表于 12-14 07:35

    如何利用卷積神經網絡去更好地控制巡線智能車呢

    巡線智能車控制中的CNN網絡有何應用?嵌入式單片機中的神經網絡該怎樣去使用?如何利用卷積神經網絡去更好地控制巡線智能車呢?
    發表于 12-21 07:47

    如何實現開發嵌入式神經網絡

    已經有很多關于將人工智能用于日益智能的車輛的文章。但是,您如何將在服務器群上開發的神經網絡 (NN) 壓縮到量產汽車中資源受限的嵌入式硬件中呢?本文探討了我們應該如何授權汽車生產 AI 研發工程師在
    發表于 12-23 06:30

    卷積神經網絡一維卷積的處理過程

    以前的神經網絡幾乎都是部署在云端(服務器上),設備端采集到數據通過網絡發送給服務器做inference(推理),結果再通過網絡返回給設備端。如今越來越多的神經網絡部署在
    發表于 12-23 06:16

    卷積神經網絡模型發展及應用

    分析了目前的特殊模型結構,最后總結并討論了卷積神經網絡在相關領域的應用,并對未來的研究方向進行展望。卷積神經網絡(convolutional neural network,CNN) 在
    發表于 08-02 10:39

    靈活應變計算平臺滿足嵌入式AI要求

    隨著智能安全、機器人或無人駕駛汽車等應用越來越依靠嵌入式人工智能技術來提高性能,交付全新的用戶體驗,傳統計算平臺上的推斷引擎很難在有限的功耗、時延和物理尺寸限制下滿足實際
    的頭像 發表于 10-02 09:45 ?2978次閱讀

    卷積神經網絡原理:卷積神經網絡模型和卷積神經網絡算法

    一。其主要應用領域在計算機視覺和自然語言處理中,最初是由Yann LeCun等人在20世紀80年代末和90年代初提出的。隨著近年來計算機硬件性能的提升和深度學習技術的發展,CNN在很多領域取得了重大的進展和應用。 一、卷積
    的頭像 發表于 08-17 16:30 ?1421次閱讀