精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

電子發燒友App

硬聲App

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
電子發燒友網>電子資料下載>電子資料>MindSpore-GraphEngine基于C++的前端和昇騰處理器之間的連接模塊

MindSpore-GraphEngine基于C++的前端和昇騰處理器之間的連接模塊

2022-06-17 | zip | 4.74 MB | 次下載 | 2積分

資料介紹

授權協議 Apache-2.0
開發語言 C/C++
操作系統 跨平臺
軟件類型 開源軟件

軟件簡介

圖引擎模塊(GE)由C++實現,位于前端模塊MindSpore/Tensorflow和底層硬件之間,起到承接作用。圖引擎模塊以ME/TF下發的圖作為輸入,然后進行一系列的深度圖優化操作,最后輸出一張可以在底層硬件上高效運行的圖。GE針對昇騰AI處理器的硬件結構特點,做了特定的優化工作,以此來充分發揮出昇騰AI處理器的強大算力。在進行模型訓練/推理時,GE會被自動調用而用戶并不感知。GE主要由GE API和GE Core兩部分組成,詳細的架構圖如下所示。

poYBAGKn-56ARRT3AABLObS7174976.png

  • GE API

    GE API是連接前端模塊ME/TF和GE Core的接口,負責GE Core中初始化、Session管理模塊的接口,支持運行環境初始化,Session創建、銷毀,圖添加執行。

  • GE Core

    GE Core是GE的核心模塊,負責整個訓練過程中的圖管理。GE Core中的圖處理可細分為六大步驟,分別是圖準備、圖拆分、圖優化、圖編譯、圖加載和圖執行,對于ME下發的每一張圖都會經過這六個步驟的操作,最終得到可以直接在底層硬件上高效執行的圖。

    • 圖準備 & 整圖優化

      完成整圖級別的數據準備和優化,涉及到IR庫及算子庫。使用IR庫中算子的InferShape函數,完成整圖的Shape推導,以便后續申請內存;同時根據算子的聚合屬性,完成某些算子的聚合優化,如allreduce算子,會按照聚合參數,將若干各參數對應梯度的allreduce算子聚合為一個,以此減少通訊耗時。

    • 圖拆分

      昇騰AI處理器是一種異構芯片,含有CPU(AICPU)和向量計算部件AICORE,圖中每個算子會按照開銷模型選擇執行的核心,此階段會對算子進行最優的核心分配,每種核心對應軟件上的一個抽象引擎;按照之前對各算子的引擎分配,以引擎為邊界,將整圖拆分為若干子圖,在圖邊界算子上插入相應的Placeholder算子以做標識,之后的優化、編譯、加載操作均會以子圖為單位進行,這樣可以有效減少優化過程的耗時。

    • 子圖優化

      根據子圖所屬引擎,調用不同的優化器接口執行優化。為了充分發揮昇騰AI處理器中AICORE模塊的算力,在AICORE內CUBE單元進行計算的算子會采用一種5D的數據格式,圖優化階段會對相應算子進行4D/5D的類型轉換;為了進一步發揮CUBE單元的算力,減少數據搬運次數,GE會對某種范式的算子連接進行融合操作,此步驟也在圖優化階段進行;對所有子圖優化之后,需進行算子運行屬性計算,以計算輸入輸出內存大小。

    • 圖編譯 & 圖加載

      GE采用即時算子編譯技術,即按照實際網絡結構即時編譯生成算子可執行程序,同時完成內存復用與內存分配、流分配、算子可執行程序加載等。每個算子執行任務綁定到特定的流上,同一個流的任務是串行執行的,不同流上的任務可以并行執行。圖加載階段按照引擎歸屬的runtime,將子圖加載到硬件上準備執行。

    • 圖執行

      最終在硬件上執行子圖,并返回相應的輸出值。為了提高運行效率,圖執行階段提供了一種下沉模式,可以在底層硬件上連續運行多輪再返回輸出值,以此減少從底層硬件拷貝數據的次數。

在訓練/推理過程中,上述過程會自動執行,通過上述圖操作,GE可以將前端下發的圖轉換為一種可以在昇騰AI處理器上高效運行的圖模式。

安裝說明

安裝GE

GE內嵌在MindSpore/Ascend安裝包中,MindSpore/Ascend安裝完畢后,GE以動態庫的方式被調用。

源碼安裝

GE也支持由源碼編譯,進行源碼編譯前,首先確保你有昇騰910 AI處理器的環境(可通過昇騰開發者社區獲取),同時系統滿足以下要求:

  • GCC >= 7.3.0
  • CMake >= 3.14.0
  • Autoconf >= 2.64
  • Libtool >= 2.4.6
  • Automake >= 1.15.1

編譯完成后會生成幾個動態庫,他們會鏈接到MindSpore/Ascend中執行,無法單獨運行。

  1. 下載GE源碼。

    GE源碼托管在碼云平臺,可由此下載。

    git clone https://gitee.com/mindspore/graphengine.git
    cd graphengine
  2. 在GE根目錄下執行下列命令即可進行編譯。

    bash build.sh
    • 開始編譯之前,請確保正確設置相關的環境變量。
    • build.sh的腳本中,會進行git clone操作,請確保網絡連接正常且git配置正確。
    • build.sh的腳本中,默認會8線程編譯,如果機器性能較差,可能會編譯失敗。可以通過-j{線程數}來控制線程數,如bash build.sh –j4
  3. 完成編譯后,相應的動態庫文件會生成在output文件夾中。

更多指令幫助,可以使用:

bash build.sh –h

如果想清除歷史編譯記錄,可以如下操作:

rm -rf build/ output/
bash build.sh

社區

貢獻

歡迎參與貢獻,更多信息詳見Contributor Wiki

路標

以下將展示graphengine近期的計劃,我們會根據用戶的反饋訴求,持續調整計劃的優先級。

總體而言,我們會努力在以下幾個方面不斷改進。

1、完備性:Cast/ConcatV2算子支持輸入數據類型為int64的常量折疊;

2、完備性:onnx parser支持一對多映射;

3、架構優化:ATC解耦并遷移至parser;

4、易用性:提供tensorflow訓練的checkpoint文件轉pb文件的一鍵式轉化工具;

5、易用性:提供一鍵式本地編譯環境構建工具;

6、可維測:ATC轉換生成的om模型包含框架信息、cann版本信息和芯片信息等;
?

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數據手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關電源設計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數字電路基礎pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅動電路設計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費