精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力騰訊助力“開悟”AI開放研究平臺

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-21 10:47 ? 次閱讀

案例簡介

? 本案例中通過NVIDIA V100 GPUTensorRT,騰訊“開悟”AI開放研究平臺將強(qiáng)化學(xué)習(xí)模型訓(xùn)練中的自對弈推理部分,從CPU遷移到GPU上,實(shí)現(xiàn)了10倍的加速,并使推理成本下降90%,整體訓(xùn)練成本下降 67%。

? 本案例主要應(yīng)用到 NVIDIA V100 GPU 和 TensorRT。

客戶簡介及應(yīng)用背景

騰訊一直積極地推動強(qiáng)化學(xué)習(xí)在游戲AI領(lǐng)域的發(fā)展,并在2019年推出了“開悟”AI開放研究平臺,提供不同游戲的訓(xùn)練場景、支撐AI進(jìn)行強(qiáng)化訓(xùn)練的大規(guī)模算力、統(tǒng)一的強(qiáng)化學(xué)習(xí)框架以加速研發(fā)速度、通用的訓(xùn)練與推理服務(wù),加快AI訓(xùn)練速度。

客戶挑戰(zhàn)

和圖像以及語音的訓(xùn)練方式不同,目前在游戲AI訓(xùn)練上表現(xiàn)最好的方式是強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)除了需要大量的算力來訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)之外,還需要一個(gè)自對弈的模塊用來產(chǎn)生訓(xùn)練數(shù)據(jù)。在自對弈模塊當(dāng)中,會模擬游戲環(huán)境,并且選擇不同時(shí)期的模型來操控游戲內(nèi)的角色,AI對游戲內(nèi)角色的每一操控都需要對模型進(jìn)行一次前向推理。由于更新模型的訓(xùn)練數(shù)據(jù)來自于自對弈模塊,因此自對弈的推理速度會對整個(gè)模型的訓(xùn)練速度和效果造成非常大的影響。

而自對弈推理每一次前向推理對延時(shí)的要求比實(shí)際的線上服務(wù)小,因此常見的方式是通過CPU來進(jìn)行自對弈中的推理,但CPU成本太高。為了提高自對弈的速度與吞吐,減少推理成本,騰訊希望在“開悟”AI開放研究平臺里面充分利用GPU去進(jìn)行自對弈中的模型前向推理。

應(yīng)用方案

為了解決上述在自對弈推理當(dāng)中GPU利用率不高的問題, 騰訊“開悟”AI開放研究平臺選擇使用NVIDIA V100 GPU和NVIDIA TensorRT推理引擎來加速推理。

為了自動化地將模型從TensorFlow轉(zhuǎn)換到TensorRT, 騰訊“開悟”AI開放研究平臺一開始通過自行開發(fā)parser,將TensorFlow的算子映射到TensorRT的算子。同時(shí),為了支持更廣泛的模型與算子,減少維護(hù)和開發(fā)的成本, 騰訊“開悟”AI開放研究平臺也積極地與NVIDIA合作,推動從TensorFlow轉(zhuǎn)換成ONNX模型,再通過TensorRT ONNX parser轉(zhuǎn)換到TensorRT的流程。

在自對弈的過程中,需要頻繁地更新模型的權(quán)重,讓自對弈模型始終能保持在較新的狀態(tài)。這個(gè)更新的頻率大概幾分鐘一次,每次必須限制在幾百個(gè)毫秒。如果通過重新build engine 的方式來更新模型的話,無法滿足上述要求。因此 騰訊“開悟”AI開放研究平臺采用 TensorRT refit engine的功能來更新權(quán)重。同時(shí),為了對更新權(quán)重有更好的支持、以及支持更多的算子, 騰訊“開悟”AI開放研究平臺從原本的TensorRT 5 升級到TensorRT 7。

TensorRT 7雖然在部分算子上支持權(quán)重更新,但并不支持LSTM這個(gè)在游戲AI當(dāng)中很重要的算子。為了解決這個(gè)問題, 騰訊“開悟”AI開放研究平臺通過開發(fā)TensorRT插件的方式封裝LSTM算子,并在插件當(dāng)中更新權(quán)重。

為了充分利用NVIDIA V100 GPU的Tensor core, 騰訊“開悟”AI開放研究平臺希望能夠使用TensorRT FP16精度來加速推理。由于TensorRT對FP16的支持非常成熟和簡便,整個(gè)推理流程很快被切換到FP16,并取得了2倍左右的加速。

尋找模型推理時(shí)的性能瓶頸,通過開發(fā)TensorRT插件進(jìn)行算子融合,進(jìn)一步地提升推理的速度。

在完成以上的工作之后,對比TensorFlow的基礎(chǔ)版本,TensorRT 7 能提供5倍以上的加速效果。

使用效果及影響

通過NVIDIA V100 GPU以及TensorRT推理引擎加速自對弈訓(xùn)練的推理部分,騰訊“開悟”AI開放研究平臺極大地提升了自對弈推理的吞吐量與速度,進(jìn)一步地提升了整個(gè)模型訓(xùn)練的速度與降低訓(xùn)練成本,加快模型迭代的周期。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4940

    瀏覽量

    102815
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4701

    瀏覽量

    128705
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30146

    瀏覽量

    268411
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA助力企業(yè)創(chuàng)建定制AI應(yīng)用

    NVIDIA 近日宣布與眾多技術(shù)領(lǐng)導(dǎo)者一同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMo和NVIDIA NIM微服務(wù),幫助企業(yè)創(chuàng)建定制
    的頭像 發(fā)表于 11-20 09:12 ?245次閱讀

    NVIDIA AI助力初創(chuàng)企業(yè)為心理治療師提供AI工具

    NVIDIA AI 助力初創(chuàng)企業(yè)為心理治療師提供 AI 工具,以此來優(yōu)化和提升心理健康服務(wù)水平,為人們的心理健康保駕護(hù)航。
    的頭像 發(fā)表于 11-19 16:03 ?144次閱讀

    NVIDIA AI助力實(shí)現(xiàn)更好的癌癥檢測

    由美國頂級醫(yī)療中心和研究機(jī)構(gòu)的專家組成了一個(gè)專家委員會,該委員會正在使用 NVIDIA 支持的聯(lián)邦學(xué)習(xí)來評估聯(lián)邦學(xué)習(xí)和 AI 輔助注釋對訓(xùn)練 AI 腫瘤分割模型的影響。
    的頭像 發(fā)表于 11-19 15:54 ?124次閱讀

    NVIDIA開放計(jì)算項(xiàng)目捐贈Blackwell平臺設(shè)計(jì)

    近日,在美國加利福尼亞州舉行的 OCP 全球峰會上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計(jì)算平臺的一些基礎(chǔ)元素捐贈給開放計(jì)算項(xiàng)目(OCP),并擴(kuò)大
    的頭像 發(fā)表于 11-19 15:30 ?126次閱讀

    賴耶科技通過NVIDIA AI Enterprise平臺打造超級AI工廠

    NVIDIA 技術(shù)團(tuán)隊(duì)保持合作。賴耶科技通過NVIDIA AI Enterprise平臺打造的超級 AI 工廠,致力于加速大模型場景應(yīng)用
    的頭像 發(fā)表于 11-19 14:55 ?234次閱讀

    NVIDIA助力Amdocs打造生成式AI智能體

    Amdocs 是一家為通信和媒體提供商提供軟件與服務(wù)的領(lǐng)先供應(yīng)商。該公司構(gòu)建的 amAIz 特定領(lǐng)域生成式 AI 平臺幫助電信公司深入改變了客戶體驗(yàn),實(shí)現(xiàn)了流程自動化,并優(yōu)化了決策。Amdocs
    的頭像 發(fā)表于 11-19 14:48 ?234次閱讀

    NVIDIA助力印度打造AI基礎(chǔ)設(shè)施

    在孟買舉辦的 NVIDIA AI Summit 上,黃仁勛和穆克什·安巴尼(Mukesh Ambani)探討了關(guān)于 AI 基礎(chǔ)設(shè)施的投資,這些投資有望為各行各業(yè)帶來變革。
    的頭像 發(fā)表于 10-27 09:44 ?227次閱讀

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書對ai4s基本
    發(fā)表于 09-09 15:36

    NVIDIA加速計(jì)算和 AI助力數(shù)字銀行揭穿金融欺詐騙局

    Bunq 利用 NVIDIA AI 將其欺詐檢測模型的訓(xùn)練速度提高近百倍。 ? 歐洲新型銀行 Bunq 正在 NVIDIA 加速計(jì)算和 AI助力
    的頭像 發(fā)表于 06-27 17:41 ?792次閱讀

    電子制造商采用NVIDIA AI和 Omniverse助力工廠提高運(yùn)營效率并降低成本

    NVIDIA Omniverse、Isaac 和 Metropolis 助力 Delta Electronics、Foxconn、和碩、Wistron 以數(shù)字化方式構(gòu)建、模擬和運(yùn)營工廠數(shù)字孿生
    的頭像 發(fā)表于 06-04 10:22 ?581次閱讀

    助力科學(xué)發(fā)展,NVIDIA AI加速HPC研究

    科學(xué)家和研究人員正在利用 NVIDIA 技術(shù)將生成式 AI 應(yīng)用于代碼生成、天氣預(yù)報(bào)、遺傳學(xué)和材料科學(xué)領(lǐng)域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?385次閱讀
    <b class='flag-5'>助力</b>科學(xué)發(fā)展,<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b>加速HPC<b class='flag-5'>研究</b>

    是德科技與NVIDIA攜手推進(jìn)6G研究平臺發(fā)展

    是德科技近日宣布與現(xiàn)已開啟與全新NVIDIA 6G研究平臺的合作,加速推進(jìn)6G技術(shù)研究。該平臺集成了N
    的頭像 發(fā)表于 03-27 09:26 ?673次閱讀

    NVIDIA推出微服務(wù),助力企業(yè)邁向生成式AI

    NVIDIAAI 平臺適用于任何高瞻遠(yuǎn)矚的企業(yè)使用,而且比以往任何時(shí)候都更加易于應(yīng)用。
    的頭像 發(fā)表于 03-21 09:39 ?367次閱讀

    NVIDIA AI Enterprise助力九州未來構(gòu)建MaaS平臺

    本案例中,九州未來的團(tuán)隊(duì)基于NVIDIA AI Enterprise的全棧軟件套件,構(gòu)建其 MaaS 大模型一體化開發(fā)及部署平臺,該平臺同時(shí)支持云端部署和私有化部署,通過九州未來開發(fā)的
    的頭像 發(fā)表于 01-10 17:24 ?1143次閱讀

    NVIDIA 人工智能開講 | 什么是 AI For Science?詳解 AI 助力科學(xué)研究領(lǐng)域的新突破

    ”兩大音頻 APP上搜索“ NVIDIA 人工智能開講 ”專輯,眾多技術(shù)大咖帶你深度剖析核心技術(shù),把脈未來科技發(fā)展方向! AI For Science (亦稱 “AI In Science” ),是人工智能領(lǐng)域的一大熱門話題,
    的頭像 發(fā)表于 12-25 18:30 ?953次閱讀
    <b class='flag-5'>NVIDIA</b> 人工智能開講 | 什么是 <b class='flag-5'>AI</b> For Science?詳解 <b class='flag-5'>AI</b> <b class='flag-5'>助力</b>科學(xué)<b class='flag-5'>研究</b>領(lǐng)域的新突破