精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NIO的自動駕駛AI推理工作流

jf_pJlTbmA9 ? 來源:NVIDIA ? 作者:NVIDIA ? 2023-07-05 16:30 ? 次閱讀

自動駕駛汽車必須能夠快速準(zhǔn)確地檢測物體,以確保其駕駛員和道路上其他駕駛員的安全。由于自動駕駛( AD )和視覺檢查用例中對實時處理的需求,具有預(yù)處理和后處理邏輯的多個 AI 模型 組合在流水線中,并用于 機器學(xué)習(xí)( ML )推理。

流水線的每一步都需要加速,以確保低延遲工作流。延遲是獲取推理響應(yīng)所需的時間。更快地處理 AD 數(shù)據(jù)將能夠更有效地分析和使用信息,創(chuàng)造更安全的駕駛環(huán)境。任何一個方面的延遲都會降低整個管道的速度。

為了實現(xiàn)低延遲推理工作流,電動汽車制造商 NIO 將 NVIDIA Triton 推理服務(wù)器集成到其 AD 推理管道中。 NVIDIA Triton 推理服務(wù)器是一個開源的多幀推理服務(wù)軟件。

這篇文章解釋了 NIO 如何在 GPU 上使用 NVIDIA Triton 協(xié)調(diào)其圖像預(yù)處理、后處理和 AI 模型的管道。它還展示了 NIO 如何減少網(wǎng)絡(luò)傳輸,以成功加快 AD 用例的 AI 推理工作流。

用于實時響應(yīng)的更快 AI 推理

NIO 設(shè)計、開發(fā)、聯(lián)合制造和銷售高級智能電動汽車,推動自動駕駛、數(shù)字技術(shù)、電動動力系統(tǒng)和電池等新一代技術(shù)的創(chuàng)新。 NIO 自動駕駛開發(fā)平臺( NADP )是一個致力于 NIO 核心自動駕駛服務(wù)的研發(fā)平臺。

NIO 選擇 NVIDIA Triton Inference Server 是因為幾個關(guān)鍵的技術(shù)和操作原因,包括:

NVIDIA Triton 支持基于 DAG 的多種模型編排,以及預(yù)處理或后處理模塊

NVIDIA Triton 的云原生部署實現(xiàn)了多 GPU 、多節(jié)點的輕量級擴展

高質(zhì)量的文檔和學(xué)習(xí)資源有助于輕松遷移到 NVIDIA Triton

NVIDIA Triton 的穩(wěn)定性和強大功能是 AD 用例所必需的

NIO 的自動駕駛 AI 推理工作流

數(shù)百個人工智能模型用于從自動駕駛汽車中挖掘數(shù)據(jù)。在自動駕駛這樣的用例中,推理工作流由多個 AI 模型組成,其中預(yù)處理和后處理邏輯在流水線中拼接在一起。

NIO 將管道的預(yù)處理和后處理從運行在 CPU 上的客戶端移動到運行在 GPU 上的 NVIDIA Triton 。 NVIDIA Triton 的業(yè)務(wù)邏輯腳本( BLS )功能用于協(xié)調(diào)管道,以優(yōu)化 AD 使用。

通過將預(yù)處理從 CPU 移動到 GPU 并利用高效的管道編排, NIO 在一些核心管道中實現(xiàn)了 6 倍的延遲減少,將總吞吐量提高了 5 倍。

工作流管道之前和之后如圖 1 所示。

image3-6.png

圖 1. NVIDIA Triton 推理服務(wù)器推出之前(左)和之后(右) NIO AI 推理工作流的比較

NVIDIA Triton 的模型管道編排優(yōu)勢

本節(jié)探討了 NIO 通過集成 NVIDIA Triton 實現(xiàn)的每一項好處。

GPU 加速預(yù)處理

NVIDIA Triton 使用 nvJPEG 和 NVIDIA DALI 在 GPU 上加速了解碼、調(diào)整大小和換位等預(yù)處理任務(wù)。這顯著減輕了客戶端 CPU 的計算工作量,并減少了預(yù)處理延遲。

升級模型而無需修改客戶端應(yīng)用程序

通過將模型的預(yù)處理和后處理移至 NVIDIA Triton ,每次升級模型時,客戶端不需要任何修改。這實質(zhì)上加快了模型的推出,幫助其更快地達到生產(chǎn)。

使用單個 GPU 節(jié)點減少網(wǎng)絡(luò)數(shù)據(jù)傳輸開銷

統(tǒng)一的預(yù)處理使輸入的多個副本能夠與多個后端識別模型共享。該過程在服務(wù)器端使用 GPU 共享內(nèi)存,無需數(shù)據(jù)傳輸開銷。

圖 2 顯示了該管道可以使用 NVIDIA Triton 業(yè)務(wù)邏輯腳本功能連接多達九個模型。

image2-7.png

圖 2. NVIDIA Triton 業(yè)務(wù)邏輯腳本的模型管道編排

對于 2K 分辨率的輸入圖像,每幀的大小為 1920 x 1080 x 3 x 8 = 47 Mb 。假設(shè)全幀速率為 60 fps ,每秒輸入的數(shù)據(jù)量為 1920 x 1080 x 3 x 8 x 60 = 2847 Mb 。在前一個工作流中,每個圖像通過網(wǎng)絡(luò)依次發(fā)送給九個模型。每秒傳輸?shù)臄?shù)據(jù)為 1920 x 1080 x 3 x 8 x 60 x 9 = 25 Gb = 3 Gb 。

在新的工作流程中,九個模型與 NVIDIA Triton 業(yè)務(wù)邏輯腳本配合。這意味著模型可以訪問 GPU 共享存儲器中的圖像,并且圖像不必通過網(wǎng)絡(luò)發(fā)送。假設(shè) PCIe 帶寬為 160 Gb =每秒 20 Gb ,理論上,如果通過 PCIe 傳輸數(shù)據(jù),每秒生成的數(shù)據(jù)可以節(jié)省 150 毫秒的數(shù)據(jù)傳輸時間。

假設(shè)可用帶寬為 16 Gb =每秒 2 Gb ,理論上,如果數(shù)據(jù)通過網(wǎng)絡(luò)傳輸,每秒生成的數(shù)據(jù)可以節(jié)省 1500 毫秒的數(shù)據(jù)傳輸時間。所有這些都會加快工作流程。

使用圖像壓縮節(jié)省網(wǎng)絡(luò)傳輸

為了進行準(zhǔn)確的模型預(yù)測,輸入圖像必須為 1920 x 1080 x 3 x 8 字節(jié),并且必須通過網(wǎng)絡(luò)傳輸。在引入服務(wù)器端預(yù)處理之后,可以在允許的精度損失范圍內(nèi)將原始圖像更改為壓縮的三通道 720 像素圖像( 1280 x 720 x 3 )。

因此,只需幾百 KB 即可傳輸壓縮圖像的字節(jié),并在服務(wù)器上以最小的精度損失將大小調(diào)整為 1920 x 1080 x 3 x 8 字節(jié)。這導(dǎo)致了額外的網(wǎng)絡(luò)傳輸節(jié)省,加快了工作流程。

NADP 推理平臺中的易集成性

NIO 目前基于 NVIDIA Triton 的推理平臺是其自動駕駛開發(fā)平臺( NADP )的關(guān)鍵組件,用于其自動駕駛解決方案。

由于 NIO 平臺構(gòu)建在 Kubernetes ( K8s )上, NVIDIA Triton 必須與 Kubernete 良好集成。工作流程的組件圍繞 NVIDIA Triton 實現(xiàn)為 K8s CRD (本地和自定義)。

image4-5.png

圖 3.NIO 在 Kubernetes 中的機器學(xué)習(xí)工作流

持續(xù)集成/持續(xù)交付( CI / CD )

Argo 是 Kubernetes 中用于協(xié)調(diào)工作流的引擎。它有助于開發(fā)、量化、訪問、云部署、壓力測試和發(fā)布中涉及的所有組件的 CI / CD 。 NVIDIA Triton 通過在加載模型時觸發(fā)工作流中的下一步來幫助 CI / CD 。

此外, NVIDIA Triton Docker 容器的使用有助于在開發(fā)、測試和部署環(huán)境中實現(xiàn)一致的功能。

將 Jupyter 環(huán)境無縫集成到 NVIDIA Triton 圖像中。 Jupyter 為需要在線調(diào)試或離線復(fù)制的復(fù)雜問題提供了一個方便的開發(fā)環(huán)境。

易用 Istio 部署

NVIDIA Triton 本機支持與應(yīng)用程序通信的 gRPC 協(xié)議。然而,由于 Kubernetes 本地服務(wù)無法為 gRPC 提供有效的請求級負(fù)載平衡, NVIDIA Triton 與 Istio 服務(wù)網(wǎng)格集成。 Istio 用于對 NVIDIA Triton 推理服務(wù)器的流量進行負(fù)載平衡,并通過 NVIDIA Triton 的活躍度/就緒性探針監(jiān)測服務(wù)的運行狀況。

阿波羅配置管理易于使用

阿波羅配置中心用于基于模型名稱的服務(wù)發(fā)現(xiàn)。用戶可以訪問模型,而不知道模型部署的特定域名。結(jié)合 NVIDIA Triton 模型存儲庫,用戶可以直接觸發(fā)模型的部署。

普羅米修斯和格拉法納的指標(biāo)

NVIDIA Triton 基于模型維度提供了一整套模型服務(wù)指標(biāo)。例如, NVIDIA Triton 可以區(qū)分推理請求排隊時間和 GPU 計算時間,從而實現(xiàn)在線模型服務(wù)性能的細(xì)粒度診斷和分析,而無需進入調(diào)試模式。

由于 NVIDIA Triton 支持云原生主流 Prometheus / Grafana ,用戶可以輕松配置每個維度的儀表板和警報,為高服務(wù)可用性提供指標(biāo)支持。

關(guān)鍵要點

NIO 的優(yōu)化工作流程集成了 NVIDIA Triton 推理服務(wù)器,使一些核心管道的延遲減少了 6 倍。這將總吞吐量提高了 5 倍。

通過使用 NVIDIA Triton 管道編排功能將預(yù)處理邏輯移至 GPU , NIO 實現(xiàn)了:

更快的圖像處理

釋放 CPU 容量

減少網(wǎng)絡(luò)傳輸開銷

更高的推理吞吐量

NIO 使用 NVIDIA Triton 推理服務(wù)器實現(xiàn)了 AI 推理工作流加速。 NVIDIA Triton 也很容易集成到基于 Kubernetes 的強大可擴展解決方案中。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4949

    瀏覽量

    102828
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30239

    瀏覽量

    268479
  • 自動駕駛
    +關(guān)注

    關(guān)注

    783

    文章

    13694

    瀏覽量

    166166
收藏 人收藏

    評論

    相關(guān)推薦

    基于工作流技術(shù)的廣州電信本地計費系統(tǒng)改造

    【作者】:龍欣庭【來源】:《華南理工大學(xué)》2009年【摘要】:工作流指業(yè)務(wù)過程的部分或整體在計算機應(yīng)用環(huán)境下的自動化,使多個參與者之間傳遞信息或任務(wù)的過程按照某種預(yù)定義的規(guī)則自動進行。
    發(fā)表于 04-24 09:20

    基于Notes的OA工作流引擎的設(shè)計和實現(xiàn)

    到了更高層次的發(fā)展,成為企業(yè)管理現(xiàn)代化的重要標(biāo)志。目前,辦公自動化技術(shù)越來越普遍地被應(yīng)用到***機關(guān)、金融機構(gòu)和企事業(yè)單位的日常管理中,成為提高工作效率、優(yōu)化管理流程的重要手段。工作流技術(shù)的使用,使得
    發(fā)表于 04-24 09:22

    【話題】特斯拉首起自動駕駛致命車禍,自動駕駛的冬天來了?

    自動駕駛技術(shù)已經(jīng)有足夠積累,雖然還不完美無缺,但是可以投入商用,科技都是在使用中完善的,不能一遭被蛇咬,十年怕井繩,難道發(fā)生一次空難之后,以后飛機就停飛啦?技術(shù)朋友,更加關(guān)注問題本身,有什么技術(shù)手段可以解決此類問題?對于這個問題,公說公有理婆說婆有理,元芳,你怎么看?
    發(fā)表于 07-05 11:14

    自動駕駛真的會來嗎?

    自動駕駛原理示意GIF圖  特斯拉自動駕駛死亡事故給全世界帶來了極大的震驚,但這并不意味著基于壞消息之上的關(guān)注全然沒有正面意義。  在接受新浪科技采訪中,多位硅谷相關(guān)人士告訴新浪科技:一方面是對于
    發(fā)表于 07-21 09:00

    自動駕駛的到來

      傳統(tǒng)汽車廠商更趨向于通過技術(shù)的不斷積累,場景的不斷豐富,逐步從輔助駕駛過渡到半自動駕駛,進而在將來最終實現(xiàn)無人駕駛;某些高科技公司則希望通過各種外部傳感器實時采集海量數(shù)據(jù),處理器經(jīng)過數(shù)據(jù)分析然后
    發(fā)表于 06-08 15:25

    AI/自動駕駛領(lǐng)域的巔峰會議—國際AI自動駕駛高峰論壇

    由南德意志出版及活動有限公司舉辦的 國際AI自動駕駛高峰論壇 將于 2017年11月28/29日 在 德國慕尼黑 舉辦,中德聯(lián)合股份公司作為中國獨家合作伙伴,誠邀您撥冗蒞臨!【活動背景】AI
    發(fā)表于 09-13 13:59

    如何讓自動駕駛更加安全?

    最近,國內(nèi)多個城市開始發(fā)放自動駕駛的開放道路測試牌照,意味著自動駕駛的汽車可以在公共道路上進行測試。不過,駕駛安全性仍是社會關(guān)注的焦點,美國優(yōu)步公司進行自動駕駛技術(shù)測試發(fā)生致命撞擊事故
    發(fā)表于 05-13 00:26

    自動駕駛汽車的處理能力怎么樣?

    作在未來20 - 30年中,自動駕駛汽車(AV)將改變我們的駕駛習(xí)慣、運輸行業(yè)并更廣泛地影響社會。 我們不僅能夠?qū)⑵囌賳镜轿覀兊募议T口并在使用后將其送走,自動駕駛汽車還將挑戰(zhàn)個人擁有汽車的想法,并
    發(fā)表于 08-07 07:13

    自動駕駛系列報告大放送了涉及傳感器,芯片,執(zhí)行控制等

    ` 本帖最后由 AI汽車人 于 2019-8-9 17:18 編輯 自動駕駛系列報告,總共五部, 自動駕駛系列報告之一:綜合篇:自動駕駛的時代已經(jīng)開始到來,
    發(fā)表于 08-09 17:14

    如何保證自動駕駛的安全?

    美好未來到來的更快。AI還在路測,黑客們的自動駕駛已經(jīng)成熟了這一點并不是危言聳聽,在自動駕駛汽車還處在路測階段時,汽車黑客就已經(jīng)能在地球另一端把你家汽車開走了。早在2015年的一場BlackHat大會上,就有
    發(fā)表于 10-22 07:45

    自動駕駛AI芯片現(xiàn)狀分析

    自動駕駛AI芯片到位了么?
    發(fā)表于 12-04 06:13

    自動駕駛車輛中AI面臨的挑戰(zhàn)

    自動駕駛車輛中采用的AI算法自動駕駛車輛中AI面臨的挑戰(zhàn)
    發(fā)表于 02-22 06:39

    自動駕駛系統(tǒng)設(shè)計及應(yīng)用的相關(guān)資料分享

    作者:余貴珍、周彬、王陽、周亦威、白宇目錄第一章 自動駕駛系統(tǒng)概述1.1 自動駕駛系統(tǒng)架構(gòu)1.1.1 自動駕駛系統(tǒng)的三個層級1.1.2 自動駕駛系統(tǒng)的基本技術(shù)架構(gòu)1.2
    發(fā)表于 08-30 08:36

    【KV260視覺入門套件試用體驗】八、VITis AI自動駕駛多任務(wù)執(zhí)行MultiTask V3

    是一種模型,旨在同時執(zhí)行自動駕駛場景中的不同任務(wù),同時實現(xiàn)優(yōu)異的性能和效率。這些任務(wù)包括對象檢測、分割、車道檢測、可行駛區(qū)域分割和深度估算,這些都是自動駕駛感知模塊的重要組成部分。 三、代碼實現(xiàn)
    發(fā)表于 09-26 16:43

    基于案例推理工作流異常處理研究

    工作流的異常和案例推理(Case - Based Reasoning,簡稱CBR)的機制進行了介紹,給出了一個應(yīng)用CBR 技術(shù)進行異常處理的工作流模型,并研究了應(yīng)用CBR 方法處理工作流
    發(fā)表于 06-15 10:20 ?14次下載