精品国产一区二区三区不卡免费_黄片在线免费观看一区二区三区_国产午夜福利精品集在线观看

案例簡介

本案例中通過NVIDIA T4 GPU，通過Ronda平臺調用Triton以及TensorRT，整體提升開發和推理效能，幫助騰訊PCG的多個服務整體效能提升2倍，吞吐量最大提升6倍，同時降低了40%的延時。本案例主要應用到 NVIDIA T4 GPU、TensorRT和Triton。

本案例主要應用到 NVIDIA T4 GPU、TensorRT和Triton。

客戶簡介及應用背景

騰訊平臺與內容事業群（簡稱騰訊PCG）負責公司互聯網平臺和內容文化生態融合發展，整合QQ、QQ空間等社交平臺，和應用寶、瀏覽器等流量平臺，以及新聞資訊、視頻、體育、直播、動漫、影業等內容業務，推動IP跨平臺、多形態發展，為更多用戶創造海量的優質數字內容體驗。

騰訊PCG機器學習平臺部旨在構建和持續優化符合PCG技術中臺戰略的機器學習平臺和系統，提升PCG機器學習技術應用效率和價值。建設業務領先的模型訓練系統和算法框架；提供涵蓋數據標注、模型訓練、評測、上線的全流程平臺服務，實現高效率迭代；在內容理解和處理領域，輸出業界領先的元能力和智能策略庫。機器學習平臺部正服務于PCG所有業務產品。

客戶挑戰

業務繁多，場景復雜

業務開發語言包括C++/Python

模型格式繁多，包括ONNX、Pytorch、TensorFlow、TensorRT等

模型預處理涉及圖片下載等網絡io

多模型融合流程比教復雜，涉及循環調用

支持異構推理

模型推理結果異常時，難以方便地調試定位問題

需要與公司內現有協議/框架/平臺進行融合

應用方案

基于以上挑戰，騰訊PCG選擇了采用NVIDIA 的Triton推理服務器，以解決新場景下模型推理引擎面臨的挑戰，在提升用戶研效的同時，大幅降低了服務成本。

NVIDIA Triton 是一款開源軟件，對于所有推理模式都可以簡化模型在任一框架中以及任何 GPU 或 CPU 上的運行方式，從而在生產環境中使用 AI。Triton 支持多模型ensemble，以及 TensorFlow、PyTorch、ONNX 等多種深度學習模型框架，可以很好的支持多模型聯合推理的場景，構建起視頻、圖片、語音、文本整個推理服務過程，大大降低多個模型服務的開發和維護成本。

基于C++ 的基礎架構、Dynamic-batch、以及對 TensorRT 的支持，同時配合 T4 的 GPU，將整體推理服務的吞吐能力最大提升 6 倍，延遲最大降低 40%，既滿足了業務的低延時需求，成本也降低了20%-66%。

通過將Triton編譯為動態鏈接庫，可以方便地鏈入公司內部框架，對接公司的平臺治理體系。符合C語言規范的API也極大降低了用戶的接入成本。

借助Python Backend和Custom Backend，用戶可以自由選擇使用C++/Python語言進行二次開發。

Triton的Tracing能力可以方便地捕捉執行過程中的數據流狀態。結合Metrics 和 Perf Analysis等組件，可以快速定位開發調試，甚至是線上問題，對于開發和定位問題的效率有很大提升。

NVIDIA DALI 是 GPU 加速的數據增強和圖像加載庫。DALI Backend可以用于替換掉原來的圖片解碼、resize等操作。FIL Backend也可以替代Python XGBoost模型推理，進一步提升服務端推理性能。

方案效果及影響

借助NVIDIA Triton 推理框架，配合 DALI/FIL/Python 等Backend，以及 TensorRT，整體推理服務的吞吐能力最大提升 6 倍，延遲最大降低 40%。幫助騰訊PCG各業務場景中，以更低的成本構建了高性能的推理服務，同時更低的延遲降低了整條系統鏈路的響應時間，優化了用戶體驗。

審核編輯：郭婷

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
4949

瀏覽量
102826
C++

C++

+關注

關注
22

文章
2104

瀏覽量
73503
python

python

+關注

關注
56

文章
4783

瀏覽量
84473

NVIDIA助力Figure發布新一代對話式人形機器人

該初創公司展示了新型機器人，其使用 NVIDIA Isaac Sim 處理合成數據，并使用基于 NVIDIA 加速計算進行實時推理訓練的生成式 AI 模型。

發表于 11-04 10:10 ?215次閱讀

FPGA和ASIC在大模型推理加速中的應用

隨著現在AI的快速發展，使用FPGA和ASIC進行推理加速的研究也越來越多，從目前的市場來說，有些公司已經有了專門做推理的ASIC，像Groq的LPU，專門針對大語言模型的推理做了優化

發表于 10-29 14:12 ?217次閱讀

FPGA和ASIC在大模型<b class='flag-5'>推理</b><b class='flag-5'>加速</b>中的應用

NVIDIA助力麗蟾科技打造AI訓練與推理加速解決方案

麗蟾科技通過 Leaper 資源管理平臺集成 NVIDIA AI Enterprise，為企業和科研機構提供了一套高效、靈活的 AI 訓練與推理加速解決方案。無論是在復雜的 AI 開發任務中，還是在高并發

發表于 10-27 10:03 ?168次閱讀

<b class='flag-5'>NVIDIA</b><b class='flag-5'>助力</b>麗蟾科技打造AI訓練與<b class='flag-5'>推理</b><b class='flag-5'>加速</b>解決方案

NVIDIA與思科合作打造企業級生成式AI基礎設施

由 NVIDIA 加速計算平臺、NVIDIA AI Enterprise 軟件和 NVIDIA NIM 推理微服務加持的思科 Nexus H

發表于 10-10 09:35 ?294次閱讀

NVIDIA助力提供多樣、靈活的模型選擇

在本案例中，Dify 以模型中立以及開源生態的優勢，為廣大 AI 創新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務器產品，為

發表于 09-09 09:19 ?440次閱讀

英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務，與同樣剛推出的 Llama 3.1 系列開源模型一起，為全球企業的生成式 AI

發表于 07-25 09:48 ?675次閱讀

LLM大模型推理加速的關鍵技術

LLM（大型語言模型）大模型推理加速是當前人工智能領域的一個研究熱點，旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型推理加速關鍵技術的詳細探討，內容將涵蓋模型壓縮、

發表于 07-24 11:38 ?783次閱讀

NVIDIA加速計算和 AI助力數字銀行揭穿金融欺詐騙局

Bunq 利用 NVIDIA AI 將其欺詐檢測模型的訓練速度提高近百倍。 ? 歐洲新型銀行 Bunq 正在 NVIDIA 加速計算和 AI 的助力下，揭穿金融欺詐者的騙局。被稱為“

發表于 06-27 17:41 ?796次閱讀

英特爾助力京東云用CPU加速AI推理，以大模型構建數智化供應鏈

發表于 05-27 11:50 ?507次閱讀

英特爾<b class='flag-5'>助力</b>京東云用CPU<b class='flag-5'>加速</b>AI<b class='flag-5'>推理</b>，以大模型構建數智化供應鏈

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫，用于優化從 PC 到云端的 NVID

發表于 04-28 10:36 ?491次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實踐中，唯品會 AI 平臺與 NVIDIA 團隊合作，結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將推理的稠密網絡和熱

發表于 04-20 09:39 ?650次閱讀

使用NVIDIA Triton推理服務器來加速AI預測

這家云計算巨頭的計算機視覺和數據科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。

發表于 02-29 14:04 ?547次閱讀

利用NVIDIA產品技術組合提升用戶體驗

本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學習模型，并借助NVIDIA Triton推理服務器在

發表于 01-17 09:30 ?658次閱讀

什么是Triton-shared？Triton-shared的安裝和使用

經過前面幾章關于triton在nv gpu上調優的講解，我們這章開始來看看triton的一個third_party庫，該庫是為了讓triton去支持更多其他的backend。該項目的地址如下所示

發表于 12-19 09:47 ?1125次閱讀

NVIDIA 初創加速計劃 Omniverse 加速營

新的 AI 技術和迅速發展的應用正在改變各行各業，生成式 AI 已經展示出在藝術、設計、影視動畫、互娛、建筑等領域加速內容創作的價值，助力實現高質量、高效率、多樣化的內容生產，成為推動數字生產力變革

發表于 12-04 20:35 ?622次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

NVIDIA Triton助力騰訊PCG加速在線推理

評論

NVIDIA助力Figure發布新一代對話式人形機器人

FPGA和ASIC在大模型推理加速中的應用

NVIDIA助力麗蟾科技打造AI訓練與推理加速解決方案

NVIDIA與思科合作打造企業級生成式AI基礎設施

NVIDIA助力提供多樣、靈活的模型選擇

英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

LLM大模型推理加速的關鍵技術

NVIDIA加速計算和 AI助力數字銀行揭穿金融欺詐騙局

英特爾助力京東云用CPU加速AI推理，以大模型構建數智化供應鏈

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

利用NVIDIA組件提升GPU推理的吞吐

使用NVIDIA Triton推理服務器來加速AI預測

利用NVIDIA產品技術組合提升用戶體驗

什么是Triton-shared？Triton-shared的安裝和使用

NVIDIA 初創加速計劃 Omniverse 加速營