精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

NVIDIA英偉達企業解決方案 ? 來源:未知 ? 2023-03-23 06:55 ? 次閱讀

谷歌云、D-ID、Cohere 將新平臺用于各種生成式 AI 服務,包括聊天機器人、文本生成圖像內容、AI 視頻

加利福尼亞州圣克拉拉 - GTC - 太平洋時間 2023 年 3 月 21 日 – NVIDIA 于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式 AI 應用進行了優化,能夠幫助開發人員快速構建用于提供新服務和洞察的 AI 驅動的專業應用。

這些平臺將 NVIDIA 的全棧推理軟件與最新的 NVIDIA Ada、Hopper 和 Grace Hopper 處理器相結合,包括今天推出的 NVIDIA L4 Tensor Core GPU 和 NVIDIA H100 NVL GPU。各平臺針對 AI 視頻、圖像生成、大型語言模型部署、推薦系統推理等需求激增的工作負載進行了優化。

NVIDIA 創始人兼首席執行官黃仁勛表示:“生成式 AI 的興起需要更加強大的推理計算平臺。生成式 AI 應用的數量是無限的,它唯一的限制就是人類的想象力。為開發人員提供最強大、靈活的推理計算平臺將加快新服務的創造速度,這些新服務將以前所未有的方式改善我們的生活?!?/p>

加速生成式 AI 的各種推理工作負載集

每個平臺都包含一個為特定生成式 AI 推理工作負載而優化的 NVIDIA GPU 和專用的軟件:

  • 適用于 AI 視頻的 NVIDIA L4 可提供比 CPU 高出 120 倍的 AI 視頻性能,同時能效提高了 99%。這款適用于幾乎所有工作負載的通用 GPU 提供更加強大的視頻解碼和轉碼能力、視頻流式傳輸、增強現實、生成式 AI 視頻等。

  • 適用于圖像生成的 NVIDIA L40 針對圖形以及 AI 支持的 2D、視頻和 3D 圖像生成進行了優化。L40 平臺是 NVIDIA Omniverse(一個用于在數據中心構建和運行元宇宙應用的平臺)的引擎,與上一代產品相比,其 Stable Diffusion 推理性能提高了 7 倍,Omniverse 性能提高了 12 倍。

  • 適用于大型語言模型部署的 NVIDIA H100 NVL 是規模化部署像 ChatGPT 這樣的大型語言模型(LLMs)的理想平臺。這款新的 H100 NVL 擁有 94GB 內存和 Transformer 引擎加速,在數據中心規模,與上一代 A100 相比,GPT-3 上的推理性能提高了多達 12 倍。

  • 適用于推薦模型的 NVIDIA Grace Hopper 是圖形推薦模型、矢量數據庫和圖神經網絡的理想平臺。通過 NVLink-C2C 以 900 GB/s 的速度連接 CPU 和 GPU,Grace Hopper 的數據傳輸和查詢速度比 PCIe 5.0 快了 7 倍。

這些平臺的軟件層采用 NVIDIA AI Enterprise 軟件套件,包括用于高性能深度學習推理的軟件開發套件 NVIDIA TensorRT,以及幫助實現模型部署標準化的開源推理服務軟件 NVIDIA Triton Inference Server。

早期采用者與支持

谷歌云是 NVIDIA 推理平臺的重要云合作伙伴和早期客戶。該公司正在將 L4 平臺整合到其機器學習平臺 Vertex AI 中,并且是第一家提供 L4 實例的云服務提供商,其 G2 虛擬機的私人預覽版已于今天推出。

NVIDIA 和谷歌今天分別宣布了首批在谷歌云上使用 L4 的兩家機構——Descript 和 WOMBO,前者使用生成式 AI 幫助創作者制作視頻和播客,后者提供 “Dream” 這一 AI 驅動的文本-數字藝術轉換應用程序。

另一個早期采用者快手提供了一個短視頻應用程序,利用 GPU 對傳入的實時流媒體視頻進行解碼、捕捉關鍵幀并優化音視頻。然后,它使用一個基于 Transformer 的大型模型理解多模態內容,從而提高全球數億用戶的點擊率。

快手高級副總裁于越表示:“快手推薦系統所服務的社區每天的用戶人數超過 3.6 億,他們每天貢獻 3000 萬條 UGC 視頻。在相同的總體擁有成本下,相較于 CPU,NVIDIA GPU 將系統的端到端吞吐量提高了 11 倍,將延遲降低了 20%。”

領先的生成式 AI 技術平臺 D-ID,通過使用 NVIDIA L40 GPU 從文本中生成逼真的數字人,支持任何內容來生成人臉,不僅幫助專業人士改進視頻內容,同時減少了大規模視頻制作的成本和麻煩。

D-ID 研發副總裁 Or Gorodissky 表示:“L40 的性能十分驚人。有了它,我們將推理速度提高了一倍。D-ID 十分高興能夠將這個新硬件作為我們產品的一部分,以前所未有的性能和分辨率實現 AI 人的實時流傳輸,并降低我們的計算成本。”

領先的 AI 制作工作室 Seyhan Lee 使用生成式 AI 為電影、廣播和娛樂行業開發沉浸式體驗和迷人的創意內容。

Seyhan Lee 聯合創始人 Pinar Demirdag 表示:“L40 GPU 為我們的生成式 AI 應用帶來了驚人的性能提升。憑借 L40 的推理能力和內存容量,我們可以部署非常先進的模型,并以驚人的速度和精度向客戶提供創新的服務?!?/p>

語言 AI 領域的先鋒 Cohere 所運行的平臺使得開發人員能夠在保護數據隱私和安全的情況下,構建自然語言模型。

Cohere 首席執行官 Aidan Gomez 表示:“憑借 NVIDIA 的全新高性能 H100 推理平臺,我們可以使用先進的生成式模型為客戶提供更加優質、高效的服務,推動對話式 AI、多語言企業搜索、信息提取等各種 NLP 應用的發展。”

供應情況

NVIDIA L4 GPU 私人預覽版現已通過谷歌云平臺以及 30 多家計算機制造商所組成的全球網絡提供。

NVIDIA L40 GPU 現已通過全球領先的系統提供商提供,并且合作伙伴平臺的數量將在今年持續增加。

Grace Hopper 超級芯片已開始樣品供貨,預計下半年將全面投產。H100 NVL GPU 也將于下半年面市。

NVIDIA AI Enterprise 現在通過各大云市場以及數十家系統提供商和合作伙伴提供。NVIDIA AI Enterprise 為客戶提供 NVIDIA 企業級支持、定期安全審查以及 NVIDIA Triton Inference Server、TensorRT 和 50 多個預訓練模型與框架的 API 穩定性。

NVIDIA LaunchPad 上免費提供的動手實驗室可以試用用于生成式 AI 的 NVIDIA 推理平臺。樣品實驗室的內容包括訓練和部署一個客服聊天機器人、部署一個端到端 AI 工作負載、在 H100 上調整和部署一個語言模型以及使用 NVIDIA Triton 部署一個欺詐檢測模型。

掃描海報二維碼,或點擊“閱讀原文”即可觀看 NVIDIA 創始人兼首席執行官黃仁勛 GTC23 主題演講重播!

ef9782d0-c903-11ed-bfe3-dac502259ad0.gif ?

百里挑一!

3 月 23 日不可錯過的演講!

GTC23 | 黃仁勛與 Ilya Sutskever 的爐邊談話重磅來襲!— 看 AI 的現狀和未來


原文標題:GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3749

    瀏覽量

    90857

原文標題:GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開發了一個全新的生成 AI 模型。利用輸入的文本和音頻,該模型可以創作出包含任意
    的頭像 發表于 11-27 11:29 ?213次閱讀

    NVIDIA助力Amdocs打造生成AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發和交付基于商用大語言模型(LLM)和領域適配
    的頭像 發表于 11-19 14:48 ?261次閱讀

    AMD助力HyperAccel開發全新AI推理服務器

    HyperAccel 是一家成立于 2023 年 1 月的韓國初創企業,致力于開發 AI 推理專用型半導體器件和硬件,最大限度提升推理工作負載的存儲器帶寬使用,并通過將此解決方案應
    的頭像 發表于 09-18 09:37 ?332次閱讀
    AMD助力HyperAccel開發全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b>服務器

    NVIDIA攜手Meta推出AI服務,為企業提供生成AI服務

    NVIDIA近日宣布了一項重大舉措,正式推出NVIDIA AI Foundry服務與NVIDIA NIM(
    的頭像 發表于 07-25 16:57 ?496次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理
    的頭像 發表于 07-25 09:48 ?678次閱讀

    NVIDIA AI Foundry 為全球企業打造自定義 Llama 3.1 生成 AI 模型

    Foundry 提供從數據策管、合成數據生成、微調、檢索、防護到評估的全方位生成 AI 模型服務,以便部署自定義 Llama 3.1
    發表于 07-24 09:39 ?685次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球企業打造自定義 Llama 3.1 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    基于CPU的大型語言模型推理實驗

    隨著計算和數據處理變得越來越分散和復雜,AI 的重點正在從初始訓練轉向更高效的AI 推理。Meta 的 Llama3 是功能強大的公開可用的大型語言
    的頭像 發表于 07-18 14:28 ?487次閱讀
    基于CPU的<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b><b class='flag-5'>推理</b>實驗

    如何加速大語言模型推理

    隨著人工智能技術的飛速發展,大語言模型(LLM)已成為自然語言處理領域的核心工具,廣泛應用于智能客服、文本生成、機器翻譯等多個場景。然而,大
    的頭像 發表于 07-04 17:32 ?470次閱讀

    NVIDIA宣布全面推出 NVIDIA ACE 生成 AI 微服務

    采用 NVIDIA 宣布全面推出 NVIDIA ACE 生成 AI 微服務,以加速新一代數字人
    的頭像 發表于 06-04 10:18 ?624次閱讀

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI
    的頭像 發表于 06-04 09:15 ?651次閱讀

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    NVIDIA NVLink,支持 FP4 AI 精度。 GB200 NVL72是一款性能卓越的計算平臺,采用更快的第二代Transformer引擎和FP8精度,可將大型
    發表于 05-13 17:16

    Snowflake推出面向企業AI的大語言模型

    Snowflake公司近日推出了企業級AI模型——Snowflake Arctic,這是一款大型語言模型
    的頭像 發表于 05-07 10:03 ?456次閱讀

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    。這一過程的不斷迭代使大語言模型語言理解和生成能力逐步提升。大語言模型在自然
    發表于 05-04 23:55

    世界數字技術院發布:生成AI安全測試標準及大語言模型

    據悉,上述兩款標準主要針對大型模型生成AI應用領域的安全檢測設定了新基準。參與制定工作的單位有OpenAI、螞蟻集團、科大訊飛、谷歌、微
    的頭像 發表于 04-17 16:51 ?1005次閱讀

    生成 AI 進入模型驅動時代

    隨著ChatGPT和大型語言模型(LLM)呈現爆炸增長,生成人工智能(GenerativeA
    的頭像 發表于 04-13 08:12 ?493次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 進入<b class='flag-5'>模型</b>驅動時代