NVIDIA推出用于大型語言模型和生成式AI工作負載的推理平臺

谷歌云、D-ID、Cohere將新平臺用于各種生成式AI服務，包括聊天機器人、文本生成圖像內容、AI視頻等。
?

?
加利福尼亞州圣克拉拉 -? GTC - 太平洋時間2023年3月21日 – NVIDIA于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式AI應用進行了優化，能夠幫助開發人員快速構建用于提供新服務和洞察的AI驅動的專業應用。
?
這些平臺將NVIDIA的全棧推理軟件與最新的NVIDIA Ada、Hopper和Grace Hopper處理器相結合，包括今天推出的NVIDIA L4 Tensor Core GPU和NVIDIA H100 NVL GPU。各平臺針對AI視頻、圖像生成、大型語言模型部署、推薦系統推理等需求激增的工作負載進行了優化。
?
NVIDIA創始人兼首席執行官黃仁勛表示：“生成式AI的興起需要更加強大的推理計算平臺。生成式AI應用的數量是無限的，它唯一的限制就是人類的想象力。為開發人員提供最強大、靈活的推理計算平臺將加快新服務的創造速度，這些新服務將以前所未有的方式改善我們的生活。”
?
加速生成式AI的各種推理工作負載集

每個平臺都包含一個為特定生成式AI推理工作負載而優化的NVIDIA GPU和專用的軟件：
?

適用于AI視頻的NVIDIA L4可提供比CPU高出120倍的AI視頻性能，同時能效提高了99%。這款適用于幾乎所有工作負載的通用GPU提供更加強大的視頻解碼和轉碼能力、視頻流式傳輸、增強現實、生成式AI視頻等。

適用于圖像生成的NVIDIA L40針對圖形以及AI支持的2D、視頻和3D圖像生成進行了優化。L40平臺是NVIDIA Omniverse?（一個用于在數據中心構建和運行元宇宙應用的平臺）的引擎，與上一代產品相比，其Stable Diffusion推理性能提高了7倍，Omniverse性能提高了12倍。

適用于大型語言模型部署的NVIDIA H100 NVL是規模化部署像ChatGPT這樣的大型語言模型（LLMs）的理想平臺。這款新的H100 NVL擁有94GB內存和Transformer引擎加速，在數據中心規模，與上一代A100相比，GPT-3上的推理性能提高了多達12倍。

適用于推薦模型的NVIDIA Grace Hopper是圖形推薦模型、矢量數據庫和圖神經網絡的理想平臺。通過NVLink-C2C以900 GB/s 的速度連接CPU和GPU，Grace Hopper的數據傳輸和查詢速度比PCIe 5.0快了7倍。

?
這些平臺的軟件層采用NVIDIA AI Enterprise軟件套件，包括用于高性能深度學習推理的軟件開發套件NVIDIA TensorRT?，以及幫助實現模型部署標準化的開源推理服務軟件NVIDIA Triton Inference Server?。
?
早期采用者與支持

谷歌云是NVIDIA推理平臺的重要云合作伙伴和早期客戶。該公司正在將L4平臺整合到其機器學習平臺Vertex AI中，并且是第一家提供L4實例的云服務提供商，其G2虛擬機的私人預覽版已于今天推出。
?
NVIDIA和谷歌今天分別宣布了首批在谷歌云上使用L4的兩家機構——Descript和WOMBO，前者使用生成式AI幫助創作者制作視頻和播客，后者提供“Dream”這一AI驅動的文本-數字藝術轉換應用程序。
?
另一個早期采用者快手提供了一個短視頻應用程序，利用GPU對傳入的實時流媒體視頻進行解碼、捕捉關鍵幀并優化音視頻。然后，它使用一個基于Transformer的大型模型理解多模態內容，從而提高全球數億用戶的點擊率。
?
快手高級副總裁于越表示：“快手推薦系統所服務的社區每天的用戶人數超過3.6億，他們每天貢獻3000萬條UGC視頻。在相同的總體擁有成本下，相較于CPU，NVIDIA GPU將系統的端到端吞吐量提高了11倍，將延遲降低了20%?！?br /> ?
領先的生成式AI技術平臺D-ID，通過使用NVIDIA L40 GPU從文本中生成逼真的數字人，支持任何內容來生成人臉，不僅幫助專業人士改進視頻內容，同時減少了大規模視頻制作的成本和麻煩。
?
D-ID研發副總裁Or Gorodissky表示：“L40的性能十分驚人。有了它，我們將推理速度提高了一倍。D-ID十分高興能夠將這個新硬件作為我們產品的一部分，以前所未有的性能和分辨率實現AI人的實時流傳輸，并降低我們的計算成本?！?br /> ?
領先的AI制作工作室Seyhan Lee使用生成式AI為電影、廣播和娛樂行業開發沉浸式體驗和迷人的創意內容。
?
Seyhan Lee聯合創始人Pinar Demirdag表示：“L40 GPU為我們的生成式AI應用帶來了驚人的性能提升。憑借L40的推理能力和內存容量，我們可以部署非常先進的模型，并以驚人的速度和精度向客戶提供創新的服務。”
?
語言AI領域的先鋒Cohere所運行的平臺使得開發人員能夠在保護數據隱私和安全的情況下，構建自然語言模型。
?
Cohere首席執行官Aidan Gomez表示：“憑借NVIDIA的全新高性能H100推理平臺，我們可以使用先進的生成式模型為客戶提供更加優質、高效的服務，推動對話式AI、多語言企業搜索、信息提取等各種NLP應用的發展?！?br /> ?
供應情況
NVIDIA L4 GPU私人預覽版現已通過谷歌云平臺以及30多家計算機制造商所組成的全球網絡提供。
?
NVIDIA L40 GPU現已通過全球領先的系統提供商提供，并且合作伙伴平臺的數量將在今年持續增加。
?
Grace Hopper超級芯片已開始樣品供貨，預計下半年將全面投產。H100 NVL GPU也將于下半年面市。
?
NVIDIA AI Enterprise現在通過各大云市場以及數十家系統提供商和合作伙伴提供。NVIDIA AI Enterprise為客戶提供NVIDIA 企業級支持、定期安全審查以及NVIDIA Triton Inference Server?、TensorRT?和50多個預訓練模型與框架的API穩定性。
?
NVIDIA LaunchPad上免費提供的動手實驗室可以試用用于生成式AI的NVIDIA推理平臺。樣品實驗室的內容包括訓練和部署一個客服聊天機器人、部署一個端到端AI工作負載、在H100上調整和部署一個語言模型以及使用NVIDIA Triton部署一個欺詐檢測模型。
?

閱讀全文

NVIDIA(101461) NVIDIA(101461)
AI(263628) AI(263628)
生成式AI(160) 生成式AI(160)

大型語言模型的邏輯推理能力探究

最新研究揭示，盡管大語言模型LLMs在語言理解上表現出色，但在邏輯推理方面仍有待提高。為此，研究者們推出了GLoRE，一個全新的邏輯推理評估基準，包含12個數據集，覆蓋三大任務類型。

2023-11-23 15:05:16

476

探索高效的大型語言模型！大型語言模型的高效學習方法

在大型語言模型（LLMs）的應用中，提示工程（Prompt Engineering）是一種關鍵技術，用于引導模型生成特定輸出或執行特定任務。通過精心設計的提示，可以顯著提高LLMs的性能和適用性。本文將介紹提示工程的主要方法和技巧，包括少樣本提示、提示壓縮和提示生成。

2023-12-13 14:21:47

274

NVIDIA 借助超大規模 AI 語言模型為全球企業賦能

NVIDIA NeMo Megatron 框架; 可定制的大規模語言模型 Megatron 530B；多GPU、多節點 Triton推理服務器助力基于語言的AI開發和部署，推動行業和科學發展。

2021-11-10 14:22:52

752

NVIDIA 推出大型語言模型云服務以推進 AI 和數字生物學的發展

NVIDIA NeMo 大型語言模型（LLM）服務幫助開發者定制大規模語言模型；NVIDIA BioNeMo 服務幫助研究人員生成和預測分子、蛋白質及 DNA ? 美國加利福尼亞州圣克拉拉

2022-09-21 15:24:52

434

NVIDIA推出DGX GH200 AI超級計算機

驅動的NVIDIA DGX?超級計算機，旨在助力開發面向生成式AI語言應用、推薦系統和數據分析工作負載的巨型、下一代模型。 ? NVIDIA DGX GH200的超大共享內存空間通過NVLink互連技術以及NVLink

2023-05-30 14:15:36

422

AI大模型在醫療領域起飛

電子發燒友網報道（文/李彎彎）ChatGPT等大型語言模型在語言理解、生成、知識推理等方面正展現出令人驚艷的能力。近段時間，各企業開始探索大模型在不同行業中的應用落地，并針對不同領域推出相對應的行業

2023-07-25 00:12:00

1434

NVIDIA Jetson的相關資料分享

Jetson概述爆炸式增長的AI模型的復雜性專為自主機器開發人員設計的AI計算板加快AI處理的SDK“JetPack”概述NVIDIA Jetson是NVIDIA公司嵌入式單板計算機的一系列

2021-11-09 08:26:45

NVIDIA 在首個AI推理基準測試中大放異彩

的BERT、GNMT 和Jasper 等AI模型開源優化幫助開發者實現頂尖推理性能。NVIDIA的客戶和合作伙伴中包括有會話式AI領域的一流公司，比如Kensho、微軟、Nuance、Optum等。最后要

2019-11-08 19:44:51

AscendCL快速入門——模型推理篇（上）

騰CANN平臺專用的離線模型，既然要調用模型進行推理，首先當然是要把模型加載進來，最簡單的場景就是從磁盤加載一個離線模型文件進內存，接口如下： aclError aclmdlLoadFromFile

2023-08-24 11:04:14

Dllite_micro （輕量級的 AI 推理框架）

DLLite-Micro 是一個輕量級的 AI 推理框架，可以為 OpenHarmony OS 的輕量設備和小型設備提供深度模型的推理能力DLLite-Micro 向開發者提供清晰、易上手的北向接口

2021-08-05 11:40:11

HarmonyOS：使用MindSpore Lite引擎進行模型推理

場景介紹 MindSpore Lite 是一款 AI 引擎，它提供了面向不同硬件設備 AI 模型推理的功能，目前已經在圖像分類、目標識別、人臉識別、文字識別等應用中廣泛使用。本文介紹

2023-12-14 11:41:13

壓縮模型會加速推理嗎？

你好我使用 STM32CUBE-AI v5.1.2 ApplicationTemplate 將簡單的 CNN 導入到 STM32L462RCT我發現壓縮模型對推理時間沒有影響。aiRun 程序在 8

2023-01-29 06:24:08

在X-CUBE-AI.7.1.0中導入由在線AI平臺生成的.h5模型報錯怎么解決？

你好，我試圖在 X-CUBE-AI.7.1.0 中導入由在線 AI 平臺生成的 .h5 模型，收到錯誤：E010(InvalidModelError): Model saved with Keras 2.7.0 but

2022-12-27 06:10:35

基于SRAM的方法可以加速AI推理

基于SRAM的方法可加速AI推理

2020-12-30 07:28:28

如何在RK3399這一 Arm64平臺上搭建Tengine AI推理框架呢

Tengine是什么呢？如何在RK3399這一 Arm64平臺上搭建Tengine AI推理框架呢？

2022-03-04 12:31:35

嵌入式AI在linux芯片平臺上的部署方案分享

ONNX文件并生成特定平臺和運行框架所支持的神經網絡模型。ONNX本身不是AI神經網絡運行框架，只是AI神經網絡模型通用中間描述文件格式GitHub鏈接https://github.com/onnx/onnx編程語言C++ / Python熱度5星Tenso

2021-12-14 06:18:44

嵌入式邊緣AI應用開發指南

如果在沒有嵌入式處理器供應商提供的合適工具和軟件的支持下，既想設計高能效的邊緣人工智能(AI)系統，同時又要加快產品上市時間，這項工作難免會冗長乏味。面臨的一系列挑戰包括選擇恰當的深度學習模型

2022-11-03 06:53:28

深度剖析OpenHarmony AI調度管理與推理接口

管理圖主要流程：任務推理創建流程：首先配置客戶端sessionId，端配置clientId，由clientId和clientId組合生成唯一的transactionId，然后根據模型框架類型和推理網絡

2022-03-25 11:15:36

深度學習推理和計算-通用AI核心

，支持廣泛的應用程序和動態工作負載。本文將討論這些行業挑戰可以在不同級別的硬件和軟件設計采用Xilinx VERSAL AI核心，業界首創自適應計算加速平臺超越了CPU/GPU和FPGA的性能。

2020-11-01 09:28:57

LuxStudio增材制造晶格模型自動生成平臺

對一些非參數化設計師以及3D打印純小白非常不友好。為此，清鋒科技推出了面向增材制造的晶格模型自動生成平臺——LuxStudio，不僅可以實現多種結構晶格的自動生成

2022-11-09 10:43:02

亞馬遜推出AWS Inferentia芯片專門用于部署帶有GPU的大型AI模型

亞馬遜宣布推出Inferentia，這是由AWS設計的芯片，專門用于部署帶有GPU的大型AI模型，該芯片將于明年推出。

2018-12-03 09:46:08

1753

NVIDIA技術助力線上大模型推理

自然語言理解、匹配排序等等，這些模型的訓練和推理都大量依賴于NVIDIA GPU，尤其在推理方面，NVIDIA GPU及相應的解決方案都滿足了業務所需的延遲和吞吐要求。微信搜索業務需要更高效平臺微信搜索業務由多個子模塊構成，包括查

2021-10-28 15:28:12

1551

NVIDIA為全球企業開發和部署大型語言模型打開一扇新的大門

NVIDIA NeMo Megatron 框架; 可定制的大規模語言模型Megatron 530B；多GPU、多節點 Triton推理服務器助力基于語言的AI開發和部署，推動行業和科學發展

2021-11-12 14:30:07

1327

NVIDIA宣布其AI推理平臺的重大更新

軟件的新功能，該軟件為所有AI模型和框架提供跨平臺推理；同時也包含對NVIDIA TensorRT的更新，該軟件優化AI模型并為NVIDIA GPU上的高性能推理提供運行時優化。 NVIDIA還推出了NVIDIA A2 Tensor Core GPU，這是一款用于邊

2021-11-12 14:42:53

1684

NVIDIA Triton開源推理服務軟件三大功能推動效率提升

Microsoft Teams借助AI生成的實時字幕和轉錄功能，幫助全球學生和職場人士順利進行在線會議。用于訓練的NVIDIA AI計算技術和用于推理語音識別模型的NVIDIA Triton推理服務器進一步提升了這兩個功能。

2022-01-04 14:20:11

1407

NVIDIA Triton推理服務器幫助Teams使用認知服務優化語音識別模型

2022-01-04 17:45:12

1472

Microsoft使用NVIDIA Triton加速AI Transformer模型應用

Microsoft 的目標是，通過結合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件，率先將一系列強大的 AI Transformer 模型投入生產用途。

2022-04-02 13:04:21

1456

NVIDIA推理平臺和全棧方法提供最佳性能

現在，您和開發人員社區的其他成員都可以使用這些成果，主要是以開源軟件的形式。此外， TensorRT 和 Triton 推理服務器可從?NVIDIA NGC?免費獲得，以及預訓練模型、深度學習框架

2022-04-08 16:31:31

931

NVIDIA TensorRT助力打造AI計算機視覺算法推理平臺

“在使用 NVIDIA TensorRT和NVIDIA T4 GPU對平臺賦能后，“極星”推理平臺的算法推理效率得到了進一步的提升，更好地支持速接入各類算法、數據及智能設備，實現AI自閉環能力，并通過應用服務和標準化接口，幫助終端客戶低成本實現AI與業務的結合，快速構建智能應用。

2022-04-13 14:49:19

862

使用NVIDIA Triton推理服務器簡化邊緣AI模型部署

　　NVIDIA Triton 有助于在每個數據中心、云和嵌入式設備中實現標準化的可擴展生產 AI 。它支持多個框架，在 GPU 和 DLA 等多個計算引擎上運行模型，處理不同類型的推理查詢。通過與 NVIDIA JetPack 的集成， NVIDIA Triton 可用于嵌入式應用。

2022-04-18 15:40:02

2306

基于NVIDIA Triton的AI模型高效部署實踐

NVIDIA Triton 推理服務器(以前稱為 TensorRT 推理服務器)是一款開源軟件，可簡化深度學習模型在生產環境中的部署。借助 Triton 推理服務器，Devops 和 MLops

2022-06-28 15:49:47

1293

騰訊云與NVIDIA仍持續為AI推理加速進行合作

Kit 不僅大大提升了 GPU 集群上多機多卡分布式訓練的效率，對于 GPU 上的模型推理也通過集成 NVIDIA TensorRT 帶來了顯著加速。雙方團隊就 GPU 推理加速這一話題將進行持續深入的合作，推出定制化的優化方案，為業界客戶帶來顯著的性能收益。

2022-08-31 09:24:07

1235

騰訊云TI平臺利用NVIDIA Triton推理服務器構造不同AI應用場景需求

騰訊云 TI 平臺 TI-ONE 利用 NVIDIA Triton 推理服務器構造高性能推理服務部署平臺，使用戶能夠非常便捷地部署包括 TNN 模型在內的多種深度學習框架下獲得的 AI 模型，并且顯著提升推理服務的吞吐、提升 GPU 利用率。

2022-09-05 15:33:01

1419

螞蟻鏈AIoT團隊與NVIDIA合作加速AI推理

螞蟻鏈 AIoT 團隊與 NVIDIA 合作，將量化感知訓練(QAT)技術應用于深度學習模型性能優化中，并通過 NVIDIA TensorRT 高性能推理 SDK 進行高效率部署，通過 INT8 推理，吞吐量提升了 3 倍，助力螞蟻鏈版權 AI 平臺中的模型推理服務大幅降本增效。

2022-09-09 09:53:52

872

NVIDIA NeMo最新語言模型服務幫助開發者定制大規模語言模型

NVIDIA NeMo 大型語言模型（LLM）服務幫助開發者定制大規模語言模型；NVIDIA BioNeMo 服務幫助研究人員生成和預測分子、蛋白質及 DNA

2022-09-22 10:42:29

742

KT利用NVIDIA AI平臺訓練大型語言模型

韓國先進的移動運營商構建包含數百億個參數的大型語言模型，并使用 NVIDIA DGX SuperPOD 平臺和 NeMo Megatron 框架訓練該模型。

2022-09-27 09:24:30

915

NVIDIA AI平臺為大型語言模型帶來巨大收益

隨著大型語言模型（ LLM ）的規模和復雜性不斷增長， NVIDIA 今天宣布更新 NeMo Megatron 框架，提供高達 30% 的訓練速度。

2022-10-10 15:39:42

644

NVIDIA GPU加速潞晨科技Colossal-AI大模型開發進程

通過 NVIDIA GPU 加速平臺，Colossal-AI 實現了通過高效多維并行、異構內存管理、大規模優化庫、自適應任務調度等方式，更高效快速部署 AI 大模型訓練與推理。

2022-10-19 09:39:39

1149

NVIDIA 和 Evozyne 創建用于生成蛋白質的生成式 AI 模型

科學家使用 NVIDIA BioNeMo 創建出能夠生成高質量蛋白質的大型語言模型，以此加快藥物研發并助力創造更具可持續性的環境。初創企業 Evozyne 使用 NVIDIA 提供的預訓練 AI

2023-01-13 23:15:02

419

大型語言模型有哪些用途？

大型語言模型能識別、總結、翻譯、預測和生成文本及其他內容。 AI 應用在大型語言模型的幫助下，可用于解決總結文章、編寫故事和參與長對話等多種繁重工作。大型語言模型（LLM）是一種深度學習算法，可以

2023-02-23 19:50:04

3887

大型語言模型有哪些用途？大型語言模型如何運作呢？

大型語言模型能識別、總結、翻譯、預測和生成文本及其他內容。

2023-03-08 13:57:00

6989

NVIDIA 為全球企業帶來生成式 AI 推出用于創建大型語言模型和視覺模型的云服務

為AI驅動的應用構建自定義模型 ? 加利福尼亞州圣克拉拉 – GTC – 太平洋時間 2023年3月21日 – 為了加速企業應用生成式AI，NVIDIA今日宣布推出一套云服務，使企業能夠構建、完善

2023-03-22 13:45:40

261

NVIDIA GTC 2023:GPU算力是AI的必需品

NVIDIA 創始人兼首席執行官黃仁勛將在 GTC 2023 上介紹生成式 AI、元宇宙、大型語言模型、云計算等領域的最新進展。同時黃仁勛不僅闡述了NVIDIA 在人工智能時代的諸多成就和對未來發展

2023-03-22 15:23:28

2900

英偉達 GTC 2023上黃仁勛談生成式AI

，NVIDIA AI Foundations云服務系列為需要構建、完善和運行自定義大型語言模型及生成式AI的客戶提供服務，他們通常使用專有數據進行訓練并完成特定領域的任務。圖源? NVIDIA 直播截圖 Audio2Face 可以支持中文

2023-03-22 17:14:33

1621

GTC23 | NVIDIA 為全球企業帶來生成式 AI，推出用于創建大型語言模型和視覺模型的云服務

Foundations 云服務為 AI 驅動的應用構建自定義模型加利福尼亞州圣克拉拉 – GTC – 太平洋時間 2023年3月21日 – 為了加速企業應用生成式 AI，NVIDIA 宣布推出一套云服務，使企業

2023-03-23 06:50:04

365

GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

日 – NVIDIA 于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式 AI 應用進行了優化，能夠幫助開發人員快速構建用于提供新服務和洞察的 AI 驅動的專業應用。這些平臺將 NVIDIA

2023-03-23 06:55:02

654

GTC23 | NVIDIA 攜手谷歌云提供強大的全新生成式 AI 平臺，基于新款 L4 GPU 和 Vertex AI 構建

NVIDIA 生成式 AI 推理平臺將集成至谷歌云 Vertex AI 中；谷歌云成為首家提供 NVIDIA L4 GPU 實例的云服務商加利福尼亞州圣克拉拉 – GTC – 太平洋時間 2023

2023-03-23 06:55:02

438

GTC23 | NVIDIA 發布大型語言模型和生成式 AI 服務以推動生命科學研發

年 3 月 21 日 – NVIDIA 今日推出一整套用于自定義 AI 基礎模型的生成式 AI 云服務。這些服務將加速新蛋白質和治療方法的創建以及基因組學、化學、生物學和分子動力學等領域的研究。作為

2023-03-23 06:55:03

328

GTC23 | 彌補不足：大型語言模型借企業數據之力變得更加智能

NVIDIA NeMo 服務幫助企業將大型語言模型與其專有數據相結合，賦能智能聊天機器人、客戶服務等更多應用。如今的大型語言模型知識淵博，但它們的工作方式有點像時間膠囊——所收集的信息僅限于第一次

2023-03-25 09:10:03

274

GTC23 | NVIDIA 為全球企業帶來生成式 AI，推出用于創建大型語言模型和視覺模型的云服務

2023-03-25 15:20:04

285

NVIDIA 在 MLPerf 測試中將推理帶到新高度

在最新 MLPerf 基準測試中，NVIDIA H100 和 L4 GPU 將生成式 AI 和所有其他工作負載帶到了新的水平，Jetson AGX Orin 則在性能和效率方面都有所提升。作為獨立

2023-04-08 00:30:08

389

ServiceNow 與 NVIDIA 宣布聯合打造面向企業 IT 的生成式 AI

基于 ServiceNow 平臺并采用 NVIDIA AI 軟件和 DGX 基礎設施構建的自定義大型語言模型將為企業帶來更智能的工作流自動化 ServiceNow 和 NVIDIA 宣布達成合作伙伴

2023-05-19 00:50:02

342

NVIDIA 與微軟合作加速企業就緒的生成式 AI

NVIDIA AI Enterprise 與 Azure 機器學習集成，提供端到端云平臺，供開發者構建、部署和管理大型語言模型的 AI 應用微軟 Build 大會——太平洋時間 2023

2023-05-25 09:15:02

347

戴爾科技集團與 NVIDIA 聯合發布用于安全、本地化部署生成式 AI 的 Project Helix

?? Project Helix 使企業能夠輕松構建和部署值得信賴的生成式 AI ?? 戴爾和 NVIDIA 的基礎設施與軟件包含內置的數據安全功能，用于本地生成式 AI 應用戴爾科技集團全球大會

2023-05-25 09:15:02

349

NVIDIA 攜手微軟，在生成式 AI 的新時代推動 Windows PC 創新

行業領導者打破藩籬，使開發人員能夠輕松地在 Windows 11 上訓練并部署先進的 AI 模型，并在配備 RTX 的 PC 和工作站上提供節能的推理。生成式 AI，以 ChatGPT 等大型語言

2023-05-25 09:15:02

509

大型語言模型能否捕捉到它們所處理和生成的文本中的語義信息

? 大型語言模型能否捕捉到它們所處理和生成的文本中的語義信息？這一問題在計算機科學和自然語言處理領域一直存在爭議。然而，MIT的一項新研究表明，僅基于文本形式訓練、用于預測下一個token的語言模型

2023-05-25 11:34:11

434

COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超級計算機

Switch System 驅動的 NVIDIA DGX 超級計算機，旨在助力開發面向生成式 AI 語言應用、推薦系統和數據分析工作負載的巨型、下一代模型。 NVIDIA DGX GH200 的超大共享內存空間通過 NVLink 互連技術以及 NV

2023-05-30 01:40:01

1459

COMPUTEX2023 | NVIDIA 推出面向超大規模生成式 AI 的加速以太網平臺

全新的 NVIDIA Spectrum-X 網絡平臺集 NVIDIA Spectrum-4、BlueField-3 DPU 和加速軟件于一身；全球頭部云服務提供商采用該平臺來橫向擴展其生成式 AI

2023-05-30 01:40:02

352

NVIDIA 為 1 億臺 Windows RTX PC 和工作站提供全新生成式 AI 功能與突破性性能

搭載 Tensor Core 的 NVIDIA RTX GPU 正在加速生成式 AI 模型的開發與部署；即將推出的 Max-Q 低功耗 AI 推理將提高能效比。生成式 AI 正在迅速開創一個計算

2023-05-31 03:50:02

344

NVIDIA為Windows RTX工作站提供全新生成式AI功能與突破性性能

隨著越來越多的 AI 推理在本地設備上運行，工作站將需要強大而高效的硬件以支持這些復雜的任務。為了滿足這一需求，RTX GPU 將添加用于 AI 工作負載的 Max-Q 低功耗推理。在執行輕量級

2023-06-07 14:55:24

442

基于Transformer的大型語言模型（LLM）的內部機制

本文旨在更好地理解基于 Transformer 的大型語言模型（LLM）的內部機制，以提高它們的可靠性和可解釋性。隨著大型語言模型（LLM）在使用和部署方面的不斷增加，打開黑箱并了解它們的內部

2023-06-25 15:08:49

991

大型語言模型的應用

?? 大型語言模型（LLM）是一種深度學習算法，可以通過大規模數據集訓練來學習識別、總結、翻譯、預測和生成文本及其他內容。大語言模型（LLM）代表著 AI 領域的重大進步，并有望通過習得的知識改變

2023-07-05 10:27:35

1463

如何使用NVIDIA Triton 推理服務器來運行推理管道

使用集成模型在 NVIDIA Triton 推理服務器上為 ML 模型管道提供服務

2023-07-05 16:30:34

1082

AI和大語言模型給云計算和DevOps帶來了哪些影響？

通過降低認知負載和為即時管理、工單系統和代碼生成等任務提供支持，人工智能（AI）和大型語言模型（LLMs）可能在云計算和 DevOps 領域發揮重要作用。主要的云計算供應商，如微軟、谷歌和亞馬遜云科技等，已經將 AI 集成到他們的產品和服務中，充分展示了行業在 AI 技術上的投入。

2023-08-03 15:26:42

813

NVIDIA 與 Hugging Face 將連接數百萬開發者與生成式 AI 超級計算

年 8 月 8 日 — NVIDIA 與 Hugging Face 宣布建立合作伙伴關系，為數百萬開發者提供生成式 AI 超級計算服務，幫助他們構建大語言模型（LLM）和其他高級 AI 應用。 ? 此次

2023-08-09 11:41:59

100

SIGGRAPH 2023 | NVIDIA 與全球數據中心系統制造商大力推動 AI 與工業數字化的發展

計算密集型的復雜應用，包括 AI 訓練與推理、3D 設計與可視化、視頻處理以及工業數字化等。這款全新 GPU 將加速生成式 AI 的計算工作負載。生成式 A

2023-08-09 19:10:06

264

SIGGRAPH 2023 | NVIDIA AI Workbench 助力全球企業加速采用自定義生成式 AI

從 PC 和工作站到企業數據中心、公有云和 NVIDIA DGX 云，新推出的開發者套件在 NVIDIA AI 平臺上引入了簡化的模型優化與部署。洛杉磯 — SIGGRAPH — 太平洋時間

2023-08-09 19:10:09

261

英偉達全球首發HBM3e 專為生成式AI時代打造

2023年8月8日，NVIDIA創始人兼CEO黃仁勛在計算機圖形年會SIGGRAPH上發布了HBM3e內存新一代GH200 Grace Hopper超級芯片。這款芯片被黃仁勛稱為“加速計算和生成式AI時代的處理器”，旨在用于任何大型語言模型，以降低推理成本。

2023-08-11 16:29:17

767

清華大學大語言模型綜合性能評估報告發布！哪個模型更優秀？

近日，清華大學新聞與傳播學院發布了《大語言模型綜合性能評估報告》，該報告對目前市場上的7個大型語言模型進行了全面的綜合評估。近年，大語言模型以其強大的自然語言處理能力，成為AI領域的一大熱點。它們

2023-08-10 08:32:01

607

生成式AI時代要來了嗎 NVIDIA生成式AI獲新突破

這些性能強大的新系統將利用 NVIDIA Omniverse 平臺加速高計算密集度的復雜應用，包括 AI 訓練和推理、3D 設計和可視化、視頻處理、工業數字化等。

2023-08-23 14:20:18

224

VMware 與 NVIDIA 為企業開啟生成式 AI 時代

全新 VMware Private AI Foundation With NVIDIA 幫助企業為生成式 AI 在業務中的應用做好準備；該平臺將在數據隱私性、安全性和可控性方面提供進一步支持

2023-08-23 19:10:07

446

全球領先系統制造商推出 NVIDIA AI 就緒型服務器，為企業大幅提升生成式 AI 性能

戴爾科技、慧與和聯想即將推出采用 NVIDIA L40S GPU 和 NVIDIA BlueField 的服務器，以支持 VMware Private AI Foundation

2023-08-23 19:10:09

350

Meta發布一款可以使用文本提示生成代碼的大型語言模型Code Llama

今天，Meta發布了Code Llama，一款可以使用文本提示生成代碼的大型語言模型（LLM）。

2023-08-25 09:06:57

885

谷歌云與 NVIDIA 進一步深化合作

兩家 AI 領軍企業一同優化谷歌云，使更多生成式 AI 領域的初創企業能夠構建下一代應用。生成式 AI 和大語言模型（LLM）不斷推動創新，使訓練和推理工作的算力需求以驚人的速度增長。為了滿足

2023-08-31 13:00:03

230

訓練大語言模型帶來的硬件挑戰

生成式AI和大語言模型（LLM）正在以難以置信的方式吸引全世界的目光，本文簡要介紹了大語言模型，訓練這些模型帶來的硬件挑戰，以及GPU和網絡行業如何針對訓練的工作負載不斷優化硬件。

2023-09-01 17:14:56

1046

虹科分享 | 谷歌Vertex AI平臺使用Redis搭建大語言模型

化。有Redis加持的大語言模型可應用于文檔檢索、虛擬購物助手、客戶服務助理等，為企業帶來益處。一、語言模型構件應用程序生成、理解和使用人類語言的能力正變得越來越重要，從客服機器人到虛擬助手，再到內容生成，人們對AI應用功能的需求橫跨眾多領

2023-09-18 11:26:49

316

Oracle 云基礎設施提供新的 NVIDIA GPU 加速計算實例

生成式 AI 和大語言模型（LLM）不斷推動突破性創新，訓練和推理對算力的需求也隨之急劇上升。這些現代生成式 AI 應用需要全棧加速計算，首先要有能夠快速、準確處理大量工作負載的先進基礎設施

2023-09-25 20:40:02

269

NVIDIA 擴展機器人平臺，迎接生成式 AI 的崛起

基于 NVIDIA Jetson 平臺進行開發的 1 萬多家公司現在可以利用全新的生成式 AI、API 和微服務來加快推進行業數字化 ? ? 強大的生成式 AI 模型、云原生應用程序接口（ API

2023-10-19 17:16:24

121

NVIDIA 擴展機器人平臺，迎接生成式 AI 的崛起

務已應用于邊緣。生成式 AI 正在將 Transformer 模型和大語言模型的強大力量帶到各行各業，應用范圍現已擴展到邊緣、機器人和物流系統相關領域，如缺陷檢測、實時資產追蹤、自主規劃和導航以及人機交互等。 NVIDIA 今日宣布，對適用于邊緣 AI 和機器人的? NVIDIA Jetson ?平臺上的兩個框

2023-10-20 02:05:02

320

NVIDIA AI 現已在 Oracle Cloud Marketplace 推出

OCI 在業內率先擴展了企業對 NVIDIA DGX 云 AI 超級計算平臺和 NVIDIA AI Enterprise 軟件的訪問權限。訓練生成式 AI 模型變得更容易了。 NVIDIA DGX

2023-10-24 10:30:02

206

周四研討會預告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會，將幫助您了解 NVIDIA 開源大型語言模型（LLM）推理加速庫 TensorRT-LLM ?及其功能

2023-10-26 09:05:02

174

現已公開發布！歡迎使用 NVIDIA TensorRT-LLM 優化大語言模型推理

NVIDIA 于 2023 年 10 月 19 日公開發布 TensorRT-LLM ，可在 NVIDIA GPU 上加速和優化最新的大語言模型（Large Language Models）的推理

2023-10-27 20:05:02

478

硅谷：設計師利用生成式 AI 輔助芯片設計

芯片工程師展示了一個高度專業化的行業如何使用 NVIDIA NeMo 來定制大語言模型，以獲得競爭優勢。 ? ? 10 月 31 日，NVIDIA?????? 發布的一篇研究論文描述了生成式 AI

2023-11-01 14:45:08

141

全新NVIDIA Spectrum-X網絡平臺構筑阿里生成式AI云底座

全新 NVIDIA Spectrum-X 網絡平臺構筑阿里生成式 AI 云底座。

2023-11-02 09:07:25

300

利用 NVIDIA Jetson 實現生成式 AI

上以交互速率運行的 Llama-2-70B 模型。圖 1. 領先的生成式 AI 模型在? Jetson AGX Orin 上的推理性能如要在 Jetson 上快速測試最新的模型和應用，請使用 Jetson 生成式 AI 實驗室提供的教程和資源。

2023-11-07 21:25:01

398

NVIDIA 為全球領先的 AI 計算平臺 Hopper 再添新動力

Tensor Core GPU 和領先的顯存配置，可處理生成式 AI 與高性能計算工作負載的海量數據。 ? NVIDIA H200 是首款采用 HBM3e 的 GPU，其運行更快、更大的顯存容量將進一步加速生成式 AI 與大語言模型，同時

2023-11-14 14:30:01

SC23 | NVIDIA 為全球領先的 AI 計算平臺 Hopper 再添新動力

再添新動力。 NVIDIA H200 是首款采用 HBM3e 的 GPU，其運行更快、更大的顯存容量將進一步加速生成式 AI 與大語言模型，同時推進用于 HPC 工作負載的科學計算。憑借 HBM3e

2023-11-14 20:05:01

269

NVIDIA 在 Microsoft Azure 上推出面向全球企業和初創公司的生成式 AI Foundry 服務

Models、NVIDIA NeMo? 框架和工具，以及 NVIDIA DGX? 云 AI 超算服務三大要素，為企業提供創建自定義生成式 AI 模型

2023-11-16 14:13:08

116

NVIDIA 在 Microsoft Azure 上推出面向全球企業和初創公司的生成式 AI Foundry 服務

AI Enterprise 軟件進行部署 NVIDIA 于今日推出一項 AI foundry 服務，助力企業和初創公司在 Microsoft Azure 上開發、調優和部署其自定義生成式 AI

2023-11-16 21:15:02

270

NVIDIA 加快企業自定義生成式 AI 模型開發

的業務數據進行自定義。如今，免費、開源的大語言模型對企業來說就像是一頓“自助餐”。但對于構建自定義生成式 AI 應用的開發者來說，這頓“大餐”可能會讓他們應接不暇，因為他們需要滿足各種不同的項目和業務

2023-11-16 21:15:02

312

NVIDIA 通過企業級生成式 AI 微服務為聊天機器人、AI 助手和摘要工具帶來商業智能

— 太平洋時間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項生成式 AI 微服務，支持企業將自定義大語言模型與企業數據相連接，使其 AI 應用能夠提供高度準確的響應

2023-11-29 14:37:12

121

NVIDIA 通過企業級生成式 AI 微服務為聊天機器人、AI 助手和摘要工具帶來商業智能

微服務，支持企業將自定義大語言模型與企業數據相連接，使其 AI 應用能夠提供高度準確的響應。 NVIDIA NeMo Retriever 是 NVIDIA NeMo （一個用于構建、自定義和部署生成

2023-11-29 21:05:02

340

NVIDIA 為部分大型亞馬遜 Titan 基礎模型提供訓練支持

GPU 和海量的數據集上所訓練而成。不過這可能會給想要使用生成式 AI 的企業帶來很多巨大的挑戰。 NVIDIA NeMo （一個用于構建、自定義和運行 LLM 的框架）能夠幫助企業克服上述挑戰

2023-11-29 21:15:02

295

大語言模型簡介：基于大語言模型模型全家桶Amazon Bedrock

本文基于亞馬遜云科技推出的大語言模型與生成式AI的全家桶：Bedrock對大語言模型進行介紹。大語言模型指的是具有數十億參數（B+）的預訓練語言模型（例如：GPT-3, Bloom, LLaMA)。這種模型可以用于各種自然語言處理任務，如文本生成、機器翻譯和自然語言理解等。

2023-12-04 15:51:46

356

安霸發布全新N1系列生成式AI芯片

安霸在CES 2024上發布了全新的N1系列生成式AI芯片，這是一款專門為前端設備設計的芯片，支持本地運行大型語言模型（LLM）應用。其單顆SoC能夠支持1至340億參數的多模態大模型（Multi-Modal LLM）推理，從而實現低功耗的生成式AI功能。

2024-01-09 15:32:54

602

NVIDIA即將推出一項新的生成式AI專業認證

NVIDIA 即將推出一項新的生成式 AI 專業認證，助力開發者在這一重要領域證明自身技術實力。

2024-03-14 09:43:34

286

NVIDIA推出微服務，助力企業邁向生成式AI

NVIDIA 的 AI 平臺適用于任何高瞻遠矚的企業使用，而且比以往任何時候都更加易于應用。

2024-03-21 09:39:27

109

NVIDIA Isaac將生成式AI應用于制造業和物流業

NVIDIA Isaac 機器人平臺利用最新的生成式 AI 和先進的仿真技術，加速 AI 機器人技術的發展。

2024-03-22 10:06:21

已全部加載完成

搜索歷史

NVIDIA推出用于大型語言模型和生成式AI工作負載的推理平臺

評論