Google Gemma優化后可在NVIDIA GPU上運行

借助 TensorRT-LLM，Google 全新開放語言模型可在 NVIDIA AI 平臺（包括本地 RTX AI PC）上加速運行。

2024 年 2 月 21 日，NVIDIA 攜手 Google 在所有 NVIDIA AI 平臺上發布面向 Gemma 的優化功能，Gemma 是 Google 最先進的新型輕量級 2B 和 7B 開放語言模型，可在任何地方運行，從而降低成本并加快特定領域用戶案例的創新工作。

NVIDIA 和 Google 的團隊緊密合作，利用 NVIDIA TensorRT-LLM（用于優化大語言模型推理性能的開源庫），在數據中心的 NVIDIA GPU、云計算和搭載 NVIDIA RTX GPU 的 PC 上運行時，加速 Gemma 性能（Gemma 由創建 Gemini 模型的相同研究和技術構建）。

這使開發者能將全球高性能 AI PC 中超過 1 億臺搭載 NVIDIA RTX GPU 的用戶作為潛在用戶進行開發。

開發者還可在搭載 NVIDIA GPU 的云端運行 Gemma，該實例擁有 141GB HBM3e 顯存，速度為 4.8TB/秒，Google 將于今年部署該實例。

此外，企業級開發者還可利用 NVIDIA 豐富的工具生態系統（包括依托 NeMo 框架的 NVIDIA AI Enterprise 和 TensorRT-LLM），對 Gemma 進行微調，并將優化后的模型部署到生產應用中。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
4940

瀏覽量
102815
云計算

云計算

+關注

關注
39

文章
7735

瀏覽量
137202
gpu

gpu

+關注

關注
28

文章
4700

瀏覽量
128700

原文標題：共耀光芒：Google Gemma 優化后可在 NVIDIA GPU 上運行

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達】歡迎添加關注！文章轉載請注明出處。

如何構建及優化GPU云網絡

并從計算節點成本優化、集群網絡與拓撲的選擇等方面論述如何構建及優化GPU云網絡。

發表于 11-06 16:03 ?243次閱讀

如何構建及<b class='flag-5'>優化</b><b class='flag-5'>GPU</b>云網絡

AMD與NVIDIA GPU優缺點

，NVIDIA的RTX系列顯卡以其強大的光線追蹤和DLSS技術領先于市場。例如，NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲體驗，而AMD的Radeon RX 6800 XT雖然在某些游戲中表現接近，但在光線追蹤技術上

發表于 10-27 11:15 ?459次閱讀

TI TDA2x SoC上基于GPU的環視優化

電子發燒友網站提供《TI TDA2x SoC上基于GPU的環視優化.pdf》資料免費下載

發表于 10-10 09:14 ?0次下載

NVIDIA CorrDiff生成式AI模型能夠精準預測臺風

在 NVIDIA GPU 上運行的一個擴散模型向天氣預報工作者展示了加速計算如何實現新的用途并提升能效。

發表于 09-13 17:13 ?657次閱讀

Google Gemma 2模型的部署和Fine-Tune演示

Google 近期發布了最新開放模型 Gemma 2，目前與同等規模的開放模型相比，取得了明顯的優勢，同時在安全可控性上得到了顯著的增強。

發表于 08-09 17:04 ?451次閱讀

暴漲預警！NVIDIA GPU供應大跳水

gpu

jf_02331860
發布于 :2024年07月26日 09:41:42

英國公司實現英偉達CUDA軟件在AMD GPU上的無縫運行

7月18日最新資訊，英國創新科技企業Spectral Compute震撼發布了其革命性GPGPU編程工具包——“SCALE”，該工具包實現了英偉達CUDA軟件在AMD GPU上的無縫遷移與運行，標志著在

發表于 07-18 14:40 ?597次閱讀

使用google-translate和wwe合并后無法使用google-tts怎么解決？

，在使用喚醒詞喚醒后，我想讓他使用google-tts說一句話，但是出現以下錯誤Code: Select all I (16188) wwe_example: rec_engine_cb

發表于 06-28 06:05

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫，用于優化從 PC 到云端的 NVID

發表于 04-28 10:36 ?487次閱讀

NVIDIA推出兩款基于NVIDIA Ampere架構的全新臺式機GPU

兩款 NVIDIA Ampere 架構 GPU 為工作站帶來實時光線追蹤功能和生成式 AI 工具支持。

發表于 04-26 11:25 ?588次閱讀

NVIDIA全面加快Meta Llama 3的推理速度

Meta 最新開源大語言模型采用 NVIDIA 技術構建，其經過優化后可在云、數據中心、邊緣和 PC 的 NVIDIA

發表于 04-23 09:52 ?422次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實踐中，唯品會 AI 平臺與 NVIDIA 團隊合作，結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將推理的稠密網絡和熱 Embedding 全置于

發表于 04-20 09:39 ?645次閱讀

NVIDIA 發布全新交換機，全面優化萬億參數級 GPU 計算和 AI 基礎設施

NVIDIA Quantum-X800 InfiniBand 網絡，打造性能最強大的 AI 專用基礎設施 NVIDIA Spectrum-X800 以太網絡，數據中心必備的優化 AI 網絡

發表于 03-19 10:05 ?312次閱讀

TensorRT LLM加速Gemma！NVIDIA與谷歌牽手，RTX助推AI聊天

NVIDIA今天在其官方博客中表示，今天與谷歌合作，在所有NVIDIA AI平臺上為Gemma推出了優化。

發表于 02-23 09:42 ?562次閱讀

谷歌發布全球最強開源大模型Gemma

谷歌近日宣布，其全新開源大模型Gemma正式亮相。Gemma被譽為全球性能最強大、同時也是最輕量級的模型系列，分為2B（20億參數）和7B（70億）兩種尺寸版本。令人矚目的是，即便是2B版本，也能夠在筆記本電腦上流暢運行。

發表于 02-22 14:51 ?755次閱讀

NVIDIA英偉達
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot VR、AR與MR的發展歷史以及商業應用實例
Hot NVIDIA RTX與GTX的區別是什么？

New NVIDIA CEO黃仁勛對話香港科技大學畢業生
New NVIDIA加速全球大多數超級計算機推動科技進步

精選推薦
更多

文章

資料

帖子

被人忽視的“ILD”指標，竟隱藏著高速設計的核心思維

海馬硬件
15分鐘前

9 閱讀

湖北移動，以5G-A規模商用“換”出內需新活力

腦極體
30分鐘前

29 閱讀

如何在音頻播放時插播音頻

立功科技
1小時前

100 閱讀

ADC噪聲系數對射頻接收器的影響

德州儀器
1小時前

94 閱讀

適用于MEMS傳感器的先進ML：提高精度、性能和功耗

eeDesigner
1小時前

129 閱讀

用示波器修彩電的步驟及方法

nana
256 MB

免費

1493下載

電子電路系統及標準最佳設計

lizq_110
11.5 MB

免費

0下載

DIY自制Arduino機器人_自平衡踏板車+自動避障龜

jfzhangjin
2876KB

2積分

299下載

MHImageTabBar iOS選擇卡

李紅
0.07 MB

免費

0下載

ASI4U評估板數據手冊

2.45 MB

免費

0下載

開源項目！可以自主演奏音樂的尤克里里機器人！

紅舊衫
16小時前

75 閱讀

【開箱評測】米爾電子PG2L100H開發板深度體驗報告

asdfsdfsd
16小時前

102 閱讀

開源項目！基于 Arduino 的 MIDI 架子鼓

紅舊衫
16小時前

140 閱讀

電路小知識 | 電源選型要點、電路圖的解讀方法、LED及其應用示例

聽我講
16小時前

195 閱讀

【「HarmonyOS NEXT啟程：零基礎構建純血鴻蒙應用」閱讀體驗】+1-7章有感

夜孤影
1天前

284 閱讀

推薦專欄
更多

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

Google Gemma優化后可在NVIDIA GPU上運行

評論

如何構建及優化GPU云網絡

AMD與NVIDIA GPU優缺點

TI TDA2x SoC上基于GPU的環視優化

NVIDIA CorrDiff生成式AI模型能夠精準預測臺風

Google Gemma 2模型的部署和Fine-Tune演示

暴漲預警！NVIDIA GPU供應大跳水

英國公司實現英偉達CUDA軟件在AMD GPU上的無縫運行

使用google-translate和wwe合并后無法使用google-tts怎么解決？

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA推出兩款基于NVIDIA Ampere架構的全新臺式機GPU

NVIDIA全面加快Meta Llama 3的推理速度

利用NVIDIA組件提升GPU推理的吞吐

NVIDIA 發布全新交換機，全面優化萬億參數級 GPU 計算和 AI 基礎設施

TensorRT LLM加速Gemma！NVIDIA與谷歌牽手，RTX助推AI聊天

谷歌發布全球最強開源大模型Gemma