精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Google Gemma優化后可在NVIDIA GPU上運行

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 2024-02-25 11:01 ? 次閱讀

借助 TensorRT-LLM,Google 全新開放語言模型可在 NVIDIA AI 平臺(包括本地 RTX AI PC)上加速運行。

2024 年 2 月 21 日,NVIDIA 攜手 Google 在所有 NVIDIA AI 平臺上發布面向 Gemma 的優化功能,Gemma 是 Google 最先進的新型輕量級 2B 和 7B 開放語言模型,可在任何地方運行,從而降低成本并加快特定領域用戶案例的創新工作。

NVIDIA 和 Google 的團隊緊密合作,利用 NVIDIA TensorRT-LLM(用于優化大語言模型推理性能的開源庫),在數據中心的 NVIDIA GPU、云計算和搭載 NVIDIA RTX GPU 的 PC 上運行時,加速 Gemma 性能(Gemma 由創建 Gemini 模型的相同研究和技術構建)。

這使開發者能將全球高性能 AI PC 中超過 1 億臺搭載 NVIDIA RTX GPU 的用戶作為潛在用戶進行開發。

開發者還可在搭載 NVIDIA GPU 的云端運行 Gemma,該實例擁有 141GB HBM3e 顯存,速度為 4.8TB/秒,Google 將于今年部署該實例。

此外,企業級開發者還可利用 NVIDIA 豐富的工具生態系統(包括依托 NeMo 框架的 NVIDIA AI Enterprise 和 TensorRT-LLM),對 Gemma 進行微調,并將優化后的模型部署到生產應用中。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4940

    瀏覽量

    102815
  • 云計算
    +關注

    關注

    39

    文章

    7735

    瀏覽量

    137202
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4700

    瀏覽量

    128700

原文標題:共耀光芒:Google Gemma 優化后可在 NVIDIA GPU 上運行

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何構建及優化GPU云網絡

    并從計算節點成本優化、集群網絡與拓撲的選擇等方面論述如何構建及優化GPU云網絡。
    的頭像 發表于 11-06 16:03 ?243次閱讀
    如何構建及<b class='flag-5'>優化</b><b class='flag-5'>GPU</b>云網絡

    AMD與NVIDIA GPU優缺點

    NVIDIA的RTX系列顯卡以其強大的光線追蹤和DLSS技術領先于市場。例如,NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲體驗,而AMD的Radeon RX 6800 XT雖然在某些游戲中表現接近,但在光線追蹤技術
    的頭像 發表于 10-27 11:15 ?459次閱讀

    TI TDA2x SoC基于GPU的環視優化

    電子發燒友網站提供《TI TDA2x SoC基于GPU的環視優化.pdf》資料免費下載
    發表于 10-10 09:14 ?0次下載
    TI TDA2x SoC<b class='flag-5'>上</b>基于<b class='flag-5'>GPU</b>的環視<b class='flag-5'>優化</b>

    NVIDIA CorrDiff生成式AI模型能夠精準預測臺風

    NVIDIA GPU 運行的一個擴散模型向天氣預報工作者展示了加速計算如何實現新的用途并提升能效。
    的頭像 發表于 09-13 17:13 ?657次閱讀

    Google Gemma 2模型的部署和Fine-Tune演示

    Google 近期發布了最新開放模型 Gemma 2,目前與同等規模的開放模型相比,取得了明顯的優勢,同時在安全可控性上得到了顯著的增強。
    的頭像 發表于 08-09 17:04 ?451次閱讀
    <b class='flag-5'>Google</b> <b class='flag-5'>Gemma</b> 2模型的部署和Fine-Tune演示

    暴漲預警!NVIDIA GPU供應大跳水

    gpu
    jf_02331860
    發布于 :2024年07月26日 09:41:42

    英國公司實現英偉達CUDA軟件在AMD GPU的無縫運行

    7月18日最新資訊,英國創新科技企業Spectral Compute震撼發布了其革命性GPGPU編程工具包——“SCALE”,該工具包實現了英偉達CUDA軟件在AMD GPU的無縫遷移與運行,標志著在
    的頭像 發表于 07-18 14:40 ?597次閱讀

    使用google-translate和wwe合并無法使用google-tts怎么解決?

    ,在使用喚醒詞喚醒,我想讓他使用google-tts說一句話,但是出現以下錯誤Code: Select all I (16188) wwe_example: rec_engine_cb
    發表于 06-28 06:05

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優化從 PC 到云端的 NVID
    的頭像 發表于 04-28 10:36 ?487次閱讀

    NVIDIA推出兩款基于NVIDIA Ampere架構的全新臺式機GPU

    兩款 NVIDIA Ampere 架構 GPU 為工作站帶來實時光線追蹤功能和生成式 AI 工具支持。
    的頭像 發表于 04-26 11:25 ?588次閱讀

    NVIDIA全面加快Meta Llama 3的推理速度

    Meta 最新開源大語言模型采用 NVIDIA 技術構建,其經過優化可在云、數據中心、邊緣和 PC 的 NVIDIA
    的頭像 發表于 04-23 09:52 ?422次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網絡和熱 Embedding 全置于
    的頭像 發表于 04-20 09:39 ?645次閱讀

    NVIDIA 發布全新交換機,全面優化萬億參數級 GPU 計算和 AI 基礎設施

    NVIDIA Quantum-X800 InfiniBand 網絡,打造性能最強大的 AI 專用基礎設施 NVIDIA Spectrum-X800 以太網絡,數據中心必備的優化 AI 網絡
    發表于 03-19 10:05 ?312次閱讀
    <b class='flag-5'>NVIDIA</b> 發布全新交換機,全面<b class='flag-5'>優化</b>萬億參數級 <b class='flag-5'>GPU</b> 計算和 AI 基礎設施

    TensorRT LLM加速Gemma!NVIDIA與谷歌牽手,RTX助推AI聊天

    NVIDIA今天在其官方博客中表示,今天與谷歌合作,在所有NVIDIA AI平臺上為Gemma推出了優化。
    的頭像 發表于 02-23 09:42 ?562次閱讀
    TensorRT LLM加速<b class='flag-5'>Gemma</b>!<b class='flag-5'>NVIDIA</b>與谷歌牽手,RTX助推AI聊天

    谷歌發布全球最強開源大模型Gemma

    谷歌近日宣布,其全新開源大模型Gemma正式亮相。Gemma被譽為全球性能最強大、同時也是最輕量級的模型系列,分為2B(20億參數)和7B(70億)兩種尺寸版本。令人矚目的是,即便是2B版本,也能夠在筆記本電腦上流暢運行
    的頭像 發表于 02-22 14:51 ?755次閱讀