精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

MLPerf首次GPT大模型推理放榜墨芯連續(xù)三屆登頂

隨著ChatGPT等AIGC應用掀起大模型浪潮，算力層作為基礎設施，成為最先受益的產業(yè)。

然而，算力需求大、費用昂貴等問題，已成為企業(yè)落地大模型的普通痛點，更可能制約AI向前發(fā)展：大模型參數(shù)日益增長，而算力供給瓶頸迫在眉睫，二者形成巨大矛盾。

如何探索更好的大模型算力方案，是業(yè)界共同關注的焦點。

近日，全球權威測評MLPerf 公布最新推理測評結果，這是MLPerf首度引入GPT大模型推理測試，參與熱度再創(chuàng)紀錄，收到了來自英偉達、英特爾、谷歌、高通等企業(yè)提交的13500 多項性能結果。

在MLPerf Inference 3.1中，墨芯人工智能（Moffet AI）S30計算卡在大模型GPT-J（60億參數(shù)）上，單卡、4卡、8卡的算力均獲得第一。

這是墨芯在MLPerf上連續(xù)第三次衛(wèi)冕。此前墨芯曾在MLPerf Inference 2.0與2.1上，連續(xù)兩屆獲得第一。

墨芯的成績，為大模型算力方案帶來了可行的創(chuàng)新方向。

事實證明：結合AI模型與計算平臺的軟硬協(xié)同創(chuàng)新，能夠釋放更大的算力潛力。這也再度印證：以稀疏計算為代表的創(chuàng)新技術，將是大模型時代算力發(fā)展的關鍵。

墨芯參加的是MLPerf開放分區(qū)，據(jù)主辦方MLCommons介紹，該分區(qū)旨在鼓勵創(chuàng)新。因此參賽者可以通過軟硬協(xié)同等方式，探索對算力的提升。在MLPerf中的GPT-J大模型上，與4nm制程的H100純硬件加速方案相比，12nm制程的墨芯S30計算卡通過“原創(chuàng)的雙稀疏算法+硬件協(xié)同”方式，取得了高達1.8倍的優(yōu)勢。

本次測評的GPT-J模型是生成式AI模型，墨芯S30計算卡在8卡、4卡、單卡模式下，性能分別為170.59，91.57，23.28 (Sample/s)，達到英偉達H100性能的1.6倍、1.8倍、1.8倍，展現(xiàn)出墨芯產品在AIGC類任務上的能力。

三度奪冠，大模型算力率先“交卷”，軟硬協(xié)同持續(xù)創(chuàng)新——墨芯的產品實力數(shù)次經過MLPerf的嚴格檢驗，也探索出大模型算力發(fā)展的新路徑。

1

稀疏計算——大模型“潛力股”

獲得市場認可

墨芯接連的優(yōu)異成績，主要得益于基于稀疏化算法的軟硬協(xié)同設計。

在大模型時代，稀疏計算的重要性不言而喻：AI模型大小與其稀疏化潛力成正比。

也就是說，當模型越大，算法上有更大稀疏的可能性，稀疏計算可加速的幅度也越高。對于一般大型語言模型，稀疏計算可帶來數(shù)十倍加速。

墨芯獨創(chuàng)的雙稀疏算法，結合軟硬協(xié)同設計，使墨芯Antoum芯片成為全球首款高稀疏倍率AI芯片，支持高達32倍稀疏——這也正是墨芯在本次MLPerf中創(chuàng)新紀錄的關鍵。

模型越大，稀疏計算的優(yōu)勢越明顯——尤其是在GPT等大模型參數(shù)動輒上百億、千億的現(xiàn)狀下，這使得墨芯的護城河更為穩(wěn)固。

墨芯的產品實力與稀疏計算的大勢所趨，也獲得了市場的認可：墨芯商業(yè)化進程接連取得重要突破，助力企業(yè)加速AI應用。

就在近日，墨芯成為支持Byte MLPerf的供應商之一。

來源：Byte MLPerf網站

當前，墨芯AI計算平臺已能夠支持不同參數(shù)級別的大模型，包括 BLOOM, OPT, GPT-J，LLaMA，StableDiffusion等。同時具有高吞吐、低延時、低功耗等特點，緩解算力之困，真正為企業(yè)帶來“好用”、“用得起”的大模型算力方案。

2

帶來根本性的算力變革

稀疏計算助力大模型發(fā)展

墨芯的稀疏計算方案不僅能夠緩解當前的算力難題，也為AI的持續(xù)發(fā)展打開新的空間。

稀疏計算減少了AI模型的計算量，這意味著能讓大模型既在參數(shù)量上躍升若干個數(shù)量級的同時，又不產生過大的計算量，大模型參數(shù)增長與算力瓶頸的矛盾有望從根本上得到解決。

同時，由于計算量的減少，大模型的高算力需求、高功耗、高費用等痛點，也一并得到解決，實現(xiàn)“多贏”效果。

墨芯Antoum芯片：全球首款高稀疏倍率AI芯片，支持高達32倍稀疏

連續(xù)三屆MLPerf的優(yōu)異成績，不僅是對墨芯產品實力的證明，也為業(yè)界帶來新啟示：在稀疏計算等技術的助力下，大模型的發(fā)展與應用有望迎來更廣闊的施展空間，加速AIGC等應用在各行各業(yè)遍地開花。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

GPT

GPT

+關注

關注
0

文章
351

瀏覽量
15315
AI芯片

AI芯片

+關注

關注
17

文章
1860

瀏覽量
34912
ChatGPT

ChatGPT

+關注

關注
29

文章
1548

瀏覽量
7504

原文標題：MLPerf首次GPT大模型推理放榜，墨芯連續(xù)三屆登頂

文章出處：【微信號：墨芯人工智能，微信公眾號：墨芯人工智能】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

立儀科技受邀參加第三屆中國傳感器與應用技術大會

?11月11日，備受矚目的"第三屆中國傳感器與應用技術大會"在深圳光明云谷國際會議中心隆重舉行。立儀科技作為國內專注光譜共焦傳感器領域的公司榮幸受邀參加此次盛會并進行業(yè)務簽約。 ? 立儀科技受邀參加

的頭像

發(fā)表于 11-15 16:25 ?283次閱讀

立儀科技受邀參加第<b class='flag-5'>三屆</b>中國傳感器與應用技術大會

高效大模型的推理綜述

大模型由于其在各種任務中的出色表現(xiàn)而引起了廣泛的關注。然而，大模型推理的大量計算和內存需求對其在資源受限場景的部署提出了挑戰(zhàn)。業(yè)內一直在努力開發(fā)旨在提高大模型

的頭像

發(fā)表于 11-15 11:45 ?236次閱讀

高效大<b class='flag-5'>模型</b>的<b class='flag-5'>推理</b>綜述

線上逛展 | 沉浸探索第三屆OpenHarmony技術大會五大展區(qū)

世博中心又有什么大事發(fā)生？第三屆OpenHarmony技術大會五大展區(qū)全方位展示智慧互聯(lián)未來雷科技從現(xiàn)場發(fā)來探展邀約一起跟隨他的視角漫步展區(qū) 在精彩紛呈的特色產品、應用案例中體驗OpenHarmony的快速發(fā)展吧！

發(fā)表于 10-24 21:50

高燃回顧｜第三屆OpenHarmony技術大會精彩瞬間

第三屆OpenHarmony技術大會圓滿落幕全球開源精英齊聚共同展示OpenHarmony技術、生態(tài)、人才的最新進展見證OpenHarmony南北向生態(tài)繁榮共繪開源生態(tài)發(fā)展藍圖星光璀璨致謝

發(fā)表于 10-16 18:47

云知聲山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

近日，多模態(tài)人工智能模型基準評測集MMMU更新榜單，云知聲山海多模態(tài)大模型UniGPT-mMed以通用能力、醫(yī)療專業(yè)能力雙雙排名第一的優(yōu)異成績登頂榜首，力壓GPT-4V，充分彰顯其硬核

的頭像

發(fā)表于 10-12 14:09 ?259次閱讀

云知聲山海多模態(tài)大<b class='flag-5'>模型</b>UniGPT-mMed<b class='flag-5'>登頂</b>MMMU測評榜首

第三屆OpenHarmony技術大會亮點紛呈

10月12日—13日第三屆OpenHarmony技術大會如期而至，高能看點，一觸即發(fā)！讓我們攜手走進這場技術盛宴 ?

的頭像

發(fā)表于 10-11 11:08 ?230次閱讀

第<b class='flag-5'>三屆</b>OpenHarmony技術大會亮點紛呈

30s高能速遞 | 第三屆 OpenHarmony技術大會精彩搶鮮看

技術引領筑生態(tài) 萬物智聯(lián)創(chuàng)未來第三屆 OpenHarmony技術大會如約而至高燃登場 10月12-13日，上海世博中心重磅嘉賓，前沿議題看億萬代碼如何改變未來，與卓越伙伴共繪閃耀繁星亮點

發(fā)表于 10-08 17:36

OpenAI即將發(fā)布“草莓”推理大模型

科技界迎來新動態(tài)，據(jù)可靠消息透露，OpenAI正緊鑼密鼓地籌備著一項重大發(fā)布——預計在兩周內，將正式推出名為“草莓”的新型AI推理模型，并將其無縫融入ChatGPT服務中。這款以卓越推理能力為核心的大模型，旨在突破現(xiàn)有

的頭像

發(fā)表于 09-11 16:53 ?484次閱讀

LLM大模型推理加速的關鍵技術

LLM（大型語言模型）大模型推理加速是當前人工智能領域的一個研究熱點，旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型

的頭像

發(fā)表于 07-24 11:38 ?779次閱讀

佰維存儲第三屆“Factory Tour”即將啟航，誠邀夢想少年共赴精彩“芯”程！

都離不開半導體封裝測試的精密工藝它確保了每一顆“芯”的穩(wěn)定與高效是連接數(shù)字世界與物理世界的橋梁想親眼見證智能設備的強大內“芯”（存儲芯片）如何鍛造？延續(xù)往屆的熱忱與初心我們再次吹響集結號第三屆佰維存儲“Facto

發(fā)表于 07-08 13:36 ?169次閱讀

佰維存儲第<b class='flag-5'>三屆</b>“Factory Tour”即將啟航，誠邀夢想少年共赴精彩“<b class='flag-5'>芯</b>”程！

第三屆中國電磁頻譜學術大會圓滿落幕，知語科技閃耀西安！

?西安盛事！第三屆中國電磁頻譜學術大會圓滿落幕，知語云智能科技閃耀全場西安，這座承載著千年歷史文化的古都，在2024年6月21日至22日再次成為科技領域的焦點。第三屆中國電磁頻譜學術大會的圓滿收

發(fā)表于 06-24 11:05

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

用于文本生成，根據(jù)提示或上下文生成連貫、富有創(chuàng)造性的文本，為故事創(chuàng)作等提供無限可能。大語言模型也面臨挑戰(zhàn)。一方面，其計算資源需求巨大，訓練和推理耗時；另一方面，模型高度依賴數(shù)據(jù)，需要大規(guī)模訓練數(shù)據(jù)才能

發(fā)表于 05-04 23:55

全球最強大模型易主，GPT-4被超越

近日，AI領域的領軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型，其中包括最強版Claude 3 Opus。據(jù)該公司稱，Claude 3系列在推理、數(shù)學、編碼、多語言理解和視覺方面全面超越了包括GPT-4在內的所

的頭像

發(fā)表于 03-05 09:58 ?622次閱讀

GPT EVAL_BDPS_DRIVER可以使用GPT12 IP或GTM IP來實現(xiàn)連續(xù)定時器和單次定時器嗎？

GPT EVAL_BDPS_DRIVER可以使用GPT12 IP或GTM IP來實現(xiàn)連續(xù)定時器和單次定時器？是嗎？

發(fā)表于 01-22 08:16

HarmonyOS：使用MindSpore Lite引擎進行模型推理

場景介紹 MindSpore Lite 是一款 AI 引擎，它提供了面向不同硬件設備 AI 模型推理的功能，目前已經在圖像分類、目標識別、人臉識別、文字識別等應用中廣泛使用。本文介紹

發(fā)表于 12-14 11:41