国产成+人+综合+亚洲专_日韩一级a不卡久久久久久_最近免费高清版在线观看_99人妻在线视频这里有精品_亚洲午夜电影av_国产黄网站色视频免费在线观看_久久免费观看一级毛片下载_亚洲AⅤ国产成人AV片妓女熟女_无码无需播放器在线观看

電子發燒友網報道（文/周凱揚）近日，一家由哈佛輟學生成立的初創公司Etched，宣布了他們在打造的一款“專用”AI 芯片Sohu。據其聲稱該芯片的速度將是英偉達H100的20倍，但只能跑transformer架構的模型。

Sohu，比H100快上20倍

之所以打算Sohu這一自研ASIC AI芯片，是因為Etched認為GPU在性能升級上的速度太慢了。如果以H100的單位面積算力和交期作為參考，那么從2022年到2025年，英偉達的H100迭代至B200，2.5年的時間內性能只有15%的提升。所以要想有效提高性能的方式，只有走特化的ASIC芯片一途。

現在發布的任何AI芯片，在提到性能時，無疑都會把英偉達的H100作為對比參照，Etched的Sohu也不例外。根據Etched提供的數據，單個Sohu服務器運行Llama 70B時可以做到50萬Tokens每秒，這一速度是單個H100服務器的20倍以上，也是單個B200服務器的10倍以上。

在服務器的配置上，Sohu服務器和H100服務器均采用的8卡的配置，所以Etched強調一個8xSohu的服務器就可以替換掉至少160個H100，大大降低成本的同時，也不會有性能損失。

由于Sohu僅支持一種算法，所以絕大多數的控制流模塊都可以被剔除，芯片可以集成更多的數學計算單元，在算力利用率上可以達到90%以上，而GPU卻只能做到30%。這也是因為在GPU的電路設計上，用于矩陣乘法的晶體管數量甚至沒有占到10%。不過Etched對于英偉達的設計還是相當佩服的，指出如果同時想支持CNN、LSTM、SSM等其他模型，確實很難做得比英偉達更好。

當然了，這里的測試條件也必須做一個說明，測試標準為FP8精度的Llama 70B，無稀疏，其中H100是基于最新版本的TensorRT-LLM測試的，而B200由于還未交付，所以其性能是預估的。

為何專攻Transformer模型

市面上的AI芯片和GPU產品為了覆蓋更靈活的客戶需求，盡管不少都采用了ASIC的設計方案，但支持的模型卻不會局限在一類。Etched也在其官網列出了市面上一些競品方案，包括英偉達的GPU、谷歌的TPU、亞馬遜的Trainium、Graphcore的IPU、Tenstorrent的Grayskull和英特爾的Gaudi等等，這些方案無一不對廣泛的AI模型提供了支持。

但我們從市面上頭部的模型來看，幾乎占據主導地位的都是transformer架構的模型，比如GPT、Sora、Gemini和Stable Diffusion。Etched很大方地表示，如果哪一天transformer被SSM、RWKV或其他新的架構替代了，他們的芯片將變得一無是處，對于千變萬化的AI市場而言，絕大多數廠商都不敢沒法做出這樣的預測。

而Etched從2022年底，就賭transformer模型將會統治整個市場。這在當時還沒有ChatGPT的年代，是一個大膽的預測，畢竟當時圖像生成還有基于CNN的U-Net，不少自動駕駛的視覺處理也還在廣泛使用CNN。而且對于一個規模不算大的設計團隊而言，維護單一架構的軟件棧明顯壓力更小一些，他們只需要為transformer編寫驅動、內核即可。

寫在最后

至于Etched的這場豪賭是否能成功，還得看芯片的成品表現如何。雖然他們嘗試的這條路線沒人走過，但財力和研發能力均在他們之上的廠商也沒能打造出超過英偉達GPU的競品，硅谷的VC們能否造出新神，依然不能過早下定論。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

Transformer

Transformer

+關注

關注
0

文章
141

瀏覽量
5981
AI芯片

AI芯片

+關注

關注
17

文章
1859

瀏覽量
34908

Transformer模型的具體應用

如果想在 AI 領域引領一輪新浪潮，就需要使用到 Transformer。

發表于 11-20 09:28 ?253次閱讀

<b class='flag-5'>Transformer</b>模型的具體應用

Transformer模型能夠做什么

盡管名為 Transformer，但它們不是電視銀幕上的變形金剛，也不是電線桿上垃圾桶大小的變壓器。

發表于 11-20 09:27 ?210次閱讀

<b class='flag-5'>Transformer</b>模型能夠做什么

北京見 | 賽昉科技邀您參加2024全球AI芯片峰會

9月6-7日，2024全球AI芯片峰會（GACS2024）將在北京遼寧大廈盛大舉辦。全球AI芯片

發表于 09-04 08:03 ?313次閱讀

北京見 | 賽昉科技邀您參加2024<b class='flag-5'>全球</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>峰會

2024年全球AI芯片收入將達712.52億美元

市場調查機構Gartner近日發布了一份關于全球AI芯片市場的收入預測報告。據該機構分析，到2024年，全球AI

發表于 06-03 14:26 ?667次閱讀

全球AI芯片市場收入預計持續增長

根據市場調查機構Gartner的最新報告，全球AI芯片市場展現出強勁的增長勢頭。預計2024年，全球AI

發表于 05-31 10:26 ?512次閱讀

安霸發布兩款用于車隊遠程監控及信息處理系統的最新一代AI芯片

兩款新型 5nm 芯片提供業界領先的每瓦 AI 性能、支持獨特的小巧外形設計、單盒集成視覺 Transformer 和 VLM 分析功能。

發表于 05-22 09:09 ?436次閱讀

risc-v多核芯片在AI方面的應用

RISC-V多核芯片在AI方面的應用主要體現在其低功耗、低成本、靈活可擴展以及能夠更好地適應AI算法的不同需求等特點上。首先，RISC-V適合用于高效設計實現，其內核面積更小，功耗更低，使得它能

發表于 04-28 09:20

號稱全球最強開源AI模型DBRX登場

洞見分析

電子發燒友網官方
發布于 :2024年03月28日 11:10:51

最強AI芯片發布，Cerebras推出性能翻倍的WSE-3 AI芯片

近日，芯片行業的領軍企業Cerebras Systems宣布推出其革命性的產品——Wafer Scale Engine 3，該產品成功將現有最快AI芯片的世界紀錄提升了一倍。

發表于 03-19 09:31 ?1005次閱讀

蘋果M3芯片MacBook Air被譽為全球最佳消費級AI產品

蘋果在推文中說：“全新Mac Airliness利用Apple芯片的力量，將Mac變為理想的AI平臺。M3芯片融入速度敏銳的16核神經網絡引擎，提升設備端機器學習速率，讓MacBook Air成為了

發表于 03-05 11:36 ?835次閱讀

英偉達將用AI設計AI芯片

AI芯片行業資訊

深圳市浮思特科技有限公司
發布于 :2024年02月19日 17:54:43

全球芯片巨頭暴漲6萬億引發芯片產業熱潮

隨著全球領先的芯片公司阿斯麥、AMD、英特爾和高通等迎來新的AI浪潮，市場對AI技術的需求呈現爆發性增長。

發表于 01-26 16:42 ?1391次閱讀

把Transformer大模型部署在端側，IPC SoC正在普惠AI

電子發燒友網報道（文/黃晶晶）AI大模型襲卷而來，而如何讓終端產品插上AI的翅膀會是芯片廠商研發的方向和市場的機會。如今網絡攝像機作為智慧城市、智能家居等應用的主流終端發展迅速，IPC SoC

發表于 12-08 13:50 ?1119次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

只能跑Transformer的AI芯片，卻號稱全球最快？

評論

Transformer模型的具體應用

Transformer模型能夠做什么

北京見 | 賽昉科技邀您參加2024全球AI芯片峰會

AI芯片會導元件中間商消失嗎？

2024年全球AI芯片收入將達712.52億美元

AI芯片哪里買？

全球AI芯片市場收入預計持續增長

安霸發布兩款用于車隊遠程監控及信息處理系統的最新一代AI芯片

risc-v多核芯片在AI方面的應用

號稱全球最強開源AI模型DBRX登場

最強AI芯片發布，Cerebras推出性能翻倍的WSE-3 AI芯片

蘋果M3芯片MacBook Air被譽為全球最佳消費級AI產品

英偉達將用AI設計AI芯片

全球芯片巨頭暴漲6萬億引發芯片產業熱潮

把Transformer大模型部署在端側，IPC SoC正在普惠AI