国产亚州精品女人久久久久久_欧美日韩国产精品中文_亚洲av日韩av永久在线观看_欧美激性欧美激情在线户外_国产黄片久久三级_一级特黄性色生活片免费_非洲人粗长硬配种视频_香蕉国产精品偷在线观_日韩少妇无码一区二区三区

電子發燒友網報道（文/梁浩斌）過去幾年中爆發的AI算力需求，英偉達 GPU成為了最大的贏家，無論是自動駕駛還是AI大模型，比如特斯拉、小鵬、OpenAI、字節跳動等廠商都在爭相搶購英偉達GPU產品，獲得足夠的算力構建自己的計算中心，用于訓練不同應用的AI模型。

AI領域眾星捧月也造就了英偉達市值曾突破三萬億美元，并短暫登頂全球第一的位置。不過蘋果卻反其道而行之，在7月底蘋果公司揭露的官方論文顯示，蘋果自研大模型AFM背后，完全沒有英偉達GPU的影子。

蘋果大模型訓練，選擇了谷歌芯片

在蘋果近期揭露的一篇技術論文中，詳細介紹了蘋果在端側和服務器側的大模型。在大模型預訓練的階段，蘋果基礎模型是在AXLearn框架上進行訓練的，據蘋果介紹，AXLearn框架是蘋果公司在2023年發布的開源項目，這個框架建立在JAX和XLA的基礎上，允許模型在各種硬件和云平臺上進行高效和可擴展性訓練，包括TPU以及云端和本地的GPU。

蘋果采用了數據并行、張量并行、序列并行和完全分片數據并行（FSDP）的組合來沿多個維度擴展訓練，如數據規模、模型規模和序列長度。

其中，蘋果的AFM服務器端大模型是蘋果規模最大的語言模型，該模型在8192個TPUv4芯片上進行了預訓練，這些芯片被配置成8*1024個芯片集群，通過數據中心網絡（DCN）連接。預訓練有三個階段，首先使用 6.3 萬億個Tokens開始，接著使用 1 萬億個Tokens繼續訓練，最后使用 1000 億個Tokens進行上下文長度的擴展。

而在AFM的端側模型上，蘋果對其進行了大幅修剪，論文披露AFM端側模型是一個擁有30億參數的模型，該模型是從64億參數的服務器模型中蒸餾而來，而這個服務器模型則是在完整的6.3萬億參數量上進行訓練。

與服務器端模型不同的是，AFM端側模型采用的芯片是谷歌的TPUv5，論文中的信息顯示，AFM端側模型是在一個由2048個TPUv5p芯片組成的集群上進行訓練的。

谷歌在去年12月發布了TPUv5p，面向云端AI加速，谷歌稱之為“迄今為止最強大、可擴展性最強和最靈活的人工智能加速器”。

TPUv5p在bfloat16精度下可以提供459 teraFLOPS（每秒可執行459萬億次浮點運算）算力；在Int8精度下，TPU v5p可以提供918 teraOPS（每秒可執行918萬億次整數運算）；支持95GB的HBM內存，帶寬高達2.76 TB/s。

相比上一代的TPU v4，TPUv5p實現了每秒浮點運算次數提高一倍，內存帶寬是前代的三倍，訓練大模型速度提升2.8倍，并且性價比是前代的2.1倍。

除了蘋果之外，目前采用谷歌TPU系列芯片進行大模型訓練的還有谷歌自家的Gemini、PaLM，以及OpenAI前副總裁創立的Anthropic所推出的Claude大模型，上個月Anthropic發布的Llama 3.1 405B還被認為是最強開源大模型。

蘋果、谷歌、Anthropic的實例，證明了TPU在大模型訓練上的能力。但相比于英偉達，TPU目前在大模型領域的應用依舊只是冰山一角，背后更多的大模型公司，包括OpenAI、特斯拉、字節跳動等巨頭，主力AI數據中心依然是普遍采用英偉達GPU。

英偉達的挑戰者們

一直以來，圍繞CUDA打造的軟件生態，是英偉達在GPU領域最大的護城河，尤其是隨著目前AI領域的發展加速，市場火爆，英偉達GPU+CUDA的開發生態則更加穩固，AMD、英特爾等廠商雖然在努力追趕，但目前還未能看到有威脅英偉達地位的可能。

但市場的火爆難免吸引更多的玩家入局，對英偉達發起挑戰，或者說是在AI廣闊的市場空間中，希望分得一杯羹。

首先是英偉達在GPU領域的最大對手AMD ，今年一月有研究人員在Frontier超算集群上，利用其中8%左右的GPU，訓練出一個GPT 3.5級別規模的大模型。而Frontier超算集群是完全基于AMD硬件的，由37888個MI250X GPU和9472個Epyc 7A53 CPU組成，這次研究也突破了在AMD硬件上突破了先進分布式訓練模型的難點，為AMD平臺訓練大模型驗證了可行性。

同時，CUDA生態也在逐步擊破，今年7月英國公司Spectral Compute推出了可以為AMD GPU原生編譯CUDA源代碼的方案，大幅提高了AMD GPU對CUDA的兼容效率。

英特爾的Gaudi 3 也在發布時直接對標英偉達H100，并宣稱在模型訓練速度和推理速度上分別比英偉達H100提高了40%和50%。

除了芯片巨頭外，也不乏來自初創公司的沖擊。比如Groq推出的LPU、Cerebras推出的Wafer Scale Engine 3、Etched推出的Sohu等等。國內方面，有走多卡集群訓練路線的初創公司，比如摩爾線程在今年6月宣布與羽人科技合作成功實現了摩爾線程夸娥（KUAE）千卡智算集群與羽人系列模型解決方案的訓練兼容適配，高效完成了70億參數羽人大語言模型YuRen-7b的訓練測試。

摩爾線程夸娥方案基于全功能MTT S4000 GPU，該GPU采用了第三代MUSA內核，單卡支持48GB顯存容量和768GB/s的顯存帶寬，FP16算力為100TFLOPS。值得一提的是，MTT S4000計算卡借助摩爾線程自研開發工具，可以充分兼容現有CUDA軟件生態，實現CUDA代碼零成本遷移到MUSA平臺。

天數智芯也與智源研究院、愛特云翔合作，提供天垓100加速卡、構建算力集群及全程技術支持，實現基于自主通用GPU的大模型CodeGen（高效編碼）項目，通過中文描述來生成可用的C、Java、Python代碼以實現高效編碼。

另外值得一提的是，國內還有一家走TPU路線的AI芯片公司——中昊芯英。該公司在2023年底推出了國內首款量產TPU AI訓練芯片“剎那”，據稱在處理大模型訓練和推理任務時相比英偉達A100，性能提高近150%，能耗下降30%，單位算力成本僅為A100的42%。

當然，除了芯片公司，據現有的信息，目前主流的云服務供應商，比如前面提到的谷歌，還有亞馬遜、微軟、Meta、阿里巴巴、字節跳動、百度、華為等都有自研芯片的布局，其中還包括用于AI大模型訓練的芯片。

寫在最后

從長遠來看，自研芯片是云服務供應商有效降低算力成本的方式之一，當AI大模型訓練成為了云計算的重要用途時，自研AI訓練芯片自然也是云服務廠商的長遠之計。蘋果作為消費電子巨頭已經邁出了重要的一步，即擺脫對英偉達的算力依賴，并且還有大量的挑戰者正在蠢蠢欲動。星星之火，可以燎原，英偉達在AI訓練領域的地位，可能沒有表面看起來那么穩固。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

gpu

gpu

+關注

關注
27

文章
4550

瀏覽量
127931
蘋果

蘋果

+關注

關注
61

文章
24063

瀏覽量
193457
AI

AI

+關注

關注
87

文章
28397

瀏覽量
265683
英偉達

英偉達

+關注

關注
22

文章
3591

瀏覽量
89546
大模型

大模型

+關注

關注
2

文章
2049

瀏覽量
1749

蘋果AI模型訓練新動向：攜手谷歌，未選英偉達

近日，蘋果公司發布的最新研究報告揭示了其在人工智能領域的又一重要戰略選擇——采用谷歌設計的芯片來訓練其AI模型，而非行業巨頭英偉達的產品。這

發表于 08-01 18:11 ?765次閱讀

英偉達推出Flextron AI框架:賦能靈活高效的AI模型部署

在人工智能與機器學習領域，隨著技術的不斷演進，模型的高效部署與適應性成為研究的新熱點。近日，英偉達與德克薩斯大學奧斯汀分校攜手宣布了一項重大突破——推出了一種名為FLEXTRON的新型靈活模型

發表于 07-18 15:22 ?2237次閱讀

英偉達推出AI模型推理服務NVIDIA NIM

英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型

發表于 06-04 09:15 ?475次閱讀

英偉達首席執行官黃仁勛：AI模型推動英偉達AI芯片需求

近來，以ChatGPT為代表的AI聊天機器人已經導致英偉達AI芯片供應緊張。然而，隨著能夠創造視頻并進行近似人類交流的新型AI

發表于 05-24 10:04 ?323次閱讀

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

計算工作負載、釋放百億億次計算能力和萬億參數人工智能模型的全部潛力提供關鍵基礎。 NVLink釋放數萬億參數AI模型的加速性能，顯著提升大型多GPU系統的可擴展性。每個

發表于 05-13 17:16

蘋果將使用自研大型語言模型Ajax優化iOS 18

在科技界的矚目下，蘋果再次展示了其在人工智能領域的深厚實力。近日，蘋果宣布將使用自研的大型語言模型（LLM）Ajax來優化即將發布的iOS

發表于 05-10 11:20 ?392次閱讀

研華與英偉達深化合作，成為NVIDIA AI Enterprise軟件全球分銷商

近日，研華宣布擴大與英偉達的合作，未來將通過工業級邊緣計算和英偉達 AI Enterprise

發表于 05-10 10:25 ?260次閱讀

微軟自研AI大模型即將問世

微軟正悄然醞釀一項重大技術突破，據內部消息人士透露，公司正全力訓練一款名為“MAI-1”的自研人工智能大模型。這款模型備受期待，其規模龐大，足以與谷歌的Gemini和OpenAI的Ch

發表于 05-07 14:46 ?350次閱讀

國產GPU在AI大模型領域的應用案例一覽

電子發燒友網報道（文/李彎彎）近一年多時間，隨著大模型的發展，GPU在AI領域的重要性再次凸顯。雖然相比英偉達等國際大廠，國產

發表于 04-01 09:28 ?3273次閱讀

盤點國產GPU在支持大模型應用方面的進展

，近些年國內也有不少GPU企業在逐步成長，雖然在大模型的訓練和推理方面，與英偉達GPU差距極大，但是不可忽視的是，不少國產

發表于 03-29 00:27 ?4563次閱讀

英偉達市值躍居全球第四文生視頻大模型Sora帶動

英偉達市值躍居全球第四文生視頻大模型Sora帶動文生視頻大模型Sora引發市場關注；OpenAI的首款文生視頻大模型Sora橫空出世帶動

發表于 02-19 16:48 ?859次閱讀

英偉達缺貨？OpenAI選擇自研芯片

勢在必行。然而掀起這股AI洪流，或者說將其推向浪尖的“始作俑者”，OpenAI，卻也已經在計劃著自研芯片。 ? 有了英偉達供應的前提下為何要

發表于 01-30 00:51 ?3485次閱讀

谷歌揭秘Gemini，AMD對峙英偉達

今天，我們看到谷歌揭開了多模態AI模型Gemini的神秘面紗，AMD挑戰英偉達在AI芯片市場的霸主地位，微軟在英國

發表于 12-07 20:05 ?577次閱讀

微軟發布自研AI芯片！

微軟的Azure Maia AI芯片和Arm架構Azure Cobalt CPU將于2024年上市。今年，英偉達的H100 GPU需求激增，這些處理器被廣泛用于訓練和運行生成圖像工具和

發表于 11-16 14:13 ?658次閱讀

OpenAI計劃自研AI芯片，試圖超越英偉達的市場份額

據了解，OpenAI至少從去年開始就開始討論解決AI芯片短缺的方案，包括自研AI芯片、與英偉達等

發表于 10-09 18:24 ?1071次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

AI大模型不再依賴英偉達GPU？蘋果揭秘自研大模型

評論

蘋果AI模型訓練新動向：攜手谷歌，未選英偉達

英偉達推出Flextron AI框架:賦能靈活高效的AI模型部署

英偉達推出AI模型推理服務NVIDIA NIM

英偉達首席執行官黃仁勛：AI模型推動英偉達AI芯片需求

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

蘋果將使用自研大型語言模型Ajax優化iOS 18

研華與英偉達深化合作，成為NVIDIA AI Enterprise軟件全球分銷商

微軟自研AI大模型即將問世

國產GPU在AI大模型領域的應用案例一覽

盤點國產GPU在支持大模型應用方面的進展

英偉達市值躍居全球第四文生視頻大模型Sora帶動

英偉達缺貨？OpenAI選擇自研芯片

谷歌揭秘Gemini，AMD對峙英偉達

微軟發布自研AI芯片！

OpenAI計劃自研AI芯片，試圖超越英偉達的市場份額

搜索歷史

AI大模型不再依賴英偉達GPU？蘋果揭秘自研大模型

評論

AI大模型不再依賴英偉達GPU？蘋果揭秘自研大模型