據金融時報報道,中國的互聯網巨頭正爭相采購對構建生成人工智能系統至關重要的高性能英偉達芯片,由于擔心美國將實施新的出口管制,中國的互聯網巨頭們紛紛購買了價值 50 億美元的訂單。
據多位知情人士透露,百度、字節跳動、騰訊和阿里巴巴已下達價值 10 億美元的訂單,從這家美國芯片制造商采購約 10 萬顆 A800 處理器,并將于今年交付。兩位接近 Nvidia 的人士表示,中國集團還購買了價值 40 億美元的圖形處理器,將于 2024 年交付。
領先的云 GPU 提供商表示,Nvidia 最好的 AI 芯片在 2024 年之前的產能已經售罄。
Nvidia的產品現已成為科技行業最寶貴的資源。企業和初創企業正在瘋狂地將預算重點轉向新的人工智能項目,并迫切需要 GPU。亞馬遜網絡服務首席執行官 Adam Selipsky在本周接受 The Verge 采訪時表示:“[Nvidia GPU] 供不應求”。
“我認為,至少在短期內,英偉達需求超過供應,這一點毫無爭議,對每個人來說都是如此。”Adam Selipsky補充說。
Adam Selipsky進一步指出,生成式人工智能并不便宜。目前它的價格非常昂貴。GPU 的性能非常好,但也相當昂貴。例如,訓練模型的成本非常昂貴。然后,運行推理或運行模型并在生產中對這些模型進行查詢也非常昂貴。因此為了經濟地完成這些任務,您需要云。絕大多數公司都需要像 AWS 這樣的公司進行創新,隨著時間的推移大幅降低成本,以推動我們不可避免地希望看到生成式 AI 使用量的指數級增長。
CoreWeave 聯合創始人兼首席技術官 Brian Venturo在接受Barron's Tech的采訪時也表示,今年第一季度,確保供應鏈中的 [GPU] 分配和產能仍然相當容易。從四月初開始,市場變得異常緊張。交貨時間從合理到年底。[這一轉變]發生在一周內。不僅僅是云服務提供商,他們已經有了自己的分配。這都是增量需求。它來自大型企業和人工智能實驗室。
他表示,任何對物流和資源規劃進行合理規劃的人現在都在關注 2024 年第一季度至 2024 年第二季度。而CoreWeave也將開始為明年第二季度和第三季度的部署進行采購。
在問到為何大家都在搶購英偉達GPU時,Brian Venturo指出,英偉達的護城河是雙重的。
首先是硬件方面。沒有人比英偉達更擅長制造芯片。其次是軟件。上市時間對于初創企業來說非常重要。如果您需要重組整個技術堆棧以使用 AMD 或 TPU [來自 Google 的張量處理單元],那么您可能會失去市場機會,這是寶貴的時間。
Nvidia 在 CUDA(軟件編程平臺)生態系統上進行了大量投資,他們的先見之明令人難以置信。他們現在基本上領先其他人10年。這不僅僅是 Nvidia 的 10 年,而是他們的客戶和開發人員在該生態系統(使用軟件工具和庫)上構建的 10 年,利用了其他人之前的工作。我認為在短期甚至中期內沒有其他人能夠超越 Nvidia。
使用 Google 的 TPU 和 AWS Trainium 加速器的問題被鎖定在具有非常具體的技術解決方案的供應商身上。對于初創企業來說,這可能不是最好的選擇。您希望供應商具有靈活性,因為您知道可以在多個地方獲得相同的東西。
[Nvidia 的專有網絡] InfiniBand 還提供了當今最好的解決方案來最大限度地減少延遲。其他產品不具備擁塞控制和使工作負載發揮最佳性能的功能。
為了供應,英偉達將GPU裝換為AI引擎
為了緩解GPU 擠壓的壓力,Nvidia 的 RTX GPU(主要以游戲和圖形聞名)正在為對桌面 AI 感興趣的愛好者進行配置和重新包裝。新的 GPU 是 Nvidia 使 GPU 在客戶需要時隨時隨地可用的方法的一部分。
該公司發布了 RTX GPU,可用于人工智能推理和訓練。GPU基于Ada Lovelace架構,與供不應求的紅熱H100 GPU中使用的Hopper架構不同。
愛好者已經在游戲筆記本電腦上使用 GPU 來運行人工智能驅動的應用程序,例如文本到文本或文本到圖像模型。在本周的 SIGGRAPH 會議上,Nvidia 宣布了采用 RTX GPU 的新桌面和工作站設計。
包括戴爾、聯想和 Boxx 在內的計算機制造商將推出可在機箱中容納多達四個 RTX 6000 數據生成的工作站。Nvidia 表示,該 GPU 的建議零售價為 6,000 美元,但戴爾等供應商的售價(含稅)超過 9,000 美元。
每個 RTX 6000 GPU 均基于 Ada Lovelace 設計,擁有 48GB GDDR6 內存和 200Gbps 網絡接口卡。GPU 的功耗為 300 瓦,基于較舊的 PCIe 4.0 互連標準。
Nvidia還發布了L40S Ada GPU,它更像是H100的窮人版本,因為它在AI訓練和推理方面比上一代A100 GPU更快。新產品是一年前發布的L40服務器GPU的變體。
L40S 還具有 48GB GDDR6 內存,并將應用于基于 OVX 參考服務器設計的系統中,用于 Metaverse 應用程序。
與基于上一代 Ampere 架構的上一代 A40 GPU 相比,L40S 的 AI 和圖形工作負載速度提高了四倍。AI訓練速度比A100 GPU快1.7倍,推理速度快1.5倍。L40S 具有更快的時鐘速度和更高的張量和圖形渲染性能。
Nvidia 的企業 RTX 系統是為 Metaverse 和 AI 市場打造的,新硬件將包括 Omniverse 和 AI Enterprise 軟件的許可證。該公司還發布了 AI Enterprise 4.0,其中將包括 Nemo 大語言模型。
購買將于今年晚些時候發貨的 L40S GPU 電源應該不會有什么困難。
Nvidia 專業可視化副總裁 Bob Pette 在新聞發布會上表示:“這些不會像我們在一些最高端 GPU 中那樣受到限制。”
Nvidia 的低端 RTX 4000 GPU 將于 9 月上市,售價為 1,250 美元。RTX 4500 將于 10 月開始發售,售價為 2,250 美元。
對于 Nvidia 來說,人工智能與游戲一樣重要。該公司希望讓 GPU 成為一種商品,愛好者可以在上面創建自己的程序,然后在最接近的 GPU 可用的地方運行。Nvidia 的 H100 GPU 很難找到,但已成為公司的資產。一家名為 CoreWeave 的初創公司已將其 Nvidia GPU 作為抵押品,為其發展提供資金。加密貨幣礦工也在重新利用數據中心的 GPU 來運行人工智能。
審核編輯:劉清
-
人工智能
+關注
關注
1791文章
46882瀏覽量
237640 -
英偉達
+關注
關注
22文章
3749瀏覽量
90848 -
PCIe接口
+關注
關注
0文章
120瀏覽量
9680 -
GPU芯片
+關注
關注
1文章
303瀏覽量
5781 -
GDDR6
+關注
關注
0文章
52瀏覽量
11300
原文標題:傳中國廠商掃貨英偉達GPU,豪擲50億買芯片,訂單已經排到2024年
文章出處:【微信號:TenOne_TSMC,微信公眾號:芯片半導體】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論