電子發燒友網報道(文/吳子鵬)根據外媒The Information的報道,有知情人士透露,英偉達向其客戶表示,新款Blackwell B200芯片將延遲發布三個月或更長時間,批量出貨或延遲至明年Q1。
隨后,SemiAnalysis在最新研報中剖析了英偉達Blackwell B200芯片的技術挑戰,主要在合封方面。一顆Blackwell B200芯片包含了2個Blackwell GPU,連接2個Blackwell GPU的關鍵電路目前還存在一些問題,導致芯片的良率不高。這一故障也導致包含2個Blackwell GPU和1個Grace CPU的GB200超級芯片同樣面臨量產挑戰。
合封是Blackwell B200和GB200發揮性能的關鍵
根據英偉達的發布會信息,Blackwell B200芯片被定義為目前地表最強的AI加速芯片,基于臺積電的4nm工藝打造,在芯片內部,采用將2個Blackwell GPU互聯組成雙芯設計,單顆芯片的晶體管數量高達2080億個。
先進工藝+先進封裝讓Blackwell B200芯片成為一個性能怪獸,AI性能可達20PFLOPS,是H100芯片的5倍,可以為 LLM(大語言模型)的推理帶來30倍的效率提升。Blackwell GB200芯片的性能就更強了,其AI性能是H100的7倍,訓練性能是H100的4倍。
不難看出,由于摩爾定律失效,先進封裝技術已經成為英偉達提升芯片性能的關鍵手段。為了讓兩顆GPU合封在一起還能充當單顆的GPU,英偉達在2個Blackwell GPU之間使用了高速帶寬接口10 TB/s NV-HBI,整塊芯片還封裝有192GB高速HBM3e顯存。
不過,知情人士透露,就是2個Blackwell GPU之間的電路設計出現了一些問題,導致B200芯片無法按照原計劃量產。Blackwell封裝是第一個使用臺積電CoWoS-L技術進行大規模量產設計的封裝,使用帶有局部硅互連(LSI)和嵌入橋接芯片的RDL中介層。相較于此前熱門的CoWoS-S,CoWoS-L更加復雜,不過帶來的性能助益也更高。
谷歌、Meta和亞馬遜受影響最大
Blackwell芯片原計劃于2024年10月開始批量生產,若因延期而推遲至2025年4月,將直接影響英偉達的季度收益。而客戶方受影響最大的是谷歌、Meta和亞馬遜三家公司。
據報道,谷歌、Meta和亞馬遜三家公司已經向英偉達下了高達600多億美元的訂單。根據著名投行摩根斯坦利的估算,單個英偉達超算計算卡采用的連接技術分別是NVL36和NVL72,也就是在一個計算卡上搭載36顆或者72顆Blackwell B200芯片,按照3萬-4萬美元/顆芯片單價計算,即便是36顆芯片,只算芯片的價格就超過了100萬美元,如果是4萬美元的話,就是150萬美元,因此采用NVL36連接的算力卡售價將定在200萬美元,采用NVL72連接的則定價為300萬美元,符合黃仁勛定義的買得越多越便宜的標準。
如果谷歌、Meta和亞馬遜三家公司都是下定300萬美元的NVL72計算卡,那么Blackwell B200芯片的需求量高達140萬顆,如果大規模采購繼續有優惠,那么這個數量會更大。事實也確實如此,根據接近谷歌方面的人士透露,谷歌大概會投入100億美元,以獲取40萬顆Blackwell B200芯片,以及相關的服務器設施,那么600億美元的預算可能帶來差不多240萬顆Blackwell B200芯片需求缺口。
同時,黃仁勛在發布英偉達Blackwell B200芯片時就曾透露,戴爾、微軟、OpenAI、甲骨文、特斯拉和xAI都有計劃采用Blackwell產品。如果單看Blackwell B200芯片,其推遲發布可能會影響到英偉達在今年的營收目標。
不過,目前前沿數據中心的打造,計算芯片基本100%來自英偉達,英偉達的彌補措施是繼續延長Hopper系列芯片發貨量,同時盡可能在今年實現Blackwell B200芯片供貨,一旦實現,2025年英偉達可能會沖刺2000億美元的營收,2024年為475億美元。
結語
根據半導體研究機構TechInsights的統計數據,2023年全球數據中心GPU總出貨量達到了385萬顆,相比2022年的267萬顆增長了44.2%。其中,英偉達以98%的市場份額穩居第一。基于這樣的統治力,英偉達Blackwell B200芯片的需求之大是可想而知的。
不過,Blackwell B200芯片是一顆復雜的芯片,采用了臺積電的CoWoS-L封裝技術,目前正面臨一些量產挑戰,但相信以英偉達和臺積電的能力,會很快解決的。
-
英偉達
+關注
關注
22文章
3637瀏覽量
89871 -
AI芯片
+關注
關注
17文章
1828瀏覽量
34669
發布評論請先 登錄
相關推薦
評論