過去一年,用于AI服務器的GPU一直供不應求,而從未來一年的發展態勢來看,相關產品的緊張程度有增無減。
據TrendForce(集邦咨詢)預測,2024年全球服務器整機出貨量約1365.4萬臺,年增長率約2.05%。同時,市場仍聚焦部署AI服務器,出貨占比約為12.1%。
從各大ODM出貨動態來看,今年,增長幅度最高的是Foxconn(富士康),預估出貨量年增約5%~7%,包含Dell 16G平臺、AWS Graviton 3與4、Google Genoa和Microsoft Gen9等訂單。AI服務器訂單方面,Foxconn今年已斬獲Oracle訂單,同時也承接了部分AWS訂單。
增長幅度排名第二的是Inventec,預估出貨量年增約0~3%。AI服務器方面,除了北美CSP,中國客戶,如ByteDance需求最強,預估今年Inventec 的AI服務器出貨量年增長率可達雙位數,占比約10%~15%。
排在Inventec之后的是廣達和Supermicro,預計今年服務器出貨量年增長率持平。
整體而言,各家ODM在2024年的出貨仍以AI服務器最為強勁,主要受惠于北美云端數據中心廠商訂單帶動,預計今年AI服務器出貨增長率和占比都將達到兩位數百分比。就出貨種類而言,今年,搭載高端AI訓練芯片(如英偉達H系列和AMD的MI系列產品)的機種出貨量有機會翻倍增長。這對英偉達和AMD來說,意味著更大商機。
?01 店大欺客?
目前,英偉達占據80%的AI服務器GPU芯片市場份額,AI系統和互聯網大廠都需要該公司的GPU,因此,英偉達在該市場擁有很大話語權。
最近,有外媒報道,英偉達可能刻意延后出貨,以限制競爭對手接單。
報道稱,如果英偉達發現客戶正在尋求更好的業務機會,則可能會拖延數據中心GPU的出貨。英偉達的競爭對手、人工智能芯片創業公司Groq表示,由于客戶擔心英偉達報復性出貨延遲,都心存恐懼地對取得或設計人工智能技術保密。
Groq首席執行官羅斯(Jonathan Ross)表示,由于潛在客戶擔心被英偉達發現與其它廠商討論接單,客戶們都會否認自己曾與這些競爭對手公司會面。實際上,這種情況在業界并不少見。羅斯說:“很多人都說,如果英偉達聽說客戶正在會面,它們會否認這一點。問題是你必須提前一年向英偉達付款,可能會在一年內得到硬件,也可能需要更長時間?!?/p>
外媒甚至暗示,微軟、Google和亞馬遜等科技巨頭正打造自有人工智能加速器,但都堅稱不打算成為英偉達的競爭對手,因為英偉達在人工智能市場中占有主導地位。
針對羅斯的聲明,英偉達CEO黃仁勛告訴行業分析師,他試圖公平地向客戶分配GPU,并將避免向不立即使用加速器的公司出售產品。
在Groq指控英偉達使用延后出貨手段后,AMD前副總裁赫克爾曼(Scott Herkelman)表示,英偉達的確采取類似策略,他甚至稱英偉達為“GPU獨占集團”。他在社交媒體X上發文寫道:“這種情況發生的次數比預期的要多?!?/p>
赫克爾曼的表態十分引人關注,因為他從2016年起負責AMD的圖形業務部門,該部門在消費者和數據中心業務方面與英偉達競爭,直到2023年離開AMD。更重要的是,他在2012年9月~2015年5月間擔任英偉達GeForce業務總經理。
不過,目前尚不清楚是否有證據證明英偉達確實有上述行為。
?02 如何保持行業領導地位?
英偉達在占據AI服務器用GPU市場主動地位的情況下,一定會想方設法實現利潤最大化,具體措施方面,除了高定價,保持客戶粘性是很重要的方式,在這方面的具體措施,包括技術性的,如用CUDA軟硬件生態系統牢牢地抓住廣大工程師,還有就是商業操作層面的,要盡量降低競爭對手的獲客機會。
在當前的AI服務器和相關GPU市場行情下,無論是GPU提供商,還是系統集成商或互聯網大廠,都越來越敏感了,特別是互聯網大廠,都在做兩手準備,在向英偉達采購更多GPU的同時,正在加緊自研相關芯片。對于英偉達的各種客戶而言,更多地接觸AMD和英特爾是必然。
微軟、Meta、亞馬遜等云服務提供商為了降低芯片成本,并使芯片供應鏈多元化,減少對英偉達的依賴,不僅開始提升采購AMD的MI300系列產品數量,要求ODM廠設計專門采用MI300系列產品的AI服務器,還紛紛加強自研HPC芯片力度,爭取將更多自研芯片用于自家的互聯網和云計算系統。
AMD是英偉達最大的競爭對手,由于受到越來越多英偉達客戶的關注,對AMD產品的采購量在增加,使得該GPU“二哥”的行業地位持續提升,這在資本市場上有越來越明顯的表現。最近,AMD股價漲幅超過9%至每股192.53美元,創造歷史新高,2月份累計上漲了14.8%,市值首度突破3000億美元。
根據道瓊斯市場數據,AMD的市值達到了3110億美元。在近期的連續上漲之后,AMD股價越來越貴,其市盈率接近50倍,遠高于英偉達的32倍。
這樣看來,雖然英偉達依然很風光,但受限于先進制程、封裝產能,以及來自各級別芯片對手的競爭,該公司的危機意識也在增加。
對于英偉達來說,要加快推出新品和優化原有產品的節奏。
英偉達AI年度盛會“GTC 2024”將于3月18日在美國登場,屆時,黃仁勛將公布旗下最新的AI芯片、采用新一代Blackwell架構的B100 GPU。據悉,該新品將由臺積電3nm制程代工生產,最快今年第四季度出貨。
GTC大會不僅將世界各地的專業工程師、研究人員會聚一堂,還將邀請多位科技大老親自到場,活動預計將涌進超過30萬人(線下和線上總參與人數),今年的GTC也被外界看作是觀察2024和2025年AI關鍵技術發展進程的重要風向標。
英偉達即將發布的B100,與目前的H系列GPU相比,整體效能有大幅提升。其中,光是HBM內存容量,就比H系列最強的H200芯片高出約40%的容量,使得B100能應對高效能HPC或加速LLM的AI訓練需求。據了解,B100芯片的AI效能,至少是Hopper架構H200的兩倍,可以達到H100的4倍以上。
多家AI服務器系統大廠已經開始爭奪B100,包括已成為英偉達B100模組供應商的代工大廠緯創,以及提供3nm或4nm制程技術的臺積電,還有現已開始接到來自英偉達B100 AI服務器水冷項目訂單的代工大廠英業達。英業達表示,今年的AI服務器市場仍以英偉達產品為主流,并以高端訓練用的AI服務器產品為市場主力。
對于即將發布的新品B100,英偉達對所搭載的散熱技術也進行了升級,從原來的氣冷轉為水冷,對此,黃仁勛曾提到,自己堅信浸沒式水冷技術是未來發展方向,將帶動整個散熱市場迎來全面的革新。據悉,英偉達從B100開始,未來所有產品的散熱技術,都將由氣冷轉為水冷。
?03 中國市場給英偉達增添了更多危機感
英偉達對競爭對手帶給它威脅的重視程度,從它對中國大陸市場及本土芯片企業的態度就可以看出來。
中國大陸市場占英偉達銷售額的20%左右,近兩年,該公司不得不多次改變GPU性能規格,以滿足美國政府的出口要求。
2022年8月,美國政府禁止向中國大陸出口英偉達的A100和H100芯片,因為這些芯片的通信帶寬達到了600GB/s或更高。針對中國大陸市場,英偉達隨后推出了A800和H800處理器,通信帶寬都明顯低于600GB/s。
2023年10月,美國商務部工業與安全局(BIS)表示,將使用 “性能密度”作為新參數對受限芯片進行分類。根據新規定,英偉達的A800、H800、L40、L40S和RTX 4090相關產品被禁止銷往中國大陸。針對這項規定,英偉達又于去年11月推出了三款AI芯片——H20、L20和L2,但要到2024年第二季度才能量產交付。
針對RTX 4090在中國大陸銷售受限問題,英偉達開發出了RTX 4090 D顯卡,通過降低部份規格,以符合美國出口管制要求。據悉,RTX 4090 D滿足綜合運算性能(TPP)4800限制,RTX 4090的TPP是5286。
最近,英偉達推出了最新版本的中國特供GPU和顯卡RTX 5880 Ada,符合4800 TPP的限制規定。英偉達將AD102芯片用于RTX 6000 Ada和RTX 5000 Ada,RTX 5880 Ada很可能使用相同芯片的變體。AD102擁有18,432個CUDA內核。
隨著近幾年美國限制政策的出臺,以及中國本土企業和產品競爭力的提升,英偉達等廠商的技術和產品優勢正在縮小。例如,H20在性能和效率上仍比中國本土AI芯片具有優勢,但這種優勢正在縮小,因為多家中國本土芯片廠商正在快速發展。
由于中國本土AI芯片與英偉達特供版產品之間的差距在縮小,進入2024年以來,多家中國互聯網大廠和云服務提供商表示,今年下訂的英偉達H20等產品數量將遠少于原本想買的,因為來自中國本土的相關芯片用量增加了。
測試結果顯示,H20能在多個處理器之間高效傳輸數據,比中國本土相關芯片更適合AI計算應用,但是,需要更多H20才能表現出英偉達常規GPU的算力,這就大幅提高了成本。相比之下,中國本土最先進的AI芯片也能處理AI相關應用,只是處理任務的復雜度低于英偉達的。知情人士表示,多家中國互聯網大廠和云服務提供商已經把一些AI芯片訂單轉至本土廠商,以華為為例,據悉,該公司去年已從本土互聯網大廠手中拿到至少5000組Ascend 910B芯片訂單,預定今年交貨。
2月下旬,黃仁勛在接受外媒采訪時表示,如今,整個科技行業都在爭相開發和優化自己的芯片技術,無論是TPU團隊、AWS Trainium和Interentia團隊,還是微軟的Maia項目,以及中國各大云服務提供商和初創公司,都在這一領域投入了大量的精力。這種競爭態勢確實非常激烈。
對于中國大陸的競爭對手,黃仁勛表示,華為是非常好的公司。盡管他們受到現有半導體制程技術的限制,但他們仍然可以通過將許多芯片聚集在一起來構建非常強大的系統。為了與華為競爭,英偉達正在向客戶提供兩款專門針對中國市場的新AI芯片樣品。
這是英偉達首次公開將華為列為競爭對手。此前,英偉達唯一一次公開提到華為是在2017年的一份財報中,當時,該公司表示,華為將使用英偉達的Volta HGX架構為數據中心構建AI系統。在那份報告中,英偉達還將華為列為其AI智慧城市平臺的合作伙伴,而現在,華為成為了英偉達不得不重視的競爭對手。
?04 結語
經過2023年的火爆,2024年的AI服務器市場很可能會更加旺盛,這給相關高性能芯片、特別是GPU廠商提供了更多商機。
對于行業領導廠商而言,眾多競爭對手,甚至包括客戶都虎視眈眈。站得越高,如果處理不好的話,摔得就會越慘,需要在技術、產品和商業推廣等多方面,充分發揮原有優勢,壓制競爭對手,才能保持行業地位。
對于英偉達來說,2024年的AI服務器GPU市場依然會是它的天下。但在不斷變化、發展的高性能計算市場,誰能斷定兩三年后的技術和產品市場會有多大變化呢?就像兩年前,誰能斷定華為能在2023年實現手機處理器制造突破一樣。
審核編輯:黃飛
?
評論
查看更多