競爭驅動洗牌,洗牌催生跨越。
我們深知,適應比預測更重要。無論是如今寫在歷史中的大公司們,還是依舊尋找方向的創業公司,無一例外不經歷著一次又一次的洗牌,又在一次又一次的洗牌中或退場、或重生。
這是一個洗牌年代,也是一個值得書寫的年代。
2024年注定是AI芯片廠商們捉對廝殺的一年。
過去一年時間里,AI賽道烈火烹油,以英偉達為代表的GPU廠商手握算力心臟,背靠AI企業擴大云計算規模和訓練大模型的需求,吃下了AI時代的第一筆紅利,賺得盆滿缽滿。
隨著時間來到2024,AI從云端蔓延向終端,「AI+產品」概念下的許多新物種逐漸走到消費級的臨界點。為了捕捉這些增長點,雄踞于各個細分領域的AI芯片龍頭紛紛開啟了跨界合作,一手推出新品,一手尋找新的合作伙伴。
即便是確定性相對較強的云端算力市場,也透著一股「山雨欲來風滿樓」的氣息。谷歌、微軟、亞馬遜先后宣布推出或計劃推出自研AI芯片,AMD的新產品MI300X在性能上緊咬英偉達H100,英特爾CEO基辛格透露:“整個行業都被推動來減少CUDA(英偉達推出的運算平臺)的市場?!?/p>
2024,AI芯片市場的格局將迎來什么變化?而這潑天富貴,又將花落誰家?
云端之戰:英偉達如何對抗圍剿?
從云端需求和企業動作來看,2024年研發下一代大模型仍將是各大科技公司競爭的核心,其中多模態模型占比逐漸提高的趨勢帶動了更大的算力需求。
C端AI應用數量的增加也為云市場的增長注入了穩定性。過去,模型的預訓練是GPU消耗最大的環節,大約80%,但隨著越來越多的消費者開始調用模型進行推理,未來推理和訓練的算力占比將倒置。晚點LatePost報道,多位大模型從業者估算,如果千億參數或更大的人工智能模型被廣泛使用,大模型的訓練成本和推理成本會達到2:8,甚至1:9。
對AI創業者以及科技巨頭來說,這個消息憂喜參半。
2023年,所有涌向AI的掘金者都對上游芯片供應商有一種復雜的情緒。研發AI產品離不開AI芯片這顆算力心臟,但高昂的價格和短缺的產能同時也令他們無時無刻不被焦慮包圍。
除了恐懼拿到芯片的同行領先自己在市場上鋪開業務,更擔心賣方市場的格局仍將持續下去,無法擺脫向上游「納稅」的命運。
但令人意外的是,這些賺得盆滿缽滿的賣水人同樣不安。GPU龍頭英偉達創始人黃仁勛在去年十一月的一場演講中表示:“我們不需要假裝公司一直處于危險之中。我們(確實)一直處于危險之中?!?/p>
黃仁勛在AI的暴風眼站了一年,這句話大概是他的真實感受。
壓力首先來自于同行競爭。
作為市場上唯一有希望在GPU領域挑戰英偉達的企業,AMD每次發布新芯片,英偉達都會被拿出來做對比,你甚至可以在去年12月的多輪交鋒中看到火花迸射。
AMD12月6日推出MI300x時,宣稱表現優于英偉達的AH100。英偉達隨后發布了自己的基準測試作為回應,表明AH100在正確的設置下仍然更好。AMD再次對此做出回應,發布了新的基準測試,再次顯示MI300X在正確的設置下表現出色。
此外,英特爾雖然在GPU領域鮮有建樹,但仍未放棄這塊甜美的蛋糕。英特爾聲稱,將在2024年上市的Gaudi 3,性能超過了英偉達的AI芯片H100。
除了同行,英偉達的客戶們也并不忠誠,谷歌、亞馬遜、特斯拉、阿里、百度、微軟……幾乎所有的大客戶都宣布將自研AI芯片。
這些客戶還對英偉達的生態護城河發起了猛攻。“整個行業都被推動來減少CUDA的市場”,英特爾CEO基辛格最近公開表示,MLIR、谷歌和OpenAI等都在轉向一個“以Python語言為基礎的編程層”,以使AI訓練更加開放。
自研芯片和生態建設并非易事,為何反倒成為了行業共識?英偉達的「鐮刀」實在太鋒利了。
《財新》的一篇報道中顯示,哪怕花英偉達同樣的成本,只要做出十分之一的效果,這些科技廠商便已經有利可圖。更具體的案例是,按照谷歌的報價,使用其最新的AI芯片TPUv5e在訓練、推理參數少于2000億的大模型時,成本低于用A100或H100。
英偉達搶客戶的行為也讓云廠商難以接受。去年3月GPU最稀缺的時候,英偉達推出云計算服務DXGCloud。簡單來說就是把賣給云廠商的GPU再租回來,進一步優化后再出租給需要GPU算力的客戶。一來一去,云廠商承擔了數據中心的建設成本,但客戶卻去了英偉達。
對英偉達來說,最大的變量可能還是在中國。近日外媒的一篇報道顯示,由于對華出口芯片的性能被一壓再壓,中國玩家正在對其失去興趣,這意味著它可能失去接近五分之一的營收。
當然,作為硅谷最具戰斗精神和固執的企業之一,坐以待斃從來不是英偉達的風格。過去的一年里,憑借占市場份額接近95%的最大GPU賣方身份,英偉達的護城河其實被拓寬了。
英偉達的核心競爭力主要由三個板塊構成——供應鏈優勢、軟硬件生態、投資。
軟硬件生態方面,預計2024年出貨的AI芯片H200及生態配件,仍是市場上最適合大模型生長的「土壤」。而投資方面,2023年英偉達完成了20多筆投資,投資版圖涵蓋AI相關的各個行業,即便未必能從中穩定獲利,過程中積累起的KnowHow,也將逐漸成為其它初創企業選擇英偉達的理由。
真正決定2024年市場格局的,是英偉達的供應鏈優勢。
AI芯片產業鏈冗長、復雜,每個細分領域都有各自的領頭企業,只有將它們集成到一起,才能生產出性能最好的芯片。
英偉達籠絡它們的手段是承諾不可取消的訂單。目前,英偉達有111.5億美元的采購承諾、產能義務和庫存義務,另外還額外簽訂了價值38.1億美元的預付費供應協議。這些被承諾的訂單中包含臺積電近六成產能和SK海力士、三星、美光HBM的大部分供應。
臺積電封裝對芯片性能的影響無須多言,HBM同樣關鍵。HBM是高帶寬內存芯片,而GPU只有內存足夠大、數據傳輸速度足夠快,才能保證運行效率。
單從這方面看,沒有其他供應商可以與之相媲美,因此他們也將無法參與正在發生的狂熱AI浪潮,即便是谷歌等科技巨頭。
綜上所述,2024年的云端戰事確定性較強,雖然英偉達遭遇圍剿,但無論是自研芯片還是生態建設都需要時間來慢慢發酵,至少在供應鏈緊張的問題解決之前,英偉達的統治地位不會被動搖。
場景之戰:AI PC、 AI Car 、AI Phone成最熱板塊
淘金先富賣鏟人,背后的AI芯片廠商已經摩拳擦掌。分行業來看,AI PC、AI Phone、AI Car是其中關注度最高的三個板塊。
AI Phone:亟待AI拉動新增量
過去幾年時間里,手機處于增長乏力的狀態,即便廠商在硬件上「卷」到了極致,仍難以掩蓋創新缺失的殘酷真相。除了華為mate 60橫空出世給市場帶來了一些新鮮血液,就連蘋果的發布會都難以講出說服消費換機的新故事。
AI是它唯一能拉動增長的發力點?!窤I上機」的傳說從ChatGPT向C端開放起就飄蕩在市場的上空,被談論了一整年。但在大模型向小型化發展之前,硬件與模型規模之間的矛盾幾乎不可調和。
事實上在手機端,至今也很難在保證模型性能的情況下,避免手機發熱、內存占用量過大等體驗對消費者購買欲產生的影響。
年初,手機芯片雙雄之一高通演示了在安卓上運行Stable Diffusion的效果,并在近期宣布將推理時間縮短到1秒以內,但另一雄的聯發科工程師表示,本地運行13B體量的小模型就意味著需要占用約13GB的內存,再加上安卓本身的4G,在不下載任何其他App的情況下,就已經超過了大多數手機16GB的內存容量。
即便如此,市場仍為AI Phone領域的增長投下了贊成票。它們的理由是,手機是人們日常使用頻率最高的電子產品,基于入口優勢,雖然本地部署還存在一定的困難,但云端運行AI帶來的增量仍不容忽視。分析機構Canalys預測,2024年全球智能手機出貨量將在2024年恢復增長,增幅約為4%。
AI PC:硬件、框架之爭
相比之下,AI PC的進展則順利得多。理由也很簡單,與手機相比,PC的體積更大,芯片性能的上升空間更廣。IDC預測,2024年將成為AI PC快速發展的第一年,2024年整體PC市場AI PC占比將達到55%,而2027年將達到85%。
目前PC端的AI芯片廠商已經釋放出了濃烈的火藥味,彼此間的混戰一觸即發。
NPU與GPU之爭是混戰的第一個賽點。
GPU無需多言,關鍵是NPU為什么能站上擂臺。與算力中心背靠成千上萬臺集成了CPU、GPU等各種芯片的服務器不同,PC的算力主要集中在一塊「總芯片」當中,這塊芯片由CPU、GPU、NPU等「分芯片」構成,各芯片分工不同。其中NPU就是專門被設計出來處理AI相關運算任務的。
因此,矛盾產生了。雖然GPU的定義是圖形處理器,但同時它浮點、并行運算的特性也促使它成為了運行AI運算的最佳載體之一,這一點在云端已經被證明。一旦AI PC實現,大量AI運算任務勢必帶動GPU的銷量。本次CES展開幕之前,英偉達連發三款消費級GPU,顯然是向市場釋放信號。
X86構架和ARM構架之爭,是混戰的第二個賽點。
X86和ARM是芯片的兩種構架。X86構架是英特爾的代名詞,在PC芯片端,直接與英特爾展開競爭的是采用ARM構架的手機芯片龍頭高通和聯發科。
X86和ARM的區別可以簡單概括成前者性能、功耗雙高,后者雙低。過去,ARM一般被用于手機,但近年內,隨著ARM芯片的性能不斷提高,低功耗的優勢正在引起業內玩家的注意。微軟、蘋果、Meta等廠商都在支持基于ARM的PC。據界面新聞報道,英偉達和AMD正在考慮2024年為移動PC提供基于ARM的解決方案。
高通對于AI PC垂涎已久,去年10月面對Windows 11發布的驍龍X Elite芯片與同級X86相比,性能可達競品的兩倍,而達到相同峰值性能時,功耗僅為競品的三分之一。
AI Car:兩大陣營跑馬圈地
雖然AI PC的戰場已經硝煙四起,但若是與AI Car相比,甚至能被稱作一團和睦。背后的原因也很好理解,PC和手機是為存量市場里找增量,而車載AI則是實打實的藍海。
在智能座艙領域,高通率先采用SoC邏輯設計車載MCU芯片的舉措為它帶來了先發優勢,因此扮演著守城者的角色。眼下,它正面臨著英偉達、聯發科、英特爾等企業的多重圍攻。
去年6月,聯發科宣布將與英偉達合作,為下一代軟件定義汽車提供全套車載人工智能座艙提供解決方案,覆蓋從豪華到主流的所有汽車細分市場。
雙強合作的模式是,聯發科將開發集成英偉達GPU的汽車SoC。而英偉達則是目前高端車型主要采用的自動駕駛系統供應商,客戶資源廣泛。本次CES展中,英偉達公布了DRIVE系列汽車業務的最新進展,理想、長城、極氪、小米等企業均已采用DRIVE Orin平臺為其智能自動駕駛系統提供支持。
英特爾亦在CES宣布了進軍汽車行業的重要戰略,推出專為下一代汽車設計的AI增強軟件定義車輛系統芯片(SoCs)。其旗下的自動駕駛解決方案公司Mobileye一直處于世界領先的地位。
在自動駕駛領域,則呈現兩強爭霸的格局。英偉達與地平線分別包攬高端和低端車型,按覆蓋車型價格區間的廣度排名,地平線第一,英偉達第二。
與英偉達CUDA類似,地平線也有自己的生態護城河。同時,作為本土供應商,地平線在交付效率上更具優勢。
格局之戰:2024,誰是最關鍵的變量?
各家芯片廠商在AI PC、AI Phone、AI Car卷出天際,在這個堪比「春秋戰國」的新競爭時代,即便英偉達依舊遙遙領先,一些關鍵問題也隨之而來:2024年,誰能殺出重圍?誰又是英偉達之外最關鍵的變量?
毫無疑問,這將是一場格局之戰。我們可以從蛛絲馬跡中對2024年誰將殺出重圍做出一些預判。
雖然三大熱門場景都有變化,但增量的絕對值不盡相同。綜合硬件性能、用戶需求、市場規模等因素,「硅基研究室」判斷,AI Car會是增量最大的領域,AI Phone次之,AI PC最末。
車端可能是2024年最撲朔迷離的AI芯片戰場。
市場上玩家布局的路線主要可以歸納成兩條。一條從自動駕駛出發,向智能座艙拓展,譬如英偉達和Mobileye(通過英特爾實現)。另一條則是從智能座艙出發,向自動駕駛拓展,譬如高通。
在智能座艙領域,眼下市場上各家新能源車企的競爭,與其說是芯片性能之爭,不如說是對用車場景的理解之爭。而在自動駕駛領域,因為和安全息息相關,必須要保證硬件運行的穩定性,并且需要經過市場驗證,領先玩家具備更高的壁壘。
從這個角度出發,英偉達、Mobileye將率先受益,地平線等二線廠商有望憑借低成本、高成熟度的產品成為車企的替代方案。
但是,如果將視角切換到交付的穩定度和市場鋪開面上,則是地平線、華為等國產玩家具備更強的潛力。
一方面,在地緣政治背景下,AI芯片的對華出口能否持續、穩定,需要畫一個問號。性能和生態固然是一道門檻,但正在解決當中。
另一方面,雖然目前地平線主要在低端車型中鋪開,但企業在自動駕駛領域的發展高度依賴數據積累,未來以更快的速度對先進廠商完成反超也并非沒有可能。
在手機領域,AI芯片廠商享受紅利的前置條件是大模型本地部署。
眾所周知,大模型上機有兩種模式,一種是云端接入,另一種是終端部署。前者靠將用戶的訴求反饋至云端,運算后在將結果發回手機。后者全流程均依靠本地硬件完成。
從能實現的功能上來看,兩者類似,唯一對消費者購機意愿影響較大的因素是“是否愿意將本地數據(包括照片、文件、對話記錄)上傳至云端”。從這一點出發,本地部署確實存在需求,手機AI芯片的增長值得期待。
那么高通和聯發科誰能將占據領先地位呢?
從市場站位來看,高通和聯發科分別占據高端和中低端手機市場,向上突破的難度遠大于向下兼容,并且目前推出AI手機的廠商均將價格定位在高端。
高端的市場站位給高通帶來了更豐厚的毛利率,對比財報來看,高通第三季度的毛利率約為55.1%,聯發科毛利率水平為47.4%,這意味著高通有更多的「余錢」來推動研發。滾雪球效應下,恐怕聯發科想要追趕高通仍有一段路要走。
值得一提的是,蘋果和華為的AI芯片計劃也會對市場格局產生影響,但程度較輕。
近年來,蘋果手機芯片的性能提升幅度與高通、聯發科等競爭對手相比均不占優勢。不久前登場的兩大安卓芯片——高通8 Gen3以及聯發科天璣9300,在CPU多核性能、CPU多核能效比、GPU峰值性能、GPU能效比等核心技術指標上均已領先同時期的蘋果A17 Pro。
華為方面,受到地緣政治因素影響,目前在芯片性能方面還難以和國際一流芯片廠商掰手腕。
在PC端,雖然近日AI PC的聲量不小,但距離它真正撬動C端市場的銷量,還需要一些時日。
從C端場景出發,可以大致將AI應用區分為辦公和娛樂兩大類。
辦公場景中,雖然微軟、金山辦公、Midjourney、Adobe等軟件已經將AI功能融入其中,但它們的推理任務主要還是由云端負擔,并且已經形成了按次付費的商業模式,不需要本地硬件具備太高的性能。
在娛樂場景中,在AI熱興起之前,為了支撐游戲流暢運行,本身就對GPU為代表的圖形處理能力有較高的要求。按照眼下能被「塞」進PC的模型規模,過去用于渲染游戲畫面的GPU,完全有充足的算力支撐AI衍生應用運行。
仍以英偉達為例,雖然在本次CES揭幕之前發布了三款新的消費級GPU,但三款GPU的性能均未超越2022年發布的RTX 4090。
綜上所述,2024年,在云計算等傳統領域,英偉達得益于供應鏈優勢等護城河,最值錢的賣水人地位短期內不會發生改變。
而在AI PC、AI Phone、AI Car三大場景中,分別在技術和渠道方面占據優勢的英偉達和地平線將率先吃到AI Car的紅利,而高通有望在亟需新故事拉動增長的AI Phone品類殺出重圍,至于AI PC,在新場景和新工作范式出現,并帶動更強的硬件需求之前,相關企業的市場份額及銷量還有待觀察。
2024年是AI芯片廠商迎來潑天富貴的一年,但同時,也能感受到水面之下醞釀著激烈的變化。企業和投資者當然可以投身這片藍海,但最好時刻保持警惕。
審核編輯:黃飛
評論
查看更多