成功的一種方式是在正確的時間出現在正確的地點(假設你足夠聰明可以識別到這個機會)。預見市場的發展是另一種方式,而創造市場則是成功的另一條路徑。Nvidia在AI領域做到了這一切,甚至更多。
在大型語言模型(LLM)、Transformer和生成式AI大行其道之前,Nvidia就已經開始了當時所謂的“加速計算”或GPU計算,并使用其CUDA C++類似的編程語言作為催化劑和通道,來利用GPU的并行處理能力。GPU是復雜的設備,讓多個數據線程正確且同步地運行是一個棘手的過程。CUDA減輕了很多這方面的工作,而且回報非常好,以至于大型組織中的數百名開發者利用它建立了一個龐大的專有和開放程序庫,這些程序運行在Nvidia的GPU上。
當生成式AI出現時,已經有了大量的CUDA程序員。這部分歸功于Nvidia在2000年代末的遠見,在全球大多數主要大學設立CUDA編程課,并由Nvidia承擔費用。這是一個大膽的投資,而且得到了豐厚的回報,這也是創造市場概念的一部分。
Nvidia還雇傭了許多AI領域的超級明星,盡管當時他們在AI業務上并沒有很多,但公司投資于未來。這是預見市場的一部分。
Nvidia已鋪墊好一切,而生成式AI就這樣飄然而至。此后每次都是如此。市場就在計算機社區前面發展,幾乎在其他人識別到這個巨大機會之前,Nvidia就擁有了它,在正確的時間出現在正確的地點。
Nvidia擁有90%或更多的AI訓練市場以及基于云的推理市場,通過基于云的LLM支持。他們擁有大量的工具和示例庫,以及26,000名員工和該領域的科學領軍人物。有人能趕超Nvidia,并向其發出挑戰嗎?
要追趕Nvidia,僅僅開發獨特的AI處理器是不夠的。那么為自己的處理器開發一個類似于CUDA的東西,并將其提供給開發者,會是超越的訣竅嗎?可能是,而像OpenCL這樣的東西確實存在。
任何專用設備都無法與Nvidia的規模經濟競爭。Nvidia將GPU銷售給游戲玩家、汽車客戶、工程師、超算中心、電影制片廠以及AI研究人員和開發者。Nvidia提供每FLOP的最低成本,并且提供多種封裝和系統。是的,專用的特定應用處理器總是會超過通用處理器的性能。但是,特定應用處理器在價格上無法競爭,無法與通用處理器的發展速度相匹配,尤其是像GPU這樣的處理器。
簡單算一下,Nvidia擁有26,000多人。一個初創公司有多少人?可能100人,最多也許500人?Nvidia已經從事GPU業務超過23年,他們擁有無數的經驗、人脈、資源和資金。Nvidia還擁有某些需要時間,甚至多年時間才能獲得的東西,即軟件、軟件工具、庫,以及成百上千的客戶用GPU做出了Nvidia和其他人沒預料到的案例,但這一切都回到了Nvidia。
Nvidia已經這樣做了十多年。他們的游戲AI軟件,稱為DLSS(Deep Learning Super Sampling),已經徹底改變了游戲行業,并迫使AMD和Intel處于追趕模式。目前已有500多款游戲在使用它。這至少帶來了兩個結果:一個是龐大的用戶體驗,可用于調優和開發改進版本和功能;另一個是客戶忠誠度。AI領域也是如此。
如何說服開發者支持自己?
那么,什么因素能激勵潛在客戶或現有用戶為一款未知的AI處理器開發庫呢?
客戶關懷、對應用的專業知識,以及為特定應用精細調整的處理器。Nvidia擁有眾多垂直市場的專家和領域專家,例如模擬、渲染、LLM、HPC、可視化等,但他們不可能為每個應用都配備專家,尤其是那些四五年才購買一次處理器的應用。因此,你會看到初創公司吹噓他們在非常深奧的應用領域取得了設計勝利。這是沒問題的。從Nvidia的角度來看,這反而消除了低容量、購買頻次低的干擾。
Nvidia現在無疑是華爾街的寵兒。Nvidia面臨的挑戰將是找到新的AI應用。醫療領域可能是AI的主要市場,那里沉淀著幾十年的研究和病人監測數據。其他大型應用包括重新審查從衛星到地震的地球物理數據。物流也為AI提供了巨大的投資回報機會,這與數字孿生和機器人技術緊密相關。因此,Nvidia的可用市場總量(TAM)相當大,他們面臨的問題將是決定追求哪些領域。但他們有許多聰明人在思考這個問題。
AI處理器初創公司應該做些什么來獲得一些支持?盡可能遠離Nvidia。找到Nvidia尚未滲透的細分市場,這是對初創公司AI意識的真正考驗。如果他們找不到這些細分市場,說明他們對市場的了解并不充分,不應該浪費投資者的資金,因為他們不知道客戶是誰,這些硬件永遠不會被購買。
對于初創公司來說,局勢本來就不利。首先,大公司喜歡與大公司打交道。他們希望有一個財力雄厚的供應商,一旦出了問題,至少他們可以起訴供應商。他們還希望能夠一直為他們提供支持。對于大公司和有長遠眼光的政府機構來說,初創公司風險很大。
AMD和Intel
那么,如果初創公司無法真正與Nvidia競爭,誰能呢?另一家大公司,比如AMD,或許還有Intel。
AMD剛剛宣布了一系列從上到下的AI產品,直接面對Nvidia,并在許多測試案例中超越Nvidia。該公司表示,新款MI300X GPU超過了Nvidia H100的速度,具有2.6 petaFLOPS的FP8性能。不僅如此,AMD還與Nvidia的所有合作伙伴建立了穩固的合作關系,因此它們是久經考驗的實體。
Intel也潛伏在暗處,準備推出自己的AI處理器、軟件和服務。Intel已經建造了超級計算機GPU計算加速器,并且還有更多在開發中。Intel還擁有一些像Gaudi2這樣的ASP AI加速器,用于深度學習,以及開放的軟件和工具。Intel知道并且被計算機行業中的每個人所熟知。
市場已經成熟。Dell亞太及日本區總裁Peter Marrs最近評論說,買家不會容忍Nvidia交付GPU的漫長周期,這使得新玩家有機會進入市場。AMD的Lisa Su表示,買家不必等待,我們已經準備好了。她在最近的一次演講中說,“AI絕對是AMD的首要任務”。
像Amazon、Google和Microsoft這樣的公司已經構建并正在構建自己的ASP AI加速器。它們按分鐘出售處理器時間,并將為自己的處理器提供更優惠的費率,同時仍然提供AMD和Nvidia的G(PU)aaS GAI GPU。
那么,當所有大公司聚集在一起,滿足當前對GAI加速器無法滿足的需求時,初創公司的機會何在?
生產晶圓級WSE-2芯片的初創公司Cerebras有了一個良好的開端,它獲得了一個價值1億美元的超級計算機集群“Condor Galaxy”的建設協議。Cerebras希望為總部位于阿聯酋的G42(Group 42)建造九個設施,總成本為9億美元。
另一家備受矚目的生成式AI加速器初創公司Tenstorrent透露,Samsung將代工生產Tenstorrent基于RISC-V的處理器。如果Tenstorrent提供完全開放的RISC-V ISA,那么他們將帶來通用AI處理器,而不是像Cerebras、Google或Intel那樣的特定應用處理器。這將使他們直接面對Nvidia和AMD的競爭。
還有其他AI處理器初創公司,包括Hailo,它為邊緣AI應用提供神經學習處理器,以及Axelera AI,后者提供基于硬件和軟件的平臺,加速邊緣AI推理。大約有十家公司提供某種類型的ASP AI處理器。
在AMD創立之初,IBM、Amdahl和Intel是當時王者,挑戰他們看起來是非常愚蠢的。當Nvidia剛開始時,市場中已經存在著包括IBM在內的十幾家圖形處理器公司,挑戰他們也被認為是愚蠢的。Intel是在強大的Fairchild之下起步的,同樣也被認為是愚蠢的。
那么,初創公司挑戰Nvidia的機會是什么?沒有,因為這是非常愚蠢的,直到它變得不再愚蠢。
審核編輯:劉清
-
晶圓
+關注
關注
52文章
4851瀏覽量
127816 -
NVIDIA
+關注
關注
14文章
4949瀏覽量
102828 -
GPU芯片
+關注
關注
1文章
303瀏覽量
5781 -
AI處理器
+關注
關注
0文章
92瀏覽量
9478
原文標題:誰能對Nvidia實現趕超?
文章出處:【微信號:Astroys,微信公眾號:Astroys】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論