可以肯定的是,在接下來的幾個月里,使用 Nvidia GPU 的長隊可能會變得更短。
過去幾個月,眾多大大小小的公司都報告稱收到了數千塊 H100 GPU。
這樣,在云端使用 H100 GPU 的排隊時間可能會縮短。數據中心提供商和前比特幣挖礦公司正在開設具有 H100 集群的數據中心。這些公司承諾以大型云提供商成本的一小部分提供 H100 GPU 計算,而大型云提供商對 H100 GPU 加速的虛擬機收取高價。
亞馬遜最近宣布,將在其網站上對 H100 GPU 進行 1 至 14 天的預訂,以應對未來需求的激增。
供應正常化也有助于企業將人工智能計劃付諸實施。HPCwire 就短缺問題是否已得到解決聯系了 Nvidia,但該公司拒絕發表評論。
幾個月前,特斯拉首席執行官埃隆·馬斯克注意到 GPU 短缺,并正在等待接收 Nvidia GPU 以提高人工智能能力。馬斯克表示,特斯拉啟動了由 10,000 個 H100 GPU 組成的集群,并且部署速度極快。
“訓練是全自動駕駛和車輛自主進展的根本限制因素,”馬斯克在上個月的財報電話會議上表示。
Nvidia 一直在對 H100 進行配給,并根據 AI 模型的規模、可用基礎設施和客戶概況來評估客戶。 這家芯片制造商優先考慮各個行業財力雄厚的客戶。Nvidia 還選擇了能夠積極反映其 GPU 最佳利用的客戶。特斯拉符合頂級客戶的形象,擁有明確的人工智能模型。
Nvidia 還提供了關于客戶何時收到 H100 GPU 的更清晰的時間表。數據中心提供商 Applied Digital 購買了 34,000 個 H100 GPU,其中 26,000 個將在 4 月份部署,此后還會再部署 8,000 個。
Applied Digital 于 9 月開始收到 5 月下達的 GPU 訂單。9 月份,它收到了 1,024 個 GPU,首席執行官 Wes Cummins 估計這個數字在 10 月份翻了一番,并且“11 月、12 月以及 1 月份這個數字可能會顯著增加”。
該公司還在北達科他州埃倫代爾破土動工新建一個高性能計算數據中心,該數據中心可在計算集群中托管 50,000 個 Nvidia H100 SXM 級 GPU。
英偉達還向能夠簽署采購訂單的小型客戶提供服務。
Iris Energy 正在創建人工智能計算基礎設施,支付了約 1000 萬美元購買了 248 個 Nvidia GPU。預計在未來幾個月內交付。該公司在上個月向美國證券交易委員會提交的一份文件中表示。
H100 將為 Iris Energy 啟動一項新的人工智能業務,該公司早些時候已將自己定位為加密貨幣礦工。這家澳大利亞公司看到了更大的生成人工智能市場,并正在改造其位于美國和加拿大的比特幣挖礦數據中心,以進行人工智能計算。
由億萬富翁 Jed McCaleb 資助的初創公司Voltage Park 收到了大量 24,000 個 Nvidia H100 GPU,這些 GPU 分布在華盛頓州、德克薩斯州和弗吉尼亞州的集群中。
“訂單是在 2023 年 4 月左右下的。團隊很清楚……緊要關頭即將到來,因此他們提前下了一份非常大的訂單,以保證有足夠的供應,”Voltage Park 的 Eric Park 在一封電子郵件中表示。
這些 GPU 已經為人工智能公司 Imbue 提供服務,該公司似乎與Voltage Park 有著密切的聯系。Nvidia 和 Jed McCaleb 創立的 Astera Institute 都是 Imbue 的投資者之一。
Voltage Park 還旨在通過支持名為 FLOP Auction 的計劃,為客戶提供廉價的 H100 GPU 計算能力。它就像 eBay 在 H100 上進行人工智能計算一樣,出價最高者獲得服務器時間。
Park 表示:“這是一個早期項目,旨在研究進入Voltage Park H100 集群的拍賣機制。我們的想法是,通過拍賣時間而不是合同,這有助于保證市場價格和透明的流程。”
當前每小時 H100 集群FLOP 拍賣的中標價格比Google Cloud 上2017 年發布的 V100 的每小時價格便宜。勝利取決于合同規模和承諾。
H100 熱潮還為計算機硬件的價值賦予了全新的含義,GPU 成為新業務的抵押品。
Crusoe Energy 是一家前加密貨幣礦商,以 20,000 臺 H100 作為抵押,獲得了 2 億美元的融資。同樣,GPU 計算提供商 CoreWeave 也以 H100 作為抵押獲得了價值 24 億美元的融資。
Crusoe 的 GPU 容量將于明年第一季度投入使用。該公司已經提供了在較舊的 Nvidia GPU 上運行的集群。
甚至一家cannabis公司也加入了 H100 熱潮。總部位于科羅拉多州的 American Cannabis 公司已同意與 HyperScale Nexus Holding Corp. 合并,該公司希望圍繞 Nvidia 的 H100 GPU 創建業務。
將內存和芯片結合在一起的 CoWoS 封裝的短缺加劇了 GPU 的短缺。英偉達正在幫助臺積電尋找新的合作伙伴和供應商來解決短缺問題。
展望未來,其他因素可能會意外地結束短缺并加速 Nvidia 的 GPU 出貨量。
美國政府最近對英偉達向中國公司出口A800、H800和L40S系列GPU實施了限制。這可以打開 CoWoS 封裝并釋放制造能力,為美國和其他市場生產更多 H100 芯片。
Nvidia 沒有直接向客戶提供 GPU,而是通過云提供商租用 GPU 來擴展 H100 容量。云提供商部署的 GPU 服務器是 DGX 參考模型的復制品,其中包括 8 個 H100 GPU。
市場研究公司表示:“這一轉變還可能激發 Nvidia 擁護以 A100 或 H100 AI 服務器為基礎的 DGX 云訂閱和租賃模式的熱情,甚至擴大其視野以納入更多樣化的云服務(L40S 等)。” TrendForce 在 10 月份發布的研究報告中表示。
Oracle 在 9 月份宣布全面推出 Nvidia H100 裸機計算服務。
谷歌于 8 月下旬宣布推出 A3 超級計算機,該計算機可根據計算需求容納多達 26,000 個 H100 GPU。
微軟首席財務官 Amy Hood 在最近的財報電話會議上表示,微軟還提高了 GPU 容量,從而更好地利用其人工智能服務。
Azure 云服務是圍繞 Nvidia 的 GPU 構建的。微軟宣稱其 Azure 超級計算機是世界上最快的服務器系統之一。
該公司可能會在 11 月 21 日的下一次財報電話會議上提供 GPU 供應的最新信息。
盡管對 H100 的需求炙手可熱,Nvidia 最近還是宣布了更新的路線圖,計劃在未來三年推出新的 GPU。
107000 個挖礦 GPU 可,供出租用于 AI 工作負載
加密貨幣熱潮崩潰后,許多加密農場留下了大量未使用的 GPU。其中一些公司設法為他們的 GPU 找到其他用途,但仍有數千家公司閑置。Io.net 開發了一個分布式網絡,可以匯集數十萬個 GPU 并將它們用于人工智能應用程序——顯然目前有 107,000 個 GPU 處于等待名單上。
Io.net開發了一個去中心化物理基礎設施網絡(DePIN),支持來自不同地理位置的數據中心和加密貨幣礦工的GPU計算能力的池化和集群化。該網絡旨在通過聚合世界各地未充分利用的 GPU 來為人工智能和機器學習工作負載提供資源。為了吸引 GPU 所有者,Io.net 推出了 70 萬美元的激勵計劃,鼓勵他們為網絡貢獻資源。
雖然 Io.net DePIN 的主要想法是聚合數據中心和各個加密貨幣礦工未使用的 GPU 計算資源,但該公司還與專門從事遠程渲染的 Render 網絡合作,以獲得對額外 GPU 的訪問權限。
Io.net 并不是當今唯一的 GPU 資源 DePIN,但該公司表示,它實際上可以在幾分鐘內聚集來自不同地理位置的 GPU 資源,這與一些競爭對手不同。
Io.net 首席運營官托里·格林 (Tory Green) 在接受 Cointelegraph 采訪時表示:“問題在于它們并沒有真正集群。” “它們主要是單實例,雖然他們的網站上確實有集群選項,但銷售人員很可能會調用所有不同的數據中心來查看可用的內容。”
就功能而言,最接近的競爭對手是面向人工智能的服務,例如 Akash Network,該網絡由 8 到 32 個 GPU 組成。
Io.net 的平臺允許客戶挑選他們想要使用的 GPU 的數量和位置以及安全設置,從而使企業和機器學習工程師能夠更輕松地獲得他們所需的計算能力。
該公司使用 Solana 區塊鏈技術來管理其網絡內的微交易,以便向 GPU 計算提供商付款。Solana 的技術可以促進大量小額交易,而傳統區塊鏈可能無法有效地處理這些交易,因為處理時間較慢/費用較高。這使得 Solana 成為 Io.net 基礎設施的關鍵組成部分,使其能夠通過強大的支付系統運行 GPU 計算能力的去中心化網絡。
RTX 4090 零售價格,過去一個月上漲 10%
Nvidia RTX 4090目前是最佳顯卡中速度最快的 GPU,在我們的GPU 基準測試層次中處于桿位。它從來就不是一款價格實惠的卡,建議零售價為 1,599 美元,但最近的趨勢是價格更高。在美國,我們看到價格最低的卡在過去一個月的成本上漲了 10%,并且查看亞馬遜上的特定型號,其中一些價格上漲得更多。有多種因素可能在起作用。
首先,或許也是最重要的一點,從 11 月 17 日開始,RTX 4090 將受到中國出口限制。這要歸功于其原始計算能力,但也可能是因為它有點太像數據中心 Nvidia L40 和 L40S——它們使用相同的數據中心AD102芯片為4090。但限制這些GPU出口到中國也意味著在中國組裝顯卡也被禁止。大多數顯卡公司出于成本原因在中國進行顯卡組裝,因此華碩、技嘉、微星、PNY 等都將不得不將 4090 卡的生產轉移到其他地方,而以中國為中心的品牌可能不得不完全停止生產。
查看 CamelCamelCamel 上的一些定制 RTX 4090 卡,可以深入了解最近幾個月的進展情況。華碩RTX 4090 TUF OC觸底價為 1,699 美元,但現在售價為 1,819 美元——亞馬遜上該卡的最高價格。同樣,華碩 4090 ROG Strix OC在 5 月份觸及 1,885 美元的低點,但在 10 月份飆升至 2,173 美元,目前價格為 2,640 美元(因為它基本上缺貨)。
我們可以嘗試看看其他 4090 型號,但還有另一個令人不安的趨勢:大多數 4090 卡開始缺貨。是因為需求增加了嗎?這是可能的,但可能性不大。更有可能的是,供應已經枯竭,要么是因為制造成本太高,要么是因為其他產品正在醞釀之中。
這就引出了影響價格和可用性的第三個潛在因素:傳聞已久的 RTX 4090 Ti。在過去一年的大部分時間里,我們一直聽到有關 4090 Ti(有時也稱為新 Titan RTX)的所謂“泄露”消息。當然,Nvidia 在創建 RTX 4090 時為更高性能的 AD102 部件留出了空間。但考慮到 4090 的 16 針連接器故障及其已經有些令人厭惡的 450W TGP 額定值,推出了 600W 或更高的 RTX 4090 Ti TGP 似乎會帶來更多問題。
盡管如此,最新的Nvidia RTX 4070 Ti Super 傳聞還提到了 RTX 4070 Super、RTX 4080 Super 和 RTX 4090 Ti。這可能會發生,也可能不會發生,但如果 4090 Ti 將在未來幾個月內推出(1 月份的 CES 2024 似乎確實有可能),顯卡制造商幾乎肯定會停止普通 4090 卡的生產。
這是因為 4090 目前是光環產品,價格也與之相匹配。那些想要盡可能快的 GPU 的人可能會被吸引去購買 4090 而不是 4080,但出于同樣的原因,如果存在 4090 Ti,他們為什么會選擇去年推出的倒數第二個 GPU?換句話說,如果 Nvidia 推出 4090 Ti,它很可能會停產 4090,或者至少減少該部件的產量。
還有另一個憤世嫉俗的因素也可能在起作用。理論上,黑色星期五 GPU 銷售即將到來。雖然我們通常不會看到很多顯卡促銷活動,但我們經常會在促銷開始前看到價格呈上漲趨勢。今年早些時候售價為 600 美元的 GPU 可能會在一個月左右的時間內突然升至 700 美元,然后再次以 600 美元的價格“上市”。“節省 14%!”
我們無法確定上述每個因素如何影響 RTX 4090 的定價方程,但我們確實知道4090 的價格在過去兩個月里一直在攀升。理想情況下,我們將在不久的將來獲得一款新的 RTX 4090 Ti,建議零售價與 4090 相同,均為 1,599 美元。不幸的是,更有可能的是,這樣的卡——如果它存在并且很快就會推出——將使建議零售價提高一個檔次。無論如何,我們將繼續跟蹤價格,等待事情的最終結果。
-
gpu
+關注
關注
28文章
4702瀏覽量
128708 -
數據中心
+關注
關注
16文章
4693瀏覽量
71956 -
人工智能
+關注
關注
1791文章
46870瀏覽量
237593 -
英偉達
+關注
關注
22文章
3748瀏覽量
90836
原文標題:英偉達H100,沒那么缺貨了 !RTX 4090 ,大漲
文章出處:【微信號:晶揚電子,微信公眾號:晶揚電子】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論