電子發燒友網報道(文/吳子鵬)據國信證券統計,ChatGPT今年1月的月活躍用戶超過1億,用戶過億只用了2至3個月,其速度遠超過去的推特、海外版抖音等。ChatGPT爆火之后,如何打造中國版的ChatGPT成為熱門話題,并且與之相關的AIGC以及其他AI大模型應用也都受到廣泛關注。
作為國內頭部通用GPU高端芯片及超級算力系統提供商,天數智芯認為,ChatGPT的推廣進一步驗證了人工智能給工作、生活帶來很大幫助,甚至不亞于工業革命的影響,可以親身體驗到其帶來的效率上的提升。這種應用是建立在巨大算力模型訓練基礎上帶來的智能處理,因此也帶動了0座的需求。
確實,隨著以ChatGPT為代表的AIGC應用大火,背后大模型訓練所需要的算力也隨之暴漲。統計數據顯示,ChatGPT的總算力消耗約為3640PF-days(即假如每秒計算一千萬億次,需要計算3640天),整體部署大約需要7-8個500P算力的數據中心。而根據微軟官網的消息,微軟Azure為OpenAI建設了一個單獨的超算中心,具有超過28.5萬個CPU核心、1萬個GPU和400 GB/s的GPU服務器網絡傳輸帶寬。
從成本上看,ChatGPT就像一個吞金獸。數據顯示,其運行一次的費用大概需要430萬美元。這主要是因為ChatGPT背后的預訓練大模型——GPT大模型的GPT-3.5版本是一個“龐然大物”。目前,GPT-3.5模型的參數規模已經達1750億,原始數據規模達45TB。
天數智芯表示,目前大模型參數已經突破千億,并有更高的要求,對于訓練芯片的通用性及兼容性有更高的要求。訓練芯片要能支持更多的算法及改進,而且由于算力需求的規模越來越大,甚至單個算力集群無法滿足,對于異構算力、多集群協同等方面有更高的要求,進而對于異構算力上的兼容性就會有更高的要求。同時,由于數據量的急劇提升,對于數據的隱私保護也會有所要求,對于隱私計算在訓練芯片上的支持也會有要求。
從微軟對ChatGPT的介紹能夠看出,這套系統除了模型預訓練和日常運行,Finetune模型調優也是關鍵一環。因此,確實如天數智芯所言,雖然ChatGPT目前的算力規模和運行費用很高,但是這些數字還會與日俱增。
隨著ChatGPT在全球范圍內大火,目前國內眾多科技巨頭也相繼宣布,將推出自己的類ChatGPT應用。比如國內的百度,根據百度創始人、董事長兼首席執行官李彥宏在一封名為“百度站在AI浪潮之巔”的內部信中表示,百度即將在3月份推出新一代的大語言模型“文心一言”。這也是繼“文心一格”(AI作畫)、“文心百中”(產業搜索)之后,百度推出的又一大重磅的AI大模型應用。
在中國版ChatGPT不斷涌現后,算力芯片作為供給端核心環節將率先受益,而其中又以擁有數量眾多的計算單元和超長的流水線的通用GPU需求最為迫切。天數智芯表示,大規模的普及應用會對大模型算法有更高的要求,很多科研及企業也投入到大模型算法的研究中,對于算法模型會有優化和改進,因此對于算力底座支持的通用性及擴展性有很高要求,因此一定程度上會降低對于定制化AI芯片的需求,促進通用GPU市場的發展。
天數智芯自2021年3月推出云端訓練通用GPU產品--天垓100,并于2022年12月推出云端推理通用GPU產品--智鎧100,截止目前,天數智芯訂單規模就已經突破5億元。目前,基于天垓100訓練的模型種類超過了兩百種。天數智芯表示,公司在訓練芯片上堅持通用GPU架構、主流生態兼容等發展路線,對于通用性、兼容性、安全性等方面都進行了支持,可以為ChatGPT的發展提供有效安全的算力底座。
當然,正如中信證券在研報中指出的,目前在通用GPU方面,國際廠商在高精度浮點計算及CUDA生態方面還手握核心的技術壁壘,***和方案在軟硬件方面都還有一定的差距。對此,天數智芯回應稱,堅持通用GPU發展的路線,全面覆蓋訓練和推理兩條產品發展主線。結合行業解決方案為各行業、各產業發展提供完整成熟的軟硬件一體化方案。在未來的產品發展上,逐步縮小和國際先進產品的差距,為國內人工智能發展提供強有力的支持。
從中長期來看,ChatGPT的火爆以及中國版ChatGPT的陸續推出,對通用GPU有著巨大的需求。同時,國內AIGC市場將和信創市場出現疊加效應,讓天數智芯等相關廠商長期收益,并借此機會提升產品迭代的速度,逐漸達到國際領先水平。
-
gpu
+關注
關注
28文章
4703瀏覽量
128718 -
ChatGPT
+關注
關注
29文章
1548瀏覽量
7506
發布評論請先 登錄
相關推薦
評論