電子發燒友原創 章鷹
“美國的高端GPU對中國禁售,即使是英偉達面對中國市場供應的A800,也是一卡難求。現在一些互聯網大廠已經在搶英偉達2024年產品了,本來供需矛盾就在,今年加上ChatGPT為代表的生成式 AI 應用引發新一輪算力需求,導致供需矛盾特別突出。”沐曦高級產品總監周彬表示。
數字時代爆發的技術變革,使得智能化加速。根據 IDC 數據,2023年全球高性能 AI 服務器市場規模預計達 248 億美元,年增率預計高達 27%。國產GPU有哪些突破?國產圖形處理器廠商沐曦最新帶來了哪些旗艦產品?本文為你詳細報道。
國產GPU現狀不容樂觀! 沐曦發力通用GPU芯片
“目前在人工智能的負載,CPU+GPU的異構計算引領計算新趨勢。CPU負責邏輯控制,GPU來專職做計算;另一方面,GPU本身的迭代速度比CPU快很多。根據調研機構IDC的數據,GPU作為現如今通用算力的核心基礎設施承接了約90%的算力供應。” 沐曦高級產品總監周彬分析說,“現在的市場格局,基本上英偉達一家占據86%的市場份額,再加上AMD、英特爾,總計占據99%的市場,目前國產GPU的市場份額基本上可以忽略不計。”
國產GPU迫在眉睫,突破之路也是任重道遠。沐曦集成電路成立于2020年9月,致力于研發具有自主知識產權的國產高性能GPU芯片及其應用生態,設計的GPU芯片將廣泛應用于數據中心、AI以及其他需要高性能計算的行業。
“沐曦集成電路聚焦打造世界一流的GPU芯片和計算平臺,這是軟硬件的集合。英偉達最強的是GPU芯片和CUDA生態平臺結合。” 周彬指出,“沐曦自主研發了三大產品線,包括曦思N系列,曦云C系列和曦彩G三大系列高性能通用計算GPU及方案。曦思N系列面向AI推理,可以適用于智慧城市和視頻分析,還有視頻轉碼場景;曦云C系列是面向AI訓練的產品線,面向大小模型的AI推理;曦彩G系列產品是帶有渲染功能的,GPU面向數據中心的大規模云端渲染,還有未來元宇宙應用場景。”
沐曦首款人工智能推理GPU曦思N100量產
沐曦高級產品總監周彬介紹,2022年,沐熙集成電路推出了曦思N100,現在處于規模化量產和大規模出貨狀態。
圖:曦思N100 來自沐熙官方微信
曦思N100是沐曦面向人工智能推理場景推出的高效能GPU產品,內置 MXN100 異構 GPGPU 處理器以及 HBM2E 顯存,單卡算力達 160TOPS(INT8)和 80TFLOPS(FP16),能夠提供最高 128 路編碼和 96 路解碼的視頻處理能力,兼容 HEVC、H.264、AV1、AVS2 等多種視頻格式,最高支持 8K 分辨率。
同時,曦思N100配備了沐曦自主研發的MXMACA軟件棧,支持多種主流框架的網絡模型,其中包括簡單易用的MacaRT推理引擎、開箱即用的Model Zoo和應用實例,同時也對主流軟件生態如FFMPEG、OpenCV等進行了兼容支持,實現了各類應用場景和業務模型的快速遷移。支持應用于智慧城市、智慧安防、智慧交通、云計算、智能視頻處理等場景。
沐曦首款面向AI訓練和通用計算芯片曦云C500流片
周彬透露,沐曦首款面向人工智能訓練及通用計算的旗艦產品曦云C500在今年6月流片,這款芯片提供強大高精度及多精度混合算力,配備大規格高帶寬顯存,片間互聯MetaXLink無縫鏈接多GPU系統,自主研發的MXMACA軟件棧可兼容主流GPU生態,能夠全面滿足大模型推理和訓練需求。
曦云MXC500芯片已于2023年6月13日完成基礎測試,預計將于今年年底實現量產。
圖:曦云C500 來自沐曦官方微信
曦云C500單卡算力高達30TFlops FP32,單卡64GB HBM2E高帶寬顯存,帶寬1.8TB/s,這張卡還配備自研MetaXlink高速接口,適合于大模型訓練。4卡既可以支持65B大模型推理,8卡可以支持130B模型推理。采用通用 GPU 架構,兼容 CUDA,預計年底規模出貨。
-
gpu
+關注
關注
28文章
4703瀏覽量
128723
發布評論請先 登錄
相關推薦
評論