2024年7月29日,中國上海——燧原科技宣布與網絡廠商銳捷網絡簽署戰略合作協議,雙方將聯合研發面向人工智能數據中心的高性能網絡互聯解決方案,應對超大規模集群的網絡挑戰,提升大模型計算效率,確保智算中心網絡的可靠性,為客戶提供更好的服務,推動人工智能領域的創新和發展。
技術突破與兼容性適配
燧原科技的二代訓練產品已成功完成與銳捷RoCE交換機的互操作兼容性適配,并通過了銳捷RALB和AILB等負載均衡技術的嚴格測試,實現了網絡無阻塞傳輸,實測帶寬利用率高達97%。這一突破性成果,不僅滿足了超大規模集群對于大量數據傳輸和實時響應的嚴苛需求,更為AI大模型的快速訓練與迭代提供了強有力的網絡支撐。
共創智算中心AIGC網絡解決方案
基于銳捷網絡智算中心AI-Fabric網絡解決方案,該方案充分利用以太網RoCE技術生態,實現基于業務流量模型的多軌道互聯架構,提供大帶寬接入能力,確保在萬卡級別場景下實現可擴展、更高效和靈活的集群組網。同時,通過創新性的應用鏈路負載和擁塞控制技術,有效解決網絡擁塞沖突問題,進一步提升計算效率和系統性能。
開創智算組網仿真模型
雙方還將通過建模和仿真技術,收集規模級智算網絡參數、環境,生成組網仿真體系的大模型,不斷擬合和迭代,確保真實AIGC業務的網絡解決方案能夠發揮硬件性能,推算不同縱向擴展(Scale-Up)下的模型性能收益,為AI大模型的訓練提供最佳的網絡環境部署方案。
燧原科技研發副總裁鄧輝表示:“在處理AIGC大模型預訓練的大規模數據、高并發請求和分布式計算的場景下,高性能、低延遲的網絡互聯系統至關重要。由此,超大規模計算集群也由“算力墻”、“存儲墻”演進到了“IO墻”,如何打造一個AI加速卡間的高可用且高可靠的網絡系統已成為智算中心釋放算力的關鍵。面對AI產業發展的新挑戰,燧原將與銳捷攜手合作,發揮各自產品的技術優勢,提供超大規模AI集群的網絡互聯解決方案,提升計算效率和系統性能,構建新一代AI大模型算網融合平臺,加速發展新質生產力,賦能千行百業‘數智化’轉型。”
銳捷網絡企業系統部總經理夏國卿進一步闡述:“銳捷網絡與燧原科技的深度合作,不僅根植于我們雙方堅實的合作基礎,更是基于對未來技術發展趨勢的深刻洞察。銳捷網絡連續多年在中國數據中心交換機市場占據領先地位,特別是在200G/400G領域的卓越表現,充分證明了我們在高速、高效網絡構建上的強大實力。燧原科技作為AI加速卡和解決方案的佼佼者,其在AI計算領域的深厚積累與銳捷網絡的網絡基礎設施優勢相得益彰。銳捷的AI-Fabric解決方案與燧原的AI加速卡技術相結合,將能夠進一步優化GPU計算集群的網絡架構,解決AI大模型訓練中的數據傳輸瓶頸,提升整體計算效率與資源利用率。同時,雙方還將共同探索在業務仿真測算、智能運維等方面的深度合作,為客戶提供從硬件到軟件、從基礎設施到上層應用的全方位、一體化解決方案,助力客戶在AI時代搶占先機。”
燧原科技
燧原科技專注人工智能領域云端和邊緣算力產品,致力為通用人工智能打造算力底座,提供原始創新、具備自主知識產權的AI加速卡、系統集群和軟硬件解決方案。憑借其高算力、 高能效比的創新架構和高效易用的軟件平臺,產品可廣泛應用于泛互聯網、智算中心、智慧城市,智慧金融、科學計算、自動駕駛等多個行業和場景。
燧原科技秉承開源開放的宗旨,攜手產業伙伴共創生態,成為通用人工智能時代產業的驅動力。
銳捷網絡
成立于2003年的銳捷網絡,目前也已經發展成為行業領先的網絡基礎設施及解決方案提供商。IDC報告顯示,2022和2023年中國200G/400G數據中心交換機市場占有率第一,2024年1季度中國200G/400G數據中心交換機市場占有率第一,2019年至2023年中國以太網交換機市場占有率排名第三。
-
數據中心
+關注
關注
16文章
4517瀏覽量
71637 -
銳捷網絡
+關注
關注
0文章
21瀏覽量
7888 -
燧原科技
+關注
關注
0文章
115瀏覽量
8234
原文標題:燧原科技與銳捷網絡簽署戰略合作協議,聯合開發面向萬卡超大規模集群的高性能網絡解決方案
文章出處:【微信號:gh_1222367b8780,微信公眾號:燧原科技Enflame】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論