精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA助力百度智能云落地新一代高性能AI計算集群

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-05-20 15:00 ? 次閱讀

案例簡介

百度智能云是中國 AI 公有云服務市場的領先企業。近日,百度智能云落地新一代高性能AI計算集群,提供EFLOPS級算力支持,并發布了新一代GPU服務器實例GPU-H5-8NA100-IB01。該集群基于NVIDIA A100-80GB GPU和NVIDIA InfiniBand網絡構建,成為領先的AI原生云算力底座。研究人員可基于全新發布的實例組建上千節點規模的超高性能計算集群,成倍縮短超大AI模型的訓練時間,激發AI業務創新想象力。

客戶挑戰

隨著 AI 的發展,創新業務層出不窮,業務復雜性不斷提升,大模型、超大模型成為必然趨勢,對于快速訓練與部署應用提出了前所未有的緊迫要求。百度智能云早在 2020 年就預見到這一發展態勢,啟動規劃與方案設計,并參考 NVIDIA 高性能分布式集群參考架構,設計落地新一代高性能 AI 集群,通過基礎架構的升級,釋放技術使能想象力,幫助百度以及客戶的業務創新更上一層樓。

應用方案

NVIDIA 提出的高性能分布式集群參考架構基于 NVIDIA A100 GPU 和 NVIDIA HDR 200Gb/s ConnectX-6 網卡組建,采用模塊化設計,能支持不同規模大小的設計,以 20 臺為一個可擴展單元(Scalable Unit), 可以任意擴展到 100 臺、 200 臺、400 臺或更大的規模,通過 InfiniBand 交換機采用胖樹結構全互聯起來。此集群架構旨在幫助 AI 研究人員快速搭建強大、靈活、高效的系統,以滿足工業界日益復雜、多變的模型對計算資源不同程度的需求。尤其對于超大語言模型預訓練而言,此架構尤為重要。

基于同樣的設計思路,百度智能云的新一代高性能 AI 集群采用百度自研的 X-MAN 架構超級 AI 計算機為硬件平臺。

X-MAN 自 2016 年推出以來,已在鳳巢、自動駕駛、自然語言處理等百度內部業務進行大規模應用多年,申請六項專利,包括 PCIe Fabric 架構、液冷技術、最大支持 64 GPU 卡擴展等,是百度 AI 業務快速落地的重要基礎設施。

目前, X-MAN 已經全面升級到第四代 X-MAN 4.0 ,為 AI 和 HPC 等計算場景進行了新的優化設計。配置方面,每臺 X-MAN 4.0 包含8張搭載 NVLink 互聯技術的 NVIDIA A100-80GB GPU , 并可支持 8 張 200Gb/s 的 InfiniBand 網卡,實現了高速存儲、高速無阻網絡、高性能計算于一體的超級 AI 計算機。架構方面, X-MAN 4.0 全新設計的架構縮短了數據傳輸延遲,提高了數據傳輸帶寬,有效解決本地數據傳輸的通信瓶頸,降低 AI 作業中 GPU 的閑置時間。在 MLCommons 1.1 榜單中, X-MAN 4.0 在同配置單機硬件性能名列 TOP2 。

為了實現更高的集群運行性能,百度智能云專門設計了適用于超大規模集群的 InfiniBand 網絡架構。這個架構優化了網絡收斂比,提升了網絡吞吐能力。并結合容錯、交換機親和,拓撲映射等手段,得以將 EFLOPS 級算力的計算集群性能發揮到極致。

應用效果

經過百度內部 NLP 研究團隊的驗證,在這個網絡環境下的超大規模集群上提交千億模型訓練作業時,同等機器規模下整體訓練效率是普通 GPU 集群的 3.87 倍。

2022 年 3 月 1 日百度發布的 Q4 及 2021 全年財報顯示,百度智能云2021年實現全年總營收 151 億元,同比增長 64% 。高速增長的背后,是百度智能云在研發能力上的持續投入,以保持云智一體的技術引領,為客戶提供堅實的基礎架構與服務平臺。

百度副總裁謝廣軍先生表示:“AI原生云是推動企業智能化升級的核心驅動力。作為中國AI公有云服務市場領跑企業,百度智能云一直在優化提升智能計算的核心能力。X-MAN 4.0助力百度內部業務發展的同時,我們也愿意將這一領先的架構開放給百度智能云的眾多客戶,幫助大家一起更高效地進行AI研發與探索,驅動業務創新,邁向AI原生。”

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4701

    瀏覽量

    128708
  • 計算機
    +關注

    關注

    19

    文章

    7423

    瀏覽量

    87719
  • AI
    AI
    +關注

    關注

    87

    文章

    30153

    瀏覽量

    268423
收藏 人收藏

    評論

    相關推薦

    百度將發布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計劃在即將舉行的百度世界大會上推出款全新的AI
    的頭像 發表于 11-11 14:50 ?336次閱讀

    英特爾攜手百度智能加速AI落地

    在2024年9月25日-26日舉辦的2024百度智大會上,作為大會的聯合主辦方,英特爾帶來了AI全棧軟硬件方案,深入講解了如何基于英特爾 至強 處理器和新一代極具性價比的加速卡高效地
    的頭像 發表于 10-12 10:08 ?425次閱讀

    英特爾與百度共同為AI時代打造高性能基礎設施

    2024年9月25日,北京 ?——?在2024百度智大會上,英特爾應邀出席并披露基于英特爾?至強?6處理器的新一代實例即將在百度
    的頭像 發表于 09-27 09:48 ?248次閱讀
    英特爾與<b class='flag-5'>百度</b>共同為<b class='flag-5'>AI</b>時代打造<b class='flag-5'>高性能</b>基礎設施

    百度AI計算平臺4.0震撼發布

    在2024年百度智大會的璀璨舞臺上,百度智能重磅推出了
    的頭像 發表于 09-26 14:46 ?412次閱讀

    百度智能推出“千帆行業增強版”

    在近日于北京舉辦的2024智能經濟論壇上,百度集團執行副總裁、百度智能事業群總裁沈抖分享了百度
    的頭像 發表于 05-30 09:30 ?548次閱讀

    高性能計算集群的能耗優化

    、人工智能、大數據分析等。隨著高性能計算集群的規模和性能的不斷提升,其能耗問題也日益突出。高性能
    的頭像 發表于 05-25 08:27 ?384次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b><b class='flag-5'>集群</b>的能耗優化

    百度副總裁、小CEO李瑩正式發布了小新一代操作系統DuerOS X

    4月16日,以“創造未來”為主題的2024百度Create AI開發者大會在深圳舉辦。百度集團副總裁、小科技CEO李瑩正式發布了小
    的頭像 發表于 04-18 09:27 ?616次閱讀
    <b class='flag-5'>百度</b>副總裁、小<b class='flag-5'>度</b>CEO李瑩正式發布了小<b class='flag-5'>度</b><b class='flag-5'>新一代</b>操作系統DuerOS X

    百度沈抖沈抖正式發布新一代智能計算操作系統—萬源

    4月16日,Create 2024 百度AI開發者大會在深圳召開。期間,百度集團執行副總裁、百度智能
    的頭像 發表于 04-18 09:22 ?408次閱讀
    <b class='flag-5'>百度</b>沈抖沈抖正式發布<b class='flag-5'>新一代</b><b class='flag-5'>智能</b><b class='flag-5'>計算</b>操作系統—萬源

    百度沈抖:傳統計算不再是主角,智能計算呼喚新一代“操作系統”

    4月16日,Create 2024 百度AI開發者大會在深圳召開。期間,百度集團執行副總裁、百度智能
    發表于 04-16 16:26 ?315次閱讀
    <b class='flag-5'>百度</b>沈抖:傳統<b class='flag-5'>云</b><b class='flag-5'>計算</b>不再是主角,<b class='flag-5'>智能</b><b class='flag-5'>計算</b>呼喚<b class='flag-5'>新一代</b>“操作系統”

    百度智能攜手烏鎮共建AI數據產業基地

    近日,百度智能與桐鄉市烏鎮大數據高新技術產業園區簽署合作協議,雙方將發揮各自優勢,以人工智能標注產業為基礎,共建百度
    的頭像 發表于 04-01 16:12 ?608次閱讀

    百度智能正式發布了《百度智能水業大模型白皮書》

    3月28日,由E20環境平臺主辦的2024(第二十二屆)水業戰略論壇在北京召開。會上,百度智能正式發布了《百度智能
    的頭像 發表于 03-29 09:20 ?1335次閱讀
    <b class='flag-5'>百度</b><b class='flag-5'>智能</b><b class='flag-5'>云</b>正式發布了《<b class='flag-5'>百度</b><b class='flag-5'>智能</b><b class='flag-5'>云</b>水業大模型白皮書》

    東莞與百度簽署戰略合作協議,推動人工智能的全場景應用落地

    3月22日,東莞市人民政府與百度簽署戰略合作協議,雙方將緊密圍繞人工智能產業發展,充分發揮百度AI 算法、
    的頭像 發表于 03-25 10:05 ?809次閱讀

    百度智能大模型應用產品發布會定檔

    百度智能官方宣布,備受矚目的“AI Cloud Day:百度智能
    的頭像 發表于 03-21 11:37 ?791次閱讀

    首屆百度智能全球生態大會,4月9日成都見!

    為了加快人工智能的發展步伐,進步推動大模型產業的實際落地,促進AI原生應用的全面繁榮,百度智能
    的頭像 發表于 03-12 09:43 ?609次閱讀

    三星電子與百度智能達成合作

    近日,三星電子與百度智能宣布了項重要的合作,將百度的文心大模型集成至三星全新的AI手機Gal
    的頭像 發表于 01-26 17:14 ?1141次閱讀