精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AIStaiton,有效提升大模型算力平臺效率

浪潮AIHPC ? 來源:浪潮AIHP ? 2023-06-30 15:06 ? 次閱讀

日前,2023全球人工智能產品應用博覽會在蘇州開幕。浪潮信息智能業務生產創新平臺AIStation憑借領先的資源調度與平臺管理能力,有效提升大模型算力平臺使用效率,榮獲智博會核心獎項“產品金獎”。此次獲獎,不僅體現了AIStation在大模型算力與業務支撐方面的領先性,也體現了產業對大模型算力平臺效率的高度關注。

當前,以大模型為代表的生成式AI技術正在加速發展并革新各行業智能轉型路徑。生成式AI創新需要基于海量數據集,在擁有成百上千加速卡的AI服務器集群上對千億級參數的AI大模型進行分布式訓練。如何發揮大模型算力平臺效能、抑制性能損耗,以高效完成AI大模型的訓練部署,已成為AIGC時代的新挑戰。

作為專為人工智能開發和部署提供全流程支持的端到端平臺,AIStation能夠以強大的資源調度和管理能力助力客戶加速AI大模型開發與部署,通過對計算資源、數據資源、深度學習軟件棧資源進行統一管理,有效提升大模型AI算力集群的使用效率。

一站式管理、毫秒級調度,集群利用率達70%

大模型訓練需要構建包含計算、網絡、存儲、框架等在內的系統性分布式訓練環境,傳統的分散化管理不僅門檻高、效率低,且缺少針對性優化的整體調度系統,導致大模型計算平臺的整體協同性較差,訓練算力效率低。

針對分布式訓練計算規模大、系統性強的特點,AIStation實現了異構算力集群的統一池化管理,通過自研分布式任務自適應系統將訓練底層的計算、存儲、網絡環境自動化配置,并提供自定義修改基本超參數功能。通過多種資源高效管理和調度策略,AIStation能實現萬卡集群的毫秒級調度,提升整體資源利用率到70%以上。

同時,AIStation集成主流的大模型訓練框架,依托容器化技術,能夠將運行環境、框架適配過程標準化、模塊化,支持秒級構建運行環境,保障AI開發和AI業務的高效運行。

瓶頸優化、穩健容錯,全流程加速大模型訓練

針對大規模分布式訓練過程中遇到的算力網絡搭建、數據加速、網絡通信優化等瓶頸,AIStation通過鏡像分發加速、數據緩存加速、網絡拓撲調度、資源動態彈性伸縮等特性,在提高計算資源利用率的同時加速整個訓練過程。其中,AIStation通過數據緩存機制可讓模型訓練效率獲得200%-300%的提升,并能夠根據節點的數據緩存情況自動調度訓練任務,避免訓練數據重復下載,節省數據加載時間,與自研調度系統配合后,分布式訓練線性加速比能夠高達0.9,有效抑制多節點協同的性能損耗。

健壯性與穩定性是目前高效完成大模型訓練的強要求。對此,AIStation通過提供全生命周期管理、故障容錯、集群監控運維等一體化能力,能夠實現訓練異常和故障的全面檢測和自動處理,有效縮短斷點續訓時間,降低復雜度,以持續穩定的訓練降低大模型訓練成本和周期。

高效調用,釋放大模型應用價值

針對大模型訓練完成后的應用部署,AIStation實現訓練和推理的全打通,加快模型應用落地。針對大模型實際應用中的調用突發性,AIStation可根據推理服務資源需求的變化及時調整資源配給,根據實時業務的請求量實現秒級服務擴縮容,可支持百萬級高并發的大模型AI推理服務場景,服務響應平均延遲低于1ms,突發的訪問高峰的響應效率提升50%。

目前,AIStation已經在2457億參數的“源”大模型訓練實踐中得到有效驗證,支撐 “源”大模型的訓練算力效率達44.8%,高于GPT-3的21.3%。同時,某大型商業銀行基于AIStation打造的并行運算集群,憑借領先的大規模分布式訓練支撐能力,榮獲2022IDC“未來數字基礎架構領軍者”獎項。未來, AIStation平臺將持續為各行業的大模型開發與部署提供高效的算力平臺管理能力,加速AIGC技術迭代革新。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1787

    文章

    46060

    瀏覽量

    234947
  • 算力
    +關注

    關注

    1

    文章

    836

    瀏覽量

    14567
  • 大模型
    +關注

    關注

    2

    文章

    2134

    瀏覽量

    1970

原文標題:【開放試用】AIStaiton,有效提升大模型算力平臺效率

文章出處:【微信號:浪潮AIHPC,微信公眾號:浪潮AIHPC】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    摩爾線程GPU底座助力大模型產業發展

    以大模型為代表的新一代人工智能技術是引領新一輪科技革命和產業變革的戰略性技術和重要驅動力量,隨著對需求的日益高漲,人工智能底座公司日
    的頭像 發表于 08-27 16:15 ?428次閱讀

    模型時代的需求

    現在AI已進入大模型時代,各企業都爭相部署大模型,但如何保證大模型,以及相關的穩定性和性能,是一個極為重要的問題,帶著這個極為重要的問
    發表于 08-20 09:04

    【書籍評測活動NO.41】大模型時代的基礎架構:大模型中心建設指南

    書籍介紹 大模型是近年來引人注目的熱點之一。大模型蓬勃發展的基礎,是針對其需求設計的及基礎架構。本書針對如何為大模型構建基礎架構進行深入
    發表于 08-16 18:33

    中科曙光入選2024服務產業圖譜及服務產品名錄

    近日,中國信通院公布首個《服務產業圖譜(2024年)》及《服務產品名錄(2024年)》。曙光智構建的全國一體化
    的頭像 發表于 08-06 14:23 ?414次閱讀

    曙光攜手“互聯公共服務平臺”提高全國匹配效率

    近日,由中國信息通信研究院開發的“互聯公共服務平臺”在重慶上線。作為該平臺合作方之一,曙光智參與了
    的頭像 發表于 07-16 15:45 ?497次閱讀

    浪潮信息發布“源2.0-M32”開源大模型

    浪潮信息近日推出了革命性的“源2.0-M32”開源大模型。該模型在源2.0系列基礎上,引入了“基于注意機制的門控網絡”技術,構建了一個包含32個專家的混合專家模型(MoE),
    的頭像 發表于 05-29 09:08 ?520次閱讀

    鯤泰新聞|神州鯤泰創新智之旅北京站開幕,發布全新智架構和液冷整機柜產品應對 “多云、異構、綠色

    加速平臺HICA以及一體化交付的神州鯤泰全液冷整機柜產品。幫助企業客戶在整個異構智資源池中匹配更優組合、
    的頭像 發表于 05-22 10:56 ?291次閱讀
    鯤泰新聞|神州鯤泰創新智<b class='flag-5'>算</b>之旅北京站開幕,發布全新智<b class='flag-5'>算</b>架構和液冷整機柜產品應對 “多云、異構、綠色

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開發效率提升10倍

    的潞晨科技Colossal-AI系統,用戶可實現在本地平臺一鍵訓練、微調、推理、部署大模型,將大模型開發
    的頭像 發表于 03-01 09:43 ?379次閱讀
    潞晨科技Colossal-AI + 浪潮信息AIStation,大<b class='flag-5'>模型</b>開發<b class='flag-5'>效率</b><b class='flag-5'>提升</b>10倍

    iBeLink KS MAX 10.5T大領跑KAS新領域

    挖掘機,它可以為用戶提供超高的,低廉的功耗,以及舒適的使用體驗。如果您想要加入Kaspa的挖掘行列,或者想要提升您的挖掘效率和收獲,那么iBeLink ks max 10.5T是您
    發表于 02-20 16:11

    智能規模超通用,大模型對智能提出高要求

    電子發燒友網報道(文/李彎彎)是設備通過處理數據,實現特定結果輸出的計算能力,常用FLOPS作為計量單位。FLOPS是Floating-point Operations Per Second
    的頭像 發表于 02-06 00:08 ?5447次閱讀

    大茉莉X16-P,5800M大稱王稱霸

    Rykj365
    發布于 :2024年01月25日 14:54:52

    平臺賦能,共建,智貫東西 “2023 英特爾大會暨東數西大會”成功舉辦

    近日,以“共建,智貫東西”為主題的2023 英特爾大會暨東數西大會在麗江成功舉辦。大會由英特爾主辦,齊聚
    的頭像 發表于 12-08 19:15 ?659次閱讀
    <b class='flag-5'>平臺</b>賦能,<b class='flag-5'>算</b><b class='flag-5'>力</b>共建,智貫東西 “2023 英特爾<b class='flag-5'>算</b><b class='flag-5'>力</b>大會暨東數西<b class='flag-5'>算</b>大會”成功舉辦

    淺談為AI大而生的存-體芯片

    模型爆火之后,存一體獲得了更多的關注與機會,其原因之一是因為存一體芯片的裸相比傳統架構的AI芯片,能帶來十倍以上的
    發表于 12-06 15:00 ?299次閱讀
    淺談為AI大<b class='flag-5'>算</b><b class='flag-5'>力</b>而生的存<b class='flag-5'>算</b>-體芯片

    當大模型被塞進PC:如何提升利用效率

    第三,我們看到生成式 AI 目前主要應用于人機對話,但我們更看好它在各種行業中,尤其是垂直行業中的應用潛力。例如,目前人們正在探討用于醫療領域的大型模型,專為銀行系統設計的大型模型,甚至為金融等垂直行業開發的模型。因此,我們對它
    的頭像 發表于 11-10 16:45 ?615次閱讀

    PODsys:大模型AI平臺部署的開源“神器”

    的大模型研發工具和框架。在平臺的部署過程中,大模型研發機構常常需要面對一系列的問題:大模型
    的頭像 發表于 11-08 09:17 ?703次閱讀
    PODsys:大<b class='flag-5'>模型</b>AI<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>平臺</b>部署的開源“神器”