精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息AI存儲性能測試的領(lǐng)先之道

浪潮存儲 ? 來源:浪潮存儲 ? 2024-10-29 16:30 ? 次閱讀

MLCommons,一個致力于推動全球 AI系統(tǒng)發(fā)展的頂級工程聯(lián)盟,匯聚了包括谷歌、斯坦福大學在內(nèi)的眾多頂尖企業(yè)和研究機構(gòu)。作為該聯(lián)盟的創(chuàng)始成員之一,浪潮信息自2020年起便積極參與其中,共同探索AI技術(shù)的無限可能。近日,在MLCommons的子項目MLPerf Storage v1.0性能基準評測中,浪潮信息再度展現(xiàn)了在AI存儲領(lǐng)域的卓越實力。

MLPerf Storage v1.0評測旨在全方位考量AI系統(tǒng)在端、邊、云等場景下的訓(xùn)練、推理、存儲及安全性能。此次評估分為封閉賽道和公開賽道兩大類別。浪潮信息此次選擇了封閉賽道,要求嚴格遵循既定配置和代碼規(guī)范,以確保所有提交結(jié)果的公平性和可比性,在既定規(guī)則下更能客觀真實地展現(xiàn)產(chǎn)品的實際能力。公開賽道允許在基準測試和存儲系統(tǒng)配置方面有更多的靈活性,以展示對AI/ML社區(qū)有益的新方法或新功能。

MLPerf Storage v1.0工具是一個開源工具,可以從Github平臺下載。該工具允許所有廠商加入Storage社區(qū),發(fā)表見解,提出發(fā)現(xiàn)的問題和改進意見。在此次測試中,浪潮信息率先發(fā)現(xiàn)了測試負載CosmoFlow模型提交規(guī)則標準的問題(GPU利用率實際達不到90%)。通過多次橫向交流和社區(qū)溝通,浪潮信息得到了Micron、NVIDIA等多家廠商的積極響應(yīng),最終推動了社區(qū)對CosmoFlow模型提交規(guī)則的修改(GPU利用率要求降至70%)。這一舉措不僅體現(xiàn)了浪潮信息在測試過程中的積極參與,也展示了其作為國內(nèi)參與該社區(qū)工具構(gòu)建的先驅(qū)廠商的實力。

值得一提的是,MLPerf Storage v1.0評估采用了三種具有代表性的測試模型,分別是圖像分割領(lǐng)域的3D-UNet模型(平均文件大小146M,采用NPZ格式)、HPC領(lǐng)域的CosmoFlow模型(平均文件大小2.2M,采用TFRecord格式)以及圖像分類領(lǐng)域的ResNet50模型(平均文件大小百KB,采用TFRecord格式)。這些測試模型的選擇,不僅全面覆蓋了AI應(yīng)用的主要場景,也確保了評估結(jié)果的客觀性和準確性。

核心概念

模擬加速器:通過引入非真實的GPU/TPU等加速器,為測試者提供了一個無需實際硬件加速器的測試環(huán)境,旨在降測試成本、保證公平性的同時,提升測試效率。(本次社區(qū)提供模擬加速器H和模擬加速器A)。

加速器利用率(Accelerator Utilization ,AU):衡量模擬加速器在基準測試過程中利用效率的關(guān)鍵指標,其計算公式為:

0035c4e0-95a8-11ef-a511-92fbcf53809c.png

主機節(jié)點(Host Node):即客戶端,是運行MLPerf存儲基準代碼的機器,類似于AI訓(xùn)練集群中搭載GPU的計算服務(wù)器。主機節(jié)點的性能與配置對存儲系統(tǒng)的測試結(jié)果具有重要影響。

提交規(guī)則

MLPerf Storage的提交規(guī)則旨在確保測試結(jié)果的統(tǒng)一性和可比性。主要規(guī)則包括:

前置條件(單主機提交規(guī)則):所有提交結(jié)果必須滿足AU在3D-UNet和ResNet50上達到90%,在CosmoFlow上達到70%及以上。同時,禁止使用主機節(jié)點緩存。

多主機提交規(guī)則:在多主機測試環(huán)境中,每個主機節(jié)點的模擬加速器數(shù)量必須一致,且所有主機的測試運行參數(shù)也必須保持一致。

從 MLPerf Storage的基本概念和提交規(guī)則來看,社區(qū)致力于通過統(tǒng)一標準和減少變量來確保測試結(jié)果的統(tǒng)一、公正和可評估性。然而,在實際測試中,仍存在兩個難以統(tǒng)一的影響因素:一是存儲架構(gòu)的多樣性,涵蓋集中式、分布式及云端等多種形態(tài);二是存算節(jié)點配置非標準化,如主機與存儲節(jié)點配置不統(tǒng)一。這些因素的共同作用下,使得單一的測試指標難以全面反映各廠商存儲系統(tǒng)在AI場景下的適配程度。性能,無疑是AI存儲的一大關(guān)鍵需求。浪潮信息在MLPerf Storage v1.0基準測試中取得5項性能全球第一,單節(jié)點性能達到120GB/s,充分展示了在AI存儲性能測試領(lǐng)域的領(lǐng)先優(yōu)勢。然而,若僅將存儲帶寬作為評估標準,采用如Vdbench、FIO等專業(yè)存儲測試軟件即可滿足需求,無需借助MLPerf Storage這類針對AI場景的基準測試工具。事實上,AI對存儲的需求遠不止于產(chǎn)品性能本身,而是要求整體解決方案能夠高度適配AI應(yīng)用場景。那么,如何科學衡量一套存儲系統(tǒng)是否適合AI場景呢?基于MLPerf Storage的提交規(guī)則,我們不妨回歸AI存儲的本質(zhì)——即最大限度提升客戶端資源利用,減少資源浪費,以支撐更多的GPU計算。

MLPerf Storage的核心要求聚焦于兩大要素:一是加速器利用率(AU)需達到90%或70%以上;二是“最大加速卡數(shù)”,即在固定AU閾值下,存儲系統(tǒng)所能支撐的單節(jié)點最大加速卡數(shù)及多節(jié)點下每個客戶端的最大加速卡數(shù)。這里的“最大”不僅意味著帶寬要高,同時要求時延要低。在計算節(jié)點提供固定網(wǎng)絡(luò)帶寬的條件下,時延的降低意味著在相同時間內(nèi)能夠供給的數(shù)據(jù)量增多,從而支持更多的加速卡。

004dcb1c-95a8-11ef-a511-92fbcf53809c.png

在客戶端與存儲側(cè)網(wǎng)絡(luò)連接帶寬一定的情況下,單次IO時延的降低將直接導(dǎo)致每秒鐘能夠提供的文件數(shù)量增多,進而提升客戶端實際表現(xiàn)的帶寬。由于主機節(jié)點提供的網(wǎng)絡(luò)帶寬存在理論上限,因此,在存儲集群吞吐量略大于客戶端網(wǎng)絡(luò)總帶寬的情況下,既要確保AU在90%以上,又要盡可能跑滿每個客戶端的理論帶寬,以實現(xiàn)最佳存儲性能。

然而,在實際應(yīng)用中,由于軟硬件開銷的存在,客戶端網(wǎng)絡(luò)往往難以完全跑滿。因此,在AU達到90%的條件下,盡可能提高主機節(jié)點帶寬的利用率,成為最大化計算資源、避免網(wǎng)絡(luò)資源浪費的關(guān)鍵。這實際上就涉及到了主機節(jié)點網(wǎng)絡(luò)利用率的計算,其公式為:

0059022a-95a8-11ef-a511-92fbcf53809c.png

鑒于各廠商解決方案中主機節(jié)點連接存儲節(jié)點的網(wǎng)絡(luò)理論帶寬是固定的,我們可以將所有廠商的解決方案歸一化到網(wǎng)絡(luò)利用率這一指標上,從而在不考慮存算配置差異的情況下,對各廠商解決方案的表現(xiàn)進行客觀分析。以3D-UNet加速器H多客戶端下的測試結(jié)果為例,通過整理各廠商的測試結(jié)果,我們得到了該模型下的網(wǎng)絡(luò)利用率數(shù)據(jù):

005ccfea-95a8-11ef-a511-92fbcf53809c.png

從結(jié)果來看,在AU達到90%以上時,浪潮信息本次提交的解決方案在網(wǎng)絡(luò)利用效率方面表現(xiàn)出色,達到了72%,相比之下,其他供應(yīng)商的解決方案整體網(wǎng)絡(luò)利用率僅維持在50%左右,這直接導(dǎo)致了大量網(wǎng)絡(luò)資源的閑置。尤其在客戶端配置雙網(wǎng)卡情境下,實際利用率僅為50%左右,意味著整套方案實質(zhì)上浪費了近乎一整張網(wǎng)卡資源,大大增加了總體成本。若在大模型訓(xùn)練的萬卡集群下,僅網(wǎng)卡資源的浪費就高達數(shù)千萬級別,更不必說設(shè)備擴容所引發(fā)的算力利用率下降、連接線增加、運維復(fù)雜度提升等連鎖成本效應(yīng)。對于本就成本高昂的AI基礎(chǔ)設(shè)施(AI Infra)而言,任何可以削減的開支都顯得尤為關(guān)鍵。此時,不同存儲解決方案下的網(wǎng)絡(luò)利用率便成為衡量成本效益的核心指標——網(wǎng)絡(luò)利用率越高,成本支出越低,算力潛能得以更充分釋放,存儲與AI應(yīng)用場景的契合度也越高。通過AI存儲基準測試展現(xiàn)存儲對整個計算集群的支撐能力,這也是符合MLPerf Stortage作為AI測試基準,為ML/AI模型開發(fā)者選擇存儲解決方案提供權(quán)威參考的創(chuàng)立初衷。

進一步以3D-UNet加速器H單客戶端測試為例,我們發(fā)現(xiàn),即便在單客戶端場景下,存儲集群的總帶寬依然超越了單客戶端的帶寬需求。浪潮信息的單客戶端網(wǎng)絡(luò)利用率依然保持在70%以上,實現(xiàn)了對雙網(wǎng)卡資源的最大化利用。

0062d976-95a8-11ef-a511-92fbcf53809c.png

綜上所述,無論是單客戶端還是多客戶端環(huán)境,浪潮信息均能在AU超過90%的同時,維持70%以上的網(wǎng)絡(luò)利用率,與AI應(yīng)用場景保持了高度的適配性。

浪潮信息與AI場景的緊密契合,主要歸因于兩大核心優(yōu)勢。一是產(chǎn)品場景化定制,緊密圍繞客戶需求,從實際應(yīng)用出發(fā),提升產(chǎn)品性能,打造真正貼合AI需求的存儲產(chǎn)品;二是成熟的AI場景解決方案能力,精準平衡客戶需求、資源分配與成本控制,通過優(yōu)化解決方案與配置,為AI場景構(gòu)建堅實的數(shù)據(jù)支撐平臺。

解讀MLPerf Storage這一AI存儲評測標準,其核心在于檢驗各廠商解決方案在保持加速器利用率90%以上的前提下,能否在性能與資源利用之間找到最佳平衡點。測試結(jié)果顯示,在相同AU條件下,浪潮信息能夠進一步提升網(wǎng)絡(luò)利用率,有效減少AI Infra的資源浪費。此次權(quán)威評測不僅驗證了浪潮信息存儲在AI場景下整體解決方案的實力,更彰顯了其新產(chǎn)品完全滿足AI應(yīng)用對存儲嚴苛要求的能力,展現(xiàn)出強大的市場競爭力。對于客戶而言,浪潮信息憑借定制化產(chǎn)品開發(fā)模式和成熟的存儲解決方案能力,提供AI存儲的最優(yōu)解,為產(chǎn)業(yè)AI化(AI+)提供堅實的數(shù)據(jù)存儲底座。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4261

    瀏覽量

    85666
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    450

    瀏覽量

    23814
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30106

    瀏覽量

    268398
  • MLPerf
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    632

原文標題:MLPerf? Storage v1.0深度解析:浪潮信息AI存儲性能測試的領(lǐng)先之道

文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    浪潮信息MLPerf單機系統(tǒng)測試:7項性能第一

    ,獲得7項冠軍。該成績同時也意味著,浪潮信息在MLPerf?2021年度4次性能測試累計斬獲44項第一,毫無懸念地名列MLPerf?2021年度冠軍榜首。 MLPerf是影響力最廣的國際AI
    發(fā)表于 12-08 10:35 ?809次閱讀
    <b class='flag-5'>浪潮信息</b>MLPerf單機系統(tǒng)<b class='flag-5'>測試</b>:7項<b class='flag-5'>性能</b>第一

    MLPerf訓(xùn)練性能測試榜單發(fā)布,浪潮信息刷新多項紀錄

    日前,由谷歌、微軟云、英偉達、浪潮信息、百度、戴爾、聯(lián)想等14家公司及科研機構(gòu)參與的MLPerf 訓(xùn)練性能測試正式發(fā)布榜單成績。浪潮信息憑借兩款AI
    的頭像 發(fā)表于 12-14 10:25 ?2197次閱讀
    MLPerf訓(xùn)練<b class='flag-5'>性能</b><b class='flag-5'>測試</b>榜單發(fā)布,<b class='flag-5'>浪潮信息</b>刷新多項紀錄

    MLPerf評測完美收官,浪潮信息44項冠軍成功領(lǐng)跑

    的出色表現(xiàn),成功摘得其中的7項性能第一。至此,浪潮信息2021年在MLPerf測試數(shù)據(jù)中心AI推理、邊緣AI推理和單機
    的頭像 發(fā)表于 12-15 10:05 ?1863次閱讀
    MLPerf評測完美收官,<b class='flag-5'>浪潮信息</b>44項冠軍成功領(lǐng)跑

    音樂分離AI模型研發(fā)成功,浪潮信息AI算力服務(wù)助力

    該音樂院校與浪潮信息密切合作,通過AI算力服務(wù)解決算力挑戰(zhàn)。浪潮信息以高性能、高質(zhì)量的AI算力服務(wù)協(xié)助用戶進行音樂分離
    的頭像 發(fā)表于 04-25 11:04 ?1365次閱讀
    音樂分離<b class='flag-5'>AI</b>模型研發(fā)成功,<b class='flag-5'>浪潮信息</b>以<b class='flag-5'>AI</b>算力服務(wù)助力

    合肥大唐存儲與KeyarchOS完成浪潮信息澎湃技術(shù)兼容性認證

    日前,合肥大唐存儲DSS200企業(yè)級固態(tài)硬盤與浪潮信息云巒操作系統(tǒng)KeyarchOS(簡稱浪潮信息KOS)V5完成并通過了兼容性適配認證。測試結(jié)果顯示,合肥大唐
    的頭像 發(fā)表于 07-08 06:20 ?538次閱讀
    合肥大唐<b class='flag-5'>存儲</b>與KeyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技術(shù)兼容性認證

    智慧有數(shù) 浪潮信息發(fā)布生成式AI存儲解決方案

    與管理瓶頸,浪潮信息在"數(shù)智未來"AIGC數(shù)據(jù)應(yīng)用創(chuàng)新論壇上,正式發(fā)布面向生成式AI存儲解決方案,該方案以極致融合、極致性能、極致節(jié)能,和熱溫冷冰四級數(shù)據(jù)全生命周期管理,助力開啟生成
    的頭像 發(fā)表于 07-11 09:46 ?402次閱讀

    浪潮信息澎湃認證:浪潮分布式存儲攜手博雅云OneSRM SMP存儲管理平臺完成兼容性認證

    近日, 博雅云OneSRM SMP存儲管理平臺與浪潮分布式存儲AS13000系列產(chǎn)品完成并通過浪潮信息澎湃技術(shù)相互兼容性測試認證 ,
    的頭像 發(fā)表于 07-12 09:15 ?580次閱讀
    <b class='flag-5'>浪潮信息</b>澎湃認證:<b class='flag-5'>浪潮</b>分布式<b class='flag-5'>存儲</b>攜手博雅云OneSRM SMP<b class='flag-5'>存儲</b>管理平臺完成兼容性認證

    浪潮信息NF5468服務(wù)器LLaMA訓(xùn)練性能

    浪潮信息宣布旗下NF5468系列AI服務(wù)器率先支持英偉達最新推出的L40S GPU,可為人工智能大模型訓(xùn)練和推理、元宇宙及圖形視頻處理等應(yīng)用提供強大算力。實際測試表明,搭載8顆NVIDIA L40S
    的頭像 發(fā)表于 09-22 11:16 ?2284次閱讀

    浪潮信息澎湃認證:浪潮信息集中式存儲攜手達夢數(shù)據(jù)庫管理系統(tǒng)V8完成兼容性認證

    近日, 達夢數(shù)據(jù)庫管理系統(tǒng)V8與浪潮信息集中式存儲AS/HF系列產(chǎn)品完成并通過浪潮信息澎湃技術(shù)相互兼容性測試認證 ,測試結(jié)果顯示,達夢數(shù)據(jù)庫
    的頭像 發(fā)表于 09-27 17:10 ?605次閱讀
    <b class='flag-5'>浪潮信息</b>澎湃認證:<b class='flag-5'>浪潮信息</b>集中式<b class='flag-5'>存儲</b>攜手達夢數(shù)據(jù)庫管理系統(tǒng)V8完成兼容性認證

    浪潮信息澎湃認證:浪潮信息集中式存儲攜手儀電云i-stack云操作系統(tǒng)軟件完成兼容性認證

    近日, 儀電云i-stack云操作系統(tǒng)軟件與浪潮信息集中式存儲AS/HF系列產(chǎn)品完成并通過浪潮信息澎湃技術(shù)相互兼容性測試認證, 測試結(jié)果顯示
    的頭像 發(fā)表于 12-08 16:40 ?616次閱讀
    <b class='flag-5'>浪潮信息</b>澎湃認證:<b class='flag-5'>浪潮信息</b>集中式<b class='flag-5'>存儲</b>攜手儀電云i-stack云操作系統(tǒng)軟件完成兼容性認證

    浪潮信息發(fā)布AS13000G7-N系列分布式全閃存儲

    浪潮信息近日推出了專為大型AI模型優(yōu)化的AS13000G7-N系列分布式全閃存儲。該系列基于浪潮信息自研的分布式文件系統(tǒng),結(jié)合新一代數(shù)據(jù)加速引擎DataTurbo,為用戶提供卓越的
    的頭像 發(fā)表于 05-14 10:03 ?520次閱讀

    CCF-TCIST走進浪潮信息 共話AI時代存儲創(chuàng)新

    CCF信息存儲技術(shù)專委會走進浪潮信息 共話大模型時代的存儲創(chuàng)新之道 北京2024年6月7日?/美通社/ -- 近日,中國計算機學會
    的頭像 發(fā)表于 06-07 14:27 ?267次閱讀
    CCF-TCIST走進<b class='flag-5'>浪潮信息</b> 共話<b class='flag-5'>AI</b>時代<b class='flag-5'>存儲</b>創(chuàng)新

    浪潮信息推出AIGC存儲解決方案

    近日,在科技創(chuàng)新的浪潮中,浪潮信息成功舉辦了“元腦中國行”全國巡展的杭州站活動,此次盛會不僅匯聚了業(yè)界的精英與目光,更見證了浪潮信息在AIGC(人工智能生成內(nèi)容)領(lǐng)域的一次重大突破。會上,浪潮
    的頭像 發(fā)表于 07-03 11:16 ?676次閱讀

    長擎安全操作系統(tǒng)24與浪潮信息HF/AS存儲系列成功兼容

    在數(shù)字化轉(zhuǎn)型浪潮席卷全球的今天,信息安全與數(shù)據(jù)存儲的穩(wěn)定高效成為企業(yè)不可忽視的兩大核心要素。近日,一項重要的技術(shù)兼容性測試認證結(jié)果揭曉,標志著長擎安全操作系統(tǒng)24與
    的頭像 發(fā)表于 07-22 16:20 ?648次閱讀

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

    北京2024年9月27日?/美通社/ -- 9月25日,MLCommons協(xié)會發(fā)布最新MLPerf? Storage v1.0 AI存儲基準測試成績。浪潮信息分布式
    的頭像 發(fā)表于 09-28 16:46 ?186次閱讀
    <b class='flag-5'>浪潮信息</b>AS13000G7榮獲MLPerf? <b class='flag-5'>AI</b><b class='flag-5'>存儲</b>基準<b class='flag-5'>測試</b>五項<b class='flag-5'>性能</b>全球第一