精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA DOCA 2.9版本的亮點解析

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-11-27 11:15 ? 次閱讀

NVIDIA DOCA通過為開發者提供全面的軟件框架以利用硬件加速來增強 NVIDIA 網絡平臺的功能,從而提高性能、安全性和效率。其 API、庫和工具生態系統簡化了數據中心基礎設施的開發,實現了工作負載卸載、加速和隔離,以支持現代、高效的數據中心。

如今,許多主要的 CSP 和 NVIDIA 云合作伙伴(NCP)都在使用 DOCA,并且 DOCA 為快速開發和部署創新解決方案提供了標準化平臺。這種方法可加快上市時間、降低成本,并幫助合作伙伴在使用 NVIDIA 硬件加速的同時專注于自身的核心優勢。

DOCA 培育的開放生態系統促進了協作和互操作性,創造了各種互補解決方案。合作伙伴可以探索 AI 驅動的網絡、高級安全和高性能存儲等新興市場,讓自己處于數據中心創新的前沿。

DOCA 2.9的最新版本標志著 AI 計算網絡架構和云計算基礎設施的重大進步。這次全面的更新引入了許多新功能和改進功能,有助于改變高性能計算和網絡格局。

ba6579b2-ab12-11ef-93f3-92fbcf53809c.png

圖 1:DOCA 2.9 架構

利用增強的東西向計算網絡架構優化 AI 網絡

DOCA 2.9 版本的亮點包括改進的擁塞控制和新的遙測庫,這對于優化數據中心內的網絡流量至關重要,從而提供更好的性能、效率、可見性和控制。

支持 Spectrum-X 1.2 參考架構

Spectrum-X(SPC-X) 1.2 參考架構針對東西向以太網 AI 云環境進行了多項改進。該更新支持大規模橫向擴展能力,可在單個網絡架構中容納多達 128K 個 GPU。該架構使用NVIDIA BlueField-3 SuperNIC和NVIDIA Spectrum-4 交換機的強大組合,連接到 NVIDIA DGX 和 NVIDIA HGX 平臺,為 AI 工作負載提供出色的性能和效率。

DOCA 2.9 還改進了 Spectrum-X 的遙測能力和擁塞控制算法。這有助于更精細、更實時地監控網絡性能,并改進拓撲檢測,這對于優化大規模和長距離的 AI 工作負載至關重要。

DOCA 擁塞控制

DOCA 2.9 提升了適用于高性能計算和 AI 工作負載的擁塞控制算法,即NVIDIA 網絡擁塞控制(NVNCC)。

NVNCC Gen2 和 InfiniBand 擁塞控制 IBCC 的全面推出標志著一個重要的里程碑。IBCC 專門針對 InfiniBand 上的 AI 工作負載進行了優化,而 NVNCC 通過改進的拓撲檢測功能增強了 Spectrum-X 擁塞控制算法,現在支持長距離的 RoCE。

DOCA 遙測庫

作為此版本的新增功能,DOCA 遙測庫引入了高頻采樣功能,從而提高了 AI 驅動環境的網絡監控能力。此更新可實現低于 100 微秒間隔的計數器讀取,與之前的 0.5-1 秒間隔相比,實現了巨大飛躍。

主要功能包括用于指定計數器、時間間隔和頻率的新 API,以及對多個性能計數器(例如 RX/TX 字節、端口、擁塞通知和 PCIe 延遲)的支持。這些增強功能可滿足關鍵用例的需求,例如用于全集群異常檢測的高頻遙測(HFT)和用于應用程序分析的本地性能分析。

南北向云計算基礎設施

的連接性和安全性正在增強

DOCA 2.9 中的南北向改進側重于增強云資源與外部網絡之間的連接性。

DOCA Flow

DOCA 2.9 為 DOCA Flow 引入了一項令人興奮的新功能:“tune”性能分析工具。該工具目前處于 alpha 階段,已無縫集成到 DOCA Flow 軟件包之中,為用戶提供有關其網絡流配置的深入洞察。

“tune"工具可直觀呈現已配置的流水線,使用戶能夠清楚地了解其流結構。這項可視化功能使管理員和開發者能夠快速識別和優化流配置。

OVS-DOCA

OVS-DOCA現已正式發布,它具有本地鏡像功能,并在 NVIDIA BlueField DPU 的軟件定義網絡方面向前邁出了一大步。此長期支持(LTS)版本為用戶提供了一種對傳統使用 DPDK 或內核數據路徑(kernel datapath)的 OVS 解決方案的替代方案,為現代網絡環境提供更高的效率和擴展功能。

發布版本引入了一些關鍵的增強功能,可提升 DOCA 的功能,包括通過 DOCA Flow API 大幅提升連接追蹤(CT)功能的性能。用戶可將每秒連接數(CPS)提高 100%,每秒數據包數(PPS)提高 50%。可擴展性和吞吐量也得到了增強,最多可支持三個網卡(NIC),從而實現更靈活、更強大的網絡配置。

DOCA 基于主機的網絡 2.4 版本

DOCA 基于主機的網絡(HBN)不斷發展,2.4 版本為適用于裸金屬及服務環境的無控制器 VPC 網絡帶來了許多增強功能。DOCA HBN 2.4 以 BGP EVPN 為基礎,引入了令人印象深刻的可擴展性改進,支持高達 8K 個 VTEP 和 80K 個 Type-5 路由。

最新版本通過內核下一跳(Next-Hop)組和 OVS-DOCA 故障轉移增強了 ECMP 路由,提高了網絡彈性和性能。其中一個關鍵的新增功能是 Overlay 網關的有狀態 SNAT+PAT,使私有租戶 IP 能夠通過共享公共 IP 地址訪問外部網絡。

DOCA FireFly

增強的DOCA Firefly服務通過硬件加速為 NVIDIA DPU(數據處理器)帶來先進的時間同步功能。此更新引入了兩項顯著特性:同步以太網(SyncE)支持和數據傳輸服務(DTS)集成。

SyncE 可在網絡設備之間實現高精度頻率同步,對于電信網絡(尤其是移動基礎設施)至關重要。DTS 支持支持通過遙測通道傳輸 PTP 信息,從而實現持續的網絡時間服務監控。

NVIDIA Rivermax SDK

Rivermax SDK的增強功能主要側重于降低延遲、最小化 CPU 使用率,以及最大化數據密集型應用程序的帶寬和 GPU 利用率。一項重要的新增功能是支持 Internet Protocol Media Experience(IPMX),這是專業視聽環境中新興的 AV over IP 開放標準。

在 Rivermax 的支持下,DOCA 2.9 還支持 NVIDIA Holoscan for Media,這是一個專為媒體和娛樂行業定制的認證平臺。該功能優化了未壓縮和壓縮視頻流的處理,簡化了用于高性能媒體處理的 I/O 操作。

NVIDIA DOCA App Shield

DOCA App Shield 庫的增強功能提高了其在主機監控和威脅檢測方面的能力。一項重要的新增功能是包括了預先生成的操作系統配置文件,使各種操作系統的設置過程更加簡化。

對于 Linux 環境,App Shield 現在提供高級容器監控功能,使安全團隊能夠密切關注容器化工作負載。該服務已得到擴展,可列出網絡連接,并提供有關每個進程的網絡連接詳細信息,從而更深入地洞察潛在的安全威脅。

DOCA SNAP virtio-fs

DOCA SNAP virtio-fs 測試版是一項利用 NVIDIA BlueField-3 DPU 強大功能來提供安全加速文件系統存儲的服務。此解決方案使用內置的 virtio-fs 驅動程序向主機公開本地文件系統語義,同時直接在 DPU 上運行遠程文件系統存儲邏輯。

該版本還引入了 SNAP Virtio-fs 的測試版,作為公共 NGC 服務容器提供。它啟用了 NFS Linux 內核文件系統,并集成到 BlueField-3 內核中。開發者可以基于 SPDK FSDEV 創建自定義文件系統堆棧,從而實現靈活性和性能優化。

此解決方案支持在 AI 計算服務器中實現云規模分布式文件系統存儲,提供具有隔離和策略實施的安全環境,同時加速性能并卸載虛擬機管理程序任務。

開放虛擬網絡裸金屬租戶隔離

DOCA 2.9 包括一項新的編排服務,增強軟件定義網絡(SDN)環境中的租戶隔離。開放虛擬網絡(OVN)裸金屬租戶隔離功能可保護多租戶環境中的南北向流量,確保 AI 工作負載保持安全和獨立,即使在密集的計算集群中也是如此。

此服務基于上游 OVN 構建,提供用于租戶隔離的簡化、強大的 API,以及用于在 BlueField DPU 上輕松部署的 Ansible Playbook。關鍵創新在于卸載和加速基于 SDN 的租戶 BlueField DPU,通過隔離特定進程來提高速度和效率。這種集中組織允許使用 API 調用輕松更改隔離設置,從而更好地控制網絡管理。這使得它非常適合希望使用 SDN 創建多租戶云的 AI 云和工廠。

設備管理和開發工具

DOCA 2.9 簡化了大規模部署所需的設備管理流程。此版本還為開發者提供了新的優化和分析工具,可幫助他們更好地洞察應用程序和數據路徑性能。

DOCA 管理服務 (DMS)

DOCA 管理服務(DMS)也升級為發布狀態,為管理 BlueField DPU 和 SuperNIC 提供了增強功能。此更新引入了通過單個 API 端點管理多臺設備的能力,從而簡化了在復雜的多設備環境中的操作。

一項重要改進是支持節點重啟后的配置“持久性”,從而確保設備設置在系統重啟期間保持不變。此外,還新增了設配配置的批量導入/導出功能,可實現大規模部署的高效管理。

DOCA 數據路徑加速器

數據路徑加速器(DPA)工具包的增強功能為開發者提供了更強大的性能優化和分析工具。其中一項突出功能是將 DPA 性能計數器與新的 Nsight 工具相集成,從而更深入地洞察應用程序性能。

一個重要的新增功能是DOCA-DPA-Comms 庫,目前處于測試階段。該庫簡化了基于 DPA 的數據路徑實現,為開發者提供了更高級別的抽象。它可用于 BlueField-3 DPU 和即將推出的 NVIDIA ConnectX-8 SuperNIC,確保 NVIDIA 高級網絡硬件產品線具有廣泛的兼容性。

用于簡化部署和支持的平臺和 DOCA 軟件包

改善用戶體驗是 DOCA 發展的核心。本次發布包括許多旨在簡化和改進部署的功能,例如 DOCA-Host 配置文件 DOCA-ROCE,它適用于需要 RDMA over Converged Ethernet 功能的環境。

NVIDIA 還針對 BlueField-3 推出了 PLDM 固件更新。該測試版支持使用 PCIe 上的標準 PLDM over MCTP 實現無縫固件更新,使服務器在激活之前能夠正常運行。這一零信任功能支持 NIC 和 DPU 模式,并且無需 DPU-BMC 1GbE 連接。

此外,此版本標志著 MLNX_OFED 的最終長期支持(LTS)成為獨立版本,該版本現已作為主機配置文件 DOCA-OFED 使用。

從用于 InfiniBand 和以太網解決方案的 MLNX_OFED 驅動和工具套件過渡到 DOCA-OFED,可實現集成在 DOCA 框架內的統一、可擴展和可編程網絡堆棧。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4946

    瀏覽量

    102821
  • 云計算
    +關注

    關注

    39

    文章

    7743

    瀏覽量

    137208
  • 數據中心
    +關注

    關注

    16

    文章

    4696

    瀏覽量

    71964
  • AI
    AI
    +關注

    關注

    87

    文章

    30212

    瀏覽量

    268451

原文標題:NVIDIA DOCA 2.9 通過新的性能和安全功能來增強 AI 和云計算基礎設施

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA DOCA-OFED的主要特性

    NVIDIA DOCA 軟件平臺釋放了 NVIDIA BlueField 網絡平臺的潛力,并為NVIDIA BlueField和ConnectX設備提供了所需的所有主機驅動程序。
    的頭像 發表于 11-09 13:50 ?182次閱讀

    淺談Xpedition 2409版本的新功能

    在《創新不止|Xpedition 2409版本新功能揭秘(上)》一文中,我們了解了Xpedition 2409版本的部分改進部分。今天,我們繼續看Xpedition 2409新版本給我們帶來了什么樣的全新用戶體驗。
    的頭像 發表于 10-31 15:33 ?365次閱讀

    NVIDIA Parabricks v4.3.1版本的新功能

    會(ESHG)上發布,其加入了新的體細胞數據變異檢測功能,并將業內領先的工具升級到最新版本。這個版本是繼在 NVIDIA GTC 2024 大會上發布 Parabricks v4.3 之后推出的新
    的頭像 發表于 09-10 10:22 ?344次閱讀
    <b class='flag-5'>NVIDIA</b> Parabricks v4.3.1<b class='flag-5'>版本</b>的新功能

    NVIDIA JetPack 6.0版本的關鍵功能

    NVIDIA JetPack SDK 支持 NVIDIA Jetson 模塊,為構建端到端加速 AI 應用提供全面的解決方案。JetPack 6 通過微服務和一系列新功能,擴展了 Jetson 平臺的靈活性和可擴展性,是 2024 年截至目前下載量最高的 JetPack
    的頭像 發表于 09-09 10:18 ?348次閱讀
    <b class='flag-5'>NVIDIA</b> JetPack 6.0<b class='flag-5'>版本</b>的關鍵功能

    IB Verbs和NVIDIA DOCA GPUNetIO性能測試

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一個庫,專門為實時在線 GPU 數據包處理而設計。它結合了 GPUDirect RDMA 和 GPUD
    的頭像 發表于 08-23 17:03 ?521次閱讀
    IB Verbs和<b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> GPUNetIO性能測試

    OpenVINO 2024.2版本亮點解析

    生成式 AI 正在被應用程序設計人員快速地使用著。這不僅體現在使用來自商業云服務模型的傳統REST API形式上,而且還發生在客戶端和邊緣。越來越多的數據正在客戶端處理,通過AIPC,我們為此開始看到更多的機會。其中一種場景是人工智能助手,它能夠生成文本(郵件草稿、文檔摘要、文檔內容的答案等等)。這一切都由 LLM(大型語言模型)和不斷增長的 SLM(小型語言模型)系列提供支持。
    的頭像 發表于 08-16 15:26 ?294次閱讀

    RaftKeeper v2.1.0版本發布,性能大幅提升!

    新特性,包括異步創建 snapshot。該版本的最大亮點在于性能優化:寫請求性能提升 11%, 讀寫混合場景更是大幅提升了 118% 。本文將從工程細節的角度深入解析版本的改進
    的頭像 發表于 07-15 15:10 ?301次閱讀
    RaftKeeper v2.1.0<b class='flag-5'>版本</b>發布,性能大幅提升!

    超級猛獸 GPU ?NVIDIA GeForce RTX 5090 基本頻率接近 2.9 GHz

    ABSTRACT摘要根據最新傳言,旗艦級NVIDIAGeForceRTX5090GPU看起來將是一款超級猛獸。據稱,顯卡的基本時鐘速度將設定在2.9GHz左右,幾乎達到3GHz的門檻
    的頭像 發表于 07-12 08:26 ?388次閱讀
    超級猛獸 GPU ?<b class='flag-5'>NVIDIA</b> GeForce RTX 5090 基本頻率接近 <b class='flag-5'>2.9</b> GHz

    借助NVIDIA DOCA 2.7增強AI 云數據中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發者提供了豐富的庫、驅動和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創建高性能的應用程序和服務。
    的頭像 發表于 05-29 09:22 ?463次閱讀

    華為數據存儲伙伴賦能六大亮點解

    精彩回顧 | 華為數據存儲伙伴賦能六大亮點解
    的頭像 發表于 03-28 11:33 ?539次閱讀
    華為數據存儲伙伴賦能六大<b class='flag-5'>亮點解</b>讀

    華為中國合作伙伴大會2024:Net5.5G融合廣域網亮點解

    華為中國合作伙伴大會2024 | Net5.5G融合廣域網亮點解
    的頭像 發表于 03-20 15:13 ?493次閱讀
    華為中國合作伙伴大會2024:Net5.5G融合廣域網<b class='flag-5'>亮點解</b>讀

    基于NVIDIA DOCA 2.6實現高性能和安全的AI云設計

    作為專為 NVIDIA? BlueField? 網絡平臺而設計的數據中心基礎設施軟件框架,NVIDIA? DOCA? 使廣大開發者能夠利用其行業標準 API 在 NVIDIA Blue
    的頭像 發表于 02-23 10:02 ?433次閱讀

    NVIDIA TAO 5.2版本發布

    NVIDIA TAO 提供了一個低代碼開源 AI 框架,無論你是初學者還是專業的數據科學家,都可以使用該框架加速視覺 AI 模型開發。開發者現在可以利用遷移學習的強大功能和效率,通過調整和優化等措施,以史無前例的速度實現一流的準確性,以及生產級吞吐量。
    的頭像 發表于 01-03 10:11 ?594次閱讀

    NVIDIA DOCA 2.5 長期支持版本發布

    正值 NVIDIA DOCA 面世三周年之際,NVIDIA 于近日發布了適用于 NVIDIA BlueField-3 網絡平臺的 NVIDIA
    的頭像 發表于 12-26 18:25 ?388次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> 2.5 長期支持<b class='flag-5'>版本</b>發布

    機器視覺LED光源分類及特點解析

    機器視覺LED光源分類及特點解析 機器視覺技術已經逐漸應用于各個領域,尤其是在工業和醫療領域。在機器視覺系統中,LED光源扮演著非常重要的角色,用于提供光源以便進行圖像采集和分析。本文將詳盡、詳實
    的頭像 發表于 12-15 10:31 ?1274次閱讀