精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何通過組件配置為深度學(xué)習(xí)培訓(xùn)選擇企業(yè)服務(wù)器

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Charu Chaubal ? 2022-04-19 15:16 ? 次閱讀

深度學(xué)習(xí)已經(jīng)成為執(zhí)行許多人工智能任務(wù)的最常見的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)。數(shù)據(jù)科學(xué)家使用 TensorFlow 和 PyTorch 等軟件框架來開發(fā)和運(yùn)行 DL 算法

到目前為止,已經(jīng)有很多關(guān)于深度學(xué)習(xí)的文章,你可以從許多來源找到更詳細(xì)的信息。有關(guān)良好的高層總結(jié),請參見 人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間有什么區(qū)別?

開始深度學(xué)習(xí)的一種流行方式是在云中運(yùn)行這些框架。然而,隨著企業(yè)開始增長和成熟其人工智能專業(yè)技能,他們會尋找在自己的數(shù)據(jù)中心運(yùn)行這些框架的方法,以避免基于云的人工智能的成本和其他挑戰(zhàn)。

在本文中,我將討論如何為 深度學(xué)習(xí)培訓(xùn)選擇企業(yè)服務(wù)器。我回顧了這個獨(dú)特工作負(fù)載的具體計算需求,然后討論了如何通過組件配置的最佳選擇來滿足這些需求。

DL 培訓(xùn)的系統(tǒng)要求

深度學(xué)習(xí)培訓(xùn)通常被設(shè)計為數(shù)據(jù)處理管道。必須首先根據(jù)數(shù)據(jù)格式、大小和其他因素準(zhǔn)備原始輸入數(shù)據(jù)。

數(shù)據(jù)通常也會經(jīng)過預(yù)處理,以便相同的輸入可以以不同的方式呈現(xiàn)給模型,這取決于數(shù)據(jù)科學(xué)家所確定的將提供更強(qiáng)大的訓(xùn)練集的內(nèi)容。例如,圖像可以隨機(jī)旋轉(zhuǎn),以便模型學(xué)習(xí)識別對象,而不考慮方向。然后將準(zhǔn)備好的數(shù)據(jù)輸入 DL 算法。

pYYBAGJeYeqAJmOBAABlS6A6Eyk644.png

圖 1 深度學(xué)習(xí)培訓(xùn)數(shù)據(jù)管道

了解了 DL 培訓(xùn)的工作原理后,以下是以最快、最有效的方式執(zhí)行此任務(wù)的具體計算需求。

GPU

深度學(xué)習(xí)的核心是 GPU 。計算網(wǎng)絡(luò)每一層的值的過程最終是一組龐大的矩陣乘法。每個層的數(shù)據(jù)通常可以并行處理,各層之間有協(xié)調(diào)步驟。

GPU 設(shè)計用于以大規(guī)模并行方式執(zhí)行矩陣乘法,并已被證明是實(shí)現(xiàn) 深度學(xué)習(xí)的巨大速度 的理想選擇。

對于訓(xùn)練,模型的大小是驅(qū)動因素,因此具有更大更快內(nèi)存的 GPU ,比如 NVIDIA A100 GPU 核心張量 ,能夠更快地處理成批的訓(xùn)練數(shù)據(jù)。

中央處理器

DL 訓(xùn)練所需的數(shù)據(jù)準(zhǔn)備和預(yù)處理計算通常在 CPU 上執(zhí)行,盡管 recent innovations 已經(jīng)使越來越多的計算能夠在 GPU 上執(zhí)行。

使用高性能的 CPU 以足夠快的速度維持這些操作是至關(guān)重要的,這樣 GPU 就不會因?yàn)榈却龜?shù)據(jù)而感到饑餓。 CPU 應(yīng)該是企業(yè)級的,例如來自英特爾至強(qiáng)可擴(kuò)展處理器系列或 AMD EPYC 系列,而且 CPU 內(nèi)核與 GPU 的比例應(yīng)該足夠大,以保持流水線運(yùn)行。

系統(tǒng)存儲器

特別是對于當(dāng)今最大的機(jī)型, DL 訓(xùn)練只有在有大量輸入數(shù)據(jù)可供訓(xùn)練時才有效。這些數(shù)據(jù)從存儲器中批量檢索,然后由 CPU 在系統(tǒng)內(nèi)存中處理,然后再饋送到 GPU 。

為了保持該進(jìn)程以持續(xù)的速度運(yùn)行,系統(tǒng)內(nèi)存應(yīng)該足夠大,以便 CPU 處理的速率可以與 GPU 處理數(shù)據(jù)的速率相匹配。這可以用系統(tǒng)內(nèi)存與 GPU 內(nèi)存的比率來表示(在服務(wù)器中的所有 GPU 中)。

不同的模型和算法需要不同的比率,但最好有更高的比率,這樣 GPU 就永遠(yuǎn)不會等待數(shù)據(jù)。

網(wǎng)絡(luò)適配器

隨著 DL 模型變得越來越大,已經(jīng)開發(fā)出了多種技術(shù)來執(zhí)行訓(xùn)練,多個 GPU 一起工作。當(dāng)一臺服務(wù)器中安裝了多個 GPU 時,它們可以通過 PCIe 總線相互通信,盡管可以使用 NVLink 和 NVSwitch 等更專業(yè)的技術(shù)來實(shí)現(xiàn)最高性能。

Multi- GPU 培訓(xùn)也可以擴(kuò)展到跨多臺服務(wù)器的工作。在這種情況下,網(wǎng)絡(luò)適配器成為服務(wù)器設(shè)計的關(guān)鍵組件。在執(zhí)行多節(jié)點(diǎn) DL 訓(xùn)練時,需要高帶寬 Ethernet 或 InfiniBand 適配器來最大限度地減少由于數(shù)據(jù)傳輸而產(chǎn)生的瓶頸。

DL 框架利用 NCCL 等庫以最佳和性能的方式執(zhí)行 GPU 之間的協(xié)調(diào)。 GPUDirect RDMA 等技術(shù)使數(shù)據(jù)能夠從網(wǎng)絡(luò)直接傳輸?shù)?GPU ,而無需通過 CPU ,從而消除了延遲源。

理想情況下,系統(tǒng)中每一兩個 GPU 就應(yīng)該有一個網(wǎng)絡(luò)適配器,以便在必須傳輸數(shù)據(jù)時最大限度地減少爭用。

存儲

DL 培訓(xùn)數(shù)據(jù)通常駐留在外部存儲陣列上。服務(wù)器上的 NVMe 驅(qū)動器通過提供緩存數(shù)據(jù)的方法,可以大大加快培訓(xùn)過程。

DL I / O 模式通常由讀取訓(xùn)練數(shù)據(jù)的多次迭代組成。訓(xùn)練的第一步(或 epoch )讀取用于開始訓(xùn)練模型的數(shù)據(jù)。如果在節(jié)點(diǎn)上提供了足夠的本地緩存,則后續(xù)的數(shù)據(jù)傳遞可以避免從遠(yuǎn)程存儲中重新讀取數(shù)據(jù)。

為了避免從遠(yuǎn)程存儲中提取數(shù)據(jù)時發(fā)生爭用,每個 CPU 應(yīng)該有一個 NVMe 驅(qū)動器。

PCIe 拓?fù)?/p>

由于 CPU 、 GPU 和網(wǎng)絡(luò)之間存在復(fù)雜的相互作用,因此應(yīng)該清楚的是,具有減少 DL 培訓(xùn)管道中任何潛在瓶頸的連接設(shè)計對于實(shí)現(xiàn)最佳性能至關(guān)重要。

如今,大多數(shù)企業(yè)服務(wù)器使用 PCIe 作為組件之間的通信手段。 PCIe 總線上的主要流量發(fā)生在以下路徑上:

從系統(tǒng)內(nèi)存到 GPU

在多次 GPU 培訓(xùn)期間,在相同服務(wù)器上的 GPU 之間

在多節(jié)點(diǎn)培訓(xùn)期間 GPU 與網(wǎng)絡(luò)適配器之間

poYBAGJeYfSAL-GgAAB__2rvYgs178.png

圖 2 主 PCIe 數(shù)據(jù)通信路徑

用于深度學(xué)習(xí)的服務(wù)器應(yīng)具有平衡的 PCIe 拓?fù)浣Y(jié)構(gòu), GPU 均勻分布在 CPU 插槽和 PCIe 根端口上。在所有情況下,每個 GPU 的 PCIe 通道數(shù)應(yīng)為支持的最大數(shù)量。

如果存在多個 GPU ,且 CPU 的 PCIe 通道數(shù)量不足以容納所有通道,則可能需要 PCIe 交換機(jī)。在這種情況下, PCIe 交換機(jī)層的數(shù)量應(yīng)限制為一層或兩層,以最小化 PCIe 延遲。

類似地,網(wǎng)絡(luò)適配器和 NVMe 驅(qū)動器應(yīng)與 GPU 處于同一 PCIe 交換機(jī)或 PCIe 根復(fù)合體之下。在使用 PCIe 交換機(jī)的服務(wù)器配置中,這些設(shè)備應(yīng)與 GPU 位于同一 PCIe 交換機(jī)下,以獲得最佳性能。

選擇支持 DL 培訓(xùn)的經(jīng)過驗(yàn)證的系統(tǒng)

設(shè)計一個為 DL 培訓(xùn)而優(yōu)化的服務(wù)器很復(fù)雜。 NVIDIA 已經(jīng)發(fā)布了 關(guān)于為各種類型的加速工作負(fù)載配置服務(wù)器的指南 ,基于多年在這些工作負(fù)載方面的經(jīng)驗(yàn),并與開發(fā)人員合作優(yōu)化代碼。

為了讓你更容易上手,NVIDIA 開發(fā)了 NVIDIA-Certified Systems 程序。系統(tǒng)供應(yīng)商合作伙伴已使用特定的 NVIDIA GPU 和網(wǎng)絡(luò)適配器配置并測試了多種形式的服務(wù)器型號,以驗(yàn)證 優(yōu)化設(shè)計以獲得最佳性能 的有效性。

驗(yàn)證還包括生產(chǎn)部署的其他重要功能,如可管理性、安全性和可伸縮性。系統(tǒng)經(jīng)過針對不同工作負(fù)載類型的一系列類別認(rèn)證。 合格系統(tǒng)目錄 有一份由 NVIDIA partners 提供的經(jīng) NVIDIA 認(rèn)證的系統(tǒng)列表。數(shù)據(jù)中心類別的服務(wù)器已經(jīng)過驗(yàn)證,可以為 DL 培訓(xùn)提供最佳性能。

NVIDIA 人工智能企業(yè)

除了合適的硬件,企業(yè)客戶還希望為 AI 工作負(fù)載選擇受支持的軟件解決方案。 NVIDIA 人工智能企業(yè) 是一套端到端、云計算原生的人工智能和數(shù)據(jù)分析軟件。它經(jīng)過優(yōu)化,因此每個組織都可以擅長人工智能,經(jīng)過認(rèn)證可以部署在從企業(yè)數(shù)據(jù)中心到公共云的任何地方。人工智能企業(yè)包括全球企業(yè)支持,以便人工智能項(xiàng)目保持正常運(yùn)行。

當(dāng)您在優(yōu)化配置的服務(wù)器上運(yùn)行 NVIDIA AI Enterprise 時,您可以放心,您正在從硬件和軟件投資中獲得最佳回報。

總結(jié)

在本文中,我向您展示了如何為 深度學(xué)習(xí)培訓(xùn) 選擇具有特定計算需求的企業(yè)服務(wù)器。希望您已經(jīng)學(xué)會了如何通過組件配置的最佳選擇來滿足這些需求。

關(guān)于作者

Charu Chaubal 在NVIDIA 企業(yè)計算平臺集團(tuán)從事產(chǎn)品營銷工作。他在市場營銷、客戶教育以及技術(shù)產(chǎn)品和服務(wù)的售前工作方面擁有 20 多年的經(jīng)驗(yàn)。 Charu 曾在云計算、超融合基礎(chǔ)設(shè)施和 IT 安全等多個領(lǐng)域工作。作為 VMware 的技術(shù)營銷領(lǐng)導(dǎo)者,他幫助推出了許多產(chǎn)品,這些產(chǎn)品共同發(fā)展成為數(shù)十億美元的業(yè)務(wù)。此前,他曾在 Sun Microsystems 工作,在那里他設(shè)計了分布式資源管理和 HPC 基礎(chǔ)設(shè)施軟件解決方案。查魯擁有化學(xué)工程博士學(xué)位,并擁有多項(xiàng)專利。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4936

    瀏覽量

    102814
  • 云計算
    +關(guān)注

    關(guān)注

    39

    文章

    7733

    瀏覽量

    137199
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9021

    瀏覽量

    85183
收藏 人收藏

    評論

    相關(guān)推薦

    配置rsyslog服務(wù)器

    配置rsyslog服務(wù)器
    的頭像 發(fā)表于 11-11 11:13 ?134次閱讀
    <b class='flag-5'>配置</b>rsyslog<b class='flag-5'>服務(wù)器</b>

    SMTP服務(wù)器配置教程

    1. 了解SMTP服務(wù)器 SMTP服務(wù)器是用于發(fā)送電子郵件的服務(wù)器。它使用SMTP協(xié)議來處理郵件的發(fā)送。配置SMTP服務(wù)器需要了解以下幾個關(guān)
    的頭像 發(fā)表于 10-30 16:16 ?463次閱讀

    新手小白怎么通過服務(wù)器跑pytorch?

    安裝PyTorch的步驟可以根據(jù)不同的操作系統(tǒng)和需求有所差異,通過服務(wù)器運(yùn)行PyTorch的過程主要包括選擇GPU云服務(wù)器平臺、配置
    的頭像 發(fā)表于 09-25 11:35 ?223次閱讀

    為什么選擇使用服務(wù)器

    為什么要選擇使用服務(wù)器
    的頭像 發(fā)表于 08-23 16:33 ?195次閱讀

    gpu服務(wù)器與cpu服務(wù)器的區(qū)別對比,終于知道怎么選了!

    gpu服務(wù)器與cpu服務(wù)器的區(qū)別主要體現(xiàn)在架構(gòu)設(shè)計、性能特點(diǎn)、能耗效率、應(yīng)用場景、市場定位等方面,在以上幾個方面均存在顯著差異。CPU服務(wù)器更適合數(shù)據(jù)庫管理和企業(yè)應(yīng)用,而GPU
    的頭像 發(fā)表于 08-01 11:41 ?441次閱讀

    圖床服務(wù)器如何選擇配置

    選擇圖床服務(wù)器時,應(yīng)考慮存儲空間、帶寬、安全性和穩(wěn)定性等因素。建議選擇配置較高的服務(wù)器,以滿足需求。 在選擇圖床
    的頭像 發(fā)表于 07-11 15:36 ?244次閱讀

    云存儲服務(wù)器怎么配置

    云存儲服務(wù)器配置是一個復(fù)雜的過程,涉及到硬件、軟件、網(wǎng)絡(luò)等多個方面。 云存儲服務(wù)器配置概述 云存儲是一種基于互聯(lián)網(wǎng)的存儲方式,用戶可以通過網(wǎng)
    的頭像 發(fā)表于 07-02 09:15 ?784次閱讀

    新手小白怎么學(xué)GPU云服務(wù)器深度學(xué)習(xí)?

    新手小白想用GPU云服務(wù)器深度學(xué)習(xí)應(yīng)該怎么做? 用個人主機(jī)通常pytorch可以跑但是LexNet,AlexNet可能就直接就跑不動,如何實(shí)現(xiàn)更經(jīng)濟(jì)便捷的實(shí)現(xiàn)GPU云服務(wù)器
    發(fā)表于 06-11 17:09

    企業(yè)選擇大帶寬服務(wù)器時需要考慮哪些其他因素?

    企業(yè)選擇大帶寬服務(wù)器時,除了成本因素,還需要考慮哪些因素,rak部落小編為您整理發(fā)布企業(yè)選擇大帶寬
    的頭像 發(fā)表于 04-12 10:31 ?338次閱讀

    linux服務(wù)器和windows服務(wù)器

    較為熟悉,需要高性能和穩(wěn)定性,并且希望能夠進(jìn)行自定義配置和更好的安全性,那 么Linux服務(wù)器是一個不錯的選擇。 而如果你對服務(wù)器操作系統(tǒng)不太熟悉,需要廣泛的應(yīng)用支持和易用的管理工具,
    發(fā)表于 02-22 15:46

    選擇服務(wù)器硬件配置需要注意什么?

    決定了服務(wù)器同時處理數(shù)據(jù)的數(shù)量 。常規(guī)內(nèi)存默認(rèn)配置在8G左右。SATA硬盤通常轉(zhuǎn)速7200轉(zhuǎn),而固態(tài)硬盤比SATA硬盤快很多倍,啟動快,讀取數(shù)據(jù)時間快。因此,在選擇時,可以考慮性價比
    的頭像 發(fā)表于 02-20 15:16 ?402次閱讀

    什么是web服務(wù)器?如何選擇服務(wù)器配置

    )、LiteSped等。這些軟件在配置和功能上略有不同,但其目標(biāo)是提供高性能、可靠、安全的網(wǎng)頁內(nèi)容交付。 如何選擇web服務(wù)器配置?這主要取決
    的頭像 發(fā)表于 01-03 15:25 ?1056次閱讀

    如何選擇視頻服務(wù)器配置尺寸?

    服務(wù)器用于構(gòu)建視頻網(wǎng)站的配置要求非常高。它需要高性能的硬件配置和網(wǎng)絡(luò)帶寬來支持實(shí)時視頻流處理和傳輸。它不僅需要高性能的CPU處理,而且對內(nèi)存和硬盤空間也有很高的要求。視頻
    的頭像 發(fā)表于 12-14 11:28 ?573次閱讀

    weblogic服務(wù)器狀態(tài)shutdown

    詳細(xì)分析該問題的可能原因,并提供解決方案,旨在幫助用戶快速解決這一困擾。 第一部分:問題分析 WebLogic服務(wù)器狀態(tài)Shutdown的原因 1.1 錯誤的配置文件:可能是由于錯誤的配置
    的頭像 發(fā)表于 12-05 15:37 ?1271次閱讀

    DHCP服務(wù)器配置方法

    DHCP服務(wù)器 首先,您需要選擇一款適合您操作系統(tǒng)的DHCP服務(wù)器軟件。最常用的DHCP服務(wù)器軟件是ISC DHCP(Internet Systems Consortium)
    的頭像 發(fā)表于 11-27 14:48 ?1994次閱讀