精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

    0
    • 聊天消息
    • 系統(tǒng)消息
    • 評(píng)論與回復(fù)
    登錄后你可以
    • 下載海量資料
    • 學(xué)習(xí)在線(xiàn)課程
    • 觀看技術(shù)視頻
    • 寫(xiě)文章/發(fā)帖/加入社區(qū)
    會(huì)員中心
    創(chuàng)作中心

    完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

    3天內(nèi)不再提示

    從SmartNIC走向DPU,專(zhuān)用加速器的崛起

    E4Life ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2022-06-25 01:17 ? 次閱讀
    在計(jì)算架構(gòu)和負(fù)載變得愈發(fā)復(fù)雜和多樣的情況下,處理器廠商紛紛開(kāi)始了自己的造詞之路。要想體現(xiàn)產(chǎn)品定位,又要讓大家對(duì)其縮寫(xiě)印象深刻,所以PU成了最常見(jiàn)的后綴。現(xiàn)在的處理器家族中已經(jīng)有了不少成員,除了常見(jiàn)的CPUGPU、APU之外,按照處理對(duì)象的不同,在人工智能深度學(xué)習(xí)的崛起下,NPU和TPU也紛紛出現(xiàn)。
    DPU模糊的定義
    不過(guò)這些已經(jīng)定義明確的處理單元并不是我們今天的主角,而是找到了全新定義的xPU。什么是xPU,其實(shí)很難定義,這其中有DPU(數(shù)據(jù)處理單元)、IPU(基礎(chǔ)設(shè)施處理單元)和FAC(功能加速卡),這些剛冒頭的產(chǎn)品就是xPU,它們代表了從SmartNIC演化過(guò)來(lái)并超越其定位的新時(shí)代加速器硬件。除了SmartNIC以外,這些xPU雖然命名不同,但其實(shí)很多時(shí)候,它們是完全重合的,現(xiàn)在為了方便,很多時(shí)候也以DPU統(tǒng)稱(chēng)。
    BlueField-3 DPU / 英偉達(dá)
    這樣說(shuō)DPU的定義還是很模糊,我們就從其特點(diǎn)來(lái)看。SmartNIC往往需要主CPU來(lái)完成管理工作,DPU雖然往往也屬于一個(gè)主系統(tǒng)中的部件,但卻可以做到完全獨(dú)立,可以部署到邊緣、JBOF存儲(chǔ)和網(wǎng)關(guān)上,并為它們提供網(wǎng)絡(luò)接口和虛擬功能。它的另一項(xiàng)職責(zé)就是幫CPU減輕負(fù)擔(dān),節(jié)省服務(wù)器上有限的處理器核心。
    因此,盡管DPU看起來(lái)和一些PCIe智能網(wǎng)卡或GPU差不多,但它本質(zhì)上就是一個(gè)為數(shù)據(jù)流和數(shù)據(jù)包處理提供加速、卸載和本地服務(wù)的微型服務(wù)器,在服務(wù)器中提供一個(gè)獨(dú)立單元的同時(shí),又不乏協(xié)助其他單元的處理能力。
    什么樣的任務(wù)需要DPU?
    至于為什么要用到DPU,這就不得不談到日益增加的數(shù)據(jù)密集型任務(wù)了,短視頻、實(shí)時(shí)金融交易的興起,高帶寬的數(shù)據(jù)流要求數(shù)據(jù)中心對(duì)網(wǎng)絡(luò)、存儲(chǔ)、安全和AI/ML進(jìn)行高效的處理。比如谷歌在數(shù)年前就提到,在他們的數(shù)據(jù)中心里,有三分之一的任務(wù)都是數(shù)據(jù)密集型的,這些都是交由底層基礎(chǔ)設(shè)施完成的,而且這類(lèi)任務(wù)的占比是在逐步增加的。因?yàn)镃PU和GPU這樣的通用計(jì)算單元并不擅長(zhǎng),所以專(zhuān)門(mén)針對(duì)這類(lèi)任務(wù)優(yōu)化的DPU就得出來(lái)?yè)?dān)此大任了。其次就是企業(yè)數(shù)據(jù)中心和公共數(shù)據(jù)中心也想獲得超大規(guī)模巨頭廠商那樣的效率,做到這一點(diǎn)就必須解聚那些昂貴的硬件資源,比如SSD、GPU等,DPU為數(shù)據(jù)中心的解聚提供了極高的效率,優(yōu)化了擁有成本、占用面積和安全性。
    DPU可以完成各個(gè)方面的卸載與加速,尤其是在網(wǎng)絡(luò)、安全和存儲(chǔ)這三大塊。在網(wǎng)絡(luò)端,DPU可以有效實(shí)現(xiàn)虛擬路由器,輔助數(shù)據(jù)包交換、定義交換規(guī)則等工作,減少延遲的同時(shí)還能夠提高吞吐量;在安全上,DPU可以用于下一代防火墻(NGFW)的加速,完成數(shù)據(jù)包過(guò)濾、內(nèi)容檢測(cè)和報(bào)頭檢測(cè)與重寫(xiě),將性能提高數(shù)倍以上;在存儲(chǔ)上,DPU可以卸載高速NVMe/TCP,進(jìn)一步提升存儲(chǔ)性能。最關(guān)鍵的是,這三者都能有效地接管CPU控制面的負(fù)載,節(jié)省CPU本身的計(jì)算核心。

    基于DPU的服務(wù)器存儲(chǔ)方案 / Fungible
    以上是DPU為服務(wù)器提供的加強(qiáng),主要以PCIe加速卡的形式來(lái)提供,此外,還有單獨(dú)的DPU存儲(chǔ)產(chǎn)品。傳統(tǒng)的CPU存儲(chǔ)方案中,整個(gè)系統(tǒng)由DRAM、x86 CPU、SmartNIC、加速器和PCIe接口組成,而在未來(lái)的存儲(chǔ)方案,比如高性能存儲(chǔ)、計(jì)算型存儲(chǔ)和軟件定義網(wǎng)絡(luò)應(yīng)用的存儲(chǔ)中,單片集成的方案更能滿(mǎn)足要求,這就是與DRAM結(jié)合的DPU存儲(chǔ)產(chǎn)品。這種方案不僅可以提升IOPS,也能進(jìn)一步降低能耗。
    正因如此,數(shù)據(jù)中心會(huì)用DPU來(lái)完成數(shù)據(jù)密集型任務(wù),從而減少功耗、擁有成本和占用空間。此外,他們也會(huì)用到基于DPU的存儲(chǔ)、GPU/TPU資源池和主機(jī)卡,來(lái)高效地完成高成本硬件資源的解聚。
    DPU市場(chǎng)混戰(zhàn)
    在不少?gòu)S商對(duì)DPU的宣傳中,往往都會(huì)提到這將是除了CPU和GPU之外的第三大硬件。大家可能覺(jué)得類(lèi)似的承諾,好像一些AI處理器也有提到,但市面上還是GPU占據(jù)主導(dǎo)地位,DPU又會(huì)有何不同呢?事實(shí)證明,市場(chǎng)對(duì)DPU的信心很足,這我們從入局DPU的廠商就能看出。
    云霄DPU / 云豹智能
    如今制造DPU的企業(yè)分為三種,一是初創(chuàng)公司,比如:云豹智能、星云智聯(lián)、中科馭數(shù)、云脈芯聯(lián)、芯啟源、大禹智芯、Fungible等;二是市面上一些已有的服務(wù)器巨頭,比如AMD/Xilinx、英特爾、Marvel、英偉達(dá);三是CSP(云服務(wù)供應(yīng)商)廠商,比如亞馬遜AWS、微軟Azure、阿里云等等。后者更多是負(fù)責(zé)設(shè)計(jì)或者聯(lián)合設(shè)計(jì)這些xPU,好專(zhuān)用于自己的云服務(wù)器。最終售賣(mài)這些DPU的除了DPU廠商外,還有基礎(chǔ)設(shè)施的OEM和ODM,增值分銷(xiāo)商和集成方案廠商,CSP廠商在售賣(mài)服務(wù)器的時(shí)候,自然也會(huì)以間接的方式來(lái)體現(xiàn)DPU的價(jià)值。
    隨著Mellanox被英偉達(dá)收購(gòu),Pensando被AMD收購(gòu),而Fungible的DPU主要針對(duì)存儲(chǔ)加速和卸載,雖然沒(méi)有被收購(gòu),但也收獲了軟銀的主導(dǎo)的融資。國(guó)內(nèi)的DPU廠商同樣備受青睞,比如騰訊屢次投資的云豹智能,字節(jié)跳動(dòng)投資的云脈芯聯(lián),美團(tuán)和百度投資的星云智聯(lián)等,這些投資方要么是CSP,要么擁有超大規(guī)模的數(shù)據(jù)中心,他們不像其他CSP大廠,硬件設(shè)計(jì)能力缺乏或有限,卻也看到了DPU的前景。
    DPU并不完美
    即便大廠看好,但從現(xiàn)狀來(lái)看,部署DPU對(duì)某些中小企業(yè)來(lái)說(shuō)依然是雙刃劍。固然,DPU可以卸載基礎(chǔ)設(shè)施的任務(wù),減輕其負(fù)擔(dān),讓服務(wù)器的CPU空出來(lái)專(zhuān)注在應(yīng)用本身,更高的效率、更低的擁有成本和更高的安全性也都隨之而來(lái),這些優(yōu)點(diǎn)是幾乎每個(gè)服務(wù)器都能享受到的。
    但在部分服務(wù)器中,引入DPU不免增加了服務(wù)器的資本投入,而且相較于CPU、GPU這類(lèi)硬件來(lái)說(shuō),它只能卸載和加速特定的負(fù)載,并不是一個(gè)通用加速單元。此外,部分服務(wù)器在增加DPU的情況下還是會(huì)導(dǎo)致功耗提升,在服務(wù)器、數(shù)據(jù)中心紛紛開(kāi)始節(jié)能減排的當(dāng)下,如何權(quán)衡各個(gè)組件的功耗無(wú)疑會(huì)是一個(gè)大問(wèn)題。還有就是相關(guān)的開(kāi)發(fā),DPU的靈活性體現(xiàn)在可編程上,但這需要進(jìn)行一定的編程能力,加上目前每家廠商都在單干,也沒(méi)有一個(gè)標(biāo)準(zhǔn)的接口,所以在適配上絕對(duì)不輕松,這也是不少DPU選擇Arm作為核心架構(gòu)的原因,就是為了減少其編程的難度。
    也正是因?yàn)橐陨线@些理由,從市場(chǎng)滲透率上來(lái)看,DPU主要是還是大規(guī)模的CSP廠商用的更多一點(diǎn),加上托管應(yīng)用的增加,這一塊未來(lái)也會(huì)驅(qū)動(dòng)DPU產(chǎn)品的銷(xiāo)售。對(duì)于自研DPU的CSP來(lái)說(shuō),他們肯定會(huì)繼續(xù)加大這方面的投入,進(jìn)一步降低成本,而對(duì)于第三方廠商來(lái)說(shuō),英偉達(dá)、AMD和英特爾這些服務(wù)器CPU、GPU廠商無(wú)疑會(huì)更有優(yōu)勢(shì),因?yàn)樗麄兲峁└?jìng)爭(zhēng)力更強(qiáng)的集成方案。
    聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
    • 服務(wù)器
      +關(guān)注

      關(guān)注

      12

      文章

      9024

      瀏覽量

      85186
    • DPU
      DPU
      +關(guān)注

      關(guān)注

      0

      文章

      354

      瀏覽量

      24129
    • 英偉達(dá)
      +關(guān)注

      關(guān)注

      22

      文章

      3748

      瀏覽量

      90836
    收藏 人收藏

      評(píng)論

      相關(guān)推薦

      版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

      加速器
      龍智DevSecOps
      發(fā)布于 :2024年11月26日 13:42:47

      什么是神經(jīng)網(wǎng)絡(luò)加速器?它有哪些特點(diǎn)?

      神經(jīng)網(wǎng)絡(luò)加速器是一種專(zhuān)門(mén)設(shè)計(jì)用于提高神經(jīng)網(wǎng)絡(luò)計(jì)算效率的硬件設(shè)備。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展和廣泛應(yīng)用,神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度和計(jì)算量急劇增加,對(duì)計(jì)算性能的要求也越來(lái)越高。傳統(tǒng)的通用處理(CPU
      的頭像 發(fā)表于 07-11 10:40 ?427次閱讀

      “白地板”方案,智算中心加速器

      明德源能白地板方案,智算中心加速器
      的頭像 發(fā)表于 06-21 11:54 ?738次閱讀

      中科馭數(shù)DPU技術(shù)開(kāi)放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時(shí)網(wǎng)絡(luò)等方案組團(tuán)亮相

      DPU技術(shù)開(kāi)放日既是對(duì)DPU技術(shù)應(yīng)用的典型方案展示,也是DPU技術(shù)在重要細(xì)分場(chǎng)景走向成熟的標(biāo)志。
      的頭像 發(fā)表于 04-01 11:48 ?750次閱讀
      中科馭數(shù)<b class='flag-5'>DPU</b>技術(shù)開(kāi)放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全<b class='flag-5'>加速</b>、低延時(shí)網(wǎng)絡(luò)等方案組團(tuán)亮相

      家居智能化,推動(dòng)AI加速器的發(fā)展

      電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)AI加速芯片,也稱(chēng)為人工智能加速器(AI Accelerator),是一種專(zhuān)為執(zhí)行機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計(jì)的ASIC或定制化處理。在智能家居中,AI加速
      的頭像 發(fā)表于 02-23 00:18 ?4538次閱讀

      回旋加速器原理 回旋加速器的影響因素

      回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強(qiáng)磁場(chǎng)中的運(yùn)動(dòng)。本文將詳細(xì)介紹回旋加速器的原理以及影響因素。 一、回旋
      的頭像 發(fā)表于 01-30 10:02 ?3597次閱讀

      回旋加速器中粒子的最大動(dòng)能與什么有關(guān)

      回旋加速器是一種用于加速粒子的裝置,通過(guò)不斷變化的磁場(chǎng)和電場(chǎng)來(lái)不斷加速粒子,使其達(dá)到極高的速度和能量。粒子的最大動(dòng)能取決于幾個(gè)關(guān)鍵因素。 首先,回旋加速器的設(shè)計(jì)和性能對(duì)粒子的最大動(dòng)能有
      的頭像 發(fā)表于 01-18 10:42 ?2966次閱讀

      Wakefield激光加速器 - 能量里程碑

      由The University of Texas at Austin物理學(xué)副教授比約恩·“曼努埃爾”·赫格利希(Bjorn “Manuel” Hegelich)領(lǐng)導(dǎo)的國(guó)際研究小組最近展示了一種長(zhǎng)度不到20米的小型粒子加速器,該加速器產(chǎn)生的電子束能量為100億電子伏特(10
      的頭像 發(fā)表于 01-14 09:38 ?1008次閱讀
      Wakefield激光<b class='flag-5'>加速器</b> - 能量里程碑

      《數(shù)據(jù)處理DPU編程入門(mén)》DPU計(jì)算入門(mén)書(shū)籍測(cè)評(píng)

      ,國(guó)內(nèi)國(guó)外兩股部隊(duì)都在朝著超大規(guī)模計(jì)算部署。而專(zhuān)用處理器在大規(guī)模處理上帶來(lái)的經(jīng)濟(jì)和效率優(yōu)勢(shì)是通用計(jì)算不可比擬的。DPU在云計(jì)算中高性能,高功耗的特點(diǎn)將會(huì)完美符合機(jī)房設(shè)備的特征。也稱(chēng)為需求的核心。作為未來(lái)算力基座的一份子,勢(shì)必成為高端工程師的必備技能。
      發(fā)表于 12-24 10:54

      《數(shù)據(jù)處理DPU編程入門(mén)》讀書(shū)筆記

      首先感謝電子發(fā)燒友論壇提供的試讀機(jī)會(huì)。 第一周先閱讀了DPU的技術(shù)發(fā)展背景,了解到DPU是結(jié)合了高性能及軟件可編程的多核CPU、高性能網(wǎng)絡(luò)接口,以及各種靈活和可編程的加速引擎。DPU
      發(fā)表于 12-21 10:47

      粒子加速器加速原理是啥呢?

      粒子加速器加速原理是啥呢? 粒子加速器是一種重要的實(shí)驗(yàn)設(shè)備,用于研究粒子物理學(xué)、核物理學(xué)等領(lǐng)域。其主要原理是通過(guò)電場(chǎng)和磁場(chǎng)的作用,對(duì)帶電粒子進(jìn)行加速,在高速運(yùn)動(dòng)過(guò)程中使其獲得較大的動(dòng)
      的頭像 發(fā)表于 12-18 13:52 ?1985次閱讀

      《數(shù)據(jù)處理DPU編程入門(mén)》+初步熟悉這本書(shū)的結(jié)構(gòu)和主要內(nèi)容

      之一。隨著人們對(duì)云計(jì)算和大數(shù)據(jù)處理需求的增加,數(shù)據(jù)中心的計(jì)算負(fù)載也不斷增加。傳統(tǒng)的中央處理(CPU)在處理這些工作負(fù)載時(shí)可能會(huì)遇到瓶頸,難以提供足夠的性能和效率。DPU通過(guò)提供專(zhuān)門(mén)的硬件加速,可以
      發(fā)表于 12-08 18:03

      在CCES環(huán)境下如何使用21489的IIR加速器

      在VDSP++的環(huán)境下程序已經(jīng)實(shí)現(xiàn),但是到了CCES下,把中斷初始化函數(shù)修改了,還是無(wú)法正確配置中斷,直接返回IIR的中斷初始化失敗,請(qǐng)問(wèn)CCES下怎么使用IIR加速器
      發(fā)表于 11-30 08:20

      21489的IIR加速器濾波參數(shù)設(shè)置如何對(duì)應(yīng)加速器的濾波參數(shù)?

      目前在用21489內(nèi)部的IIR加速器去做一個(gè)低通濾波,在例程的基礎(chǔ)上修改參數(shù)。通過(guò)平板的fda 工具工具去設(shè)計(jì)參數(shù),但是設(shè)計(jì)出來(lái)的參數(shù)不知道如何對(duì)應(yīng)加速器的濾波參數(shù),手冊(cè)里也看得不是很明白。 設(shè)計(jì)的參數(shù)如下: 請(qǐng)問(wèn)
      發(fā)表于 11-30 08:11

      使用ADSP-21489的fir加速器時(shí),存在很大的噪音如何解決?

      您好!當(dāng)我使用ADSP-21489的fir加速器時(shí),存在很大的噪音,未知如何解決,希望這里有高人幫我解決。 附件上有工程,該工程參考iir加速器使用例子編寫(xiě)。
      發(fā)表于 11-30 07:49