精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

服務器行業(yè)將需要證明異構計算的有效性

存儲加速器 ? 來源:存儲社區(qū) ? 作者:存儲社區(qū) ? 2021-04-01 15:40 ? 次閱讀

服務器中的CPU數(shù)量正在增長,制造這些處理器的供應商數(shù)量也在增加。

除了IBM的Power和Z系列是主要的例外之外,CPU服務器一般是多核的x86處理器。盡管不一定要更換x86處理器,但它們會通過新的處理器設計得到補充和擴充,以用于各種更專門的任務。

在最近的Top500超級計算機列表中,有140個超級計算機具有Nvidia GPU協(xié)處理器,而且這個數(shù)字只會增加。在未來5到10年內(nèi),通用服務器將隨x86處理器,GPU,FPGAArm內(nèi)核,AI協(xié)處理器,5G調(diào)制解調(diào)器和網(wǎng)絡加速器一起交付。

這是公認的一種尺寸并不能完全適合應用程序處理。終端市場可能會四分五裂,所有這些都要求定制化的解決方案。結果,一定會導致計算的未來(尤其是在服務器端)是異構的。

TECHnalysis Research總裁兼首席分析師Bob O‘Donnell說:“人們發(fā)現(xiàn),不同的芯片架構更適合于處理不同類型的工作負載。而且由于這種工作負載的多樣化將繼續(xù),因此對多樣化計算的需求也將繼續(xù)。將會有其他必要的芯片。這并不意味著CPU會大量消失,但是其他類型的芯片將會有更多的多樣性。然后最大的問題將是互連封裝。”

英特爾在其XPU項目中采取了積極的態(tài)度,該項目將CPU,GPU(通過其新的Xe GPU),Altera的FPGA和AI處理器與API結合在一起。英特爾數(shù)據(jù)中心XPU產(chǎn)品和解決方案副總裁兼總經(jīng)理Jeff McVeigh說:“我認為未來的發(fā)展不會有一個統(tǒng)一的答案。但是會有很多種類型,從緊密集成的單片芯片到集成到系統(tǒng)級連接的多芯片封裝。”

Nvidia企業(yè)計算部門負責人Manuvir Das認為:“對不同計算體系結構的需求是由新數(shù)據(jù)類型驅動的。每個公司都有越來越多的數(shù)據(jù)可供使用。而且公司越來越愿意收集越來越多的數(shù)據(jù)。這樣做的原因是因為他們現(xiàn)在可以看到他們可以從數(shù)據(jù)中獲取價值。”

近幾個月來,隨著公司通過購買而非自然增長實現(xiàn)產(chǎn)品多樣化,半導體行業(yè)見證了相當大的并購活動。

英偉達(Nvidia)是一家多年來未曾進行大筆收購的公司,它突然打開了錢包,以70億美元的價格收購SmartNIC制造商Mellanox,以400億美元的價格收購ARM Holdings。

AMD計劃以350億美元的價格收購Xilinx,這是多年來的首次重大收購行動。

Marvell Technology以60億美元收購了Arm服務器芯片制造商Cavium,并以100億美元收購了網(wǎng)絡半導體制造商Inphi。

ADI公司已經(jīng)簽署了一項協(xié)議,以210億美元的價格收購Maxim Integrated產(chǎn)品。

O’Donnell說:“他們之所以多樣化,是因為他們都認識到必須擁有各種各樣的不同芯片架構。最困難的部分將是英特爾要使用一種API來做的事情,那就是,我如何采用這些多樣化的架構,并使它們可供人們使用?每個架構都需要不同的指令集,不同的編程方式,不同類型的編譯器等。”

一個或多個芯片?

那么問題就變成了主板上是否會有一塊大硅片,或者每個芯片組有多個插座?這幾乎不是一個新主意。片上系統(tǒng)(system-on-chip)已經(jīng)存在多年。但是SoC正在發(fā)生變化。

SoC設計通常會縮減處理器,尤其是GPU,以使所有這些芯片都適合合理的散熱范圍。僅具有完整CPU,GPU和FPGA的SoC的TDP約為700瓦,這對任何人來說都是完全沒有吸引力的。如果要進行包裝設計,則很可能會縮小處理器的規(guī)模。

系統(tǒng)和解決方案副總裁兼Rambus杰出發(fā)明家Steven Woo表示:“AMD已經(jīng)做了一些偉大的工作,表明可以將小芯片封裝用于CPU內(nèi)核和I/O芯片。而且,如果您想獲得更強大的功能,則可以構建整個小芯片,這些小芯片可能只是CPU內(nèi)核,一個是更多的神經(jīng)網(wǎng)絡引擎,也許是GPU,然后可以將它們組合在一起。”

英特爾的McVeigh可以選擇采用多封裝設計。“從存儲器帶寬的角度來看,單封裝設計顯然有好處,但是在每個封裝中可以裝多少東西也有限制。因此,我認為未來的發(fā)展不會有一個單一的答案。但是,從緊密集成的單片芯片到集成到系統(tǒng)級連接的多芯片封裝,將有多種選擇。”他說。

英偉達也對多芯片封裝的想法持開放態(tài)度,盡管它的愿景與英特爾類似。它提供所有的硅。Das指出,英偉達已經(jīng)擁有Tegra形式的Arm/GeForce SoC,以及結合了Mellanox ConnectX-6網(wǎng)絡控制器,Arm CPU和Ampere GPU的新型Bluefield 2數(shù)據(jù)處理單元(DPU)系列。按照Nvidia的發(fā)展路線圖,2022年的BlueField 4將在一塊硅片上配備所有三個CPU。

“如果僅考慮從現(xiàn)在起三年后以及從現(xiàn)在起五年后將要完成的計算量,那么如果您不這樣做的話,世界將負擔不起。因此,將有多種形式。當您靠近邊緣時,它將看起來將更傾向于集成解決方案,” Das說。

但這就是英特爾和英偉達將自己所有的IP包裝到一塊硅中。當兩家或更多公司合作的前景(例如,Marvell和AMD)時,這種觀點是令人懷疑的。

Supermicro的FAE和業(yè)務開發(fā)高級副總裁Vik Malyala表示:“這將非常困難。為什么英特爾或AMD會向Nvidia開放有關其處理器架構的所有內(nèi)容?英偉達也是如此。Nvidia為什么要開放其GPU的所有功能以與某人一起工作?所以說他們試圖購買Arm是有原因的。”

Arm基礎設施業(yè)務部門的營銷高級總監(jiān)Eddie Ramirez表示,多供應商芯片是有先例的。“如果您要看10年前的事,我們幾乎還沒有將您的設計與制造分開的初期階段。對于現(xiàn)在的SoC,這是司空見慣的。因此,在您談論的時間范圍內(nèi),在5到10年內(nèi),生態(tài)系統(tǒng)將發(fā)展到可以使用來自不同供應商的硅片構建FCM的地步。”他說。

但是,他質(zhì)疑鑒于不同的芯片具有不同的使用壽命,這是否是一個好主意。“擁有一臺帶有PCI卡的服務器是一回事,您可以更換卡。但是,當它們裝在一個包裝中時,您必須立即更換所有東西。這適用于不同的生命周期嗎?這是這里的有趣之處。”他補充說。

Malyala還指出,芯片供應商針對不同的性能場景提供了多種芯片,將一大堆集成到一個封裝中會限制客戶的選擇。例如,如果我是Xilinx,那么我有十幾個不同的FPGA。但是,如果我要在給定的硅片中放置一個硅片,那就是說這就是它的原樣,即使我的配置過多或配置不足,我也堅持這樣做。

CXL公式

服務器中非CPU處理器的當前解決方案是PCI Express卡。GPU,SSD,F(xiàn)PGA和其他協(xié)處理器占用一個PCIe插槽,并且服務器中只有太多空間可用于存儲卡,尤其是超薄1U和2U設計。

PCIe還具有作為點對點通信協(xié)議的局限性。由于Compute Express Link(CXL)協(xié)議可與PCIe以及其他自動協(xié)商交易協(xié)議一起使用,因此已迅速成為PCIe的替代協(xié)議。

McVeigh說:“當我們進入這些更復雜的體系結構時,真正需要的是可以支持對等通信的各種拓撲,以及能夠擴展這些拓撲的能力。PCI Express本身并不能解決所有這些問題。但是,對于您希望能夠進行升級的情況,顯然是從現(xiàn)有設計中升級,即您擁有單獨的卡,并且可能不需要完全的互連性,那么在那兒做得很好。”

CXL的一大優(yōu)點是它通過其快速連接將加速器放置在距離處理器更近的位置,更重要的是,它使連接到加速器的內(nèi)存成為系統(tǒng)內(nèi)存的一部分,而不是專用設備內(nèi)存。這可以減輕系統(tǒng)內(nèi)存的負擔,并減少必須移動的數(shù)據(jù)量,因為設備內(nèi)存(例如GPU)中的數(shù)據(jù)很容易看到,而無需在系統(tǒng)內(nèi)存之間來回移動。

無論多個處理器是在單個裸片上還是在多個裸片上,它們都必須以某種方式綁在一起,并且CXL被視為將它們綁定在一起的網(wǎng)格。PCIe有其用途,但它是點對點協(xié)議,而不是像CXL這樣的網(wǎng)格。另外,CXL允許處理器共享內(nèi)存,而PCIe則無法做到這一點。

“ CXL絕對是非常可信的,” Rambus的Woo說。“如果行業(yè)真正圍繞它發(fā)展起來,那將是新型互連發(fā)展的墊腳石,我們將圍繞節(jié)點之間相互連接所發(fā)生的事情對它進行更大程度的優(yōu)化。也許將處理器連接到內(nèi)存和分解方案,甚至將處理器連接到GPU和存儲之類的東西。”

Ramirez說,CXL出現(xiàn)的一個例子是在具有PCIe的不同端點之間具有一致的內(nèi)存訪問的概念。如果您試圖在一個加速器上進行一定數(shù)量的計算,并且需要與其他加速器進行通訊,則它們應該能夠直接講話,而不是使用“輪輻式”模型,在該模型中,一切都必須花一點時間才能完成。協(xié)調(diào)。拉米雷斯說:“ PCI Express本質(zhì)上不具備該功能。”

可能會有一種全新的標準在PCIe的良好組成部分基礎上發(fā)展,而忽略了不需要的部分。Woo指出,當兩個PCI Express設備首先開始互相通信時,它們使用PCIe Gen 1進行協(xié)商,然后逐步升級,直到找到可以通話的最高速度。

Woo說:“整個初始化序列要麻煩一些。如果您從芯片設計師的角度考慮問題,必須把所有這些Gate都放進去,它們將習慣于弄清楚我可以更快地講話,并且我不再使用那些晶體管了。擁有這種簡單的協(xié)議是有好處的。作為硅設計師,我寧愿將這些Gate用于其他用途。”

一個可以統(tǒng)治所有應用程序的API

而沒有軟件的硬件只是一堆金屬,因此,這些工作背后的真正問題是如何將它們組合在一起。英特爾的oneAPI程序提供了最完整的解決方案。oneAPI提供了用于計算和數(shù)據(jù)密集型領域的庫,例如深度學習,科學計算,視頻分析和媒體處理。

oneAPI可與用C,C ++,F(xiàn)ortran和Python編寫的代碼以及MPI和OpenMP等標準進行互操作。它還具有一組編譯器,性能庫,分析和調(diào)試工具,以及一個兼容性工具,該工具有助于將以CUDA編寫的代碼遷移到Data Parallel C ++(DPC ++),這是一種基于C ++和Khronos SYCL構建的開放式標準跨體系結構語言。

DPC ++擴展了這些標準,并提供了顯式的并行構造和卸載接口,以支持各種計算體系結構和處理器。當然,它支持英特爾,但McVeigh說,他希望其他芯片公司也采用它。

McVeigh說:“我們將其視為一項行業(yè)計劃,將這些異構架構與統(tǒng)一的編程模型結合在一起。而且我們已經(jīng)將其用作真正結合這些架構的關鍵要素,因此您可以使用一種通用語言,一套與OS供應商解決方案一起使用的通用庫(不僅是英特爾產(chǎn)品)對它們進行編程。”

O‘Donnell相信,該軟件解決方案將全面存在,從BIOS和驅動程序供應商到Linux發(fā)行版,如Red Hat Enterprise Linux和Canonical的Ubuntu。他說:“這是一個如此多層的堆棧。現(xiàn)在,它是全面的。我認為您不會看到任何解決方案。涉及的部分太多了。”

結論

服務器行業(yè)將需要更多的證明點來證明異構計算的有效性。但這不是尋找市場的解決方案。存在著許多市場,隨著邊緣的推出,正在開發(fā)新的市場。所發(fā)生的變化是,解決方案是針對它們量身定制的,而不是最終市場適應現(xiàn)有的最佳現(xiàn)成技術。

O’Donnell說:“從概念上講,我們將需要不同的芯片體系結構才有意義。我們需要一個單一的軟件平臺來利用它們,但是在這種硬件抽象層以及其他所有東西的幕后,它需要采取某種神奇的方式。”

隨著人們開始使用多芯片架構,我們是否將開始看到它按他們期望的方式工作?我們是否正在獲得人們期望的性能優(yōu)勢?劃算嗎?在現(xiàn)實世界中這實際上是如何工作的?

他說:“除了理論之外,這還有待觀察。” “我們將不得不在多個層面上看到這一點。英特爾將驅動它,但是您也會看到其他公司也嘗試驅動它。”

原文標題:服務器以后會變得越來越異構?

文章出處:【微信公眾號:存儲社區(qū)】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    60

    文章

    9880

    瀏覽量

    171498
  • 服務器
    +關注

    關注

    12

    文章

    9019

    瀏覽量

    85182

原文標題:服務器以后會變得越來越異構?

文章出處:【微信號:TopStorage,微信公眾號:存儲加速器】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    服務器主要應用行業(yè)及優(yōu)勢

    服務器作為一種基于云計算技術的虛擬化計算資源,正逐漸成為眾多行業(yè)數(shù)字化轉型的重要支撐。它不僅提供了靈活的資源配置,還帶來了諸多傳統(tǒng)物理服務器
    的頭像 發(fā)表于 10-31 09:24 ?145次閱讀

    最強服務器CPU來了!AI性能直接翻倍

    以及AI服務器及AI數(shù)據(jù)中心場景的CPU產(chǎn)品。它不僅能支持廣泛的第三方GPU及AI加速,與它們組合形成強大的異構計算平臺,還能在其中補足GPU或專用加速覆蓋不到或不足的地方,為更多
    的頭像 發(fā)表于 09-29 11:00 ?691次閱讀
    最強<b class='flag-5'>服務器</b>CPU來了!AI性能直接翻倍

    什么是AI服務器?AI服務器的優(yōu)勢是什么?

    AI服務器是一種專門為人工智能應用設計的服務器,它采用異構形式的硬件架構,通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片的組合來滿足高吞吐量互聯(lián)的需求,為自然語言處理、計算
    的頭像 發(fā)表于 09-21 11:43 ?621次閱讀

    服務器搭建詳細過程

    隨著云計算技術的發(fā)展,越來越多的企業(yè)和個人開始選擇使用云服務器來部署自己的應用和服務。相比于傳統(tǒng)的物理服務器,云服務器提供了更高的靈活性、可
    的頭像 發(fā)表于 09-12 10:00 ?276次閱讀

    打造異構計算新標桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設計

    參考設計是首個支持異構計算架構的CXL硬件設備,標志著CXL技術在數(shù)據(jù)中心領域迎來異構計算新階段。 ? 國數(shù)集聯(lián)基于FPGA與自主研發(fā)的CXL協(xié)議IP的先進特性,可實現(xiàn)CPU、GPU、DDR、SSD
    的頭像 發(fā)表于 08-06 14:19 ?276次閱讀
    打造<b class='flag-5'>異構計算</b>新標桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設計

    AvaotaA1全志T527開發(fā)板AMP異構計算簡介

    Avaota SBC 的部分平臺內(nèi)具有小核心 CPU,與大核心一起組成了異構計算的功能。 在異構多處理系統(tǒng)中,主核心和輔助核心的存在旨在共同協(xié)作,以實現(xiàn)更高效的任務處理。這種協(xié)作需要系統(tǒng)采取一系列
    發(fā)表于 07-24 09:54

    異構計算:解鎖算力潛能的新途徑

    在這個數(shù)據(jù)爆炸的時代,計算力是推動社會與科技創(chuàng)新的核心。從日常智能設備的流暢運行到超級計算機的尖端模擬,均依賴強大的計算能力。但面對多樣化的復雜計算任務,單一處理
    的頭像 發(fā)表于 07-18 08:28 ?7783次閱讀
    <b class='flag-5'>異構計算</b>:解鎖算力潛能的新途徑

    AI服務器異構計算深度解讀

    AI服務器按芯片類型可分為CPU+GPU、CPU+FPGA、CPU+ASIC等組合形式,CPU+GPU是目前國內(nèi)的主要選擇(占比91.9%)。
    發(fā)表于 04-12 12:27 ?567次閱讀
    AI<b class='flag-5'>服務器</b><b class='flag-5'>異構計算</b>深度解讀

    高通NPU和異構計算提升生成式AI性能?

    異構計算的重要不可忽視。根據(jù)生成式AI的獨特需求和計算負擔,需要配備不同的處理,如專注于AI工作負載的定制設計的NPU、CPU和GPU。
    的頭像 發(fā)表于 03-06 14:15 ?733次閱讀

    linux服務器和windows服務器

    較為熟悉,需要高性能和穩(wěn)定性,并且希望能夠進行自定義配置和更好的安全,那 么Linux服務器是一個不錯的選擇。 而如果你對服務器操作系統(tǒng)不太熟悉,
    發(fā)表于 02-22 15:46

    物理服務器對ai發(fā)展的應用

    物理服務器在AI發(fā)展中扮演著重要的角色。傳統(tǒng)的以CPU為計算部件的服務器架構已難以滿足人工智能的新需求,因此,"CPU+ GPU/FPGA/ASIC"的異構計算架構成為人工智能
    的頭像 發(fā)表于 12-22 09:19 ?428次閱讀

     物理服務器和大寬服務器怎么選

    物理服務器和大寬服務器的選擇需要根據(jù)具體的業(yè)務需求來決定。物理服務器是一種獨立的、非虛擬化的計算機設備,它通常被用作高性能應用、數(shù)據(jù)庫、存儲
    的頭像 發(fā)表于 12-20 10:50 ?544次閱讀

    高防服務器和普通服務器之間的區(qū)別是什么

    ,和通用的計算機架構類似,但是由于需要提供高可靠的服務,因此在處理能力、穩(wěn)定性、可靠、安全、可擴展性、可管理性等方面要求較高。在網(wǎng)絡環(huán)境
    的頭像 發(fā)表于 12-15 14:37 ?576次閱讀

    gpu服務器是干什么的 gpu服務器與cpu服務器的區(qū)別

     相比于傳統(tǒng)的CPU服務器,GPU服務器支持同時計算大量相似的計算操作,可以實現(xiàn)更強的并行計算性能。GPU
    的頭像 發(fā)表于 12-02 17:20 ?1861次閱讀

    什么是異構集成?什么是異構計算異構集成、異構計算的關系?

    異構集成主要指多個不同工藝節(jié)點單獨制造的芯片封裝到一個封裝內(nèi)部,以增強功能和提高性能。
    的頭像 發(fā)表于 11-27 10:22 ?7011次閱讀
    什么是<b class='flag-5'>異構</b>集成?什么是<b class='flag-5'>異構計算</b>?<b class='flag-5'>異構</b>集成、<b class='flag-5'>異構計算</b>的關系?