精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

宏觀算力建設實現芯片規模化

Dbwd_Imgtec ? 來源:軟硬件融合 ? 作者:軟硬件融合 ? 2022-07-05 10:20 ? 次閱讀

1、算力由性能、規模和利用率三部分組成

算力 = (單芯片)性能 x 規模(即數量) x 利用率。

8388782c-fbfb-11ec-ba43-dac502259ad0.png

算力是由性能、規模、利用率三部分共同組成的,相輔相成,缺一不可:

有的算力芯片,可能可以做到性能狂飆,但較少考慮芯片的通用性易用性,然后芯片銷量不高落地規模小,那就無法做到宏觀算力的真正提升。

有的算力提升方案,重在規模投入,攤大餅有一定作用,但不是解決未來算力需求數量級提升的根本。

有的解決方案,通過各種資源池化和跨不同的邊界算力共享,來提升算力利用率,但改變不了目前算力芯片性能瓶頸的本質。

性能、規模、利用率,宏觀微觀,牽一發而動全身。管中窺豹終有偏,既要考慮多種因素協同設計,更要宏觀的統籌算力問題。

2、最核心的,通過超異構實現芯片性能的數量級提升

83980a62-fbfb-11ec-ba43-dac502259ad0.png

一方面,超異構可以通過集成更多的加速引擎來實現相比CPUGPU的性能的數量級提升,但更多的計算是在DSA架構引擎完成的,從單位晶體管資源的性能效率視角看,是和DSA在一個量級的。

工藝進步、3D封裝、Chiplet封裝等各種創新,支持數量級提升的設計規模。但要想充分利用這些價值,就需要創新的系統架構。超異構計算,通過分布式系統設計,可以駕馭數量級提升的更大的設計規模。因此,可以做到相比傳統DSA再繼續10倍甚至100倍的性能提升。

3、在超異構的約束下,實現規模化落地

3.1 芯片要更好地支持規模化

從微服務的視角,云計算是由不同的服務組成的分層服務體系:每一層就是一個服務族,然后不同層次的服務族組成整個云計算服務體系,這就是我們所熟悉的云計算三層服務IaaS、PaaS和SaaS。

83a22a6a-fbfb-11ec-ba43-dac502259ad0.png

更詳細的軟件堆棧如上圖所示,從非云系統所有的“服務”堆棧都需要用戶自己擁有并維護,經過IaaS、CaaS、PaaS、FaaS,再到最后的SaaS,一切都由供應商運營維護。從左到右的過程,就是“服務”堆棧的下層layer不斷地由云運營商接管的過程。

這是一個鮮明的“二八定律”案例:80%的任務由云運營商負責,20%的任務由用戶負責;站在用戶的角度,20%自己負責的任務價值占到80%,而運營商負責的部分只占到到20%的價值。

83b329d2-fbfb-11ec-ba43-dac502259ad0.png

因此,基于二八定律,我們可以把整個系統分為三部分:

基礎設施層。基礎設施層的任務都相對確定,適合DSA和ASIC處理引擎處理。

應用層可加速部分任務。基礎設施層是CSP使用,而應用層則是給到用戶應用。用戶的應用多種多樣,因此應用層的加速也需要一定程度的彈性。這樣,GPU和FPGA就相對比較合適。

應用層的不可加速部分。主要是一些通用的處理,如控制以及一些細粒度的計算。協處理器是CPU的一部分。因此,CPU適合各類通用任務處理,CPU負責兜底。

83be9db2-fbfb-11ec-ba43-dac502259ad0.png

如上圖所示,整個系統的處理有點像塔防游戲:DSA負責干粗活累活,大量的計算任務在DSA中完成;GPU是性能和靈活性折中一些,負責一些彈性加速的計算任務;CPU啥都能干,但性能較差,因此負責兜底,也就是其他處理引擎都干不了的,都放在CPU。

這樣,CPU+GPU+DSA+etc.的超異構計算架構就可以實現“包治百病”的、相對通用的計算架構和平臺,就可以實現在云、網、邊、端等大算力場景以及用戶的絕大部分覆蓋。

更多場景和更多用戶的覆蓋,這樣才能真正實現芯片的規模化落地。芯片的大規模落地之后,又進一步攤薄一次性研發成本,進一步降低成本,形成良性循環。

3.2 宏觀算力建設實現芯片規模化

要想持續不斷地增加算力,不可避免的就是建設更多的數據中心。2022年2月,國家發改委、中央網信辦、工業信息化部、國家能源局聯合印發通知,同意在京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴州、甘肅、寧夏等8地啟動建設國家算力樞紐節點,并規劃了10個國家數據中心集群。至此,全國一體化大數據中心體系完成總體布局設計,“東數西算”工程正式全面啟動。

“東數西算”通過構建數據中心、云計算、大數據一體化的新型算力網絡體系,將東部算力需求有序引導到西部,優化數據中心建設布局,促進東西部協同聯動。“東數西算”工程有三個總體思路:一是推動全國數據中心適度集聚、集約發展。通過在全國布局8個算力樞紐,引導大型、超大型數據中心向樞紐內集聚,形成數據中心集群。二是促進數據中心由東向西梯次布局、統籌發展。三是實現“東數西算”循序漸進、快速迭代。

除了大型云數據中心建設之外,也需要更多的邊緣數據中心和服務器、更多的超高算力的智慧終端,以及更智慧的網絡核心設備,來共同提升宏觀總算力。

4、在超異構的約束下,提升算力利用率

4.1 提升算力利用率的手段

云計算出現之前,部署一套互聯網系統,一般有兩種方式:小規模的時候,自己購買物理的服務器,然后租用運營商的機房;超過一定規模的時候,就需要自己建機房,租用運營商的網絡,自己運維數據中心的軟件和硬件。這個時候的算力資源是一個個孤島,整個業務的模式也非常之重,成本很高而且彈性不足。如果算力資源配置比較多,就意味著資源浪費和利用率低;如果算力資源配置比較少,就意味著無法支撐業務的發展,丟失關鍵的商業機會。

云計算通過互聯網按需提供IT資源,并且采用按使用量付費的方式。用戶可以根據需要從云服務商那里獲得技術服務,例如計算能力、存儲和數據庫,而無需購買、擁有和維護物理數據中心及服務器。云服務使用多少支付多少,可以幫助用戶降低運維成本,用戶可以根據業務需求的變化快速調整服務的使用。

其他如基于分布式云的邊緣計算、跨不同云廠家的MSP、算力網絡以及云網邊端融合等,都是盡可能的把算力資源整合成一個巨大的資源池,然后可以靈活的根據各種完全動態變化的需求來提供合適的算力。

我們分析一下,要想提升算力利用率,肯定不能是算力的孤島:

第一個階段,所有的設備是孤島,各自要實現各自的所有功能。軟件應用也是單機版,算力利用率很低,應用的規模受單個硬件規格的限制;

第二階段,有了互聯網,不同的設備可以進行協作。可以通過C/S架構實現跨設備的軟件應用協作。這樣,應用的規模就突破了單個設備的約束。

第三階段,所有的算力資源形成一個整體。可以自動的、任意的切分算力資源。軟件也升級成了MicroService架構。這樣可以根據設備的規格大小,運行合適大小合適數量的微服務。只有資源形成巨大的資源池,然后通過各種運營管理,才能真正提高算力的利用率。

4.2 芯片視角看算力利用率

資源池化是提升算力利用率的根本途徑,但資源要想池化,對硬件有很高的要求:

不同設備架構/接口一致。比如CPU等引擎架構一致(比如都是x86架構平臺),那么軟件可以運行在任何一個設備上,硬件也可以支持各種不同的軟件運行。比如NVMe SSD,可以被不同的用戶訪問,也可以同時或分時地支持多種用戶的工作。

支持虛擬化。一方面是資源粒度的問題,另一方面是資源自由和動態分配的問題,都可以通過虛擬化技術解決。虛擬化還可以實現不同架構/接口的抽象,屏蔽硬件差異。

83e87588-fbfb-11ec-ba43-dac502259ad0.png

通常,算力的平臺都是CPU,而且目前x86架構CPU占據了絕大部分市場份額,并且x86 CPU對虛擬化的支持也非常的好。CPU對資源池化的支持,或者說對算力更高利用率的支持,是相當的友好。

但是,隨著性能需求越來越高,不得不通過超異構計算來數量級提升算力的時候,問題出現了。在超異構的架構下,如何實現更高的靈活性,如何實現更高的擴展性,如何實現各類資源的輕松便捷地池化和共享,則是一個全新的挑戰:

處理引擎要支持虛擬化和高可擴展性;

軟件可以跨不同廠家的、不同架構處理引擎;

軟件可以跨跨CPU、GPU、DSA等不同類型處理引擎;

軟件可以跨云網邊端。

5、展望,云網邊端大融合

83fdf908-fbfb-11ec-ba43-dac502259ad0.png

在虛擬化的加持下,軟件可以實現完全高可用:軟件可以脫離硬件實體,隨意的尋找合適的平臺運行,自適應的在云、網、邊、端運行。

隨著CPU的性能瓶頸,I/O虛擬化技術完全硬件化的情況下,硬件接口直接暴露給軟件,這就需要云數據中心內部,以及跨云邊端的硬件平臺一致性。

要想實現跨云網邊端、跨不同廠家的芯片平臺、跨不同類型不同架構的處理引擎,就需要芯片、系統、框架和庫、以及上層應用的多方協同,就需要開源開放的超異構計算生態。

萬物互聯,當所有的設備算力資源匯集成一個大的共享資源池,算力資源將取之不盡用之不竭。

原文標題:再來聊聊大家都經常聊的算力話題

文章出處:【微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19165

    瀏覽量

    229129
  • 芯片
    +關注

    關注

    453

    文章

    50406

    瀏覽量

    421829
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10825

    瀏覽量

    211150
  • 算力
    +關注

    關注

    1

    文章

    928

    瀏覽量

    14744

原文標題:再來聊聊大家都經常聊的算力話題

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    江波龍自研主控芯片實現規模化導入

    近日,江波龍在接受機構調研時透露,公司兩款自研主控芯片WM6000和WM5000已經成功實現批量出貨,并完成了超千萬顆的規模化產品導入,市場反饋良好。
    的頭像 發表于 11-11 16:07 ?414次閱讀

    OCTC發布"工廠"!力促智中心高效規劃建設投運

    創新提出面向未來數據中心的"工廠"模式,核心是以規(劃)、建(設)、運(營)一體的交鑰匙工程,實現中心快速投運、綠色低碳,在當前A
    的頭像 發表于 10-11 09:10 ?484次閱讀
    OCTC發布&quot;<b class='flag-5'>算</b><b class='flag-5'>力</b>工廠&quot;!力促智<b class='flag-5'>算</b>中心高效規劃<b class='flag-5'>建設</b>投運

    IaaS+on+DPU(IoD)+下一代高性能底座技術白皮書

    規模生產環境落地應用的條件。某種程度上,IoD 技術已成為下一代高性能底座的核心技術與最佳實踐。 白皮書下載:*附件:IaaS+on+DPU(IoD)+下一代高性能
    發表于 07-24 15:32

    東土科技自主研發的人工智能交通服務器實現規模化應用

    在智能交通領域,一場由東土科技引領的技術革新正悄然改變著城市交通的面貌。近日,東土科技自主研發的人工智能交通服務器在北京城市副中心通州區成功實現了580處交通路口的規模化應用,標志著我國智能交通建設邁出了堅實的一步。
    的頭像 發表于 07-17 15:42 ?408次閱讀

    曙光攜手“互聯公共服務平臺”提高全國匹配效率

    的互聯互通,助力“互聯公共服務平臺”功能完善,實現全國一體體系
    的頭像 發表于 07-16 15:45 ?658次閱讀

    IBM陳旭東:攜手IBM加速 AI 規模化應用,解鎖企業新質生產

    、總經理陳旭東應邀參會,并以"加速 AI 規模化應用,解鎖企業新質生產"為題作主旨演講。 他認為,在企業規模化應用AI的路徑中,最關鍵的是如何把企業數據轉化為AI源泉,即用企業的數據去訓練大模型,讓其掌握企業獨特的知識和技能。
    的頭像 發表于 07-15 16:13 ?301次閱讀
    IBM陳旭東:攜手IBM加速 AI <b class='flag-5'>規模化</b>應用,解鎖企業新質生產<b class='flag-5'>力</b>

    助力全國一體建設,神州鯤泰以構建新質生產

    ? 6月21日,由南方財經全媒體集團指導,21世紀經濟報道主辦的一體建設研討會在北京召開,來自學術界、產業界的從業者齊聚一堂,通過對全國一體
    的頭像 發表于 06-24 16:57 ?555次閱讀
    助力全國一體<b class='flag-5'>化</b><b class='flag-5'>算</b><b class='flag-5'>力</b>網<b class='flag-5'>建設</b>,神州鯤泰以<b class='flag-5'>算</b><b class='flag-5'>力</b>構建新質生產<b class='flag-5'>力</b>

    北京:規劃建設支撐萬億級參數大模型訓練需求的超大規模集群

    ABSTRACT摘要2024年4月24日,北京市經濟和信息局、北京市通信管理局印發《北京市基礎設施建設實施方案(2024—2027年)》。其中提出,智
    的頭像 發表于 04-29 08:26 ?294次閱讀
    北京:規劃<b class='flag-5'>建設</b>支撐萬億級參數大模型訓練需求的超大<b class='flag-5'>規模</b>智<b class='flag-5'>算</b>集群

    廣東:到2025年,規模38E,智50%,國產70%

    目標,提出了6大類22項重點任務。據了解,近年來,廣東持續加快建設,電信運營商已完成粵港澳大灣區超高速400G全光運力網絡建設實現韶關
    的頭像 發表于 04-23 08:25 ?417次閱讀
    廣東:到2025年,<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>規模</b>38E,智<b class='flag-5'>算</b>50%,國產<b class='flag-5'>算</b><b class='flag-5'>力</b>70%

    聲通科技:高標準及可擴展的產品能力,助力公司實現規模化經營

    交互式人工智能解決方案提供商,一直以來都注重產品標準和可擴展性的建設,不斷提升自身的產品能力和市場競爭。 據了解,聲通科技為了實現企業級解決方案的快速
    的頭像 發表于 04-16 15:51 ?304次閱讀

    聚焦全國一體體系構建,憶聯以強大存“引擎”釋放潛能

    是數字時代的生產,為數字經濟與實體經濟深度融合提供了強大支持。在不久前結束的全國兩會中,“全國一體
    的頭像 發表于 03-22 18:13 ?504次閱讀
    聚焦全國一體<b class='flag-5'>化</b><b class='flag-5'>算</b><b class='flag-5'>力</b>體系構建,憶聯以強大存<b class='flag-5'>力</b>“引擎”釋放<b class='flag-5'>算</b><b class='flag-5'>力</b>潛能

    晶晟微納發布N800超大規模AI芯片測試探針卡

    近日,上海韜盛科技旗下的蘇州晶晟微納宣布推出其最新研發的N800超大規模AI芯片測試探針卡。這款高性能探針卡采用了前沿的嵌入式合金納米堆疊技術,旨在滿足當前超大
    的頭像 發表于 03-04 13:59 ?925次閱讀

    中國電信規劃在上海建設首個國產超大規模液冷集群

    中國電信規劃建設首個國產超大規模液冷集群 人工智能技術的快速發展催生了巨大的需求;中國電
    的頭像 發表于 02-22 18:48 ?1303次閱讀

    智能規模超通用,大模型對智能提出高要求

    電子發燒友網報道(文/李彎彎)是設備通過處理數據,實現特定結果輸出的計算能力,常用FLOPS作為計量單位。FLOPS是Floating-point Operations Per Second
    的頭像 發表于 02-06 00:08 ?6112次閱讀

    大茉莉X16-P,5800M大稱王稱霸

    Rykj365
    發布于 :2024年01月25日 14:54:52