精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

傳統用于數字設計的CPU是否已經達到了容量極限?

傅里葉的貓 ? 來源:傅里葉的貓 ? 2024-04-17 10:11 ? 次閱讀

本文翻譯自Synopsys的官方文章:

在數字設計的Implementation過程中,從RTL到GDSII的每一步都是高度計算密集型的。在SoC層面,為了最小化互連的延遲,我們需要評估數百個partition的各種布局方案。一旦確定了布局方案,接下來就是進行每個partition內的其余步驟,以實現全芯片的implementation和signoff。由于每一步的計算需求已經很高,并且還要乘以partition的數量,這就引發了一個問題:傳統用于數字設計的CPU是否已經達到了容量極限?GPU是否能夠滿足計算需求?

如今,GPU以其處理人工智能機器學習、游戲和高性能計算等要求最為苛刻的工作負載而聞名。隨著芯片越來越大、越來越復雜,也許也是時候考慮用GPU來完成數字芯片設計的Implementation了。

CPU在EDA工作負載中的容量挑戰

CPU長期以來被認為是計算機的“大腦”。擁有數十億個晶體管和多個處理核心,如今的CPU非常適合完成廣泛的任務,并且能夠快速完成。另一方面,GPU最初是為特定目的設計的,但隨著時間的推移,它們也轉變為通用的并行處理器

一般來講,EDA工具都是在基于x86處理器的CPU上運行的。然而,隨著多芯片設計等復雜架構變得越來越普遍,我們正在接近CPU計算容量的限制。考慮到芯片設計團隊始終面臨的上市時間壓力,利用額外的工具和技術來加速芯片設計過程的任何方面都是有意義的。在驗證和分析方面,新思科技的PrimeSim和VCS仿真流程已經從GPU加速中受益。雖然數字設計流程中的每個任務并不是都非常適合GPU,但有些任務確實可以加速。

最先進的高性能數據中心x86 CPU核心平均有64到128個核心,每個box最多約有200個核心。需要更多核心的任務需要分布在許多box上;如果網絡不夠快,這會產生一些開銷。RTL到GDSII流程和優化技術包含許多相互依賴性。為了使流程中的每個任務能夠成功并行執行,作業分布在CPU box之間的數據共享必須非常快速,延遲要小。然而,實際上,網絡延遲會妨礙周轉時間,使得完整的RTL到GDSII流程的分布式并行化變得不那么有吸引力。

另一方面,GPU核心可以輕松擴展。每個核心執行的操作更少,而且非常微小,以至于你可以在一個插座中擁有數萬個核心,以提供巨大的處理能力,同時保持可管理的占用空間。能夠從大規模并行性中受益的任務非常適合GPU。然而,這樣的任務也必須是主要單向的,因為任何決策和迭代都會減慢進程和/或需要回到CPU進行“如果那么”決策。這排除了許多RTL到GDSII數字implementation流程中的任務,盡管并非所有任務都不適合。

使用GPU加速加快布局過程

在數字設計流程中,自動布局是已經展示出在GPU上運行前景的一項任務。在商業環境中運行的原型中,新思科技的Fusion Compiler GPU加速布局技術相比CPU,已經展示出顯著的周轉時間優勢:

使用GPU放置一個3nm GPU流處理器設計,包含1.4M個可放置的標準單元和20個可放置的硬宏,僅需38秒,相比之下,CPU驅動的布局需要13分鐘

使用GPU放置一個12nm汽車CPU設計,包含2.9M個可放置的標準單元和200個可放置的硬宏,僅需82秒,相比之下,CPU驅動的布局需要19分鐘

結合新思科技DSO.ai的AI驅動自動設計空間優化,我們預計將在相同的完成時間線上將AI驅動的搜索空間擴大15倍到20倍。這樣做可以使設計團隊實現更好的功耗、性能和面積(PPA)結果。

在許多方面,由于對最終設計PPA的高影響,布局和 floorplanning 是涉及最廣泛探索的implementation步驟。我們可以想象,即使GPU計算資源通常與強大的CPU計算集群分開,單個designer使用基于GPU的布局技術也能具有很高的生產力。然而,在RTL到GDSII 的implementation流程的其余部分中,通過CPU和GPU集群之間移動設計數據引入的延遲可能會限制吞吐量優勢。

新的數據中心SoC正在設計中,CPU和GPU資源之間具有統一內存,用于TB級工作負載。這些新興架構消除了利用GPU加速所需的設計數據移動,并將允許我們考慮在數字設計流程中應用GPU加速的其他位置,特別是當設計師可以將GPU與AI驅動的implementation工具配對時,可以進行更快、更廣泛的探索和更好的結果。隨著像新思科技.ai這樣的AI驅動的全棧EDA流程解決方案產生更好的PPA結果、更快的達到目標時間和更高的工程生產力,人們只能想象GPU加速的加入將如何進一步改變芯片設計。

總結

雖然芯片設計過程中的仿真部分對于在GPU上運行并不陌生,但很快數字設計流程的各個方面也將有機會利用GPU加速。對于大型芯片或復雜架構(如多芯片設計),CPU在運行RTL到GDSII流程時所需的計算容量正在耗盡,無法達到期望的速度。憑借其可擴展性和處理能力,GPU有可能提供更快的周轉時間和更好的芯片結果。使用GPU驅動的放置器進行的原型實驗已經將布局速度提高了多達20倍。隨著AI集成到EDA流程中,加入GPU可以形成一個強大的組合,以提高PPA(功耗、性能和面積)和上市時間。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片設計
    +關注

    關注

    15

    文章

    1005

    瀏覽量

    54819
  • 人工智能
    +關注

    關注

    1791

    文章

    46896

    瀏覽量

    237664
  • RTL
    RTL
    +關注

    關注

    1

    文章

    385

    瀏覽量

    59710
  • 機器學習
    +關注

    關注

    66

    文章

    8382

    瀏覽量

    132439
  • GPU芯片
    +關注

    關注

    1

    文章

    303

    瀏覽量

    5781

原文標題:GPU可以加速芯片設計的Implementaion嗎?

文章出處:【微信號:傅里葉的貓,微信公眾號:傅里葉的貓】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    數字壓力表的準確度如何?是否用于精密測量?

    在工業和科研領域,壓力的測量工作至關重要,而數字壓力表因其直觀的數字顯示和高精度的特性,成為了這些領域不可或缺的測量工具。那么,數字壓力表的準確度到底如何,它是否能滿足精細測量的需求呢
    的頭像 發表于 11-07 13:58 ?110次閱讀
    <b class='flag-5'>數字</b>壓力表的準確度如何?<b class='flag-5'>是否</b>適<b class='flag-5'>用于</b>精密測量?

    突破傳輸容量瓶頸:多芯光纖與空芯光纖

    伴隨著容量的提升及輸入功率的增加,由于非線性香農極限的影響,單模光纖的傳輸容量即將到達上限。傳統單模光纖(SMF)傳輸系統的最大容量被認為在
    的頭像 發表于 10-29 15:55 ?249次閱讀
    突破傳輸<b class='flag-5'>容量</b>瓶頸:多芯光纖與空芯光纖

    數字孿生如何改變傳統行業

    數字孿生作為一種前沿技術,正在深刻改變傳統行業,其影響力和變革能力在各個領域中日益顯現。以下是數字孿生如何改變傳統行業的具體分析: 一、數字
    的頭像 發表于 10-25 15:06 ?194次閱讀

    怎樣才知道一個單片機的性能到極限了?

    要確定一個單片機的性能是否達到極限,可以從多個方面進行綜合評估。以下是一些主要的判斷依據:
    的頭像 發表于 09-11 09:39 ?267次閱讀
    怎樣才知道一個單片機的性能到<b class='flag-5'>極限</b>了?

    TLC2272輸入電壓為1V左右,較小放大倍數,在輸入電壓慢慢增大,輸出就只有4.75V就達到了極限,為什么?

    ,較小放大倍數,在輸入電壓慢慢增大,輸出就只有4.75V就達到了極限,請教這是什么原因? 使用是運放是TLC2272。
    發表于 09-04 06:11

    opa690前級放大,噪聲達到了100mv,為什么?

    我用opa690作為前級放大,為什么噪聲達到了。100mv,以下是我畫的板,,各位大神給一下意見,看看我的板存在什么問題,為什么會有那么大的噪聲
    發表于 09-02 07:51

    JAVA應用CPU跳點自動DUMP工具

    背景 在做系統監控時,CPU的使用率是一個關鍵的指標,它反映了系統的性能穩定性以及是否存在異常情況,能幫助我們了解系統的負載情況。通過監控CPU使用率,可以判斷系統是否正常運行或者
    的頭像 發表于 08-05 17:48 ?481次閱讀

    數字功放機和傳統功放哪個好用

    。然而,傳統功放機憑借其穩定的性能和成熟的技術,依然有著不可替代的地位。 第一部分:基本概念與工作原理 1.1 數字功放機的基本概念 數字功放機,顧名思義,是一種將數字信號處理技術應
    的頭像 發表于 07-29 09:36 ?1998次閱讀

    如何將精益思維應用于傳統工廠的數字化轉型?

    思維應用于傳統工廠的數字化轉型,為工廠注入新的活力。 一、認識精益思維 精益思維源于精益生產,它強調以客戶需求為導向,通過消除浪費、優化流程、持續改進等方式,實現資源最大化利用和企業效益最大化。在
    的頭像 發表于 07-18 09:43 ?201次閱讀

    超級電容的容量達到多少?超級電容的容量有多大?

    超級電容器的容量是其一個關鍵的技術參數,直接影響著其在各種應用中的性能表現。
    的頭像 發表于 04-15 16:44 ?1520次閱讀

    如何判斷stm8s207是否已經運行?

    手里有一塊掃地機的板子出現故障了,板子有一個芯片是stm8s207,用于按鍵和指示燈控制的,有故障燈一直閃,按鍵沒有反應;不知道這stm8s芯片是否已經運行,怎么判斷?謝謝大家
    發表于 04-03 07:58

    什么是輸出極限電流?怎么測試電源模塊的輸出極限電流?

    輸出電流極限測試是測試電源模塊在輸出限流點放開(PFC的過流保護也要放開)后所能輸出的最大電流。目的是檢測電源模塊的限流點是否設計合理,器件選擇是否合適。如果電源模塊輸出電流極限值較小
    的頭像 發表于 03-29 13:49 ?649次閱讀

    LTM4644 SS管腳接地,是否可以達到禁止該通道輸出的目的?

    手冊中表示,SS管腳的對地電容可以調整上電時間。問:SS管腳接地,是否可以達到禁止該通道輸出的目的? 因為我的板子已經生產完成RUN引腳上拉值高電平,并且無法割線修改為下拉來禁止該路輸出。想要通過SS管腳接地來
    發表于 01-05 12:25

    傳統數字系統的設計過程包括哪些

    傳統數字系統的設計過程是一個復雜而嚴謹的過程,涉及到多個階段和步驟。在這個過程中,設計師需要充分考慮系統的功能需求、性能指標、成本限制等因素,以確保設計出的數字系統能夠滿足實際應用的需求。本文將對
    的頭像 發表于 12-30 15:46 ?818次閱讀
    <b class='flag-5'>傳統</b><b class='flag-5'>數字</b>系統的設計過程包括哪些

    交流電機的堵轉轉矩是否為電機的轉矩極限

    交流電機的堵轉轉矩是否為電機的轉矩極限,此時,電機輸出功率如何計算,是否為電機最大功率
    發表于 12-12 07:17