精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

瞬變對AI加速卡供電的影響

analog_devices ? 來源:未知 ? 2023-12-01 18:10 ? 次閱讀

圖形處理單元(GPU)、張量處理單元(TPU)和其他類型的專用集成電路(ASIC)通過提供并行處理能力來實現高性能計算,以滿足加速人工智能(AI)訓練和推理工作負載的需求

AI需要大量的算力,尤其是在學習和推理時。這種需求不斷地將供電網絡的邊界推向前所未有的新水平。這些高密度工作負載變得愈加復雜,更高的瞬態需求推動配電網絡的每個部分都必須高效運行。AI加速卡嚴格的功耗要求對系統性能也有影響。本文將討論AI加速卡的配電網絡要求,剖析瞬變的影響,并介紹ADI公司針對這些需求提出的多相供電解決方案。

簡介

AI技術完全改變了計算架構,以復現模仿人腦的神經網絡。AI看似已廣泛存在,但實際上,驅動AI的技術仍在發展。專門用于AI計算的處理器加速器IC包括GPU、現場可編程門陣列(FPGA)、TPU和其他類型的ASIC。本文將它們統稱為xPU。

隨著AI技術部署快速推進,數據中心將繼續批量購買AI加速卡。根據Gartner的報告,2021年AI芯片收入總計超過340億美元,預計到2026年將增長至860億美元。1xPU采用大規模并行計算方案,與普通CPU相比,在AI性能方面實現了巨大飛躍。xPU擁有大量小內核,因此非常適合AI工作負載,有助于神經網絡訓練和AI推理。然而,xPU進行AI計算和移動數據通常會產生相對較大的功耗。簡而言之,xPU是非常耗電的IC。其嚴格的功耗要求對AI加速卡提出了新的挑戰,這也會影響系統性能。本文將分析AI加速卡的供電網絡要求,并介紹ADI公司針對這些嚴格要求提出的多相供電解決方案。

AI帶來的供電挑戰

AI涉及許多方面,但能效不在其中。AI工作時,尤其是處理深度學習和推理等AI工作負載時,需要極高的計算功率。在系統層面,AI加速器對于提供近乎即時的結果(正是這些結果使其有價值)發揮著關鍵作用。所有xPU都有多個高端內核,這些內核由數十億個晶體管構成,消耗數百安培電流。這些xPU的內核電壓(VCORE)已降至低于1.0 V的水平。圖1顯示了AI加速卡的通用框圖。本文將重點介紹為此類系統提出的多相控制器和相應的功率級IC。

wKgZomVpsiyAI7V5AAP7wkR4pHo407.png

圖1. 通用AI加速卡框圖

AI加速卡所需的峰值電流密度對于任何主板來說都是非常沉重的負擔,難以處理。工作負載的高度動態特性和極高的電流瞬變會導致非常高的di/dt和持續數微秒的尖峰電壓瞬變,這些瞬變非常具有破壞性,可能對xPU造成損害。AI的平均工作負載會持續很長時間,解耦電容將無法始終提供滿足即時需求的能量。本文的下一部分將介紹ADI公司提出的多相負載點(PoL)解決方案,它會消除典型AI加速器的瞬變,避免給整個配電網絡產生壓力。但首先,我們來討論AI帶來的電源設計挑戰。

AI帶來新的電源設計挑戰

目前,AI功率需求遠遠超過傳統供電網絡的能力。xPU穩壓器(VR)的要求與標準PoL穩壓器有很大不同。業界發現,某些應用要求在小于1 V的電壓下為xPU提供超過1000 A的電流。重要的是,電源必須非常穩定,產生的噪聲非常小,同時消除所有電壓瞬變可能性,以免導致xPU內部誤觸發。為了應對驚人的電流需求,高性能AI加速器VR PoL的設計必須滿足某些關鍵要求。

電壓尖峰和瞬變管理

AI加速卡的關鍵要求之一是VR的架構應能提供出色的瞬變電壓管理。向任何系統提供千瓦級功率始終是首要挑戰。輸出電壓(包括容差、紋波以及負載瞬態驟降和峰值)必須始終高于xPU最小電壓以避免系統掛起,并且還必須始終低于xPU最大電壓以免損壞xPU。加速卡的瞬態功率尖峰可能要求達到最大熱功率目標的2倍甚至更高。

這里重要的是,PoL環路帶寬須足夠靈活,以處理所遇到的各類更快速瞬變。帶寬越高,環路響應越快,電壓偏差越小。實現快速瞬態電源軌較直接的一種方法是選擇具有快速瞬態性能的穩壓器。ADI AI VCORE系列IC具有非常低的頻率輸出噪聲、快速瞬態響應和高效率等特性。除此之外,ADI AI電源芯片組還支持負載線路,有助于電源設計人員有效管理AI工作負載引起的瞬變和尖峰。

長電源路徑走線中的I2R損耗和熱管理

隨著AI xPU處理器電流不斷提高,PoL供電解決方案的密度已成為關鍵要素。既要可靠地向xPU的每個部分供電,同時不用擔心散發的熱量會影響芯片的可靠性并導致熱失控,現在變得極其困難。換言之,熱管理是設計這種高功率電源所面臨的重大挑戰之一。傳統的供電方法是將穩壓器放置在xPU的一側,以便將電力橫向傳輸到處理器。這些走線的電阻哪怕再小,也可能引起不可接受的電壓(I2R)下降。PCB電源層電阻上的壓降會隨著xPU電流提高而成比例地增加。這意味著VR和BGA引腳之間幾厘米的PCB電源走線會產生大量的損耗。PCB銅電源層中的此類損耗已成為計算穩壓器設計效率和性能的主導因素。傳統3芯片(分立式)供電解決方案需要大量高電流走線,與之相比,使用集成了電流和溫度電路模塊的單芯片功率級IC,可以大大減少PCB上的走線數量。

ADI價值主張:MAX16602 + MAX20790 + 耦合電感

AI穩壓器的精度變得更加嚴格。效率和尺寸是重中之重。性能和功耗也受到嚴格審查。正如上一節所述,解決AI加速卡VR設計問題已成為一項艱巨的任務。設計人員非常清楚,若不能有效處理不必要的瞬態效應,就無法在所需電流中產生大的階躍。解決這些瞬態效應還需要某種類型的高精度動態電壓定位或負載線路方案。ADI公司大力投資AI市場,為48 V和12 V系統提供全套解決方案。

本節介紹ADI AI多相電源芯片組,即 MAX16602 多相控制器和 MAX20790功率級,以及我們獲得專利的耦合電感(CL)技術,以幫助解決這些AI PoL設計挑戰。圖2顯示了8相 MAX16602CL8_EV 設計的MAX16602、MAX20790和CL簡化框圖連接。這種相對簡潔的設計實現了每相約88 APK的高電流傳輸能力。內部補償和先進的控制算法,加上功率級中集成的電流檢測電路以及耦合電感,使其成為擁有出色效率的小尺寸解決方案。

wKgZomVpsiyAHdduAAJxz588XK4654.png

圖2. 采用ADI高集成度電源芯片組的8相VR設計有助于實現高密度設計,同時減少外部連接

更高集成度的單芯片智能功率級IC

MAX20790是一款功能豐富的智能功率級IC,旨在與MAX16602(以及該產品系列中的其他幾款ADI控制器)配合使用,以實現高密度多相穩壓器。這是一種單芯片集成,幾乎消除了分立式設計中常見的FET和驅動器之間的寄生電阻和電感,從而實現高開關速度,而且功率損耗明顯低于傳統方案。如果檢測到開關節點(VX)故障,功率級會立即關閉,并將故障ID傳送給控制器。該智能功率級IC還有一個片內電流傳感器。此電流檢測電路模塊顯然優于使用電感直流電阻的方法。眾所周知,DCR檢測不準確,需要溫度補償才能使電流測量結果可信。

控制器IC

MAX16602是一款用于xPU VCORE VR的多相控制器。該IC提供高密度、靈活且可擴展的解決方案,可為AI xPU供電。該器件支持脈沖寬度調制(PWM)并聯,可控制多達16個相位。該IC的架構簡化了設計,減少了組件數量,支持高級電源管理和遙測功能,并在整個負載范圍內提高了節能效果。它實現了自主切相,在整個負載范圍內保持高效率。完整芯片組是一個高效率多相降壓轉換器,具有廣泛的狀態和參數測量特性。保護和關斷參數通過串行PMBus接口進行設置和監測,甚至包括功率級IC中收集的故障。

以下是該ADI控制器支持的其他幾個關鍵特性,這些特性對于任何AI供電方案都很重要。

高級調制方案

MAX16602利用高級調制方案(AMS)來提供更好的瞬態響應。該調制方案支持以極短的延遲開啟和關閉相位。根據負載需求,當負載增加時,可以同時開啟多個相位;當負載釋放時,可以立即關閉多個相位。啟用AMS后,系統閉環帶寬可以擴展,而不會造成相位裕量損失。因此,PoL能夠更好地響應AI VR的即時和動態電流需求。

負載線路控制

負載線路允許VCORE根據輸出電流在最小值和最大值之間變換。它實質上是為輕負載設置高VCORE值,為重負載設置低值。主要是為了讓控制環路可以處理更高的負載電流(這是讓計算順利進行所必需的)。ADI控制器在整個輸出電流范圍內提供準確的輸出負載線路控制。輸出電壓定位利用來自功率級IC的無損電流檢測信號進行,這些信號會反饋到控制器。負載線路是在控制器中通過對電壓控制環路誤差放大器的直流增益進行數字編程來設置。控制器的EC表和數據手冊的表6中提供了各種直流負載線路特性,從0.105 mΩ到0.979 mΩ。圖3顯示了16相PoL設計在40 A至360 A負載階躍和800 A/μs擺率下的瞬態曲線。結果表明過沖極小。

wKgZomVpsiyAChqtAAb5zagxA9M645.png

圖3. 16相VR在40 A至360 A階躍負載和800 A/μs擺率下的瞬態曲線

總而言之,ADI的多相功率轉換和PoL產品提供高效率和高功率密度。圖5顯示了我們的16相MAX16602 + MAX20790 + CLH1110-4評估板的效率曲線以及偏置和電感損耗。ADI公司為各種AI加速器應用提供穩壓器和其他電源轉換解決方案。采用我們的多相控制器和集成功率級解決方案,有助于ADI客戶滿足嚴苛的動態xPU電源要求,應對當今AI應用帶來的設計挑戰。

設計中添加有源電壓定位可以降低對負載瞬態響應的要求,并更好地利用xPU總容差窗口。負載線路控制有助于降低給定階躍負載的峰峰值輸出電壓偏差,同時可以減少輸出軌上的bulk電容量。總電壓波動將會減小,從而降低xPU崩潰或損壞的風險。請注意,MAX16602中的負載線路電路模塊可以禁用。

耦合電感(CL)的優勢

十多年來,ADI公司一直投資開發其專利CL技術。這項技術支持實現更高的密度、更大的帶寬、更快的瞬變解決方案,與分立式實現方案相比,效率提高50%,磁性元件尺寸縮小1.82倍。CL能夠有效地在穩態中用作大電感,在瞬態中用作小電感,除了減小電感尺寸外,還能節省COUT。圖4顯示了ADI多相VR設計中常用的耦合電感系列。

wKgZomVpsiyAU1YEAARq9fmNzyA804.png

圖4. ADI多相VR設計常用的耦合電感系列

根據設計規格和優先級,耦合電感消除電流紋波的優勢可用來換取更小的尺寸或更高的效率。較大的系統優勢以及ADI產品的與眾不同之處在于,AI PoL設計人員可以使用CL相對輕松地實現VR總尺寸較小的解決方案。幾家知名磁性器件供應商擁有ADI的免費CL許可,可以為我們提供所需的元件。

頂部散熱封裝

頂部散熱為表面貼裝封裝提供了另一種散熱途徑。MAX16602和MAX20790都是倒裝芯片四方扁平無引線(FCQFN)封裝,帶裸露的頂部散熱焊盤。FCQFN是一種先進的封裝,可提供設計人員青睞的出色熱性能。這種無引線封裝不僅可以減少寄生電感,還能從器件的結直接向周圍環境散熱。MAX20790的結殼頂部(θJC-TOP)熱阻為0.25°C/W。AI電源設計利用頂端散熱配置,可以提高系統的熱性能和設計靈活性。

wKgZomVpsi2AMoICAABzFKG07vI693.png

圖5. 16相AI VR評估板設計的效率曲線

垂直供電

隨著處理復雜AI功能的xPU問世,功耗隨之急劇增加。具有高達650 A連續電流和超過1000 A峰值電流傳輸能力的VR開始普及。為AI處理器供電的挑戰在于保持高效率。常規電源架構無法跟上這些非常耗電的AI xPU的步伐。VR芯片制造商和架構師正在從根本上研究不同的供電方法。業界正在討論一種為AI xPU供電的新趨勢,稱為垂直供電,也稱為背面供電。

VR必須盡可能靠近負載輸入xPU電源引腳,以實現高電流輸送。我們無法通過傳統的橫向供電方法實現這一目標。垂直供電將電源調節器移到處理器正下方,從而消除了PCB上可能產生的所有損耗。該結構將電源轉換器、功率級、電容和磁性元件放置在PCB的背面,并通過過孔垂直地向xPU供電。換言之,電流傳輸是從xPU BGA陣列下方垂直進行。這是一條長度縮短的垂直路徑,可顯著降低阻抗并消除損耗。圖6顯示了安裝在PCB另一側、xPU下方的垂直供電模塊架構。此示意圖僅用于說明。

wKgZomVpsi2AES2OAAFFabOEFx4282.png

圖6. 垂直供電模塊架構(僅用于說明目的)

ADI公司擁有廣泛的AI xPU VCORE解決方案系列,用于解決當今的這些問題。我們的電源解決方案能夠以非常小的外形尺寸實現出色的效率。本文介紹的解決方案將多相控制器MAX16602和智能單芯片功率級MAX20790相結合,可提供非常高的電源轉換效率、非常快的瞬態響應和非常準確的遙測報告。如需了解這些電源芯片組的更多信息或購買MAX16602CL8評估套件,請單擊此處。

構建垂直供電解決方案的難點包括解決模塊的重量和安裝問題。PCB另一側的xPU下方比較適合放置高頻解耦電容,用于儲存能量以滿足瞬時能量需求。垂直供電與ADI的CL技術相結合,可實現更高的電流密度、功率密度和更快的瞬態性能。垂直供電為ADI等PoL制造商提供了新的創新機會,并以自己的方式繼續支持摩爾定律的發展。

結語

支持機器學習和深度學習的加速卡通過提供加速訓練和推理工作負載所需的并行處理能力,將AI從理論變為現實。為高性能AI加速卡設計VR PoL是一項復雜的任務,尤其是在當前先進xPU的電源要求(表現在電流水平和電壓精度方面)不斷提高的情況下。

本文表明,xPU VR的要求與標準PoL調節器有很大不同。xPU供電軌具有極快的負載變化,需要動態電壓定位或負載線路,并且必須很小。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 亞德諾
    +關注

    關注

    6

    文章

    4680

    瀏覽量

    15929

原文標題:瞬變對AI加速卡供電的影響

文章出處:【微信號:analog_devices,微信公眾號:analog_devices】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    S7t-VG6 VectorPath加速卡的特性和功能

    S7t-VG6 VectorPath加速卡是Achronix公司聯合BittWare公司(Molex旗下的領先企業級FPGA加速器產品供應商)推出的一類全新的、面向高性能計算和數據加速應用的FPGA
    的頭像 發表于 11-14 11:19 ?189次閱讀

    AMD推出新款纖薄尺寸電子交易加速卡

    AMD(超威,納斯達克股票代碼:AMD)今日宣布推出 AMD Alveo UL3422 加速卡 ,這是其創紀錄的加速卡系列1的最新成員,專為超低時延電子交易應用而設計。AMD Alveo
    的頭像 發表于 10-16 09:14 ?419次閱讀

    大模型向邊端側部署,AI加速卡朝高算力、小體積發展

    電子發燒友網報道(文/李彎彎)AI加速卡是專門用于處理人工智能應用中的大量計算任務的模塊。它集成了高性能的計算核心和大量的內存,旨在加速機器學習、深度學習等算法的計算過程。當前,AI
    的頭像 發表于 09-17 00:18 ?3013次閱讀

    EPSON差分晶振SG3225VEN頻點312.5mhz應用于AI加速卡

    AI加速卡,通常也被稱為AI算力,是一種專為加速人工智能(AI)應用和算法而設計的硬件設備。
    發表于 09-10 14:56 ?0次下載

    基于菲數科技FA728Q加速卡實現低時延LLT應用

    菲數科技使用Stratix 10 FPGA和開源的開放式FPGA堆棧(OFS)基礎設施開發高性能FPGA加速卡
    的頭像 發表于 08-30 17:13 ?480次閱讀
    基于菲數科技FA728Q<b class='flag-5'>加速卡</b>實現低時延LLT應用

    YXC高頻差分晶振,頻點312.5mhz,高精度.高穩定性,應用于AI加速卡

    在一些AI加速卡中,揚興推薦的YXC差分晶振YSO210PR系列,該系列頻率范圍為10MHz ~1500MHz,可滿足高精度、高穩定度的需求,支持差分信號(LVDS/LVPECL)輸出,以下為YSO210PR系列中OA2EIBWNY-312.5M的這顆料在
    的頭像 發表于 08-21 14:03 ?303次閱讀
    YXC高頻差分晶振,頻點312.5mhz,高精度.高穩定性,應用于<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>

    借助全新 AMD Alveo? V80 計算加速卡釋放計算能力

    對于大規模數據處理,最佳性能不僅取決于原始計算能力,還取決于高存儲器帶寬。 因此,全新 AMD Alveo? V80 計算加速卡專為具有大型數據集的內存受限型應用而設計,這些應用需要 FPGA 硬件
    發表于 05-16 14:09 ?201次閱讀
    借助全新 AMD Alveo? V80 計算<b class='flag-5'>加速卡</b>釋放計算能力

    OpenAI Sora模型需大量AI加速卡及電力支持

    若以每片H100加速卡3萬美元市價估算,總花費將高達216億美元(相當于1561.68億元人民幣),這僅是H100加速卡采購費用。該模型在運營時還會產生極高的能耗,每片H100能耗達到700瓦,72萬片則意味著能耗高達50.4億瓦。
    的頭像 發表于 03-27 15:58 ?512次閱讀

    英偉達發布最強AI加速卡Blackwell GB200

    英偉達在最近的GTC開發者大會上發布了其最新、最強大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器架構Blackwell,標志著英偉達在
    的頭像 發表于 03-20 11:38 ?1074次閱讀

    英偉達發布超強AI加速卡,性能大幅提升,可支持1.8萬億參數模的訓練

    得益于NVIDIA每兩年進行一次GPU架構升級以提高性能的策略,全新的基于Blackwell的加速卡比之前的H100更為強大,尤其適用于AI相關任務。
    的頭像 發表于 03-19 12:04 ?739次閱讀

    英偉達發布最強AI加速卡GB200,開啟新一代AI圖形處理時代

    英偉達正式發布了其最新、也是迄今為止最強大的AI加速卡——GB200。這一重大發布標志著英偉達在AI圖形處理領域邁入了一個新的里程碑。
    的頭像 發表于 03-19 11:26 ?1149次閱讀
    英偉達發布最強<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>GB200,開啟新一代<b class='flag-5'>AI</b>圖形處理時代

    今日看點丨英偉達發布最強 AI 加速卡--Blackwell GB200;三星面臨罷工 存儲市場供需引關注

    1. 英偉達發布最強 AI 加速卡--Blackwell GB200 ,今年發貨 ? 3 月 19 日,英偉達發布最強 AI 加速卡--Blackwell GB200,今年發貨。英偉達
    發表于 03-19 11:08 ?1189次閱讀

    寧暢發布《基于標準PCIe接口的人工智能加速卡液冷設計》白皮書

    寧暢公司最近發布了一份名為《基于標準PCIe接口的人工智能加速卡液冷設計》的技術白皮書,這份白皮書由寧暢參與起草,并由開放計算標準工作委員會(OCTC)歸口,旨在為冷板式人工智能加速卡的設計提供重要的指導。
    的頭像 發表于 01-09 14:02 ?697次閱讀

    寧暢參與發布AI加速卡液冷設計白皮書

    近日,由寧暢參與起草的《基于標準PCIe接口的人工智能加速卡液冷設計》白皮書正式發布。該技術白皮書由開放計算標準工作委員會(OCTC)歸口,旨在為冷板式人工智能加速卡的設計提供重要指導。
    的頭像 發表于 01-09 11:28 ?749次閱讀

    HPC領域的一款大殺器-HBX-G500大帶寬加速卡

    HBX-G500是一款高性能可編程加速卡,為AI、計算、網絡等領域,提供多通道的高帶寬存儲、高性能計算、先進高速接口等解決方案;
    的頭像 發表于 11-29 09:16 ?956次閱讀
    HPC領域的一款大殺器-HBX-G500大帶寬<b class='flag-5'>加速卡</b>