ADI公司提供一套全面的硬件監控產品,適用于臺式機和筆記本電腦以及服務器。智能系統監控設備使復雜的風扇速度控制技術成為可能,以提供足夠的冷卻并保持系統中的最佳熱性能。在過去的一年中,我們開發了一系列產品,包括ADM1029雙通道PWM風扇控制器和溫度監控器、ADM1026和ADM1030/31完整、符合ACPI標準的雙通道±1°C遠程熱監控器,集成風扇控制器,適用于一個或兩個獨立風扇。它們基于ADM102x PC系統監控器產品組合中的核心技術(另見模擬對話33-1和33-4)。這些新產品根據系統內測量的溫度提供風扇速度控制,提供更完整的熱管理解決方案。我們在這里討論對這種復雜控制水平的需求以及提供這種控制所固有的問題。
背景
隨著新千年的到來,處理器正在實現 1 GHz 甚至更高的速度。它們在速度和系統性能方面的顯著改進伴隨著使用它們的機器內產生的熱量不斷增加。安全散熱的需求,以及計算行業開發“綠色PC”和用戶友好型機器(隨著互聯網設備成為主流)的舉措,推動了對更復雜的冷卻和熱管理技術的需求和發展。
PC也開始變得更小,尺寸和形狀不那么傳統 - 這可以在市場上任何最新概念的PC或超薄筆記本電腦中看到。嚴格的功耗規范,如“移動電源指南'99”(參考文獻1)規定了通過筆記本電腦鍵盤可以安全散熱而不會引起用戶不適的程度。任何多余的熱量必須通過其他方式從系統中排出,例如沿熱管和散熱器板對流,或使用風扇使空氣通過系統。顯然,我們需要的是一種可以普遍采用的智能、有效的熱管理方法。各種行業團體已經聚集在一起解決這些問題和其他問題,并制定了諸如筆記本電腦的ACPI(高級配置和電源接口)和服務器管理的IPMI(智能平臺管理接口)等標準。
行業標準
新的熱管理/速度控制產品的開發受到ACPI和IPMI標準的推動。高級配置和電源接口-ACPI由英特爾,微軟和東芝定義,主要用于定義和實現筆記本電腦的電源管理。
電源管理被定義為“硬件和軟件中的機制,用于最小化系統功耗、管理系統熱限制并最大限度地延長系統電池壽命。電源管理涉及系統速度、噪聲、電池壽命、處理速度和交流功耗之間的權衡。
首先考慮一個筆記本電腦用戶,他在穿越海洋或大陸時鍵入旅行報告。哪個特性更重要,最大 CPU 性能或延長電池壽命?在這樣一個簡單的文字處理器應用程序中,用戶擊鍵之間的時間幾乎是CPU時鐘周期的永恒,最大CPU性能遠不如電源的持續可用性那么重要。因此,CPU 性能可以與延長電池壽命相權衡。另一方面,考慮想要在數字多功能磁盤 (DVD) 上以全動態、全屏、令人麻木的聲音和亮度觀看最新詹姆斯邦德電影的用戶。至關重要的是,系統必須以足夠快的性能水平運行,以足夠快的速度解碼軟件,而不會丟失圖片或音頻幀。在這種情況下,CPU 性能不會受到影響。因此,發熱將處于最高水平,對熱管理的關注對于在不損害可靠性的情況下獲得最佳性能至關重要。輸入 ACPI。
那么什么是ACPI?ACPI 是描述組件之間的接口及其行為方式的規范。它不是純粹的軟件或硬件規范,因為它描述了 BIOS 軟件、操作系統軟件和系統硬件應如何交互。
ACPI 規范概述了兩種不同的系統冷卻方法:被動冷卻和主動冷卻。被動冷卻依靠操作系統 (OS) 和/或基本輸入/輸出系統 (BIOS) 軟件來降低 CPU 功耗,以減少機器的散熱。如何實現這一點?通過做出明智的決策,例如在指定時間后未檢測到擊鍵或其他用戶交互時進入掛起模式。或者,如果系統正在執行一些密集的計算,例如 3D 處理,并且變得非常熱,BIOS 可能會決定限制(減慢)CPU 時鐘。這將減少機器的熱輸出,但以犧牲整體系統性能為代價。這種被動式冷卻有什么好處?其明顯的優點是系統功率要求以靜默方式降低(不需要風扇操作)以降低系統溫度,但它確實限制了性能。
那么,主動冷卻呢?在主動冷卻的系統中,操作系統或 BIOS 軟件采取直接操作(如打開 CPU 安裝的風扇)來冷卻處理器。它的優點是,通過CPU的金屬塊或散熱器增加的氣流允許熱量相對快速地從CPU中排出。在被動冷卻系統中,僅 CPU 節流會阻止 CPU 進一步發熱,但散熱器對“靜止空氣”的熱阻可能相當大,這意味著散熱器會將熱量非常緩慢地散發到空氣中,延遲恢復全速處理。因此,采用主動冷卻的系統可以結合最大的CPU性能和更快的散熱。但是,風扇的運行會將噪音引入系統環境并消耗更多功率。哪種冷卻技術更好?實際上,這取決于應用程序;多功能機器將使用這兩種技術來處理不同的情況。ACPI 根據兩種不同的模式概述了冷卻技術:性能模式和靜默模式。圖1和圖2比較了這兩種模式。
圖1.性能優先。主動模式(_ACx,風扇打開)以 50 度進入,被動模式(_PSV,油門后退)以 60° 進入。關斷發生在臨界溫度 (_CRT) 90°。風扇速度可能會在高于 ACx 的水平上增加。
圖2.靜音和電池經濟性優先。被動模式首先在 45 度時進入,風扇直到 60° 才打開。
圖1和圖2是溫標示例,說明了性能、風扇噪聲和功耗/耗散之間的各自權衡。為了使系統管理設備符合 ACPI 標準,它應該能夠以 5°C 的間隔或 SCI(系統控制中斷)事件發出信號,表明發生了新的超限溫度增量。這些事件提供了一種機制,操作系統可以通過該機制跟蹤系統溫度,并就是否限制 CPU 時鐘、增加/降低冷卻風扇的速度或采取更激烈的操作做出明智的決策。一旦溫度超過_CRT(臨界溫度)策略設置,系統將作為故障安全裝置關閉,以保護 CPU。圖 1 和圖 2 中顯示的其他兩個策略設置是_PSV(被動冷卻或 CPU 時鐘限制)和_ACx。(主動冷卻,當風扇打開時)。
在圖 1(性能模式)中,冷卻風扇在 50°C 時打開。 如果溫度繼續上升到 60°C 以上,則啟動時鐘限制。此行為將最大限度地提高系統性能,因為系統僅在較高溫度下才會變慢。在圖 2(靜默模式)中,CPU 時鐘首先在 45 攝氏度時受到限制。如果溫度繼續升高,可以在 60 攝氏度時打開冷卻風扇。這種降低性能的模式也往往會延長電池壽命,因為節流時鐘會降低功耗。
圖3顯示了溫度測量帶的限值如何跟蹤溫度測量。每次越界都會產生一個中斷。
圖3.通過移動極限和生成中斷來跟蹤溫度變化。
智能平臺管理接口 (IPMI) 規范(參考文獻 2)為服務器帶來了類似的熱管理功能。IPMI 旨在通過監控系統的關鍵“心跳”參數(溫度、電壓、風扇速度和 PSU(電源單元))來降低服務器的總擁有成本 (TCO)。IPMI的另一個動機是服務器之間的互操作性需求,以促進基板和機箱之間的通信。IPMI 基于 5 伏 I 的使用2C 總線,消息以數據包形式發送。
ADI公司溫度和系統監控(TSM)系列的所有成員均符合ACPI和IPMI標準。
溫度監測
在PC內實現智能風扇速度控制的先決條件是能夠準確測量系統和處理器溫度。所使用的溫度監測技術一直是許多文章的主題(例如,參見模擬對話33-4),這里將僅簡要介紹。ADI公司的所有系統監控設備都使用稱為熱二極管監控(TDM)的溫度監控技術。該技術利用了這樣一個事實,即在恒定電流下工作的二極管連接的晶體管的正向電壓表現出負溫度系數,約為-2mV/°C。 由于VBE的絕對值因設備而異,因此此功能本身不適合用于批量生產的設備,因為每個設備都需要單獨校準。在TDM技術中,兩個不同的電流依次通過晶體管,并測量電壓變化。溫度與VBE的差異有關:
ΔVBE = kT/q × ln(N)
其中:
k = 玻爾茲曼常數
q = 電子電荷大小
T = 絕對溫度,單位為開爾文
N = 兩個電流的比值
圖4.基本TDM信號調理電路。
在任何CPU中,最相關的溫度是芯片上“熱點”的溫度。系統中的所有其他溫度(包括散熱器溫度)將滯后于該溫度的上升。出于這個原因,幾乎每個CPU(自早期英特爾奔騰II處理器以來制造)在其芯片上包含一個戰略性位置的晶體管,用于熱監控。它給出了真實的、基本上是瞬時的芯片溫度曲線。圖5顯示了系統中反復進入和從掛起模式喚醒的溫度曲線。它比較了連接到CPU散熱器的熱敏電阻和基板熱二極管測量的溫度。在實際芯片溫度來回變化約13度的短時間內,散熱器熱敏電阻無法檢測到任何變化。
圖5.散熱器熱敏電阻和TDM在一系列進入和退出掛起模式期間測量的溫度比較。
風扇溫度控制
通過建立精確的溫度監控方法,可以實現有效的風扇控制!通常,該技術是使用TDM來測量溫度,將檢測晶體管集成在片內或外部放置在盡可能靠近熱點的位置,并將風扇速度設置為確保在該溫度下足夠傳熱的水平。控制回路的各種運行參數都是可編程的,例如最小速度、風扇啟動溫度、速度與溫度斜率以及開/關遲滯。所描述的速度控制方法將包括開關、連續(“線性”)和脈寬調制(PWM)。
風扇控制方法:從歷史上看,PC中風扇速度控制的方法范圍從簡單的開關控制到閉環溫度到風扇速度控制。
兩步控制:這是PC中采用的最早的風扇速度控制形式。BIOS 將測量系統溫度(最初使用靠近 CPU 的熱敏電阻),并決定是完全打開還是關閉冷卻風扇。后來,PC使用更精確的基于TDM的溫度監視器來實現相同的兩步風扇控制。
三步控制: BIOS 或操作系統再次使用熱敏電阻或熱敏二極管測量溫度,并根據軟件設置決定是完全打開、完全關閉風扇還是將其設置為半速運行。
線性風扇速度控制:這種較新的風扇速度控制方法也稱為電壓控制。BIOS 或操作系統從 TDM 測量電路讀取溫度,并將一個字節寫回片內 DAC,以設置輸出電壓以控制風扇的速度。這種類型的IC風扇控制器就是一個例子,ADM1022具有8位DAC片內,輸出電壓范圍為0 V至2.5 V。它與具有所選風扇適當設計額定值的外部緩沖放大器配合使用。ADM1022還包含默認的自動硬件跳變點,如果TDM電路檢測到過熱情況,則風扇將全速驅動。這些類型的設備的首次亮相標志著自動風扇速度控制的出現,其中一些決策從操作系統軟件轉移到系統監控硬件。
脈寬調制 (PWM) 風扇速度控制: 在ADI公司的系統監控產品線中,這些PWM類型是最新的風扇控制產品。BIOS 或操作系統可以從 TDM 設備讀取溫度,并通過調整應用于冷卻風扇的 PWM 占空比來控制冷卻風扇的速度。
值得注意的是,上述所有風扇速度控制方法都依賴于CPU或主機干預,通過2線系統管理總線從TDM器件讀取溫度。然后,由CPU執行的熱量管理軟件必須決定風扇速度應該是多少,并將一個值寫回系統監視器IC上的寄存器以設置適當的風扇速度。
風扇速度控制發展的下一步是實現自動風扇速度控制回路,該循環可以獨立于軟件運行,并在給定的芯片溫度下以最佳速度運行風扇。這種閉環速度控制有很多好處。
一旦系統監控設備初始化(通過加載具有所需參數的限值寄存器),控制環路就完全獨立于軟件,IC可以在沒有主機干預的情況下對溫度變化做出反應。當發生災難性系統故障時,此功能尤其理想,系統無法從中恢復。如果PC崩潰,操作系統中的電源管理軟件將不再執行,從而導致熱量管理丟失!如果PC無法讀取正在測量的溫度(因為PC已崩潰),則無法期望設置正確的風扇速度以提供所需的冷卻水平。
閉環實現的另一個切實好處是,它將在任何給定溫度下以最佳速度運行風扇。這意味著噪音和功耗都降低了。全速運行風扇可最大限度地提高功耗和噪音。如果可以通過回路優化有效管理風扇速度,則僅在給定溫度下僅以所需的速度運行,則功耗和可聽見的風扇噪音都會降低。在電池供電的筆記本電腦應用中,這是一個絕對關鍵的要求,其中每一毫安電流(或毫安秒的電荷)都是寶貴的商品。
自動風扇速度控制回路
以下是實現自動風扇速度控制回路的方法,該回路將使用TDM技術測量溫度,并將風扇速度適當地設置為溫度的函數。可編程參數允許更完整地控制環路。要編程的第一個寄存器值為 T最低.這是風扇首次打開的溫度(對應于 ACx),也是風扇速度控制開始的溫度。速度暫時設置為最大以使風扇運轉,然后返回到最低速度設置(請參閱圖 6)。允許控制溫度風扇速度函數斜率的參數是從 T.MAX到 T最低或 T范圍.T 的編程值最低和 T范圍定義風扇達到最大速度的溫度,即 T.MAX= T最低* u范圍.可編程溫度范圍可選:5&de;C、10°C、20°C、40°C 和 80°C。 為了避免在T附近快速循環上下最低,滯后用于建立低于 T 的溫度最低,此時風扇將關閉。可編程到環路中的遲滯量為1°C至15°C。 此風扇控制回路可由操作系統軟件通過 SMBus 進行監控,PC 可以隨時決定覆蓋控制回路。
圖6.風扇速度編程為溫度的自動函數。
PWM 與線性風扇速度控制
有人可能會問,如果線性風扇速度控制已經廣泛使用,為什么脈寬調制是可取的。
考慮使用線性風扇速度控制驅動的 12V 風扇。當施加到風扇的電壓從 0 V 緩慢增加到約 8 V 時,風扇將開始旋轉。隨著風扇電壓的進一步增加,風扇速度將增加,直到在 12 V 驅動時以最大速度運行。因此,12V 風扇的有效工作窗口介于 8 V 和 12 V 之間;范圍僅為 4 V,可用于速度控制。
對于筆記本電腦使用的 5-V 風扇,情況變得更糟。風扇在施加的電壓約為 4 V 之前不會啟動,高于 4 V,風扇將趨向于接近全速旋轉,因此在 4 到 5 伏之間幾乎沒有可用的速度控制。因此,線性風扇速度控制不適合控制大多數類型的5V風扇。
通過脈寬調制(PWM),最大電壓施加在受控間隔(方波的占空比,通常為30至100 Hz)內。隨著該占空比或高時間與低時間之比的變化,風扇的速度將發生變化。
在這些頻率下,清潔轉速表(轉速表)脈沖從風扇接收回來,從而實現可靠的風扇速度測量。隨著驅動頻率的提高,存在用于精確測量的轉速脈沖不足的問題,然后是噪聲,最后是電尖峰破壞轉速信號。因此,大多數PWM應用使用低頻激勵來驅動風扇。外部PWM驅動電路非常簡單。它可以通過單個外部晶體管或MOSFET來驅動風扇來實現(圖7)。由模擬速度電壓驅動的線性風扇速度控制等效物需要一個運算放大器、一個調整管和一對電阻來設置運算放大器增益。
圖7.PWM驅動電路與線性驅動電路的比較。
如何測量風扇速度?3 線風扇具有轉速輸出,通常每轉輸出 1、2 或 4 個轉速脈沖,具體取決于風扇型號。然后,該數字轉速信號直接施加到系統監控設備上的轉速輸入。轉速脈沖不計算在內,因為風扇運行相對較慢,并且需要相當長的時間才能積累大量轉速脈沖以進行可靠的風扇速度測量。相反,轉速脈沖用于將運行頻率為22.5 kHz的片內振蕩器選通計數器(見圖8)。實際上,正在測量轉速周期以確定風扇速度。轉速值寄存器中的高計數表示風扇低速運行(反之亦然)。限位寄存器用于檢測風扇粘連或停止。
圖8.風扇速度測量。
風扇速度控制還有哪些其他問題?
當使用PWM控制風扇時,可靠連續風扇運行的最小占空比約為33%。但是,風扇不會以 33% 的占空比啟動,因為沒有足夠的功率來克服其慣性。如圖 6 的討論中所述,此問題的解決方案是在啟動時將風扇旋轉 2 秒鐘。如果風扇需要以最低速度運行,則在風扇旋轉后,PWM占空比可以降低到33%,并且由于遲滯而防止其失速。
風扇失速和風扇故障
然而,在系統中使用時,風扇可能會在某個時候停止。原因可能包括風扇運行太慢,或灰塵積聚阻止其旋轉。因此,ADI公司的系統監視器具有基于風扇轉速輸出的片內機制,用于檢測并重新啟動停止的風扇。如果未收到轉速脈沖,則轉速值寄存器中的值將超過轉速極限寄存器中的限制,并將設置錯誤標志。這將導致控制器嘗試通過嘗試旋轉風扇 2 秒鐘來重新啟動風扇。如果風扇繼續出現故障,最多嘗試重新啟動 5 次,則確認存在災難性風扇故障,并且 FAN_FAULT 引腳將置位以警告系統風扇出現故障。在雙風扇雙控制器系統中,第二個風扇可以全速旋轉,以嘗試補償由于第一個風扇故障而導致的氣流損失。
總結
ADI公司繼續開發卓越的熱管理解決方案,并將其提供給計算行業。為ADM1029、ADM1030/31和ADM1026開發的技術將PC內的熱管理提升到一個新的水平。這些器件具有溫度監控、硬件自動溫度控制、風扇速度測量、支持備用和冗余風扇、風扇存在和風扇故障檢測、可編程 PWM 頻率和占空比等功能。隨著電源準則變得更加嚴格,PC運行溫度明顯更高,正在開發更復雜的溫度測量和風扇速度控制技術,以更有效地管理未來的系統。
審核編輯:郭婷
-
控制器
+關注
關注
112文章
16203瀏覽量
177413 -
電源管理
+關注
關注
115文章
6155瀏覽量
144237 -
cpu
+關注
關注
68文章
10825瀏覽量
211150
發布評論請先 登錄
相關推薦
評論