在 2.5D 和 3D-IC 中,準確預測熱完整性變得越來越困難,從而產生了一連串的問題,這些問題可能會影響從系統行為到現場可靠性的方方面面。
在過去的十年中,硅中介層技術已經從簡單的互連發展成為異構集成的關鍵推動因素。如今的中介層可能包含數十個芯片或小芯片,具有數百萬個連接,并且對性能、功耗和面積的要求不斷提高。事實上,在面積大于 2,000 mm2 的中介層上看到異構集成設計的情況并不少見,系統功耗為 600 瓦,并且需要非常高的 I/O 帶寬。有了這種能力,熱完整性現在是一個首要問題,這使得高信心地按計劃簽字變得更加困難。
有許多工具可用于理解和模擬異質硅中介層設計中的熱效應,但目前大多數工具都是互不關聯的。這里的工作正在進行中,但這不是一個簡單的解決方案。并不總是很清楚這些工具應該做什么,以及所有部分如何組合在一起。
“人們面臨的普遍挑戰是從這樣一種想法開始的,‘讓我們假設這些東西是小板子。我們將永遠應用我們在板級和封裝級應用的相同技術,我們只需縮小規模,它們就會起作用,“Synopsys 杰出架構師 Rob Aitken 說。“這是真的,但它有幾個新的維度。首先,現在做這件事的人與過去不同。以前,封裝和電路板工程師會這樣做。現在,芯片人員也在研究它。
還有其他重大轉變。“當我們進行這些 3D 裝配時,重要的是要記住,我們正在跨越過去的領域,”Siemens Digital Industries Software 的 Calibre 接口和 EM/IR 產品管理高級總監 Joseph Davis 說。“曾經有芯片人會把芯片放在一個包裝里。然后我們有系統級封裝和 MCM 選項。其中很多界限已經模糊不清。那么誰擁有什么呢?有些包裝人員正在做包裝和系統仿真。對他們來說,整個芯片都有一個溫度,所以分辨率是厘米大小的,用于觀察電路板上或外殼內部的散熱情況。然后是 IC 團隊,他們現在不再只有一張 IC。有一堆IC粘在一起。這個 IC 團隊以微米的分辨率來研究事物。他們需要知道整個事情的分布情況,等等。解決方案存在挑戰。但實際上,物理和技術問題是這里最容易解決的部分。真正的問題是,每當你跨越組織邊界時,你就會遇到一個真正的問題。我們現在將多個芯片組合在一起,有時來自不同的技術,有時來自不同的鑄造廠。即使在單個晶圓代工廠內,每個芯片組都是獨一無二的。沒有一個過程可以將所有這些信息都導入到工具中。
圖 1:使用中介層、凸塊、微凸塊和硅通孔的高級封裝。來源:西門子
為了實現這一目標,各方之間必須進行溝通——芯片設計公司、EDA工具供應商、代工廠和封裝公司。
“即使是一家鑄造廠,我們也必須弄清楚所有需要進來的東西,并準備好所有的東西來完成工作,”戴維斯說。“然后是包裝和系統人員,他們以毫米為單位思考。因此,有兩個截然不同的用戶群,每個用戶群都有不同的分辨率。
并且有不同的間距和互連。“特別是對于硅中介層,你正在處理一種不同的材料,”Synopsys的Aitken說。“電路板或有機基板在材料上是相似的,因此人們過去在電路板中擁有的所有做法都是保持一切平衡并構建測試車輛來測試該系統的極限。如果這些都有效,那就太好了,但沒有人能確定它們在多大程度上起作用。物理學就是物理學,但它會改變。如果你不小心,曾經是二階效果的東西可能會變成一階效果。了解它的工作方式和地點很重要,即使你談論的是數學模型。
改變起點
一個典型的異構集成系統是一步一步建立起來的。
Ansys首席產品經理Lang Lin表示:“從系統的封裝基板開始,我們實際上將中介層安裝在其頂部,并連接數十萬個凸塊。“根據設計集成計劃,設計人員會直接在中介層頂部添加幾個芯片或小芯片。一些芯片通過微凸塊或銅對銅連接連接,而其他一些芯片可以以 3D 方式進一步堆疊。由于這種集成,中介層的作用是可靠地連接數百萬個這樣的微凸塊或銅對銅連接,以便整個系統能夠在現場生存。
這通常被稱為芯片封裝系統。中介層是一個橋梁,包含所有這些組件的供電網絡。“它還為所有芯片和芯片提供電源,并承載整個芯片和芯片,”Lin說。“但現在安裝在頂部的小芯片消耗大量功率,這可能會導致電源完整性問題。在現場工作時,這些也會產生大量的熱量,因此現在 IC 有可能由于熱完整性問題而燒毀相鄰的 IC。
簡而言之,異構集成會導致電源和熱完整性問題,甚至更多。
“如果你有具有高帶寬內存的3D堆疊芯片,電源和熱量問題也可能導致嚴重的信號完整性問題,”他說。“這意味著所有這些問題都在異構集成系統中匯集在一起。設計人員在確保成功供電、成功散熱以及信號完整性不受影響方面發揮著重要作用。
對基于中介層的異構設計進行建模會引發有關模型完整性的問題,因為涉及的變量太多了。“你假設在某些條件下,例如,’一種材料相對于另一種材料的偏轉是線性的。然后你會說,‘嗯,實際上,在其他一些條件下,它是二次的。但二次模型要復雜得多。哪一個是正確的選擇?人們仍在試圖弄清楚答案是什么,以及你需要關心多少。
這很大程度上是抽象級別的函數。Davis指出,所有這些熱方面都可以通過非常粗略的建模和平均值來解決。“隨著新技術的出現以及這些技術的混合,我們在系統中有很多非常好的絕緣體,”他說。“當我們轉向finFET時,情況變得更糟。人們開始說,’供暖問題要嚴重得多。這是為什么呢?這是因為使用平面晶體管時,所有的熱量都是在硅中產生的。塊狀硅是一種相當不錯的熱導體。它的導熱系數約為150。使用鰭片,你把晶體管放在上面,它被二氧化硅隔離,這是一種非常好的絕緣體。在那里,導熱系數為 1.4,因此為 100 倍。但是等一下。我剛剛把我的熱晶體管包在玻璃枕頭里?我該怎么處理這些熱量?我必須有辦法把它弄出來。這是通過 TSV 等完成的。此外,我們可以對這些東西進行建模。我們每天通過模擬和 EM/IR 對比熱成像更復雜的事情進行建模。我們有能力,是的。但是,將所有數據放在一起是一個真正的問題。系統和系統分辨率不是電子產品,而是工業,是最大的問題。
艾特肯說,這有兩個方面。“有一個方面是,‘我有一個系統,我有一堆方程,我將用于對系統進行建模,我有實現這些方程的工具。然后我得到輸出。輸入部分也非常重要,因為所有的骰子都不一樣。所有材料可能略有不同。此外,工作負載是不同的,有時是未知的,所以你要處理的是我們一直在封裝上考慮的散熱問題,以及我們一直在芯片上考慮的散熱問題,但現在它們都合并在一起,不能被視為獨立的。這導致當你把這些東西放在一起時,你需要去做盡可能多的分析,但也需要監控你在構建它時發生了什么,以確保你的假設繼續成立。所以你有一些東西說,’哦,我們在這里升溫。這很糟糕。讓我們放慢腳步。
了解熱流至關重要。熱量從物體較熱的一端移動到較冷的一端,但并不總是一致的。“熱傳導的概念相當容易理解,”Ansys的Lin說,“如果你從工程101中了解歐姆定律,你就知道你可以為系統的熱傳導路徑模擬具有等效熱阻的物體。給定一個特定的功率耗散值作為該系統的散熱器,你可以很容易地求解傳導路徑兩端之間的溫差。傅立葉熱傳導定律描述了系統如何散熱,以及散熱器如何影響整個系統的溫差。
通過硅中介層映射傅里葉定律更為復雜。“假設一個小芯片中有兩個熱源,”Lin說。“小芯片消耗了這個硅系統的功率,而中介層安裝在封裝的頂部。系統中總共可能有四個不同的組件或對象。我們可以對四個分量的熱阻進行建模。鑒于兩種小芯片正在加熱系統,我們有兩個Q(熱流)源,它們將熱量注入熱傳導路徑。
解決這個問題可以幫助設計人員了解系統各組件之間的溫差,進而更好地了解溫度分布。但Lin說,這個模型不夠準確,因為每個組件只有一個等效的熱阻。“熱阻實際上很大程度上取決于整個物體的材料特性。有限元分析方法可用于以數學方式表示具有自身材料屬性的物理組件或系統,以及所有表面的邊界條件。網格劃分技術用于將此 IC 布局幾何形狀或對象轉換為可識別的元素。可以使用兩種不同的網格方法對整個IC布局進行建模,并且使用所有網格單元,我們可以以3D方式求解系統所有單元之間的傳熱規律。
這也有助于解決溫度分布問題,這是一個更準確的熱模型的現實問題。
在談到這種網格劃分如何影響求解熱傳導的準確性時,Lin表示,網格劃分技術需要不斷改進,這是具有挑戰性的,因為從舊的SoC技術到最新的2.5D或3D-IC技術,系統已經變得更大。這些復雜的系統中包含數以萬計的熱源。因此,網格劃分分辨率必須從厘米提高到微米,甚至可能達到納米。“我們需要一個更精細的解決方案,精確到集成芯片的子模塊級別,以便我們可以準確地模擬熱傳導路徑。這是非常具有挑戰性的,但它是解決這種系統的熱節流問題并確保沒有可靠性或熱完整性問題的必要條件。
這使得整個分而治之的方法變得更加困難。Siemens Digital Industries Software 產品管理總監 John Ferguson 指出,從歷史上看,熱能是用電網方法完成的。“你把事情分成小方塊,然后你能走多少取決于你擁有的硬件,你有多少內存,以及你愿意等待多長時間才能得到答案。這些是你要掙扎的事情。但這種電網還有另一個挑戰,因為熱本身就是一個問題。重要的是,你要檢查一下,看看你是否確實有一個散熱問題,除了重新設計之外,無法通過任何其他方式解決。
熱也會影響機械應力和電遷移/紅外壓降。“現在你遇到這種情況,你必須確保你使用的網格可以在這些不同的東西上以某種方式對齊,”弗格森說。“如果你要嘗試把它們加起來,你可以讓一個窗口與另一個窗口重疊一半。你是怎么弄清楚這些東西的?這令人困惑。這仍然是一個很大的挑戰。該行業正在努力擺脫網格窗口方法,做一些更全面的事情,這意味著更多地從方程方法看待它,并從真正的物理學角度思考問題。例如,溫度在哪里下降?正是由于這些原因,整個電網情況是該行業的一個挑戰。我如何知道要選擇的正確分辨率?它足夠準確嗎?它會與我需要的所有其他內容集成嗎?擺脫這種做法是重要的一步。
進化變化
在這個領域,解決方案最終會是什么樣子還有待觀察。艾特肯指出,今天將進行廣泛的實驗,并相信在某個時候,該行業將開始合并。Ferguson說:“即使看一下軟件包選項,過去也有相當少的軟件包,而這些軟件包的特點是封裝供應商。“所以你知道如果你把你的設計放在那里會發生什么。但現在有許多不同的封裝設計,即使你只限于硅中介層。人們用它們做了很多事情,也有很多方法可以把它們放在一起。關于哪一個更好,并沒有真正達成任何共識。這意味著,如果您是制造商,現在您不僅要為每個客戶,而且可能為每個設計提供定制服務。這又是在尋找,“讓我們盡可能地嘗試過度設計,這樣我們才能認為我們是安全的。但與此同時,要小心。
隨著其他材料的引入,將添加新問題。“你可以加入一些新材料,設計這些東西的人沒有很長的歷史,”他說。“根據你去的地方,你可以在文獻中找到一些關于其導熱性和抗拉強度的細節。但是,誰在進行測量以真正將這些東西撥入其中呢?他們改變了。你會得到一批氧化物,而下一批則有點不同。至少對于熱,我們將進行無網格分析。但是我們仍然有一個問題,那就是需要將其覆蓋在網格上,以便我將嘗試傳遞這些數據的另一件事,它需要在上游、下游以各種方式使用。歸根結底,有了這一切,我們行業一直以來的運作方式就是我們保護它。我們說,‘他們說這個東西對10%有好處。讓我們給一個 20% 的窗口來保證自己的安全。但這意味著你總是會把一些東西留在桌面上。
此外,早期做出決定也是一個挑戰。
“我們向架構詢問可以組合在一起的問題,”西門子的戴維斯說。“我有足夠大的包裹嗎?我有足夠大的散熱器嗎?我們行業一直以來的處理方式是預算和近似模型,因此,當您在設計系統中處于更高或更早的位置時,您就有了模型。有時,模型只是一個近似值,“我認為這個芯片會產生這個溫度,因此它會像這樣導電。但現在我們看到客戶問,’我建造了這個零件。我把它放在這個包里。新版本將有一些額外的驅動程序,我希望它們會產生大量的熱量。我的包裹夠用嗎?在我開始影響可靠性之前,我的散熱是否足夠?在你遇到其他問題之前,必須回答這個問題。電遷移是溫度的函數,因此,如果溫度(指數函數)比您預期的高 10 度,它可能會使您的壽命縮短 5 年。工程團隊希望更早地做到這一點,但他們沒有關于他們將使用的技術的信息,只能說,‘我們正在考慮這個問題’。
結論
可以肯定的是,如果設計師意識到所有這些挑戰,他們現在可以使用一些技術。但是,復雜的異構設計中有很多元素,這對設計團隊來說是一個更大的挑戰。
“他們可以從設備層面應用幾種不同的解決方案,”Lin說,“他們可以降低功耗,平衡功率密度,并可能巧妙地分配芯片和小芯片,使熱傳導路徑保持良好平衡,而不會引起任何高溫。在系統層面,我們看到很多冷卻解決方案說,“如果溫度太高,讓我們限制系統,讓它不工作,讓它休眠。我們還可以做一些像熱管理、電液體冷卻和強制對流這樣的事情。所有這些我們已經在系統生產中看到了。
審核編輯:黃飛
評論
查看更多