近年來,半導體工藝水平的不斷提升使芯片性能得到顯著增強,但是摩爾定律正在逐漸逼近物理極限。同時,隨著CPU、GPU、FPGA等高性能運算芯片性能的持續提升,AI、5G、云計算等應用相繼興起,各類應用場景對高帶寬、高算力、低延時、低功耗的需求愈發強烈。
高昂的研發費用和生產成本,與芯片的性能提升無法持續等比例延續。為解決這一問題,“后摩爾時代”下的芯片異構集成技術——Chiplet應運而生,或將從另一個維度來延續摩爾定律的“經濟效益”。
Chiplet也稱作“芯?!被颉靶⌒酒?,它是將原本一塊復雜的SoC芯片,從設計時就按照不同的功能單元進行分解,然后每個單元選擇最適合的制程工藝進行制造,再通過先進封裝技術將各個單元彼此互聯,就像“樂高積木”一樣封裝為一個SoC芯片。
Chiplet的優勢可以歸結為幾個方面:
1)大幅提高大芯片良率。近年來,隨著高性能計算、AI等方面的運算需求,集成更多功能單元和更大的片上存儲使得芯片不僅晶體管數量暴增,芯片面積也急劇增大。芯片良率隨著芯片面積的增大而下降,掩模尺寸700mm2的設計通常會產生大約30%的合格芯片,而150mm2芯片的良品率約為80%。因此,通過Chiplet設計將大芯片分成更小的芯片可以有效改善良率,同時也能夠降低因為不良率而導致的成本增加。
2)降低設計的復雜度和設計成本。因為如果在芯片設計階段,就將大規模的SoC按照不同的功能模塊分解為一個個的Chiplet,那么部分Chiplet可以做到類似模塊化的設計,而且可以重復運用在不同的芯片產品當中。這樣不僅可以大幅降低芯片設計的難度和設計成本,同時也有利于后續產品的迭代,加速產品的上市周期。
3)降低芯片制造成本。一顆SoC中有不同的計算單元,同時也有存儲、各種I/O接口、模擬或數?;旌显?,這其中主要是邏輯計算單元通常依賴于先進制程來提升性能,而其他的部分對于制程工藝的要求并不高,有些即使采用成熟工藝,也能夠發揮很好的性能。所以,將SoC進行Chiplet化之后,不同的芯??梢愿鶕枰獊磉x擇合適的工藝制程分開制造,然后再通過先進封裝技術進行組裝,不需要全部都采用先進的制程在一塊晶圓上進行一體化制造,這樣可以極大的降低芯片的制造成本。
簡而言之,Chiplet旨在將芯片性能與芯片工藝解耦,從而解決芯片設計中面臨的復雜度大幅提升問題,以及先進制程中面臨的高成本、低良率問題。
在多種優勢因素及市場趨勢驅動下,AMD、臺積電、英特爾、英偉達等芯片巨頭以及眾多國內外相關企業嗅到了市場機遇,近年來開始紛紛入局Chiplet。
在這個過程中,互連成為Chiplet走向的決定因素之一。
Chiplet互聯現狀
多年來,業內一直在尋找一種“真正的互連”,以便在芯片組中實現從裸片到裸片(Die-to-Die)的通信,更好的完成數據存儲、信號處理、數據處理等豐富的功能。如何讓芯粒之間高速互聯,是Chiplet技術落地的關鍵,也是全產業鏈目前面臨的一大全新挑戰。
芯片設計公司在設計芯粒之間的互聯接口時,首要保證的是高數據吞吐量。另外,數據延遲和誤碼率也是關鍵要求,還要考慮能效和連接距離。
到目前為止,已經成功商用的Die-to-Die互連接口協議多達十幾種,主要分為串行接口協議和并行接口協議。串行接口及協議有LR、MR、VSR、XSR、USR等SerDes串行互連技術,PCIe、NVLink,用于Cache一致性的CXL、CCIX、TileLink、OpenCAPI,以及中國Chiplet產業聯盟(CCLL)推出的ACC接口標準等;并行接口及協議有AIB/MDIO(Intel)、LIPINCON(TSMC)、Infinity Fabric(AMD)、OpenHBI(Xilinx)、BoW(OCP ODSA)、INNOLINK(Innosilicon),以及用于存儲芯片堆疊互聯的HBM接口等...
比較而言,串行接口一般延遲比較大,而并行接口可以做到更低延遲,但也會消耗更多的Die-to-Die互連管腳,而且因為要盡量保證多組管腳之間延遲的一致,所以每個管腳不易做到高速率。
可以看到,這些芯片巨頭們在積極探索Chiplet技術,但同時大家又各自為戰,推動自己的高速互聯協議標準。
目前市面上部分現有互聯標準對比如下:
有觀點指出,不同工藝、功能和封裝的芯片之間沒有統一的通信接口,會造成嚴重的資源浪費。
對此,清華大學交叉信息研究院助理教授、北極雄芯創始人馬愷聲向筆者表示,在不同應用場景中Chiplet的組合形式可能是多樣化的,例如需要傳輸的數據形態及特點、對延遲/誤碼等指標的容忍度、對封裝的要求、量產成本的考慮等可能均有所不同,因此Die to Die接口作為芯粒之間實現數據傳輸的“橋梁”,可能在不同應用場景中亦有不同的優化方向。
他指出,我們看到業界所謂“各自為戰”的狀態,其實更本質反映的是不同產品場景互聯的差異化需求;比如蘋果在M1/M2 Ultra上自研的Ultrafusion方案、英偉達的NVLink方案等等都是芯片廠商與封裝廠商共同深度研發的成果,但目前也均以滿足自身產品性能需求為首要目的。不同的互聯標準,在信號模式、傳輸速率及帶寬、封裝規格等方面均有所不同,背后均體現了在特定領域優化的方向。
在眾多互聯標準中,Intel提出的通用Chiplet互聯標準UCIe成為行業中比較受關注的焦點。
對此,筆者在前面文章《Chiplet,邁出重要一步!》中有過介紹:UCIe旨在芯片封裝層面確立互聯互通的統一標準,以幫助在整個半導體行業建立一個開放的小芯片生態系統。
UCIe是一種分層協議,它指定了物理層、die-to-die適配層和協議層:
UCIe標準的推出旨在助力Chiplet從“清談”向“實操”邁進,從“各家各戶自說自話”向“組隊廝殺邁進”。希望巨頭們合力搭建起統一的Chiplet互聯標準,讓終端使用者打造SoC芯片時,可以自由搭配來自多個廠商生態系統中的小芯片,加速推動開放的Chiplet平臺發展。
但從目前實際進展來看,幾乎所有基于Chiplet設計的共同點是它們都是在一家公司內完成的。這與每個人都希望能夠從小芯片商店(Chiplet store)的貨架上挑選他們想要的小芯片,然后通過SiP封裝來工作的理想情況相差甚遠。
從行業現狀來看,無論是UCIe,還是其他互聯方案,仿佛都未能承擔起Chiplet互聯接口標準化“橋梁”的角色,小芯片商店的夢想還很遙遠。
北極雄芯在接受筆者采訪時也表示,UCIe標準協議推出的現時意義在于兩個方面:一是眾多一線大廠的入局推動后摩爾時代技術路線的走向,二是為眾多芯片設計廠商在Chiplet架構上帶來了一個可選的方案。初期的助力效應是明顯的,我們已經看到一些企業從UCIe接口IP、封裝方案等不同維度開始投入研發,但產業生態的成熟需要歷經必不可少的周期迭代。
同時,基于UCIe依賴先進工藝、互連距離約束大等限制因素,UCIe可以在小圈子、限定場景內有一定的統一性,但難以直接適用于整個Chiplet生態上。
馬愷聲指出,從目前現狀來看,業界圍繞UCIe開展的工作少之又少,基本還是處于“各自為戰”的狀態,一方面是目前沒有成熟的IP,就算有也是部分海外IP廠商只有5nm和3nm現成的IP;另一方面本來做Chiplet的公司也不多,就算是Intel自家的服務器芯片Sapphire Rapids,也是內部閉源的并口,以及今年在Hot Chips上展示的硅光互連芯片,與共封裝的光接口互連是基于他們內部更成熟的AIB方案。
可見,無論是基于什么標準,我們下一步需要看到可用的接口方案逐步推出,以及越來越多的芯片設計公司把這些標準下的接口用起來,才能真正形成行業互聯規范。
Chiplet技術的關鍵除了互連,還在于封裝。
隨著Chiplet技術的發展終究會使小芯片間的互聯達到更高的密度,要應對先進封裝功能和密度的不斷提升,散熱、應力和信號傳輸等都是重大的考驗。目前頭部的IDM廠商、晶圓代工廠以及封測企業都在積極推動不同類型的先進封裝技術,以搶占這塊市場。
在芯片尺寸不斷增大、架構變得復雜的情況下,封裝結構由原先的二維發展至三維。按封裝介質材料和封裝工藝劃分,Chiplet的實現方式主要包括以下幾種:MCM、2.5D封裝、3D封裝。目前臺積電擁有CoWoS/InFO、英特爾擁有EMIB、Fovores 3D等,Chiplet使用的先進封裝多種多樣,且新的封裝形式和結構還在不斷演進。
但是在高性能、短距離互連領域,一般要通過Interposer(中介層)或者Silicon Bridge(硅橋)進行互連,封裝成本比較高。
例如,在片間互連中的高線密度可能要求使用支持高線密度的基板或橋接技術。高帶寬存儲器(HBM)的啟用可能是這一趨勢的最好證明——因為HBM只能與ASIC集成在同一個封裝中,而且此時只能在2.5D的硅中間層配置中集成。
雖然硅基封裝技術已經發展為批量制造解決方案,但成本和復雜性可能會阻止它們成為大多數低端應用的解決方案。
Chiplet互連技術,迎來新突破
迄今為止,業界領先的小芯片互連需要先進封裝和昂貴的硅中介層。
而Eliyan憑借其Nulink技術,可以為die-to-die互聯在各種封裝襯底上提供功耗、性能和成本的優勢方案。因為這種PHY接口可以讓不同的裸片直接在有機襯底上實現高速互聯,而不必采用CoWoS、EMIB或硅中介層等昂貴的先進封裝方式,在降低成本的同時加速產品制造周期。
左邊是當今常見的使用硅中介層的Chiplet互連方法;右邊是Eliyan的NuLink技術,可以以卓越的帶寬實現小芯片互連,而無需硅中介層。
可見,NuLink通過簡化系統設計降低了系統成本。更重要的是,Eliyan可以增加芯片之間的距離,對于生成式AI,NuLink為每個ASIC提供更多的HBM內存,從而提高了配備HBM的GPU和ASIC的內存密集型應用程序的性能。
Eliyan最近還展示了其NuLink PHY的第一個工作芯片,該芯片采用5nm標準制造工藝實現,可以讓Chiplet與不同工藝的裸片實現混搭,不需要硅中介層等先進封裝技術。
NuGear消除了對大型硅中介層的需求
該芯片符合現有的UCIe規范,并且能夠超越當前規范的范圍,以40Gbps的速度運行,在標準有機封裝上以130um節距提供超過 2.2Tbps/mm的帶寬,同時滿足嚴格的功耗和面積要求目標。高面積效率的NuLink PHY受到凸塊限制,一旦在可用的標準封裝技術上以更精細的凸塊間距實現,利用其創新的干擾消除技術,可以提供高達3Tbps/mm的傳輸速度。
Eliyan CEO Farjadrad指出:“如今業內的一大需求是能夠獲得足夠大的中介層,這樣就可以構建越來越大的GPU或TPU,并帶有大內存?!?/p>
有業內人士表示,硅中介層的最大尺寸約為3300mm2,考慮到處理技術的尺寸限制,現在每個SoC只能使用6個HBM3塊。而Nulink有機基板的尺寸可以達到原來的三四倍,同時提供相同或更好的功率效率和帶寬。這導致成本更低、制造速度更快,每個封裝的計算能力更強。
例如,NVIDIA可以提供具有40GB和80GB HBM兩種型號的A100 GPU,并表明較大的內存可提供3倍的性能優勢。利用NuLink可將HBM數量增加兩倍,達到160GB。假設AI訓練中的內存優勢呈線性擴展,采用NuLink的性能將再次提高三倍。
與此同時,NuLink還為HBM DRAM提供卓越的散熱性能,消除了HBM-ASIC之間的熱串擾,允許ASIC時鐘速度提高20%,以及更簡單/低成本的冷卻。
總結來看, Eliyan消除了對先進封裝的需求,例如小芯片設計中的硅中介層尺寸有限、成品率低、成本高、難以冷卻、供應鏈有限等所有相關限制和復雜性。NuLink技術能夠實現DRAM擴展、節約材料成本、提高產量并縮短芯片上市時間等優勢。
Eliyan認為,其小芯片互連產品可以超越英特爾和臺積電等芯片巨頭的先進封裝技術,或者有望成為英特爾、臺積電的最佳選擇,從而實現下一波高性能芯片架構。NVIDIA、Intel、AMD和Google等公司可以授權NuLink IP,或從Eliyan購買NuGear小芯片,以消除硅中介層尺寸限制帶來的性能瓶頸,使他們能夠實現更高性能的AI和HPC SoC。
目前Eliyan已從英特爾投資和美光資本等投資者那里籌集了4000萬美元的A輪融資,用于開發和提高NuLink芯片間互連技術的產量。
北極雄芯對于Eliyan的創新技術表示認同,從大趨勢來說,這個技術是很直觀且正確的方向之一,由于帶寬=線數×線速,當線的速率較高時,就可以減少對互連線密度的需求,從而可以從2.5D的封裝要求切換到2D上。北極雄芯的D2D互連也是這樣的出發點。
但馬愷聲也強調:“針對Eliyan的方案也還是有額外的考慮。HBM傳統是下圖的方式:基于HBM PHY,然后在Interposer上與HBM Stack互連,互連具體位置在HBM Stack底部的一顆Base Die,上面有HBM PHY與SoC芯片的PHY互連。由于互連線數多達1024根線,所以在HBM方案誕生時就采用Interposer 2.5D的封裝來提供40μm級別的互連密度。而當采用2D封裝,必然需要增大線速來換取更低的線密度需求。但速率的增加對于PHY的設計會引入顯著的額外延時和能耗。”
因此,Eliyan的方案是維持了帶寬的性能,但是犧牲了HBM低延時、低能耗的優勢。此外,它這種方式需要重新設計HBM的Base Die,這對于方案的推廣也是存在難題。
綜合來看,無論是哪種互聯技術,都各有優劣,都需要根據實際需求來進行設計和選擇。因為在實際應用領域中,不同場景的數據傳輸特點帶來對所采用接口技術及封裝技術的較大需求差異。例如:
CPU等通用計算場景中,數據傳輸具有隨機性高、數據流結構差異大、緩存一致性要求高等特點,因此在CPU Chiplet集成中往往極為重視對延遲等指標的優化,采用并口傳輸方案,大規模走線較為依賴先進封裝技術的配套支持。
在GPGPU等面向服務器領域的通用并行計算場景中,數據傳輸具有單次量大、數據流結構可預知性高、可提前搬運預載等特點,因此在Chiplet集成中需要重點對帶寬等指標進行優化,可采用并口或串口方案,對先進封裝亦有較高的依賴。
而在特定AI加速場景中,又需綜合考慮成本敏感度、作業環境等各方面要求,采用不同的接口技術及封裝方案以滿足終端用戶的差異化的需求:如以智能駕駛領域為例,先進封裝方案往往并不滿足車規要求,而且量產成本也較高,在采用Chiplet異構集成時往往需考慮在成熟封裝方案基礎上反過來優化相應的D2D技術。
馬愷聲強調,Chiplet互聯技術應當基于場景需求及供應鏈成熟度去不斷迭代升級,并不一定是追求一個大一統的標準。Chiplet發展的過程中,產業里面會有不同的公司從芯粒設計、標準開發、封裝技術等角度參與進來,最終需要真正解決下游商業痛點問題,又能兼顧性能、成本等各方面因素,自然就成為了行業標準。
而在這個過程中,也給國內企業帶來了新的發展機遇,近年來也有廠商在此展開動作。
比如:芯動科技推出了國產自主標準的INNOLINK Chiplet IP和HBM2E等高性能計算平臺技術,支持高性能CPU/GPUINPU芯片和服務器;為了讓IP更具象、更靈活的被應用在Chiplet里面,芯原提出了IP as a Chip (laaC) 的理念,旨在以Chiplet實現特殊功能IP從軟到硬的"即插即用”,降低較大規模芯片的設計時間和風險。
此外,早在2020年北極雄芯即與國內上下游共同發起了“中國Chiplet產業聯盟”,聯盟在2023年初推出了基于國產封裝供應鏈優化的《芯?;ヂ摻涌跇藴省?,旨在為GPU、AI、大型SoC等高性能異構集成芯片提供高性能、低成本的互聯方案,目前首個接口已經回片測試成功。
對于國內企業應該如何更好地參與Chiplet產業生態,北極雄芯認為,國內企業應基于國內較大的市場需求,立足于“自主可控”供應鏈的Chiplet商業落地模式更加符合現實客觀環境。在產業上下游共同推動國內Chiplet產業生態的建立,而在這個鏈條中Chiplet芯片設計公司的作用至關重要。設計公司最貼近下游客戶的需求,能夠綜合考慮下游場景的性能、功耗、成本敏感度等因素,準確的定義各類“芯?!碑a品,從而反過來與上游IP廠商、晶圓廠商、封裝廠商、基板廠商共同推動供應鏈迭代升級,實現“自主可控”的國內Chiplet產業生態,更具有現實意義。
結語
據Gartner數據統計,基于Chiplet的半導體器件銷售收入在2020年僅為33億美元, 2022年已超過100億美元,預計2023年將超過250億美元,2024年將達到505億美元,復合年增長率高達98%,市場空間巨大。
基于Chiplet的異構集成芯片技術代表了“后摩爾時代”復雜芯片設計的研制方向。Chiplet這種將芯片性能與工藝制程相對解耦的技術為集成電路技術的發展開辟了一個新的發展路徑。
但作為一種新興技術,Chiplet當前正處于發展階段,能否成為一種新的IP產品和商業模式,甚至拯救摩爾定律的救星,關鍵就在于業界能否達成統一的Chiplet互聯標準,建立起來一個開放和標準化的Chiplet生態。
在這個過程中,中國Chiplet學術界和產業界應抓住機會,在技術研發和標準制定方面加大投入,盡快掌握核心技術。此外,芯片行業參與者需要避免單打獨斗,應注重生態建設,早日建立業界接受的基于Chiplet的異構集成技術標準,以便在未來國際競爭中占據一席之地。
-
云計算
+關注
關注
39文章
7732瀏覽量
137195 -
半導體工藝
+關注
關注
19文章
107瀏覽量
26219 -
chiplet
+關注
關注
6文章
416瀏覽量
12558
原文標題:Chiplet,怎么連?
文章出處:【微信號:IC學習,微信公眾號:IC學習】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論