電子發燒友網報道(文/周凱揚)隨著摩爾定律逐漸放緩,芯片性能的提升已經越來越慢了,這一點大家從7nm到4nm的產品就可以看出,晶體管密度增加帶來的性能升級開始出現了瓶頸。廠商們為了繼續推陳出新,在近年來想出了不少新的方案,例如3D封裝、異構集成,甚至是繼續增大芯片面積等等。而如今光子集成芯片,尤其是光子集成計算芯片的興起又帶來了新的契機。
Lightmatter
目前鉆研光子集成電路的初創企業并不少,但他們的光子計算核心原理基本相同,打造一個用于通用矩陣乘法運算(GEMM)的光子矩陣,再集成DAC、ADC、跨阻放大器(TIA)和光電探測器(PD)等其他模擬和光電器件,來替代目前深度學習和科學計算任務中的其他ASIC硬件。
Lightmatter在集成度上已經做到了很高的水平,甚至推出了8“x8”的晶圓級光子芯片。Lightmatter給出的性能指標也相當夸張,配有4個Envise光子芯片的服務器里,同時運行BERT機器學習模型,Envise服務器能實現比英偉達DGX-A100高三倍的推理性能和7倍以上的能效比。
Lightmatter在技術博客中介紹了其原理。高速DAC負責將多位數字信號轉換成多電平模擬信號,再通過光調制器轉換為光矢量輸入。通過光子矩陣的計算后,輸出光矢量經過光電探測器、跨阻放大器和ADC,重新回歸數字信號。
Lightmatter強調高分辨率的DAC功率較大而且會占用較大的芯片面積,所以它們選擇了中分辨率的DAC來保證性能。而且為了滿足TIA在高動態范圍和大帶寬上的要求,反饋電阻不能特別大,TIA之后也要加一個額外的電壓放大器。
曦智科技
去年年底,與Lightmatter可以稱為“同門師兄弟”的曦智科技也發布了旗下首個產品,高性能光子計算處理器PACE。在PACE中,單個光子芯片集成了超了一萬個光子器件,時鐘速度達到1GHz。根據曦智科技的說法,PACE在運行特定循環神經網絡時,速度可以達到高端GPU的數百倍。
PACE包含了一個64x64的光學矩陣,由集成硅光芯片和CMOS芯片3D堆疊而成,從Cadence發布的視頻來看,曦智科技的3D封裝應該是基于Cadence的Integrity 3D-IC和Innovus平臺打造與設計的。
曦智科技強調,靠光子矩陣的光子計算和光子互聯,不僅可以實現更強大的并行能力和更低的延遲,能效上也與電子IC相當,工藝要求卻不高。所以對于數據中心等場景來說,是一個替代GPU的低成本高性能方案。
大規模光子集成芯片專項
從以上兩家公司的成果可以看出,對于光子集成電路來說,最重要的一個是計算,另一個是互聯,前者保證了性能,后者保證了擴展性和延遲。要攻克這些目標無疑需要更大的投入和研究,隨著國外光子集成的研究已經起步,我國也早已認識到這一點,并在2016年啟動了“大規模光子集成”芯片這一中科院戰略性先導科技專項。
該專項分為三個目標,短期目標是在5年內,先解決目前集成電路面臨的訪存墻和I/O墻問題,互聯交換帶寬要達到3.2Tbps;中期目標則是利用大規模并行架構的光電混合計算芯片實現5萬億次矩陣乘加計算的處理能力,并以此開發深度學習計算機;長期目標則是面向未來的量子計算,推出超大規模的片上網絡,在特定算法上性能徹底超過電子計算。
很明顯,這樣一個專項任務是一個復雜的工程,所以也分配給了半導體所、上海微系統與信息技術所、西安光學精密機械所以及計算技術所來合作完成。而該專項現階段的結果已經達到了國際領先的集成規模,實現了單片集成15408個基礎元件的16x16光學交叉矩陣芯片。
結語
除了光子集成芯片在設計上的創新攻關外,要想實現大規模集成,制備加工其實同樣關鍵。目前雖然一些光通信和傳感設備上的光子集成芯片已經借著成熟的CMOS工藝量產,但如何能在磷化銦或硅光器件上更進一步,將大規模的光子集成芯片制造和量產的成本與難度降低,或許才是這些光子集成芯片公司在供應鏈上最該關注的問題。
-
芯片
+關注
關注
454文章
50430瀏覽量
421877 -
數字信號
+關注
關注
2文章
957瀏覽量
47516 -
光器件
+關注
關注
9文章
94瀏覽量
15750
原文標題:光子芯片的集成度已經到哪一步了?
文章出處:【微信號:elecfans,微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論