前言
臨近博士畢業,重復我讀博前調研過程,經過思考后最終決定還是堅持走EDA。調研期間,我通過各種方式(工作面試、與老師/前輩/朋友約談、實地溝通等)走訪了約20家國內數字方向的超大規模集成電路的企業、以及它們的不同部門、不同層級的同事,這些企業包括主要的芯片設計廠商、EDA公司以及初創(偏硬件加速器)企業,部門從最前端到最后端涉及異構加速算法(算子)研發、編譯器研發、架構設計、驗證生態、EDA(布局布線、原型設計、版圖優化、仿真、計算光刻、良率優化)等。這些企業和同事在交流時都很重視與很真誠坦率,闡述了很多我不了解的現實問題和教會了我很多不曾深刻理解的概念、分析思路、與操作。為此我非常感激。聊下來不容易,我想未必每個人都有我的時間經歷和莫名執念要這么搗鼓。因此我想這樣一輪交流,放在我的腦子里,不如分享出來,或許對后面將來投入這個行業的學弟學妹或者關心這個行業的人們或許有用。作為一個臨近畢業的學生,我很關心中國集成電路路在何方,所以提供一些主觀的信息和想法。未必正確準確,歡迎糾正和批評。或許用處不大了,但也算有一分光與熱,因為我始終相信只有核心科技掌握了、有強力而普遍的高附加值產業,才能提高中國老百姓們的生活水平。希望二三十年以后的國人回首,不會看著我們現在的選擇哭笑不得吧。
為了保護國內產業、對應企業和部門的利益,后面都不會提及/對比任何具體國內公司的名字、技術內容、發展方向、數字指標,只用碎碎念的形式來討論一些我所看到現象和想法。
1.行業定位分布:怎樣才算卡脖子
“卡脖子”是集成電路產業里面的常見關鍵詞,幾乎每一個相關企業都會提及。就如前言中異構加速算法研發、編譯器研發、架構設計、驗證生態、EDA(布局布線、原型設計、版圖優化、仿真、計算光刻、良率優化)等環節,是涉及芯片各個環節的問題,從前往后可以歸類為:怎么用芯片、怎么設計芯片、怎么生產芯片。涉及這三個方面的企業數量和體量是依次遞。這是可以理解的,因為用芯片用到極致的人,會關心設計芯片的好壞,而設計芯片到極致的人就需要關心生產是否可行。尤其是主營業務核心優勢在于其硬件電路的企業(如通信、數據中心、安防等),就會很關心芯片設計與生產。
1.1 芯片的生態
用芯片難點在于生態,一塊芯片扔給一個普通人是用不起來的,芯片需要在軟件的控制下,通過與外部其他電路和系統整合,才能發揮他們的極致性能。這不是一個企業在自己努力下能短期解決的,這需要聯合上下游廠商和用戶來推動的:
(1) 在硬件生態中,例如一個CPU芯片,用在什么場景、和哪些其他芯片協同組合、怎么連接他們構成系統,能夠讓他們穩定工作且盡可能高效。
(2) 在軟件生態中,例如一個CPU芯片,我們通常要生成二進制文件(軟件)才能讓CPU執行,而為了獲得二進制文件,工程師們需要寫程序代碼如C/C++/Java/Python/CUDA/Go等等各種語言然后利用編譯器“翻譯成”二進制文件,工程師們在成長與學習過程中已經養成了“習慣”,更改是很困難的,就像我們很難說漢字博大精深就讓外國人用一樣。描述方便、翻譯成底層指令效率高則是軟件生態難的地方。
只要這些做的不好,紙面數據多么優秀,都很難獲得大量訂單。就像單反相機如此優秀的攝影性能,但是很難在市場總量上競爭過手機相機。但是難用,也不至于用不了,同時加大力度(成本)、長期推廣,通常是可以解決的。生態需要的是時間,需要的是行業的齊心、互利與共識。但是當所有人都擔心自己的付出被別人薅羊毛了,怎么辦呢?
1.2芯片的本身設計
設計芯片會影響芯片的性能、穩定性和成本,例如CPU/GPU/AI芯片跑的快慢,似乎是可以容忍的和通過價格進行權衡,但不會直接沖擊國民生計。而且經過行業長期積累和知識人力的流動(例如初創公司/團隊靠挖先進企業人才推動項目進展以及那么多大牛跳槽來來回回),其實普遍的設計/優化思路在行業內是有大致思路的,關鍵在于細節罷了。許多很“夢幻”的名詞與概念實際上已經出現了十多年了。另外目前除了限制名單內的部分企業,大多數企業也大量(數量與金額)外購IP核(可以比喻成:別人設計好的“小模塊設計”)。所以直觀討論下來,芯片設計或許小步慢跑、給些時間、給些資金,一點點追上先進水平就好了,卡脖子似乎并不嚴重(主要是其實很難卡住設計思路的脖子的,因為基本也沒人會把設計優化思路“租”或“賣”),國產替代主要意義在于國防軍工、國計民生行業,同時從外國企業搶回來部分經濟利益、避免被遠遠拋下出現突然“斷糧”的嚴重問題。不過芯片設計優化追趕過程中,我們跑,別人也跑,往往需要有根本性的、原理架構層面的突破才能超越。因此大概設計需要的是人的靈感、知識(腦洞),短期內解決方案可以天價花錢挖人、買IP,長期內解決方案還是需要培養人。
1.3芯片的生產工具與設備
生產芯片與上面兩者的區別是,我感覺這個卡脖子是更實在的,因為它直接決定了國內有沒有自立能力,不管你多會種糧食,種子直接不賣給你。而困境上看似乎是生態與設計的困境的整合,缺人才、缺時間、缺生態/引導。
(1) 缺人,相對于其他軟件、硬件方向,國內就沒多少芯片實際生產與工具鏈有關的研究實驗室,畢竟是小眾方向。作為備份存在的一些項目,真的長期是當成備份,不會停止支持,但也不會鞭策發展。如果是備份的氛圍,是不太可能有發展動力。雖然是小眾方向,理應不至于人才少得離譜。3年前回本科學校與老師交流,老師列了一個單子,以數字電路為例子,在寫完Verilog(一種硬件描述語言)后,每一個環節有哪些國內的公司/學校實驗室/老師在做,我震驚于仿真器、邏輯綜合這么靠前端的內容,竟然也如此少關注,何況后端布局布線和生產相關環節。
(2) 資金,我個人覺得相較于芯片設計企業動輒數十/百億,是不是特別缺,除了涉及底層材料與設備研發會有高額的配置需求外。主要是風險高,收益周期長,專業人員少,導致資金投入的“謹慎”。
(3) 缺時間,涉及到底層由于工具鏈/生產原理的復雜性,需要大量的磨合與試錯,每一輪迭代都是季度/年月計數。缺生態/引導,工具鏈/生產鏈是“鏈條”,是需要對接、認證、信任的。一個新生的某個工具/設備,沒有辦法對接入鏈條是沒法運作的,這個最初的嘗試需要上下游分別承擔代價來實現對接的,而并不是每個上下游環節都愿意承擔這些風險和成本的。認證與信任,很多時候是一個正反饋,用的人多了,才能有更多人“敢”用和“愿意”用,更多人用了,工具/設備才能不斷優化。感覺國內的工具與設備鏈條,很難再走SCM三大家EDA工具廠商或ASML的幾十年收購的形式來完成生態鏈條構建了,或許在最開始就要把這些鏈條計劃好分工、標準對接好、同步發展,攪動幾下,才能讓這個發動機自己動起來。
1.4小結
1.1中的生態目前國內每個芯片設計公司都比較排外,沒有協商一致、協同共享的趨勢,哪怕所謂的技術標準,認可度與參與度不高,對于1.3中的生產工具與設備,主要芯片設計公司考慮的還是反正被封閉制裁的又不是我們。所以導致1.2中的芯片設計突破緩慢且實際還是牢牢地被把控在外部的溫水煮青蛙的環境中。
2. 公司類型:春秋戰國諸子百家還是晚唐蕃鎮割據?
隨著2019年的打壓刺激與2021年的芯片供不應求,國內集成電路迅猛發展,各類企業雨后春筍。對于我個人這個方向的從業人員,自然是喜聞樂見。從我的角度來看,芯片設計公司可以分為傳統集成電路廠商、互聯網/手機/車企造芯、創業公司,而芯片工具/生產鏈公司我主要溝通的是創業公司。
2.1 傳統集成電路廠商
傳統集成電路廠商通常就是以來硬件本身獲得企業利潤的,一旦硬件供給不能延續會有重大生存困難,沒有硬件不行。它們大部分都是經過了十到二十年的發展,自成體系,鏈條與產業方向也似乎比較明確,不過在和一些企業的同事溝通時,是能夠體會到這些廠商中的長期方向上的一些迷茫氛圍(如技術發展路線、產品的應用鋪展等等)。企業特點上看:
(1 )這些企業有非常寬的產品系列
(2) 有相對完善的半導體/超大規模集成電路研發流程、軟硬團隊配置和風險管理機制,部門內部分工細化,同時對接的上下游生態環節也比較多而全面
(3) 不過“部門墻”會比較厚重,部門之間的信息傳遞和協作的成本會比較高(如軟硬件部門之間),某些硬件的軟件層面的“可用性”/“便利性”還有可以提高的地方,某些硬件的設計可能會讓后期介入的軟件上層難以下手。畢竟普通用戶可能沒有那么多時間與知識背景去充分發揮某些芯片的威力,或許這是國內傳統集成電路廠商可以進一步優化的地方。
2.2 互聯網/手機/車企造芯
互聯網/手機/車企造芯則是通常為了本公司的業務的,因為這些公司的自身產品中,涉及到硬件(如服務器集群CPU、網卡、GPU、手機SoC、車用MCU等),這些芯片本身不是這些公司的主要利潤來源,而是用來保障自身的某些凈利潤率高的主體業務,避免受到上游壟斷地位供應商的完全控制。對于它們而言,喪失某些硬件供給不會馬上對主體業務出現重大沖擊,有硬件比沒有好。因此企業特點上看:
(1) 對硬件部門的寬容度稍微更大一些
(2) 同時有相對較強的軟件團隊支持(也有很強的軟件需求),因為此類企業/部門通常會有大量開發者會在上層使用芯片,因此軟件效率影響很大,
(3) 因為容錯程度更高,會進行一些靈活大膽的嘗試
(4) 但組織架構與項目管理不如傳統廠商一樣穩定和長遠。這些廠商通常是最近10年內開始關注集成電路產業,相應部門規模也不算非常大,初期通過從成熟的集成電路傳統廠商汲取人才實現起步,后期慢慢針對主體業務提出定制化的解決方案、建立內部品牌、積累自身人才,然后慢慢實現內部的技術迭代循環。
2.3 創業公司
上述兩類公司短期內變化應該不大,貢獻度與發展步伐也比較明朗的。創業公司方面我分成了設計公司(5家)與工具鏈公司(8家)進行溝通(生產鏈涉及設備的我還不了解,也沒有太多人際交集,因此沒有沒能實現相關的溝通學習)。
2.3.1 創業公司:芯片設計方向
這5家芯片設計公司主要都是最近3~4年成立的,在“估值”上達到了數十億,而目標主要都是各類“算力”,都配備了從生態計算庫、編譯軟件、軟硬協同、架構、RTL設計、驗證、物理實現、高頻接口、先進工藝等一系列部門團隊。這些公司的出現,能填補傳統廠商在細分領域的部分不均衡,同時更專注地培育某些方向的人才隊伍。此外可以吸引一些投資到這些領域,以及作為中轉機構,把社會資金資源進一步向研究院校傾斜轉移。針對這些設計公司,我主要思考的是兩個問題。
第一個問題,從產品定位與優勢定位上,我個人覺得是高度同質化,也是我比較憂心的部分。我想芯片內部架構的突破會才能有絕對的優勢,其余部分我認為大家實力沒有太大差異,另外國內高算力通用芯片和專用芯片早已有多年的相應企業,究竟新生企業優勢在哪呢?而在交流中我談及同質化問題如何解決時,主要獲得的回應可以分為3類:
(1) 資本更雄厚,足夠大規模招人與IP組合購買;
(2) 有特定客戶群體支持,某些在建數據中心集群說好了會買芯片板卡;
(3) 強大的團隊,執行領頭為某些先進企業的管理層。
這三點并沒有談及架構的突破和領先優勢,溝通中的內容似乎只是延續部分執行領頭過去以往的技術路線,結合一些現成IP完成初始迭代,當然也有看可能部分交流對象主要從事代碼開發工作或者出于涉密考慮,并沒有提及架構優勢。(1)中的資本愿意出錢是因(2)與(3);(2)的操作看起來更像是附屬于某些上市公司的硬件子公司,很大概率上是不能促進芯片生態的構成的;(3)有些許希望能帶來架構突破,但除了很強的大腦,實現上還是需要底下成熟的團隊解決,當然成建制的挖人也是一個辦法,但是其實并沒給國內產業突破帶來很大變化,只是一群人換了一個地方工作罷了,另外隊伍出現“混編”時,如何避免風格與決策上的沖突也很有挑戰。因此(2)(3),似乎并不能解決生態與實現短期突破,而生產問題在這些企業看來目前似乎還不是主要困擾,因為目前產量都非常低。
第二個問題是,我個人主觀覺得5年的短期內的“算力”不足不太可能靠芯片設計解決,畢竟這么多年AI芯片一波一波地出現每個性能都比別人“高2~10倍”,很多時候似乎是文字/數字游戲(如強定制化、測試基準不一致、相關產品并外部不能容易獲得)了。我個人覺得解決算力在5~10年內可能還是依賴量產,一方面需要協調設計從而提高良率,另一方面需要的是Fab如臺積電、中芯國際開大馬力,生產量提高了,成本可以攤開,更便宜、更大量則更有利于生態建立。但在臺積電、中芯國際的有馬力有限的5~10年內,先進工藝的產能肯定還是會被蘋果/NVIDIA / AMD/高通等大需求訂單填滿的,另外一旦有突破,開始怎么確保不會被外部勢力從生產一側源頭打擊?另外有點擔心,企業可以2B可以2C可以2VC,但是涉及重要產業還是希望國內能夠穩扎穩打,而不是“高舉高打”。因為這些壓根不是“賽道”的問題,而是“責任”的問題。
2.3.2 創業公司:芯片設計工具方向
這8家工具鏈方向的公司的大致業務分別:4家涉及后端(ASIC/FPGA布局布線),5家涉及前端驗證加速(軟件仿真、硬件仿真、其他用于驗證的工具與IP庫),2家涉及偏更后端(布局布線后的環節),注意部分公司的業務有多個。因為時間關系還沒找邏輯綜合相關的企業溝通學習。而這些企業的誕生,部分是院校轉化、部分是某些硬件公司的軟件工具子公司、部分是原本國外領先的EDA公司的團隊回國創業。另有有些創業公司是提供架構或描述層面的流程或設計的自動優化方案,因為我主要關心邏輯綜合與其之后的環節,所以并未進行溝通。溝通上有一種感受,就是工具鏈/設備鏈的初創團隊大多很有使命感與情懷。
2.3.2.1 前端驗證
從創業方向上看,驗證(Verification)加速是明顯多一些的,從我溝通中了解到的信息看,原因可能可以分為四個方面:
(1)從業務實現上來看,驗證對其他環節的工具鏈比其他工具鏈方向的依賴度低一些,驗證方向的開源社區相對更活躍與普及,相關工具與代碼的基礎容易構建;
(2)從可行性與風險上看,主流EDA公司如三大家或Altera/Xilinx,提供了通用工具和IP庫,而主要創業公司通常需要做的是進一步優化效率速度與提供更加定制化的服務;
(3)從用戶角度上看,對于前端/架構的設計,驗證的主要原理、方式、指標都是可知可控的,同時介入研發流程的難度比其他環節要低,第三方創業公司可以提供更貼近的定制化服務;
(4)基于(1)-(3)上面三點,原理直觀、風險可控、收益通常只要大力就能出奇跡,因此對于投資人也更為友好
從交流過程中看,偏硬件的驗證方向初創企業,與他們匹配的軟件的大規模項目管理、可用性與效率目前還很需要時間發展與優化,而偏軟件的驗證方向初創企業,軟件功能還需要大量的應用/硬件測試來支撐“可信度”。另外這個方向也是存在一些輕微的同質化風險。
2.3.2.2 后端物理實現
涉及后端(布局布線及其之后的流程)的初創企業體量都不大,幾乎都是院校轉化與回國創業團隊。后端的難度在于:
(1)它們跟工藝與設計高度相關,細節決定成敗,換了測試應用/評價指標/工藝約束,就會導致顯著差異;
(2)跟上下游工具鏈軟件也高度結合,因為EDA上下游經常需要協同優化,例如布局需要考慮布線的可行性等;
(3)方法論與先進解決方案大多是主流EDA廠商幾乎不公開,需要大量的摸索;
(4)工具的檢驗與測試困難,與互聯網企業或者普通軟件開發不同,涉及到大規模電路的復雜性,通常寫工具的人,不太能直接確定最終的實現效果(即很難做到所見即所得,你以為算法邏輯上沒問題,但是可能某些細節會出問題)。因此通常需要到最終(多次)成功后仿或(多次)成功流片,才能說某個后端工具是可靠的、穩定的,在這之前通常非常難以獲得訂單;
(5)后端人才儲備肉眼可見的少,看一下EDA會議涉及后端研究方面的論文,相對于國外,國內產出是很少的,不論是彎道超車與直線追趕都需要更多的重視和支持;
(6)因為鏈條復雜性與有些難以大力出奇跡的因素,收益難以預計,高風險下,投資會相對謹慎。
因此,后端工具鏈公司的發展,需要全產業鏈的支持,同時需要設計公司/生產廠商的信任,例如需要設計公司提供大量的測試用例,需要生產廠商及時提供工藝細節等等,而設計公司與生產廠商有時候并不完全了解EDA的算法原理、問題形式、可行性與局限性。因此,為了長期發展,目前這些企業也或多或少和院校保持協同推進的互動。一些高起點一些的后端公司會存在新生力量不了解底層機制或難以下手大規模地對業務整體框架進行優化,一些低起點的后端公司則不可避免地需要走過高起點企業的路,積累經驗和形成技術壁壘。
2.4 小結
路漫漫其修遠兮。從我的角度來看,芯片設計公司或許需要時間厚積薄發來找彎道超車的路子,工具鏈/設備鏈需要有合理的規劃以及上下游的配合進行方案集成。希望這個寒春撒下的種子,來年是滿山傲雪梅花。
3. 技術之外的一點思考
上面的內容是還是相對偏技術的思考,或者說我作為博士生,在調研中比較感興趣與側重的內容。不過在溝通中,一些前輩和朋友也談到了技術之外的一些東西,也啟發了我一些思考。
3.1 投資分布:追求低風險和高回報是資本的本性,但與行業部分節點特性矛盾
資本參與是行業發展的重要環節。但資本是逐利的,并不應該用家國情懷和社會責任感的標準來要求它們。
行業的繁榮是需要一定樂觀泡沫的。我擔憂的是:
(1) 泡沫之下能不能更高效率地積累國內的技術水平,在資本的壓力下,集成電路企業本身是否能夠高效地利用資本的價值;
(2) 資本并不是直接了解技術與行業需求的,在資本的“引導”下,行業是否會出現劣幣驅良幣。我想可能的投資造成驅良幣的三個情況:a)前期企業利用半導體研發的“長期性”(3~5年才能出產品或者量產),吹高一些概念與指標,使得行業混亂;b)中期企業融別人的資,讓別人無資可融,融資競爭,而非技術競爭,不過最近兩三年或許人脈通就錢是管夠的了;c) 后期企業大量融資、高目標下后部分產出不及預期,隨后打擊行業投資信心,從而影響其他企業的融資活動。
(3 )從目前的情況看,越是“卡脖子”的環節,投資越少。因為能“卡脖子”這么多年沒解決,說明難度大、風險高或者周期長、收益低,還有一些生產/設備廠商是資本密集型,這對普通的民間資本并不是理想的投資標的。但是不巧,對于目前國內社會的長期發展而言,越是“卡脖子”的環節,投資應該越多。嗨,真是無奈的現實,畢竟別人集成電路的資本是幾十年利潤積累下來的,短期內這些近期大手筆的資本投入只能靠國家手段了。企業當然要為投資的股東服務,但是變成了估值導向的發展和急于利益變現,可能會扭曲初心,未必對長期發展有益呢。
3.2 政策指引:事前、事中、事后
就如同硅谷的成長,離不開企業家、技術、資金、政策引導。在我們目前落后、外部封鎖、期望追趕的情況下,一個“有形”的手顯得格外重要。
感覺地方政府在事前除了制定目標,還需要有真實、細致的調研。真實是指“問是不是”,細致是指“怎么樣”。這實際上是有困難的,最沒有“成就感”的事情,但是確實是最重要的。2年前一位朋友請我幫忙,審閱一下某個創業團隊的園區資金與場所支持的申請,PPT上的內容如果讓本科時候我來看,就會覺得非常閃耀,但是經過這幾年的導師不斷地鍛煉,能夠看到許多空洞的內容。例如創業目標涵蓋了某個方向,但是實際上這個方向的每一個細分領域都很多挑戰,與他們實際團隊的背景與能力并不符合。例如沒有初始的產品或者原型展示,僅僅“想做”層面的想法或者文字上的“更高更快更強”或者“這個利潤率高”,在集成電路這些方向其實不太靠譜,尤其這些涉及技術門檻而不是商業模式的創業。例如用以體現自身領先的對比企業里面,忽略了最近幾年比較成功或者類似的企業等等。通過那份PPT,我能想象到那些審閱委員會過濾出那么多領域中的可靠的項目有多不容易,看到來頭不明的集成電路企業找政府融資上十幾億,然后爆雷,好心痛納稅人的辛勞。
另外上述幾個集成電路環節,其實是可以看到環節之間是高度依賴的,而只要一個鏈條斷了,整個流程都好不了。目前環節之間主要依賴企業之間的默契相互協調,間歇性地能看到不同的主辦方和參與者開設協調工作會議,間歇性/不同的是這個現象的關鍵詞,信任和利益協調真的太難了。然而實際上,外部的困難是明顯的溫水煮青蛙,不煮青蛙不能吃,水太燙了,青蛙就會跳走。目前這些困境不是幾個企業之間的問題,實際上是整個國內行業的根基心病,在這個層面,有形的“手”推著各個環節參與解決問題中。因為,每個用心發展的企業,終究都會碰到那個透明的天花板,未雨綢繆才能不被變成被痛打的落水狗。
有調研、有目標、有計劃,事中事后還需要合理監管的,例如計劃如何踏踏實實地推進,在保守商業秘密同時、指標如何檢驗、實際效果如何。“專項”這個概念在溝通過程中被不同的人反復提到,被提到的方式通常是“這些的的確確能夠有力地促進一些單位去實現某個目標,但是問題是,一旦專項的目標變成指標的數字和文字,而實際上到落地使用的實用化還是有比較大的距離。”其中一位前輩還打比喻“這就好像咱們造了個跑車,時速1000千米每小時,完成了最高速跑車的設計。目標完成。至于它燒的是液氧液氫而且車內溫度1000攝氏度沒法坐人,就不是關心的地方了。”國內的集成電路圈子很小了,如何有效監管審視、同時避免死板地打擊靈活性和創新活力的確很有難度。或許給出踏實的目標,低頭看路,小步快跑,努力加油會比較實在。
編輯:黃飛
評論
查看更多