當前信息技術的一個主要矛盾,是急劇增長的數(shù)據(jù)流與有限帶寬之間的矛盾,伴隨人工智能與5G技術發(fā)展,數(shù)據(jù)洪流時代將逐漸到來。據(jù)英特爾公司估算,在當下智能手機時代,每人平均產(chǎn)生的數(shù)據(jù)量約為1.5GB每天,而以后的人工智能物聯(lián)網(wǎng)時代,一家智能醫(yī)院每天產(chǎn)生3,000 GB(3TB)的數(shù)據(jù)量,一輛無人駕駛汽車每天產(chǎn)生4TB的數(shù)據(jù)量,一家智能制造工廠每天將產(chǎn)生1,000 TB的數(shù)據(jù)量。
急劇增長的數(shù)據(jù)量在改變?nèi)祟惿罘绞降耐瑫r,也在深刻影響著技術走勢。高速接口、5G拓寬了系統(tǒng)之間的數(shù)據(jù)通道,但系統(tǒng)內(nèi)部互連,特別是芯片內(nèi)部互連,也需要創(chuàng)新的方式來實現(xiàn)更高帶寬。像自動駕駛這樣的應用,不僅需要高帶寬,還要保證信息傳遞的實時性與有效性,即要保證極佳的信息服務質(zhì)量(QoS),“自動駕駛商用化,是人類第一次把身家性命大規(guī)模交給半導體來決斷,芯片內(nèi)部互連將至關重要,設計師需要保證信號回路沒有任何阻斷,延遲滿足系統(tǒng)要求。”
NetSpeed Systems(以下簡稱NetSpeed)大中華區(qū)銷售總監(jiān)黃啓弘對TechSugar表示。
將互聯(lián)網(wǎng)技術搬到芯片內(nèi)部去
支持高水平自動駕駛功能的芯片均異常復雜,以Nvidia(英偉達)為例,其首款自動駕駛片上系統(tǒng)(SoC)Xavier集成了一個特別定制的8核CPU、一個512核Volta GPU、一個全新深度學習加速器、全新計算機視覺加速器、以及全新8K HDR視頻處理器,該芯片共集成超90億個晶體管,Nvidia投入2000多名工程師在這個項目上,總研發(fā)時間超過4年,總研發(fā)費用高達20億美元。
20億美元8000個工程年,是不是自動駕駛芯片都這樣高不可攀?當然不是,Mobileye、特斯拉以及中國的地平線機器人等公司,都在發(fā)展自動駕駛用SoC芯片,根據(jù)各自對自動駕駛的理解,系統(tǒng)復雜度會有較大區(qū)別,再利用成熟的IP與工具,研發(fā)成本與時間預算與Xavier相比可能會有數(shù)量級的差異。
以特斯拉的自動駕駛芯片為例,據(jù)黃啟弘介紹,從設計到流片只花了不到一年時間,NetSpeed相關解決方案力助特斯拉縮短研發(fā)周期,快速完成設計迭代。
當一顆芯片集成數(shù)百甚至上千個運算單元時,內(nèi)部互連如何實現(xiàn)成為架構工程師與設計工程師面臨的最嚴峻考驗之一,傳統(tǒng)總線架構已經(jīng)變成系統(tǒng)性能的主要瓶頸??偩€架構適合簡單架構,但如果單芯片集成處理器核數(shù)越多,需要連接互通的模塊越多,總線架構在性能、功耗、全局時鐘同步、信號完整性及可靠性等方面面臨的挑戰(zhàn)將呈指數(shù)型增長。
NetSpeed Systems大中華區(qū)銷售總監(jiān)黃啓弘
“能否不要用總線理論,把所有數(shù)據(jù)用橋接模塊分成數(shù)據(jù)包,用互聯(lián)網(wǎng)的方法分發(fā)出去,”黃啓弘將這種片上網(wǎng)絡(NoC)理念形象地比喻成在芯片上布一個互聯(lián)網(wǎng)。
片上網(wǎng)絡采用數(shù)據(jù)路由和分組交換技術替代傳統(tǒng)總線結(jié)構,從體系結(jié)構上解決了傳統(tǒng)總線結(jié)構由于地址空間有限導致的可擴展性差,分時通訊引起的通訊效率低下,以及全局時鐘同步引起的功耗和面積較大等問題。
與傳統(tǒng)的總線互連技術相比,NetSpeed的解決方案解除了總線架構帶來的數(shù)據(jù)吞吐量限制,片內(nèi)帶寬可支持到萬億字節(jié)每秒(TB/s),接口位寬高達1024位,并可定制更高位寬。總線結(jié)構需要針對不同的系統(tǒng)需求單獨進行設計,當系統(tǒng)功能擴展時,需要對現(xiàn)有設計方案重新設計,研發(fā)成本與設計周期均比較長,NetSpeed的解決方案采用分層堆疊方式將網(wǎng)絡架構解耦,具有良好的可擴展性。當SoC片內(nèi)網(wǎng)絡中節(jié)點數(shù)量增加時,僅需要按照相應拓撲結(jié)構規(guī)則繼續(xù)增大網(wǎng)絡規(guī)模即可,縮短了產(chǎn)品的設計周期,節(jié)約了研發(fā)成本。另外,傳統(tǒng)總線架構,每次信息交互都需要驅(qū)動全局互連線,因此總線結(jié)構所消耗的功耗將隨SoC規(guī)模增加而顯著增加,而NetSpeed方案中,可以將一部分信號通路關掉,從而實現(xiàn)低功耗。
為什么是NetSpeed?
NetSpeed成立于2011年,到現(xiàn)在規(guī)模并不大,在半導體行業(yè)資歷頗深的黃啓弘為何要選擇加入NetSpeed?用他自己的話來說,就是NetSpeed顯示了增長的潛力,過去幾年營業(yè)額都是100%以上的速度增長,也具備了成功的要素,“一家初創(chuàng)企業(yè)能否成功,主要看兩點,第一是高管團隊,第二是時機,能否在合適的時間,為市場上一個普遍難解的問題,提出合適的解決方案。”
NetSpeed核心技術團隊來自思科與華為,這是他們能夠?qū)⒑暧^世界的網(wǎng)絡拓撲思想映射到芯片內(nèi)部的基礎。而人工智能應用爆發(fā)帶來的數(shù)據(jù)洪流,讓SoC的計算單元數(shù)量暴漲,對SoC內(nèi)部帶寬需求急劇增加,這正是黃啓弘所說的時機,在這個時間點上,NetSpeed解決方案為眾多專注人工智能芯片設計的公司所重視,NetSpeed首席執(zhí)行官Sundari Mitra表示:“這些新SoC內(nèi)部體現(xiàn)出的是一種新的數(shù)據(jù)流,一般來說,想實現(xiàn)快速有效的點對點數(shù)據(jù)交換,就需要大量的計算單元。傳統(tǒng)架構運行方式不同,采用中央存儲作為數(shù)據(jù)交換系統(tǒng)。而人工智能系統(tǒng)需要任意位置數(shù)據(jù)交換,這可以通過廣泛的接口而實現(xiàn),并需要支持長突發(fā)傳輸。Orion AI的一個關鍵優(yōu)勢就是能夠支持多重多播請求,并支持非阻塞傳輸?!?/p>
Orion AI由NetSpeed的圖靈機器學習引擎提供支持,該引擎使用監(jiān)督學習來探索和優(yōu)化SoC設計與架構,為優(yōu)化對自動駕駛應用的支持,Orion AI通過了ISO 26262標準,可支持ASIL D級別安全要求。
除了這次發(fā)布的Orion AI,NetSpeed還提供其他互連和高速緩存IP,以及設計開發(fā)工具NoCStudio。利用NoCStudio,SoC 開發(fā)人員可快速、高效、可靠地生成高度定制化的解決方案,NoCStudio輸出的模塊具有無死鎖、緩存一致性以及確保服務質(zhì)量的特性。
下一步計劃
人工智能應用在中美都是熱點,在NetSpeed列出的四家重要客戶中,有三家是中國公司。除了自動駕駛,在云計算、AR、VR等方面NetSpeed都有布局,NetSpeed也在與手機芯片公司展開合作。
“到了5G之后,數(shù)據(jù)量非常大,數(shù)據(jù)交換的負擔非常繁重。在NetSpeed看來,這也是在一個合適的時間點,進入一個合適的市場,因為下一代手機芯片的設計復雜度,一定是數(shù)量級上的飛躍,在這種情況下,工程師可能必須利用人工智能的方法,才能把設計做出來,在這方面,NetSpeed有優(yōu)勢?!?/p>
除了拓展中國市場及團隊,黃啓弘表示,NetSpeed還在開發(fā)芯片間互連技術,以及進一步提升現(xiàn)有產(chǎn)品的性能,他最后強調(diào),IP公司必須要以技術為本,NetSpeed成立8年以來,已經(jīng)申請了130多項專利,技術實力逐漸得到了用戶的認可,“作為一家正在成長的IP公司,技術要有足夠的優(yōu)勢,最重要是得到用戶認可。”
-
人工智能
+關注
關注
1791文章
46862瀏覽量
237587 -
5G
+關注
關注
1353文章
48368瀏覽量
563391 -
自動駕駛
+關注
關注
783文章
13685瀏覽量
166150
原文標題:打破總線瓶頸,讓片內(nèi)帶寬像海洋一樣寬闊
文章出處:【微信號:TechSugar,微信公眾號:TechSugar】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論