01.核心判斷及觀點
1.存算一體屬于芯片的底層架構(gòu)創(chuàng)新,階段非常早期,其產(chǎn)業(yè)鏈空白度及機遇挑戰(zhàn)不亞于20年前從頭開始發(fā)展GPU。
2.相對于量子計算、光子芯片、非硅基芯片等前沿算力方案,受益于介質(zhì)等技術(shù)成熟,存算一體芯片更有希望在3-5年內(nèi)廣泛落地。
3.存算一體領(lǐng)域?qū)儆谏儆械膰鴥?nèi)外同時起步的芯片領(lǐng)域,中國更有希望做出引領(lǐng)世界的產(chǎn)品。
4.當(dāng)前產(chǎn)業(yè)界及投資方認(rèn)為產(chǎn)業(yè)鏈上下游仍不完善,仍需5-10年才能投入使用,但這也意味著更為全面的創(chuàng)新機遇。
5.當(dāng)前行業(yè)玩家競爭主要集中在不同的存儲介質(zhì),長期來看存儲介質(zhì)路線并無差別,在設(shè)計方法論、測試、量產(chǎn)、軟件、場景選擇等方面全方位競爭是長期關(guān)鍵。
6.第一款、第二款芯片場景的選擇非常重要,率先取得商業(yè)化驗證,打造爆款是未來三年勝出關(guān)鍵。
7.作為新興技術(shù),產(chǎn)業(yè)人才主要集中于學(xué)界而非企業(yè)界,因此院校技術(shù)、人才轉(zhuǎn)化資源非常關(guān)鍵。
8.除創(chuàng)業(yè)公司外,大學(xué)院校及巨頭也在同步做研發(fā),長期來看,真正強勁的競爭對手可能是觀望中的巨頭。
9.存算一體芯片相對于CPU/GPU等主流算力并非是取代關(guān)系,未來將會成為主流算力的重要補充,更側(cè)重于高能效的算力。02.存算一體技術(shù)的背景及原理
在全球數(shù)據(jù)量呈指數(shù)級暴漲,算力相對于AI運算供不應(yīng)求的現(xiàn)狀下,存算一體技術(shù)主要解決了高算力帶來的高能耗成本矛盾問題,有望實現(xiàn)降低一個數(shù)量級的單位算力能耗,在功耗敏感的百億級AIoT設(shè)備上、高能耗的數(shù)據(jù)中心、自動駕駛等領(lǐng)域有望發(fā)揮其低功耗、低時延、高算力密度等優(yōu)勢。 在現(xiàn)有的成熟架構(gòu)及工藝下,當(dāng)前依靠制程技術(shù)進(jìn)步,增加晶體管密度提升算力、降低功耗已逐步趨于物理極限,且成本逐步提高;
在馮諾依曼架構(gòu)下,由于數(shù)據(jù)存儲與運算單元分離,算力提升受限,功耗增加:
應(yīng)對存儲單元與計算單元分離的現(xiàn)狀,存算一體技術(shù)思路應(yīng)運而生,在器件單元上存儲與計算單元融合,通過底層的架構(gòu)創(chuàng)新解決馮諾依曼架構(gòu)的固有瓶頸:
由于存儲介質(zhì)技術(shù)在近年來不斷突破,此外AIoT時代對于設(shè)備的智能化、低功耗、體積小、低時延等特性提出了天然要求(而現(xiàn)有的技術(shù)路線未能很好的滿足需求),在技術(shù)突破疊加市場需求的雙重作用力下,存算一體技術(shù)當(dāng)前已到達(dá)產(chǎn)業(yè)化爆發(fā)拐點:
相對于五十多年前CPU的誕生以及二十多年前GPU的誕生,當(dāng)前存算一體技術(shù)仍處于早期階段,未來依靠其更好的并行度、更好的能效比等特性,有望成為智能化時代的主流算力平臺之一,與現(xiàn)有的算力解決方案互為補充。
伴隨架構(gòu)創(chuàng)新的巨大機遇和算力需求的變化,在存算一體領(lǐng)域有希望孕育下一個千億美元級的芯片巨頭,當(dāng)前我國存算一體技術(shù)研發(fā)與國外處于齊頭并進(jìn)的階段,我國存算一體技術(shù)及產(chǎn)業(yè)有望引領(lǐng)世界。
存算一體當(dāng)前有一些相似的稱呼(如近存計算),其內(nèi)在結(jié)構(gòu)差別如下:近存計算:不改變計算單元和存儲單元本身設(shè)計功能,通過采用先進(jìn)的封裝方式及合理的硬件布局和結(jié)構(gòu)優(yōu)化,增強二者間通信寬帶,增大傳輸速率;本質(zhì)上屬于馮諾依曼架構(gòu),通過拉近存儲單元和計算單元的距離,對“存儲墻”進(jìn)行優(yōu)化。 內(nèi)存儲計算:存儲單元與計算單元完全融合,無獨立計算單元,通過存儲器顆粒上嵌入算法,由存儲器芯片內(nèi)部的存儲單元完成計算操作;其設(shè)計難度更高,未來可提升的空間也更大,但需要獲得代工廠許可支持。本文所探討是存算一體/存內(nèi)計算企業(yè)主要集中于這類。
03.存儲介質(zhì)技術(shù)路線的選擇分析存算一體,當(dāng)前存算一體芯片研發(fā)企業(yè)/機構(gòu)在成熟介質(zhì)上的切入點集中在SRAM、Nor-Flash和DRAM等;部分學(xué)術(shù)機構(gòu)選擇切入RRAM等新型介質(zhì)研發(fā)。 從存儲介質(zhì)的分類來講,分為易失性存儲器和非易失性存儲器。
上圖引自方正證券研報 當(dāng)前不同的存儲介質(zhì)在計算機架構(gòu)中均承擔(dān)著必要的工作任務(wù),其中SRAM距離CPU最近,響應(yīng)時間最快,存儲容量較小;
其次分別是DRAM、NAND-Flash等介質(zhì),在傳輸速率、存儲容量上各有其特點:
1.易失性存儲器:即在正常關(guān)閉系統(tǒng)或者突然性、意外性關(guān)閉系統(tǒng)的時候,數(shù)據(jù)會丟失,成本高。
DRAM:內(nèi)存條(一個存儲單元僅需一個晶體管和一個小電容),占據(jù)58%的半導(dǎo)體存儲市場份額,當(dāng)前已突破20nm,往10nm過渡。
SRAM:CPU緩存(一個存儲單元需要4-6個晶體管),特點是速度最快(納秒級),不需要一直充電。
2.非易失性存儲器:在上述斷電情況下數(shù)據(jù)不會丟失,成本低。
NAND Flash:如固態(tài)硬盤、U盤和內(nèi)存;容量大,但讀寫速度極低。
NOR Flash:代碼型內(nèi)存,主要存一些指令;如機頂盒、網(wǎng)關(guān)、路由器中嵌入代碼的存儲;容量較小且寫入數(shù)據(jù)極低,但讀速較快。
長期來看,存算一體芯片產(chǎn)品化的快速發(fā)展離不開新型存儲介質(zhì)成熟度提升的助推,以下為不同新型存儲介質(zhì)的原理比較:
長期來看,RRAM(憶阻器)是除了電阻器、電容器、電感器之外的一大新發(fā)現(xiàn);其與生物神經(jīng)突觸有著非常類似的特性,因此也被成為電子突觸器件。
以下為新型存儲介質(zhì)的性能比較:
以下為不同存儲介質(zhì)的存儲原理及客觀性能比較;其中成熟的存儲介質(zhì)如SRAM、DRAM、Flash基于電荷的移動完成數(shù)據(jù)存儲;新型存儲介質(zhì)與RRAM、MRAM等基于電阻大小的變化完成數(shù)據(jù)存儲功能。
除介質(zhì)以外,選擇數(shù)字計算與模擬計算也是影響存算一體芯片性能的因素之一;其中數(shù)字計算精度更高。
04.存算一體應(yīng)用場景1.存算一體架構(gòu)與深度學(xué)習(xí)網(wǎng)絡(luò)運算模型高度重合。
通用性計算芯片在服務(wù)特定AI算法方面并不具備性價比優(yōu)勢,為AI定制的芯片將成為人工智能產(chǎn)業(yè)鏈條上的底層核心技術(shù)。 存內(nèi)計算作為創(chuàng)新芯片架構(gòu)形式,突破了存儲墻問題,且其本質(zhì)是乘積累加運算(Multiply Accumulate, MAC)操作加快的體現(xiàn),與深度學(xué)習(xí)網(wǎng)絡(luò)運算模型中的基本算子高度契合,使得基于存內(nèi)計算架構(gòu)的芯片相比于市場已有的AI加速芯片,在計算效率(TOPS/W)方面有數(shù)量級上的提升。 智能時代里,從可穿戴到自動駕駛,功耗約束下場景里的計算效率都是永恒的主題,存內(nèi)計算是解放算力、提升能效比最強有力的武器之一。
資料來源:《先進(jìn)存算一體芯片設(shè)計》、知乎陳巍探芯 2.存算一體芯片適用的行業(yè)/場景(1)小算力場景:邊緣側(cè)對成本、功耗、時延、開發(fā)難度非常敏感
中早期的存算一體芯片算力較小,從小算力1TOPS開始往上走,解決的是音頻類、健康類及低功耗視覺終端側(cè)應(yīng)用場景,AI落地的芯片性能及功耗問題。
我們預(yù)測從邊緣端接入的智能設(shè)備的市場體量將快速增長,智能產(chǎn)品覆蓋面積越來越大,產(chǎn)品形態(tài)的多樣性將迎來爆發(fā)式的增長。可以預(yù)見,由于傳輸延遲或數(shù)據(jù)安全考慮,很多數(shù)據(jù)處理及推理運算將在端側(cè)發(fā)生。
(2)大算力場景:GPU在算力和能效上都無法同時與專用加速芯片競爭
目前云計算算力市場,GPU的單一架構(gòu)已經(jīng)不能適應(yīng)不同AI計算場景的算法離散化特點,如在圖像、推薦、NLP領(lǐng)域有各自的主流算法架構(gòu)。
隨著存算一體芯片算力不斷提升,使用范圍逐漸擴展到大算力應(yīng)用領(lǐng)域。針對大算力場景>100TOPS,在無人車、泛機器人、智能駕駛,云計算領(lǐng)域提供高性能大算力和高性價比的產(chǎn)品。
存算技術(shù)可支持成熟制程下匹配傳統(tǒng)結(jié)構(gòu)+高級節(jié)點才能提供的計算能力,節(jié)約制造成本,繞過工藝封鎖等問題。
自動駕駛要求很高,算力、可靠性、穩(wěn)定性需要同時達(dá)標(biāo),需要數(shù)年,目前仍有工藝挑戰(zhàn)和迭代,現(xiàn)在也還做不到數(shù)據(jù)中心的水平。
3.存算一體的其他延伸應(yīng)用:感存算一體、類腦計算
存算一體作為基礎(chǔ)原理,同樣也衍生了如感存算一體、類腦計算等創(chuàng)新技術(shù)方向:
(1)感存算一體:
傳統(tǒng)芯片,需要先利用傳感器芯片收集信息、存儲芯片進(jìn)行存儲、利用計算芯片來處理數(shù)據(jù)。感存算一體集傳感、儲存和運算為一體,在存算一體的基礎(chǔ)上增加了傳感,三位合一提高整體效率。
在傳感器自身包含的AI存算一體芯片上運算,來實現(xiàn)零延時和超低功耗的智能處理。
研究成果來看,包括壓力、光學(xué)、氣體三大類;從當(dāng)前應(yīng)用方向來看,包括實現(xiàn)更高效的機器視覺和類腦計算。
(2)類腦計算:
類腦計算又被稱為神經(jīng)形態(tài)計算,是借鑒生物神經(jīng)系統(tǒng)信息處理模式和結(jié)構(gòu)的計算理論、體系結(jié)構(gòu)、芯片設(shè)計以及應(yīng)用模型與算法的總稱。
試圖借鑒人腦的物理結(jié)構(gòu)和工作特點,讓計算機完成特定計算任務(wù),從而高速處理信息,屬于大算力高能效領(lǐng)域。
存算一體天然是將存儲和計算結(jié)合在一起的技術(shù),天然適合應(yīng)用在類腦計算領(lǐng)域,并成為類腦計算的關(guān)鍵技術(shù)基石。05.產(chǎn)業(yè)現(xiàn)狀與未來趨勢1.存算一體技術(shù)當(dāng)前面臨的挑戰(zhàn):
存算一體技術(shù)是一門非常復(fù)雜的綜合性創(chuàng)新,產(chǎn)業(yè)還算不上成熟,在產(chǎn)業(yè)鏈方面仍舊存在上游支撐不足,下游應(yīng)用不匹配的諸多挑戰(zhàn),但諸多的挑戰(zhàn)同時也構(gòu)成了當(dāng)前存算一體創(chuàng)新未來可構(gòu)筑的綜合性壁壘。
2.存算一體技術(shù)發(fā)展趨勢:更高精度、更高算力、更高能效。
3.當(dāng)前產(chǎn)業(yè)面臨的人才及生態(tài)問題:
(1)作為一個新領(lǐng)域,存算一體芯片復(fù)合型人才稀缺,人才更多在學(xué)術(shù)界。
完成存算一體芯片的產(chǎn)品化開發(fā),需同時具備較強的學(xué)術(shù)原創(chuàng)能力(存算一體的架構(gòu)和編譯器設(shè)計、存算相關(guān)的量化算法開發(fā)等)及工程實踐能力(場景理解能力、芯片落地能力)。
(2)從上游到下游的生態(tài)不完整,既是挑戰(zhàn)也是機遇。
存算一體芯片的大規(guī)模落地需與芯片廠商、軟件工具廠商以及應(yīng)用集成廠商等產(chǎn)業(yè)生態(tài)合作伙伴的大力協(xié)同研發(fā)和推廣應(yīng)用。
需有一套方便、可用的工具鏈和軟件,讓采購方遷移成本低。
兼容現(xiàn)有的軟件生態(tài),讓采購方用起來“無感”,如可直接利用現(xiàn)有GPU訓(xùn)練軟件框架。
引導(dǎo)采購方逐步切入專用工具鏈進(jìn)行模型適配、壓縮等,更好利用存算一體的優(yōu)勢,逐步建立生態(tài)。06.行業(yè)相關(guān)企業(yè)分析 當(dāng)前我國存算一體芯片創(chuàng)新企業(yè)與海外創(chuàng)新企業(yè)屬于齊頭并進(jìn)階段,共同探索存算一體技術(shù)產(chǎn)業(yè)化落地及應(yīng)用場景,在AIoT時代巨大的應(yīng)用場景下,未來我國存算一體領(lǐng)域有望產(chǎn)生引領(lǐng)世界的創(chuàng)新企業(yè)。 國內(nèi)存算一體芯片企業(yè)有:蘋芯科技、后摩智能、知存科技、億鑄科技、智芯科、千芯科技、九天睿芯等創(chuàng)新企業(yè);國外有如Mythic、Syntiant等公司。
以下為國內(nèi)外部分存算一體企業(yè)簡介:
附錄:賽道內(nèi)主要玩家的部分產(chǎn)品進(jìn)展及性能
-
AI
+關(guān)注
關(guān)注
87文章
30239瀏覽量
268475 -
產(chǎn)業(yè)鏈
+關(guān)注
關(guān)注
3文章
1350瀏覽量
25667 -
算力
+關(guān)注
關(guān)注
1文章
936瀏覽量
14750
原文標(biāo)題:存算一體:內(nèi)核架構(gòu)創(chuàng)新,打破算力能效極限
文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論