,亚洲欧美日韩国产成人精品影院,亚洲国产欧美日韩精品一区二区三区,久久亚洲国产成人影院,久久国产成人亚洲精品影院老金,九九精品成人免费国产片,国产精品成人综合网,国产成人一区二区三区,国产成...

近年間，云計算與人工智能技術(shù)的蓬勃興起，計算中心面臨著數(shù)據(jù)效率低、能耗大等核心挑戰(zhàn)，這促使學(xué)術(shù)界和工業(yè)界重新聚焦。

開宗明義，定義先行。

首先，我們先來了解一下什么是存算一體：

存算一體是通過在存儲器中嵌入計算能力，實現(xiàn)數(shù)據(jù)存儲與計算的緊密結(jié)合。其技術(shù)不僅能夠顯著提升計算效率，還能大幅降低能耗。

緊接著，存算一體技術(shù)分為三類：近存計算（Processing Near Memory, PNM）、存內(nèi)處理（Processing In Memory, PIM）和存內(nèi)計算（Computing In Memory, CIM）。

近存計算：不改變計算單元和存儲單元本身設(shè)計功能，采用先進的封裝方式及合理的硬件布局和結(jié)構(gòu)優(yōu)化，增強二者間通信寬帶，增大傳輸速率。

存內(nèi)處理：側(cè)重于將計算過程盡可能地嵌入到存儲器內(nèi)部，這種方法的能效比通常較高，但計算精度可能受限。另一種思路是在存儲器內(nèi)部集成額外的計算單元，以支持高精度計算。

存內(nèi)計算：存儲單元與計算單元完全融合，無獨立計算單元，通過存儲器顆粒上嵌入算法，由存儲器芯片內(nèi)部的存儲單元完成計算操作。

圖源：Google

事實上，存算一體的概念由來已久。早在1969年，斯坦福研究所的Kautz等人提出了存算一體計算機的概念。其受限于當時的芯片制造技術(shù)和算力需求的匱乏，那時存算一體僅僅停留在理論研究階段，并未得到實際應(yīng)用。

因此，后續(xù)研究人員在芯片電路結(jié)構(gòu)、計算架構(gòu)與系統(tǒng)應(yīng)用等方面開展了一系列研究。但受限于電路設(shè)計復(fù)雜度與工藝難度，后續(xù)的大部分研究本質(zhì)上實現(xiàn)的是 “近存計算”，其與存內(nèi)計算最大的區(qū)別是，近存計算仍然需把數(shù)據(jù)從內(nèi)存中讀取出來之后再就近進行計算，計算的結(jié)果再存儲到內(nèi)存當中。

與此同時，存算一體技術(shù)的核心在于將數(shù)據(jù)存儲與計算融合在同個芯片的同片區(qū)之中，從而徹底消除馮諾依曼計算架構(gòu)的瓶頸；將通過存儲器內(nèi)部進行數(shù)據(jù)處理或計算，此技術(shù)能夠大幅減少數(shù)據(jù)在計算與存儲之間的傳輸時間，提升整體性能。

尤其，在馮諾伊曼架構(gòu)中，計算單元與內(nèi)存是兩個分離的單元。計算單元根據(jù)指令從內(nèi)存中讀取數(shù)據(jù)，在計算單元中完成計算和處理，完成后再將數(shù)據(jù)存回內(nèi)存。

然而，整個過程中，存儲器與處理器之間數(shù)據(jù)交換通路窄，以及由此引發(fā)的高能耗形成兩大難題，在存儲與計算之間筑起一道“存儲墻”。能耗方面，大部分能耗在數(shù)據(jù)搬運過程中產(chǎn)生，數(shù)據(jù)搬運功耗是計算功耗的1000倍。而數(shù)據(jù)搬運速度方面，AI運算需1PB/s，但DRAM 40GB-1TB/s 都遠達不到要求。

存算一體技術(shù)的分類

過去數(shù)載，處理器性能以每年大約55%的速度提升，而相比之下，內(nèi)存性能的提升則顯著放緩，其年增長率僅約為10%。這種長期存在的性能發(fā)展不均衡現(xiàn)象，導(dǎo)致當前存儲系統(tǒng)的訪問速度相較于處理器的計算能力出現(xiàn)了顯著的滯后現(xiàn)象。

目前，在傳統(tǒng)計算機的設(shè)定里，存儲模塊是為計算服務(wù)的，因此設(shè)計上會考慮存儲與計算的分離與優(yōu)先級。但如今，存儲和計算不得不整體考慮，以最佳的配合方式為數(shù)據(jù)采集、傳輸和處理服務(wù)。

其中，雖然多核（例如CPU）/眾核（例如GPU）并行加速技術(shù)也能提升算力，但在后摩爾時代，存儲帶寬制約了計算系統(tǒng)的有效帶寬，芯片算力增長步履維艱。從處理單元外的存儲器提取數(shù)據(jù)，搬運時間往往是運算時間的成百上千倍，整個過程的無用能耗大概在60%-90%之間，能效非常低，“存儲墻”成為了數(shù)據(jù)計算應(yīng)用的一大障礙。

其次，存內(nèi)計算和存內(nèi)邏輯，即存算一體技術(shù)直接利用存儲器進行數(shù)據(jù)處理或計算，從而把數(shù)據(jù)存儲與計算融合在同一個芯片的同一片區(qū)之中，從而徹底消除馮諾依曼計算架構(gòu)瓶頸，以便適用于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)這種大數(shù)據(jù)量大規(guī)模并行的應(yīng)用場景。

算力發(fā)展速度遠超存儲

顯然，存算一體技術(shù)的演進軌跡導(dǎo)向了計算精度的提升、算力輸出的增強及能效比優(yōu)化的高階，以此映射出該技術(shù)內(nèi)進步邏輯的必然走向。

前移至感知端，向 “極致低功耗” 邁進：面向可穿戴設(shè)備、物聯(lián)網(wǎng)設(shè)備等端側(cè)市場，打造超低功耗、超低成本的解決方案。當前感知芯片采集到的模擬信號依賴模數(shù)轉(zhuǎn)換器轉(zhuǎn)換成數(shù)字，信號再通過智能處理器進行處理，速度慢、功耗高。

后移至邊緣端/云端，向 “極致大算力”邁進：面向邊緣端/云端服務(wù)器、數(shù)據(jù)中心與自動駕駛等場景，利用存算一體芯片大規(guī)模并行運算的特點，打造超大算力解決方案。當前的邊緣端/云端處理器大多基于 GPU 平臺，而 GPU 仍然受 “存儲墻” 限制，存在巨大的數(shù)據(jù)通信開銷，導(dǎo)致其實際算力不到標稱算力的 10%。據(jù)分析, 以 ChatGPT 為代表的主流大模型的基本組成單元 Transformer 中約有 90% 以上的運算為大規(guī)模矩陣運算，可以基于存算一體陣列高效完成。

協(xié)同異構(gòu)架構(gòu)與異構(gòu)集成，實現(xiàn)合力突圍：異構(gòu)架構(gòu)將不同計算架構(gòu)、不同功能的硬件單元進行融合，充分發(fā)揮各自的優(yōu)勢，彌補各自的不足，以實現(xiàn)系統(tǒng)更高的性能。例如，單一的數(shù)字存算一體架構(gòu)或模擬存算一體架構(gòu)在精度、能效、面積、成本等指標上各有優(yōu)劣，采用單一架構(gòu)難以兼具各項性能。

驅(qū)動 EDA 設(shè)計工具與應(yīng)用工具鏈開發(fā)：隨著存算一體芯片從 0 到 1 的突破，已驗證了其在 AI 應(yīng)用中的發(fā)展?jié)摿εc市場前景，進而吸引上下游企業(yè)的加入，催生相應(yīng)的自動化 EDA 設(shè)計工具、開發(fā)環(huán)境、仿真器、編譯工具與智能算法的協(xié)同發(fā)展，縮短芯片的研發(fā)周期與應(yīng)用開發(fā)周期，進而推動開源與標準生態(tài)的建立與繁榮，形成良性循環(huán)，加速存算一體芯片的規(guī)模化量產(chǎn)與應(yīng)用。

綜上所述，當前的存算一體芯片研究集中在單點技術(shù)，且在器件、電路、架構(gòu)、EDA工具及系統(tǒng)應(yīng)用等方面仍然存在諸多技術(shù)待解決。

另外，從技術(shù)的角度，存算一體芯片未來的研究將圍繞新型器件優(yōu)化、低功耗數(shù)模混合電路設(shè)計、高性能異構(gòu)芯片架構(gòu)、先進集成與封裝、工具鏈開發(fā)等。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
19165

瀏覽量
229128
存儲器

存儲器

+關(guān)注

關(guān)注
38

文章
7452

瀏覽量
163606
算力

算力

+關(guān)注

關(guān)注
1

文章
928

瀏覽量
14744
存算一體

存算一體

+關(guān)注

關(guān)注
0

文章
100

瀏覽量
4288

原文標題：打破算力極限，存算一體技術(shù)并駕齊驅(qū)

文章出處：【微信號：奇普樂芯片技術(shù)，微信公眾號：奇普樂芯片技術(shù)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

存算一體大算力AI芯片將逐漸走向落地應(yīng)用

電子發(fā)燒友網(wǎng)報道（文/李彎彎）前不久，后摩智能宣布，其自主研發(fā)的業(yè)內(nèi)首款存算一體大算力AI芯片成功點亮，并成功跑通智能駕駛算法模型。 ? 這是存

發(fā)表于 05-31 00:03 ?4928次閱讀

比存算一體更進一步，“感存算一體化”前景如何？

電子發(fā)燒友網(wǎng)報道（文/吳子鵬）近一段時間，存算一體再燃熱潮，成為破除“內(nèi)存墻”，以及打造大算力芯片的主要路徑之

發(fā)表于 06-08 00:01 ?5324次閱讀

探索存內(nèi)計算—基于 SRAM 的存內(nèi)計算與基于 MRAM 的存算一體的探究

本文深入探討了基于SRAM和MRAM的存算一體技術(shù)在計算領(lǐng)域的應(yīng)用和發(fā)展。首先，介紹了基于SRAM的存內(nèi)邏輯計算

發(fā)表于 05-16 16:10 ?2548次閱讀

存算一體技術(shù)路線如何選

電子發(fā)燒友網(wǎng)報道（文/李彎彎）過去幾年，越來越多企業(yè)加入到存算一體技術(shù)的研究中，如今，存算

發(fā)表于 06-21 09:27 ?4221次閱讀

存算一體技術(shù)發(fā)展現(xiàn)狀和未來趨勢

存算一體

電子發(fā)燒友網(wǎng)官方
發(fā)布于 :2023年04月25日 17:21:41

知存科技數(shù)模混合存算一體AI芯片專利解析

知存科技的該項專利是關(guān)于數(shù)模混合存算一體芯片技術(shù)，除能有效降低設(shè)計復(fù)雜度和制造成本外，還特別適用于人工智能神經(jīng)網(wǎng)絡(luò)的運算。

發(fā)表于 12-24 11:02 ?7171次閱讀

存算一體芯片在可穿戴設(shè)備市場有哪些機會

2022年，TWS耳機廠商在一種新型計算架構(gòu)中找到突破口——存算一體。與傳統(tǒng)馮諾依曼架構(gòu)相比，基于存算

發(fā)表于 10-14 09:38 ?1307次閱讀

2023年存算一體是芯片設(shè)計的技術(shù)趨勢

存算一體旨在計算單元與存儲單元融合，在實現(xiàn)數(shù)據(jù)存儲的同時直接進行計算，以消除數(shù)據(jù)搬移帶來的開銷，極大提升運算效率，以實現(xiàn)計算存儲的高效節(jié)能。存算

發(fā)表于 01-13 15:26 ?2236次閱讀

關(guān)于存算一體，我們和ChatGPT聊了聊

存算一體技術(shù)連續(xù)兩年入選了《達摩院十大科技趨勢》，被看好在高訪存、高并行的人工智能場景的規(guī)模化應(yīng)用。主要是因為

發(fā)表于 02-09 14:31 ?1992次閱讀

基于3DIC架構(gòu)的存算一體芯片仿真解決方案

數(shù)字經(jīng)濟已成為繼農(nóng)業(yè)經(jīng)濟、工業(yè)經(jīng)濟之后的主要經(jīng)濟形態(tài)。算力作為數(shù)字經(jīng)濟的核心生產(chǎn)力，將直接影響數(shù)字經(jīng)濟發(fā)展的速度，決定社會智能的發(fā)展高度。存算一體作為

發(fā)表于 02-24 09:34 ?4633次閱讀

特斯拉的下一代AI芯片：存算一體

根據(jù)存儲與計算的距離遠近，將廣義存算一體的技術(shù)方案分為三大類，分別是近存計算 (Processing Near Memory，PNM)、

發(fā)表于 03-09 09:22 ?1753次閱讀

ChatGPT開啟大模型“軍備賽”，存算一體開啟算力新篇章

存算一體需求旺盛，有望推動下一階段的人工智能發(fā)展，原因是我們認為現(xiàn)在存算

發(fā)表于 07-06 10:20 ?410次閱讀

存算一體芯片的技術(shù)壁壘

作為后摩爾時代發(fā)展的必然趨勢之一，存算一體越來越受到行業(yè)的關(guān)注。在存算十問的前六問中，我們梳理了

發(fā)表于 09-22 14:16 ?822次閱讀

蘋芯亮相ESWEEK，探索存算一體技術(shù)新思路

蘋芯科技作為專注存算一體芯片領(lǐng)域的創(chuàng)新型企業(yè)，長期以來一直關(guān)注國際前沿技術(shù)動向。蘋芯很榮幸能夠在ESWEEK向廣大專家、學(xué)者和公眾展示我們在

發(fā)表于 09-23 10:12 ?809次閱讀

存算一體芯片新突破！清華大學(xué)研制出首顆存算一體芯片

這幾天清華大學(xué)又火出圈了。但這次并不是因為招生搶人和飯?zhí)茫乔迦A大學(xué)的芯片研發(fā)團隊研制出全球首顆全系統(tǒng)集成的存算一體芯片。這是我國、乃至全世界對半導(dǎo)體行業(yè)的又一重大突破。這個芯片由

發(fā)表于 10-11 14:39 ?1072次閱讀