精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺談存算一體技術的發展路線

焉知新能源汽車 ? 來源:焉知新能源汽車 ? 2023-06-20 15:49 ? 次閱讀

后摩智能發布了首款存算一體芯片——鴻途 H30,最高物理算力 256TOPS,功耗僅為 35W,碾壓國內一眾智駕芯片。

存儲一體?還首款?

不僅是后摩智能,包括英特爾、SK 海力士、IBM、美光、三星、臺積電、阿里、九天睿芯、恒爍股份、億鑄科技、千芯科技、蘋芯科技、知存科技、智芯科技等在內,無論是國際大廠還是初創企業都紛紛扎堆涌入這個領域。

不禁要問,讓各大芯片廠商打雞血的存儲一體是個什么東西,下面我們存算一體技術是什么,為什么這么火爆。

01存算一體是什么

目前市面上的芯片都是基于馮諾依曼架構,其特點是處理單元和存儲單元分離,各不相干,需要運算的時候,計算單元再從存儲單元讀取數據進行處理,處理完再還回去。

而存算一體則是把存儲單元和處理單元合二為一,把數據和計算融合在同一片區中,這樣處理的好處在于可以直接利用存儲器進行數據處理,從根本上消除馮諾依曼架構計算存儲分離的問題,尤其特別適用于現代大數據大規模并行的應用場景。

實際上存儲一體并不是近年來被提出的新概念,最早可追溯至上個世紀 70 年代,只是受限于當時的芯片制造技術和算力需求,存算一體僅僅停留在理論研究上,一直到了大數據、人工智能時代,巨大的算力需求才為存算一體提供了新的發展動力。

比如中國國防科大、中科曙光和國家并行計算機工程技術研究中心計劃推出首臺 E 級超算,但想要研制這種級別的超算,科學家首先面臨的巨大挑戰就是功耗過高問題,以現有的技術研制 E 級超算功率高達千兆瓦,需要一個專門的核電站才能滿足耗電量,而其中 50% 以上的電量都要被用來消耗進行數據搬運。

本質上就是馮諾依曼架構的處理和存儲分離的缺陷所致,因此存算一體被當作全村的希望。

02存算一體的優勢

由于把存儲計算合二為一,去掉了中間傳輸路徑,所以可以大幅減少數據搬運,消過程中不必要的延遲和功耗,能耗可降至 1/10-1/100,能效可提升 10-100TOPS/W

因為存儲一體是以存儲器為介質,在里面加入計算單元,所以可以直接利用存儲單元進行邏輯計算提升算力。(等效于在面積不變的情況下規模化增加計算核心數),在特定區域可提供 1000TOPS 以上的算力

不依賴制程工藝,因為存儲一體基于全新架構開發,可以打破摩爾定律的限制,所以不受先進制程工藝限制。比如鴻途 H30 就是基于 12nm 制程工藝打造,在 Int8 數據精度下實現高達 256TOPS 的物理算力,功耗不超過 35W。

如果在傳統的馮·諾依曼架構下采用相同工藝,能效比多在 2TOPS/W,某國際巨頭芯片基于 8nm 工藝,如果二者用同一工藝,存算一體架構的芯片處理效率優勢將會更加明顯。

存算一體超越馮諾依曼架構,該架構可徹底消除數據搬運過程中的延遲和功耗,是一種真正意義上的處理存儲相融合,所以二者完全耦合,可以開發更細粒度的并行性,從而獲得更高的性能和能效,明顯超越現有的 ASIC 芯片。

存算一體架構無論是制程、功耗、成本還是算力,相比傳統架構都有明顯優勢,可以說完全就是為人工智能時代而生,但前途有多光明,道路就有多曲折,存算一體技術研發的困難也是相當巨大。

03存算一體的挑戰

傳統架構是計算和存儲相分離,現在兩者要合二為一,這就對存儲器本身和存算一體的設計提出更高的要求,是需要技術人員從頭探索的新領域。

隨著以后數據量不斷增大,在全新架構下,計算、功耗、通信三方面都要重新變革,對制造工藝都提出更高要求。

為了保持梯度計算的保真性和權重更新,現在市面上的AI芯片大都在 16bit 精度以上,而作為首款存算一體芯片的鴻途 H30 只有 8bit,還難以和傳統芯片媲美,即便是在 PCM 存儲器上有十多年的 IBM,也只是發布了 8bit 精度的模擬芯片,而其他大廠如微軟、英特爾、美光等則是投資創業公司

由于存算一體是把計算和數據高度耦合,因此一旦其中一方出問題,另一方幾乎也會遭到極大影響,這都是需要處理的難題。

總而言之,存算一體是一條全新的、沒有現成方法可以參考的、還需要解決傳統架構遺留問題的艱難道路。

可即便優勢明顯,但存算一體難度這么大,為什么各路大廠還要紛紛打雞血參戰,傳統芯片架構技術成熟、產品可靠,創業公司也就算了,但為什么傳統廠商也來趟這趟回水,傳統芯片架構沒路可走了嗎,下面就要說說傳統架構的問題了。

04傳統芯片架構的「原罪」

文章開頭提到過,傳統芯片都是基于馮諾依曼架構開發,這種架構的特點是處理和存儲兩部分是分開的,通過數據總線進行數據連接傳輸,而且是以處理為主,存儲主要起到輔助作用,處理器先要把存儲器里的數據搬運出來才能處理,處理完再丟回去。

但隨著芯片技術的飛速發展,處理器的性能不斷飆升,而存儲器的性能卻在龜速前進,兩者的性能差距越來越大,存儲器的讀寫速度遠遠跟不上處理器的處理速度,導致芯片在運行的時候,大部分算力都被搬運數據的過程消耗掉了,只有小部分算力被有效利用。

就相當于一個極度口渴的人拿著一瓶水,瓶子的瓶體直徑有 1 米,但瓶口直徑只有 1 厘米,那種感覺各位感受下,所以逐漸就形成了業界普遍流傳的存儲墻,嚴重制約芯片綜合性能的提升。

8a9d7ade-0f3e-11ee-962d-dac502259ad0.jpg

有算力的地方就有功耗,正如上文所說,基于馮諾依曼架構開發的芯片在處理數據的過程中,處理器先要通過數據總線把存儲器中的數據搬運出來,處理完成后在搬運回去,整個搬運過程所消耗的功耗是浮點運算的 4-1000 倍左右。

雖然半導體工藝一直在進步,芯片的總體功耗在下降,但馮諾依曼架構天然的缺陷難以改變,數據搬運的功耗比只會越來越大,整個過程的無用能耗能占到 60%-90%,能效之低,令人發指,因此又形成了功耗墻,兩面墻就這樣死死壓制著芯片性能的提升。

8accf912-0f3e-11ee-962d-dac502259ad0.jpg

另外,根據咨詢公司評估,晶圓廠每一代工藝的建設資金都在急劇增加,還不說技術專利和人才問題,只是建造一個 5nm 晶圓廠,就需要 160 億美元,光是資金就嚇退所有人。

8aff52e0-0f3e-11ee-962d-dac502259ad0.jpg

為了打破馮諾依曼架構的瓶頸,降低處理和存儲二者搬運過程帶來的高損耗,學術界和產業界嘗試了各種方法,大體可分為兩類:

近存儲計算

核心思想就是設計芯片的時候,把處理單元和存儲單元兩塊區域盡可能的拉近距離,縮短路徑,從而降低數據搬運過程中的算力損耗和功耗,目前市面上的主要技術路徑是多級緩存和高密度片上存儲。

光互連、2D/3D堆疊和高速帶寬數據通信

2D/3D堆疊技術是將多個芯片堆疊在一起,通過增大處理單元和存儲單元之間的并行寬度提高傳輸速度。

高速帶寬數據通信主要就是通過提高通信帶寬降低數據搬運過程的損耗。

因為馮諾依曼架構的天然缺陷依舊存在,所以上面兩種方案并沒有從根本上解決數據存儲和處理的搬運損耗問題,到了大數據、人工智能時代,海量的數據處理讓這些問題暴露的更加徹底,產業界和學術界都迫切希望找到一種能徹底解決該問題的方案,就是存算一體。

綜上所述,就是傳統的馮諾依曼架構缺陷導致自我消耗、限制太大,無法滿足算力需求,再加上摩爾定律逼近極限、晶圓廠建設又是個吞金獸,成本巨大,幾乎死路一條,各大廠商只能押注存算一體。

簡單來說,從馮諾依曼架構到存算一體架構,指導思想就是停止內耗,一致對外。

05存算一體技術發展路線

雖然存儲一體已經成為目前業界發展共識,但由于各個技術廠商的技術、發展方向、商業模式等條件不同,因此發展出了四種路徑。

查存計算

目前 GPU 芯片中對復雜函數的處理就是用了這種方法,主要通過在存儲單元內部查表完成處理任務,技術成熟穩定。

近存計算

國外的典型代表便是 AMD 的 ZEN 系列 CPU,國內阿里巴巴基于 DRAM 的 3D 堆疊技術芯片也是這個路線,主要通過在存儲區域外部的獨立處理單元完成操作,這種架構的代際升級成本較低,特別適合傳統芯片廠商過渡。

存內計算

主要在存儲單元內部加入獨立計算單元完成數據處理操作,計算方式可以是數字也可以是模擬,一般用于固定場景的算法計算,上文提到的鴻途 H30 便屬于這種。

存內邏輯

8b26c4ba-0f3e-11ee-962d-dac502259ad0.jpg

這是目前存算一體的最新架構,主要在存儲區域加入計算邏輯,直接進行數據計算,這種架構數據傳輸路徑最短,真正做到存算一體,能滿足大模型的計算需求,代表廠商有 TSMC 和千芯科技。

由于存算一體芯片都是基于存儲器介質開發,而存儲器可分為易失性和非易失性兩種,所以又有數字計算和模擬計算兩種方向。

基于易失性的數字計算存儲器,主要有 SRAM 和 DRAM。

SRAM 和 DRAM 技術工藝成熟,是目前存儲器的主流,因此很多廠商都基于兩者展開存算一體技術研究,具有高性能和高精度優點,也有很好的抗噪聲能力和可靠性。

基于非易失性的模擬計算存儲器,主要有閃存 Flash、相變存儲器 PCM、阻變存儲器 RRAM/憶阻器 ReRAM。

這些新型存儲器在近年來取得了較快的發展,具有存儲密度大、并行度高優點、對存儲和計算具備天然的融合性,但對環境噪聲和溫度比較敏感,但由于工藝尚不成熟,距離真正落地還有一段距離。

數字存算一體適合大算力高能效的應用場景,模擬存算一體適合小算力、不需要非常強的可靠性的民用場景。

一句話概括,未來很長一段時間內,SRAM 和 DRAM 都是存算一體芯片的主流選擇。

寫在最后

存算一體已經被業界普遍確定為下一代人工智能芯片技術發展方向,由于是全新的技術方向,目前國內外廠商都處于剛起步階段,沒有成熟方法可以借用,而且該技術依賴于存儲器的不斷流片積累經驗,需要技術團隊有充分的量產經驗和技術認知,還需要大量資金,行業壁壘很高。

目前各大廠商根據自身情況,主要有兩種發展思路:

從小算力入手,比如從 1TOPS 開始,先解決音頻類、健康類這些低功耗的應用場景,掌握芯片商業化后的性能和功耗問題,然后在進入大算力領域。

直接發展大算力,提供大于 100TOPS 的高性價比產品,應用于智能駕駛、云計算機器人等領域。

隨著現在各種大模型、自動駕駛、云計算等 AI 技術的加速落地,對大算力需求迫切增加,即使技術有很多困難,但巨大的市場需求一定會倒逼技術突破,成為繼 CPU、GPU 架構之后的另一主流架構。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19178

    瀏覽量

    229200
  • 存儲器
    +關注

    關注

    38

    文章

    7455

    瀏覽量

    163622
  • sram
    +關注

    關注

    6

    文章

    764

    瀏覽量

    114638
  • 美光
    +關注

    關注

    5

    文章

    708

    瀏覽量

    51405
  • 存算一體
    +關注

    關注

    0

    文章

    100

    瀏覽量

    4288

原文標題:存算一體技術發展路線

文章出處:【微信號:nev360,微信公眾號:焉知新能源汽車】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一體力AI芯片將逐漸走向落地應用

    電子發燒友網報道(文/李彎彎)前不久,后摩智能宣布,其自主研發的業內首款一體力AI芯片成功點亮,并成功跑通智能駕駛算法模型。 ? 這是
    的頭像 發表于 05-31 00:03 ?4939次閱讀

    一體更進步,“感一體化”前景如何?

    電子發燒友網報道(文/吳子鵬)近段時間,一體再燃熱潮,成為破除“內存墻”,以及打造大力芯片的主要路徑之
    的頭像 發表于 06-08 00:01 ?5336次閱讀

    2PFLOPS,一體迎來新的卷王

    一體技術作為當下內存廠商和不少AI芯片公司都在全力鉆研的方向,已經有了不少成果展示,下代智能存儲的產品均已呼之欲出了。但新
    的頭像 發表于 08-29 06:07 ?3386次閱讀

    探索內計算—基于 SRAM 的內計算與基于 MRAM 的一體的探究

    本文深入探討了基于SRAM和MRAM的一體技術在計算領域的應用和發展。首先,介紹了基于SRAM的
    的頭像 發表于 05-16 16:10 ?2605次閱讀
    探索<b class='flag-5'>存</b>內計算—基于 SRAM 的<b class='flag-5'>存</b>內計算與基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>的探究

    ReRAM一體AI大力芯片的獨特優勢

    近幾年,隨著傳統馮·諾依曼結構的瓶頸逐漸顯現,越來越多企業投身于一體芯片研發的浪潮中,試圖打破“墻”、“能耗墻”和“編譯墻”對AI應
    的頭像 發表于 06-20 08:00 ?3902次閱讀

    一體技術路線如何選

    電子發燒友網報道(文/李彎彎)過去幾年,越來越多企業加入到一體技術的研究中,如今,
    的頭像 發表于 06-21 09:27 ?4229次閱讀

    一體技術發展現狀和未來趨勢

    一體
    電子發燒友網官方
    發布于 :2023年04月25日 17:21:41

    2023年一體是芯片設計的技術趨勢

    一體旨在計算單元與存儲單元融合,在實現數據存儲的同時直接進行計算,以消除數據搬移帶來的開銷,極大提升運算效率,以實現計算存儲的高效節能。
    的頭像 發表于 01-13 15:26 ?2242次閱讀

    關于一體,我們和ChatGPT聊了聊

    一體技術連續兩年入選了《達摩院十大科技趨勢》,被看好在高訪、高并行的人工智能場景的規模化應用。主要是因為
    的頭像 發表于 02-09 14:31 ?1995次閱讀

    特斯拉的下代AI芯片:一體

    根據存儲與計算的距離遠近,將廣義一體技術方案分為三大類,分別是近計算 (Processing Near Memory,PNM)、
    的頭像 發表于 03-09 09:22 ?1758次閱讀

    ChatGPT開啟大模型“軍備賽”,一體開啟力新篇章

    一體需求旺盛,有望推動下階段的人工智能發展,原因是我們認為現在
    發表于 07-06 10:20 ?411次閱讀
    ChatGPT開啟大模型“軍備賽”,<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>開啟<b class='flag-5'>算</b>力新篇章

    如何選擇存儲器類型 一體芯片發展趨勢

    般是20-100TOPS以上,因此不太好直接做大力的一體。而其他的存儲器,包括SRAM、RRAM等,現在已經看到,有實際產品證明可以是可以用來做到大
    發表于 09-06 12:40 ?799次閱讀
    如何選擇存儲器類型 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>芯片<b class='flag-5'>發展</b>趨勢

    一體芯片的技術壁壘

    作為后摩爾時代發展的必然趨勢之一體越來越受到行業的關注。在
    的頭像 發表于 09-22 14:16 ?824次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>芯片的<b class='flag-5'>技術</b>壁壘

    一體芯片新突破!清華大學研制出首顆一體芯片

    這幾天清華大學又火出圈了。但這次并不是因為招生搶人和飯堂,而是清華大學的芯片研發團隊研制出全球首顆全系統集成的一體芯片。這是我國、乃至全世界對半導體行業的又重大突破。 這個芯片由
    的頭像 發表于 10-11 14:39 ?1075次閱讀

    淺談為AI大力而生的-芯片

    大模型爆火之后,一體獲得了更多的關注與機會,其原因之是因為
    發表于 12-06 15:00 ?370次閱讀
    <b class='flag-5'>淺談</b>為AI大<b class='flag-5'>算</b>力而生的<b class='flag-5'>存</b><b class='flag-5'>算</b>-<b class='flag-5'>體</b>芯片