精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國產存算一體超速前進 存算一體架構有機會解決很多AI面臨的問題

億鑄科技 ? 來源:雷鋒網(億鑄科技) ? 作者:雷鋒網(億鑄科技 ? 2022-11-25 15:26 ? 次閱讀

僅僅在五、六年前,人工智能還只存在于人們的想象。雷峰網雷峰網

短短幾年間AI快速擴張,AI算力和運算數據量每年都在以指數級增加,對算力的需求空前,但摩爾定律卻已接近極限。

在能耗墻和存儲墻的阻擋下,半導體愈來愈蹣跚的算力提升已經追不上狂奔的AI。

存算一體架構有機會讓AI面臨的問題迎刃而解。時代的浪潮下,一批探索存算一體的企業相繼成立。

在這個領域中,國內外研究幾乎站在同一起跑線上。

其中億鑄科技是將新型存儲器ReRAM用于存算一體賽道的“先行者”。成立僅僅兩年,億鑄科技就已能夠設計出能效比超過主流計算卡十倍的基于ReRAM的存算一體AI大算力芯片

在即將到來的存算一體爆發期,國產廠商們將要迎來的,是一場與國外巨頭們堂堂正正的對決。

名為GPU的馬,拉不動AI的車

自1956年約翰。麥卡錫在達特茅斯會議上提出人工智能的概念,AI已經發展了70年。

70年間,AI曾經爆發過三次浪潮。

在前兩次浪潮中,AI由于種種原因,最終未能普及。

直到第三次浪潮中,深度學習技術的興起,解決了AI普適性與可維護性的問題,這一賽道才真正迎來曙光,造就了現代意義上的基于深度學習的“人工智能”。

隨著深度學習的廣泛應用,對算力的需求日益增加,這讓能夠提供大規模算力的GPU在AI領域變得越來越重要。

然而GPU畢竟不是專為人工智能而生,隨著人工智能發展走入深水區,GPU的問題逐漸浮現,尤其是AI發展中的“存儲墻”、“能耗墻”問題,GPU無法突破。

無論是CPU還是GPU,采用的都是存算分離的馮諾依曼架構。

在馮諾依曼架構下,80%-90%的功耗發生在數據傳輸上,99%的時間消耗在存儲器讀寫過程中,導致了“存儲墻”和“功耗墻”問題。

馮諾依曼架構的芯片在工作時,計算單元要先從內存中讀取數據,計算完成后再存回內存,才能最終輸出。

但在過去幾十年中,存儲器與處理器的發展嚴重失衡,自上世紀八十年代以來,存儲器讀取速率的提升遠遠跟不上處理器性能的增長。

這導致了計算畸形的漏斗結構:無論處理器所在的漏斗“入口”一端處理了多少數據,也只能通過存儲器狹窄的“出口”輸出,嚴重影響了數據處理的效率。

曾在AI芯片公司Wave Computing工作過的熊大鵬博士對此深有感悟。

2014年左右,熊大鵬正在從事GPGPU領域的研究,在工作中他深感能耗墻與功耗墻的限制下,人工智能難以持續發展。

熊大鵬認為,打破內存與計算隔閡的存算一體架構是人工智能未來的一個可能解。

不同于馮諾依曼架構,存儲單元與計算單元一體的結構讓數據不必在兩者之間反復“搬運”,從而讓“能耗墻”與“功耗墻”問題迎刃而解。

談起對存算一體技術的初印象,熊大鵬說到:“2017年我第一次接觸到存算一體技術,當時就震驚于怎么會有這么好的東西能夠恰好解決AI芯片面臨的問題。”

在初識存算一體后,熊大鵬興趣盎然,立刻開始了著手從產業界到學界學習和調研,對存算一體建立了系統的認識。

當時,把存算一體運用到AI中還只是一種理論,熊大鵬還沒有找到將他在存算一體領域的雄心落實的機會。

熊大鵬得以實現抱負的契機是與ReRAM的偶遇,這也是他在2020年創立存算一體AI芯片公司億鑄科技的關鍵。

存算一體的「天時」、「地利」與「人和」

2018年,熊大鵬在工作中接觸到了ReRAM的領軍企業Crossbar。當時正在苦苦尋找存算一體技術在AI芯片領域落地方案的他,剛一接觸ReRAM,就近乎直覺地認為ReRAM有解決存算一體落地問題的能力。

存算一體的存儲介質選擇一般有三種方案:Flash等傳統存儲介質;相對成熟的易失性存儲器SRAM;以及ReRAM等新型存儲器。

熊大鵬說,不同的存儲介質有不同的特點,也有各自最適配的應用領域,而在他看好的AI大算力芯片場景下,ReRAM則是最合適的選擇。

在他看來,NAND Flash讀寫延時較大,性能相對落后,并且工藝節點在40nm左右,難以隨先進工藝繼續迭代,無法滿足AI大算力芯片的計算需求。

SRAM存儲器在大算力場景下則存在單位密度受限、漏電流和工程落地難度和成本較高等問題。

而ReRAM雖然在應用于模擬存算一體時也存在著精度和數模轉換等難題,但在熊大鵬看來,億鑄科技選擇的基于ReRAM的全數字化存算一體技術,能較好解決精度和數模轉換等難題,無疑更適合應用在AI大算力芯片的場景中。

ReRAM是一種新型非易失存儲器,其基本存儲單元被稱為憶阻器,是一種可編程電阻,其特點是在斷電之后電阻值依然能夠長期保持。

憶阻器可編程的性質讓其非常適合在ReRAM存儲單元上加上計算功能,而斷電后保持數據不丟失的特性也讓它能夠成為可靠的存儲器,這都讓ReRAM與存算一體架構的要求不謀而合。

在與一家全球ReRAM新型存儲技術領軍企業中的老朋友們,還有斯坦福大學、德克薩斯大學奧斯汀分校、上海交通大學、復旦大學、中國科學技術大學等高校的知名科學家們經過幾個月的討論后,熊大鵬對使用ReRAM存算一體技術解決AI大算力芯片問題有了初步想法,隨即開始組建團隊。

用ReRAM和全數字化存算一體技術做AI芯片是一條全新的道路,前人留下的腳印甚少,過河沒有石頭可摸。

一開始熊大鵬也考慮過從技術更成熟的SRAM開始,再過渡到ReRAM。

最終是團隊的支持給了熊大鵬信心。團隊組建的過程中,熊大鵬找到了過去在Wave Computing共事過的Debu博士。

Debu博士是IEEE Fellow、曾就職于斯坦福大學,當時在Cadence擔任首席科學家兼AI部門CTO,也在研究基于SRAM的存算一體IP Core,并且已經成家。如果接受熊大鵬的邀約,在家庭和事業兩方面都面臨著困難。

但Debu在了解到熊大鵬決定入局基于ReRAM的全數字化存算一體芯片后,頓覺這是一項面向未來的大事業,解決了他在Cadence研究過的基于SRAM 存算一體未能解決的技術瓶頸,克服種種困難最終還是決定加入到億鑄科技創業的行列中。

Debu不遠千里來投,讓熊大鵬感受到了有識之士對這個賽道的信心,而許多之前曾與熊大鵬有過深入交流的包括工藝器件、電路設計、架構方案和軟件生態等各方專家學者的加入,則給了熊大鵬技術攻關的底氣。

“不論是ReRAM還是MRAM都是比較前沿的領域,單憑企業自身很難成功,離不開新型存儲器領域領先的合作伙伴企業和一流研究團隊的支持。”熊大鵬說。

有了這些的支持,熊大鵬終于下定決心,決定直接從ReRAM開始。

“我們的創業團隊是‘三老’團隊,”熊大鵬略帶調侃地說,“老同事,老同學,老朋友。”

原本就對AI芯片十分熟悉的熊大鵬和對基于SRAM存算一體擁有開發經驗的Debu讓億鑄科技開局已占地利,而眾多老友的加入讓億鑄科技又添人和。而在熊大鵬看來,存算一體的天時也正在當下。

決戰近在咫尺,中國芯這次正面「亮劍」

對于國產存算一體芯片的企業們來說,前路依然漫漫,但代表著決戰的鼓聲已經悄然迫近。

創業者的身份外,熊大鵬還是一名在芯片領域縱橫多年的投資人。

作為投資人,熊大鵬見證了許多新興技術的成長。過往的經驗告訴他,屬于存算一體的時代距離現在并不遙遠。

在熊大鵬看來,存算一體產業從已經實現了從端側小算力到云端大算力的全場景覆蓋,整個產業鏈的配套正在成熟。

同時,潛在客戶對存算一體的認知也越來越清晰,從“沒聽說”到“有了解”再到如今已經對產品“有期待”。

在國家對能耗越來越嚴格的管控趨勢下,數據中心對高能效比的大算力產品的需求也在高漲。而存算一體芯片超高能效的特性正好可以滿足市場需求。

種種因素相疊加,熊大鵬做出判斷:“2024年到2025年,存算一體的產品會全面開花。”

距離存算一體的全面爆發,還有三年時間。對于國產存算一體廠商來講,這正是屬于他們的“天時”。

億鑄科技僅正式運營兩月后,就獲得了由聯想之星、中科創星和匯芯投資聯合領投的過億元天使輪融資。在推動ReRAM落地的關鍵技術上,億鑄科技也已經取得了突破。

如果用模擬或混合方式構建芯片,憶阻器在受到工藝和環境的影響時,會出現精度漂移和數模/模數轉換能耗問題。這也是ReRAM落地存算一體的關鍵阻礙。

為了突破這一難關,億鑄科技選擇攻關全數字化存算一體技術。

基于全數字化方式構造芯片,無需模數和數模信號轉換器,不會受到信噪比的影響,精度可以達到32bit甚至更高,既不會產生精度損失,也不會面臨模擬計算帶來的諸如IR-DROP等問題。

基于全數字化方式,億鑄科技將開發業界首顆基于ReRAM的全數字化存算一體AI大算力芯片,采用chiplet技術,單模組將突破1000TOPS算力,超出GPU 250TOPS算力的四倍多。

熊大鵬表示,億鑄科技的產品落地正在快速推進,第一代芯片將于2023年落地,并在同年投片第二代芯片。

雖然一切順利,但無論對億鑄科技還是對存算一體芯片來說,這都遠遠不是終點。

熊大鵬認為,在技術上實現存算一體和在商業上取得成功是兩種概念。在他看來,存算一體芯片要想大規模被應用,首先要建立起自己的生態。

熊大鵬告訴我們,在大算力應用場景下,存算一體的競爭力在于構建生態系統。

僅僅“參與”到現有的生態中,這遠遠不夠,只有跳出傳統架構的局限,一開始就以存算一體作為思路構建整體系統才能真正發揮存算一體的競爭力。

億鑄科技的目標除了將存算一體架構在AI大算力領域商用落地之外,還期望和其他存算一體賽道上的伙伴們共建生態。

而在美國對我國半導體領域持續打壓的背景下,存算一體芯片還承載著著沖破藩籬的使命。

前段時間,美國出臺了對我國的先進制程和高性能計算設計工具EDA等的出口限制政策,這無疑將對我國AI研究的未來帶來更大挑戰。

熊大鵬認為,在先進工藝短期內無法實現全國產化的大前提下,國內半導體必須具備在性能表現相同的條件下發展與先進制程解耦的技術。

存算一體就是一種突破先進制程對性能限制的有效路徑:億鑄科技基于成熟的28nm CMOS工藝和國內既有產業配套設計的存算一體AI大算力芯片已經可以實現7nm CMOS先進制程AI芯片10倍以上能效比和性能。

并且,在存算一體賽道上,國產芯片廠商們并非單方面的追趕。

在熊大鵬看來,與傳統賽道相比,在存算一體芯片領域,國外“巨頭們”并沒有在這條新開辟的道路上領先太多。

“總的來說,國內外在存算一體領域差距不大,而且在某些方面,我們做的更快更好。國內做存算一體的基本都是初創公司,初創公司可以大干快上地投入,無懼國外巨頭們的競爭,而這些巨頭們卻未必有擁抱革命性技術來革自己命的決心,效率也不一定比我們高。”熊大鵬總結道。

對于這場即將降臨的決戰的最終結果,熊大鵬顯得信心十足:“到了存算一體全面開花的那天,我們一定能夠戰勝他們。”

存算一體賽道上,第一批國產挑戰者已經起跑,相信在存算一體未來幾年內將到來的“未來之戰”中,國產芯片公司一定能夠跑出存算領域的“領航者”。

作者 | 姚勇喆

編輯 | 包永剛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • reram
    +關注

    關注

    1

    文章

    51

    瀏覽量

    25454
  • AI芯片
    +關注

    關注

    17

    文章

    1860

    瀏覽量

    34918
  • AI算力
    +關注

    關注

    0

    文章

    73

    瀏覽量

    8573
  • 存算一體
    +關注

    關注

    0

    文章

    100

    瀏覽量

    4288
  • 億鑄科技
    +關注

    關注

    0

    文章

    24

    瀏覽量

    1373

原文標題:億新聞 | 僅需28nm工藝,提升AI芯片十倍能效,國產存算一體「超速前進」

文章出處:【微信號:億鑄科技,微信公眾號:億鑄科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    開源芯片系列講座第24期:基于SRAM的高效計算架構

    鷺島論壇開源芯片系列講座第24期「基于SRAM的高效計算架構」明晚(27日)20:00精彩開播期待與您云相聚,共襄學術盛宴!|直播信息報告題目基于SRAM
    的頭像 發表于 11-27 01:05 ?70次閱讀
    開源芯片系列講座第24期:基于SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b>的高效計算<b class='flag-5'>架構</b>

    直播預約 |開源芯片系列講座第24期:SRAM一體:賦能高能效RISC-V計算

    RISC-V計算報告簡介一體種先進的計算架構技術,以克服傳統馮諾依曼架構中計算單元與存儲
    的頭像 發表于 11-16 01:10 ?110次閱讀
    直播預約 |開源芯片系列講座第24期:SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>:賦能高能效RISC-V計算

    一體化與邊緣計算:重新定義智能計算的未來

    隨著數據量爆炸式增長和智能化應用的普及,計算與存儲的高效整合逐漸成為科技行業關注的重點。數據存儲和處理需求的快速增長推動了對計算架構的重新設計,“一體化”技術應運而生。同時,隨著物
    的頭像 發表于 11-12 01:05 ?152次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>化與邊緣計算:重新定義智能計算的未來

    一體架構創新助力國產AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應用論壇》上,億鑄科技高級副總裁徐芳發表了題為《一體架構創新助力
    的頭像 發表于 10-23 14:48 ?240次閱讀

    科技新突破:首款支持多模態一體AI芯片成功問世

    一體介質,通過存儲單元和計算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統架構下的AI芯片相比,該款芯片在
    發表于 09-26 13:51 ?357次閱讀
    科技新突破:首款支持多模態<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>AI</b>芯片成功問世

    蘋芯科技引領存一體技術革新 PIMCHIP系列芯片重塑AI計算新格局

    智能芯片國產化再傳利好,8月8日,國際領先的一體芯片開拓者——蘋芯科技在北京召開 “于芯
    發表于 08-08 17:21 ?236次閱讀
    蘋芯科技引領存<b class='flag-5'>算</b><b class='flag-5'>一體</b>技術革新   PIMCHIP系列芯片重塑<b class='flag-5'>AI</b>計算新格局

    后摩智能推出邊端大模型AI芯片M30,展現出一體架構優勢

    電子發燒友網報道(文/李彎彎)近日,后摩智能推出基于一體架構的邊端大模型AI芯片——后摩漫界??M30,最高
    的頭像 發表于 07-03 00:58 ?4118次閱讀

    科技助力AI應用落地:WTMDK2101-ZT1評估板實地評測與性能揭秘

    中得到彰顯。一體架構的突破傳統馮·諾依曼架構的范式探索成為重要趨勢。這種架構改變了
    發表于 05-16 16:38

    探索內計算—基于 SRAM 的內計算與基于 MRAM 的一體的探究

    本文深入探討了基于SRAM和MRAM的一體技術在計算領域的應用和發展。首先,介紹了基于SRAM的內邏輯計算技術,包括其原理、優勢以及在神經網絡領域的應用。其次,詳細討論了基于MR
    的頭像 發表于 05-16 16:10 ?2605次閱讀
    探索<b class='flag-5'>存</b>內計算—基于 SRAM 的<b class='flag-5'>存</b>內計算與基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>的探究

    科技攜手北大共建一體化技術實驗室,推動AI創新

    揭牌儀式結束后,王紹迪在北大集成電路學院舉辦的“未名·芯”論壇上做了主題演講,分享了他對于多模態大模型時代內計算發展的見解。他強調了一體在人工智能領域的重要性及其未來發展趨勢。
    的頭像 發表于 05-08 17:25 ?887次閱讀

    北京大學-知科技一體聯合實驗室揭牌,開啟知科技產學研融合戰略新升級

    5月5日,“北京大學-知科技一體技術聯合實驗室”在北京大學微納電子大廈正式揭牌,北京大學集成電路學院院長蔡茂、北京大學集成電路學院副
    的頭像 發表于 05-07 19:31 ?1380次閱讀
    北京大學-知<b class='flag-5'>存</b>科技<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>聯合實驗室揭牌,開啟知<b class='flag-5'>存</b>科技產學研融合戰略新升級

    什么是通感一體化?通感一體化的應用場景

    通感一體化可廣泛應用于智能家居、智慧城市、智慧交通、醫療健康等方面。文檔君為大家搜集了些典型的應用場景。 智能家居 通感一體化利用基站
    發表于 01-18 16:12 ?1.1w次閱讀
    什么是通感<b class='flag-5'>算</b><b class='flag-5'>一體</b>化?通感<b class='flag-5'>算</b><b class='flag-5'>一體</b>化的應用場景

    一體芯片如何支持Transformer等不同模型?

    后摩智能致力于打造通用人工智能芯片,自主研發的一體芯片在支持各類模型方面表現突出,包括YOLO系列網絡、BEV系列網絡、點云系列網絡等。
    的頭像 發表于 01-05 14:14 ?1305次閱讀

    SRAM一體芯片的研究現狀和發展趨勢

    人工智能時代對計算芯片的力和能效都提出了極高要求。一體芯片技術被認為是有望解決處理器芯片“存儲墻”瓶頸,大幅提升人工智能力能效和
    的頭像 發表于 01-02 11:02 ?2325次閱讀
    SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>芯片的研究現狀和發展趨勢

    淺談為AI力而生的-芯片

    大模型爆火之后,一體獲得了更多的關注與機會,其原因之是因為
    發表于 12-06 15:00 ?370次閱讀
    淺談為<b class='flag-5'>AI</b>大<b class='flag-5'>算</b>力而生的<b class='flag-5'>存</b><b class='flag-5'>算</b>-<b class='flag-5'>體</b>芯片