精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

驅動云/邊緣側算力建設的高性能互聯接口方案

jf_pJlTbmA9 ? 來源:奎芯科技 ? 作者:奎芯科技 ? 2023-11-23 16:30 ? 次閱讀

9月14-15日,2023全球AI芯片峰會(GACS 2023)在深圳正式舉行。奎芯科技應邀出席大會,副總裁王曉陽發表主題為《驅動云/邊緣側算力建設的高性能互聯接口方案》的演講。在演講中,王曉陽分享了AIGC產業算力需求引發的芯片互聯趨勢,并對算力芯片瓶頸進行了分析,提出了奎芯內存互聯解決方案和Chiplet方案落地案例。

AIGC引爆的芯片互聯趨勢

最近幾年AI模型快速發展,模型規模每年差不多10倍速度增長,當令人驚訝的1750億參數的GPT3已成為過去式,迎來更大體量的萬億參數時代,AI系統算力需求也隨之增加,幾乎每季度翻倍增長。最近幾年體系結構討論最多的問題之一就是如何破解兩堵墻:內存墻和I/O墻。多年來通過工藝進步,計算架構設計革新等方法,理論算力的增長速度是驚人的,但是內存帶寬,互聯帶寬的增長卻相對緩慢,造成了巨大的落差,最近業界也在嘗試很多方法來縮小這些差距比如:增加緩存,多級緩存架構,堆疊緩存;盡量提高單節點算力減少互聯的overhead;用高速的芯片互聯和系統互聯的SerDes做芯片互聯等等。

wKgZomVda3WAdBIBAADwKs34-fA147.jpg

英偉達GH200非常重點的強調HBM帶寬,LPDDR容量,以及NVLINK的速度。AMD發布的MI300X對算力指標提都不提,只提內存容量、內存帶寬以及互聯帶寬。因此可以看到在LLM的游戲規則下,內存容量、內存帶寬以及互聯帶寬成了最核心的競爭力,而算力的重要性相對下降。

算力芯片瓶頸分析

目前主流AI大芯片采用HBM為主,它的價格相對其他內存要貴,但單位帶寬成本較低。

HBM使用有諸多限制,其一是因為HBM的顆粒必須和SOC的Die要對齊,合封在一起,所以它是一個緊耦合的狀態,會帶來如下限制:在HBM數量方面,SoC與HBM必須保持貼合,導致HBM顆粒數量受限于芯片邊緣長度;在熱管理方面,DRAM的溫度敏感性會限制SoC的工作頻率,從而影響性能,而SoC與HBM之間的熱交互對測試提出了更高的要求;在設計實施方面,HBM IP的布局和適配性相對不夠靈活;另外,工藝限制要求SoC與HBM HOST IP必須采用相同的工藝制程;最后,需要注意的是SoC的面積占用問題,在12納米工藝下每個HBM HOST IP大約占據30mm2,限制了計算單元的面積。

其二是主流HBM的應用還是以先進封裝為主,包括Silicon interposer 或者Silicon Bridge等,也帶來了不少限制:Interposer尺寸受限制,最大只能有3到4個曝光面積;2.5D封裝的成本較高,與標準封裝相比價格高出4倍,近期臺積電的CoWoS單價上漲了20%;采用uBump作為連接點時,測試覆蓋率有限,當封裝中包含超過6個HBM和2個ASIC時,良率明顯下降;最后,CoWoS產能有限,臺積電的CoWoS產能緊缺,國內2.5D封裝技術還不夠成熟。

奎芯基于UCIe接口的HBM互聯方案

針對這些問題,奎芯科技打造一站式解決方案—M2LINK,用于將HBM和SoC解耦。基本做法是利用一顆Chiplet將HBM接口協議轉成UCIE接口協議,然后用RDL interposer 把Chiplet和HBM內存封裝成一個標準模組,最后通過普通基板來和主SoC進行封裝。這樣主SoC和標準模組間距離預計可以拉遠到2.5cm,克服了原先主SoC和HBM緊耦合和綁定的限制,同時也無需受限于先進封裝的高成本和Si Interposer的有限尺寸。除此之外還有諸多好處,比如以UCIe IP取代HBM IP,節省了主芯片面積,主芯片成本降低;單位邊長可以連接更多的HBM標準模組,內存容量和帶寬都可以得到提升等等。

wKgZomVda3yAHPvGAAELq7n1XT0168.jpg

以目前主流芯片為例,SoC近HBM的邊長為30mm的話,可以擺放6個HBM顆粒,利用M2LINK方案的話,雙邊共可以擺放8個HBM模組,同等大小的SoC可利用面積增大44%,內存容量帶寬增加1/3, 最大封裝面積可以增加一倍以上。

奎芯Chiplet落地解決方案

奎芯科技作為國內領先的互聯IP產品及Chiplet產品供應商,國產自研內存及互聯解決方案,奎芯LPDDR5X接口速率可達8533Mbps,業界領先。奎芯D2D接口則具有高速率、低功耗、低延遲等優勢。而奎芯HBM接口可支持國產工藝 PHY+ Controller 全套方案,速率可達6.4Gbps。目前,奎芯已經有70件知識產權申請,以及16件榮譽獎項。

wKgaomVda4KAaU6LAAEMlVw-uU0487.jpg

奎芯科技基于對于整個封裝供應鏈的整合能力,目前和客戶一起打造一款標準的帶HBM3的2.5D全國產封裝大芯片,將會提供包含HBM IP, interposer設計,2.5D封裝的設計的完整的turn key solution。

wKgZomVda4mALNNIAAEB_o5y5LI780.jpg

同時,奎芯科技基于D2D(UCIe)解耦SoC和HBM HOST的思路不僅適用于云端訓練和推理的大算力芯片,在端側已經有具體實踐的案例,目前在給客戶打造的是一款低功耗計算產品的IO die。對于此場景,客戶希望計算部分用最先進的制程,考慮到昂貴的成本,客戶還是希望解耦內存接口放到成熟工藝上實現,因此我們給客戶打造一顆包含 LPDDR host 的完整IO die, 實現內存接口解耦,降低成本,為客戶未來產品升級增加靈活性。

奎芯科技致力于建立開放生態的一站式Chiplet服務平臺,提供接口IP,Chiplet,系統設計和先進封裝設計等服務,配套強大的供應鏈資源及高效的系統整合服務,為客戶提供完整的一站式解決方案。

來源: 奎芯科技

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    454

    文章

    50460

    瀏覽量

    421980
  • AI芯片
    +關注

    關注

    17

    文章

    1860

    瀏覽量

    34920
  • 算力
    +關注

    關注

    1

    文章

    936

    瀏覽量

    14750
  • chiplet
    +關注

    關注

    6

    文章

    419

    瀏覽量

    12561
收藏 人收藏

    評論

    相關推薦

    華為助力貴州氣象高性能項目建設

    一體化網絡國家(貴州)樞紐節點建設氣象高性能,確保能夠有效支撐國家級數值模式的貴州本地化
    的頭像 發表于 11-25 10:19 ?112次閱讀

    GPU租用平臺是什么

    GPU租用平臺是一種基于計算的服務模式,它允許用戶通過互聯網按需租用高性能GPU資源,而無需自行購買、部署和維護這些硬件。
    的頭像 發表于 10-16 10:15 ?170次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    1章 從TOP500和MLPerf看芯片格局 1.1科學最前沿TOP500 1.2 AI
    發表于 10-15 22:08

    研華發布高性能工業邊緣 AI 方案 攜手昇騰引領邊緣 AI 革新

    生態伙伴工場、華瞳智能,共同分享 AI 產業的落地成果。會上,研華重磅發布了基于昇騰 310 系列平臺的工業邊緣 AI 方案,其中包括
    的頭像 發表于 09-26 10:54 ?290次閱讀
    研華發布<b class='flag-5'>高性能</b>工業<b class='flag-5'>邊緣</b> AI <b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>方案</b> 攜手昇騰引領<b class='flag-5'>邊緣</b> AI 革新

    米爾STM32MP2核心板首發新品上市!高性能+多接口+邊緣

    /1路USB2.0 HOST/3路SDIO3.0/9路UART接口/8路I2C/4個I3/8路SPI/1路16bit FMC等。STM32MP2憑借先進、豐富接口和高安全性,為
    發表于 09-20 18:24

    ST系列-米爾STM32MP257核心板開發板-高性能+多接口+邊緣

    MYC-LD25X核心板及開發板ST第二代工業級MPU,高性能+多接口+邊緣STM32MP2系列是意法半導體推出最新一代工業級64位微處
    發表于 09-20 17:46 ?1次下載

    名單公布!【書籍評測活動NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構分析

    ,在全球范圍內,對于推動科技進步、經濟發展及社會整體的運作具有至關重要的作用。隨著信息技術的高速發展,高性能計算(HPC)和人工智能(AI)等技術在多個領域的應用變得日益廣泛,芯片
    發表于 09-02 10:09

    廣和通端AI解決方案驅動性能密集型場景商用型場景商用

    2024世界機器人大會期間,廣和通宣布:基于高通QCS8550平臺的廣和通端AI解決方案高效使能性能密集型場景。該端AI解決方案整合強大
    的頭像 發表于 08-23 16:06 ?276次閱讀

    廣和通端AI解決方案驅動性能密集型場景商用型場景商用

    2024世界機器人大會期間,廣和通宣布:基于高通QCS8550平臺的廣和通端AI解決方案高效使能性能密集型場景。該端AI解決方案整合強大
    的頭像 發表于 08-23 16:05 ?636次閱讀
    廣和通端<b class='flag-5'>側</b>AI解決<b class='flag-5'>方案</b><b class='flag-5'>驅動</b><b class='flag-5'>性能</b>密集型場景商用型場景商用

    名單公布!【書籍評測活動NO.41】大模型時代的基礎架構:大模型中心建設指南

    章講解GPU集群的網絡設計與實現;第7章講解GPU板卡調度技術;第8章講解GPU虛擬化調度方案;第9章講解GPU集群的網絡虛擬化設計與實現;第10章講解GPU集群的存儲設計與實現;第11章講解
    發表于 08-16 18:33

    IaaS+on+DPU(IoD)+下一代高性能底座技術白皮書

    、VMware、Palo Alto 等公司紛紛推出相關解決方案。這些方案背后共同的本質思想是:將計算的 IaaS 層組件從服務器卸載后圍繞 DPU 構筑
    發表于 07-24 15:32

    曙光攜手“互聯公共服務平臺”提高全國匹配效率

    近日,由中國信息通信研究院開發的“互聯公共服務平臺”在重慶上線。作為該平臺合作方之一,曙光智參與了平臺發布儀式。 ? ? 曙光將依托在
    的頭像 發表于 07-16 15:45 ?661次閱讀

    深度踐行“IaaS on DPU”理念,中科馭數正式發布“馭高性能異構解決方案

    ?高性能異構解決方案,為企業提供更快部署、更強性能和更高吞吐的
    的頭像 發表于 05-14 17:04 ?463次閱讀
    深度踐行“IaaS on DPU”理念,中科馭數正式發布“馭<b class='flag-5'>云</b>”<b class='flag-5'>高性能</b><b class='flag-5'>云</b>異構<b class='flag-5'>算</b><b class='flag-5'>力</b>解決<b class='flag-5'>方案</b>!

    明天線上見!DPU構建高性能底座——DPU技術開放日最新議程公布!

    技術在不同行業中的應用解決方案有哪些?能帶來怎樣的業務效果? 3月29日本周五,中科馭數集結產品大咖及解決方案專家團,誠邀您參加以“DPU構建高性能
    的頭像 發表于 04-03 18:12 ?979次閱讀

    EASY-EAI攜手Hailo推出高性能、高邊緣AI硬件組合

    EASY-EAI與Hailo建立合作關系,共同推出高邊緣AI產品組合。
    的頭像 發表于 02-21 09:56 ?778次閱讀