精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

奇異摩爾專用DSA加速解決方案重塑人工智能與高性能計算

奇異摩爾 ? 來源:奇異摩爾 ? 2024-09-19 11:45 ? 次閱讀

寫在開頭,奇異摩爾的 NDSA 互聯系列產品基于高性能RoCEv2 RDMA引擎,是面向智算網絡通信加速及無損數據傳輸的專用DSA加速解決方案。

本文部分內容來源于麥肯錫白皮書

隨著摩爾定律下的晶體管縮放速度放緩,單純依靠增加晶體管密度的通用計算的邊際效益不斷遞減,促使專用計算日益多樣化,于是,針對特定計算任務的專用架構成為計算創新的焦點。

在過去的幾十年的時間里,半導體晶圓上的晶體管密度幾乎每兩年翻一番,這一趨勢令人矚目。但在過去幾年中,晶體管縮放的速度顯著放緩,比摩爾定律預測的速度落后了大約十倍。

2018年,著名計算機架構師約翰·亨尼斯西(John Hennessy)和大衛·帕特森(David Patterson)在圖靈講座中指出,半導體工藝創新的放緩將逐漸增加對架構創新的激勵——即集成電路的設計方式,以執行計算任務。

“他們認為,通用計算架構(如CPU)固有的低效性將開始被專門針對特定計算任務的架構(也稱為領域專用架構,DSAs)的計算能力和成本效益所取代 。”

與此同時,隨著計算和數字化在云計算(人工智能和高性能計算)、網絡、邊緣、物聯網(IoT)和自動駕駛等眾多應用領域中普及,高度領域專用的計算工作負載正在為DSAs提供有意義的性能優勢。大型語言模型(生成式AI的核心引擎),例如ChatGPT,在高容量的AI工作負載中提供了進一步的專業化,這促進了進一步的硬件專業化。 DSA(domain-specific architecture)為特定應用領域開發的硬件和軟件的商業潛力是巨大的。專用的圖形處理單元 (GPU) 和張量處理單元 (TPU) 已經在數據中心獲得了重要的市場份額,它們在 AI 工作負載學習和推理方面的表現優于 CPU。使用GPU和TPU對某些應用的性能提升是非常顯著的,特定工作負載的可以實現15 到 50 倍的加速。此外,在汽車領域,來自領先供應商的定制的專用于某些計算場景的DSA硬件也提供了安全支持日益提高的自動駕駛水平所需的低延遲、高性能推理。

wKgaombrnnKAGY13AAKCgBR1DvE660.png

隨著 DSA 擴展到其他應用領域,麥肯錫咨詢估計到 2026 年,DSA 將占約 900 億美元的收入(約占全球半導體市場的 10% 至 15%),高于 2022 年的約 400 億美元。因此,我們看到在這個方向的硬件類的風險投資顯著增加也就不足為奇了。

01 算力革命下的高性能網絡DSA

隨著人工智能及高性能計算的高速發展,服務器集群的瓶頸逐漸從單CPU、GPU、APU的算力轉換到硬件間的互聯能力。傳統的數據中心架構中包含CPU、內存、存儲和網絡等組件,但CPU目前已經公認不再是運行基礎設施功能的最佳位置了。對于下一代數據中心而言,面向網絡加速的DSA將扮演重要的角色,根據不同應用場景的需求,加速數據傳輸。同時,以太網速度從25G增加到100G、200G、400G,再到800G,甚至還有持續增長的趨勢,超大規模數據中心的硬件架構在逐漸轉變。

據估計,對于超大規模數據中心來說,大約有一半的CPU被用在了非創收型任務上。網絡DSA可以承擔大部分繁重的工作,將CPU解放出來,專注于創收的應用處理上。同時,由于功能和作用不同,北向網絡和高帶寬域在設計時側重點不同。北向網絡側重于網絡控制與管理,主要是網絡控制器與上層應用之間的接口通信。高帶寬域網絡側重于數據傳輸性能,旨在提供高速度、低延遲的網絡連接。基于RoCE的RDMA技術,兼容現有的以太網基礎設施,擁抱開放生態,是業界解決高帶寬域網絡與北向網絡數據傳輸的重要解決方案。

02 Chiplet設計方法與DSA的完美結合

結合Chiplet設計方法學與DSA的設計,可以構建出高效、靈活且高度定制化的計算平臺。Chiplet設計方法學通過將處理器設計拆分為多個獨立的Chiplet,每個Chiplet可以針對特定功能進行優化。這樣可以在設計、制造和測試中提高靈活性。同時,不同的Chiplet分工明確,可以專門處理不同的任務,例如CPU核心、內存控制器、I/O接口等。而DSA針對特定計算任務進行優化,例如生成式人工智能、圖形處理、網絡處理等,相比于通用處理器,DSA在其特定領域內具有更高的性能和能效比。

通過Chiplet方法學,可以將多個DSA集成到一個系統中,創建一個高度定制化的平臺。比如,一個系統可以包含CPU、GPU、TPU、DPU等Chiplet,根據應用需求靈活組合。在這一背景下,組件之間的高速可連接對于確保順利快速的數據傳輸至關重要。互聯標準、帶寬、延遲和低延遲是關鍵指標。

03奇異摩爾NDSA網絡加速與無損數據傳輸解決方案

在智算中心領域,奇異摩爾 的NDSA互聯系列產品復用以太網基礎設施,基于高性能RoCEv2 RDMA引擎,面向智算網絡通信加速及無損數據傳輸的專用DSA加速解決方案。

AI原生智能網卡

奇異摩爾的Kiwi NDSA-SNIC AI原生智能網卡針對網絡數據傳輸,基于RoCE V2 RDMA技術,自適應網絡調度算法,搭載可編程加速核心SDPU,高達800G傳輸帶寬,實現Tb級萬卡集群無損數據傳輸。

高性能網絡加速芯粒

奇異摩爾的高性能網絡加速芯粒 – Kiwi NDSA互聯芯粒針對高帶寬域數據傳輸,基于RoCEv2 RDMA技術,單芯粒傳輸帶寬高達800G,攜帶UCIe-D2D芯粒可擴展互聯接口,實現集群內TB級的高速通信。

寫在最后,無論是在高性能計算領域還是在人工智能領域,我們會預見更多加速數據傳輸的DSA問世。它們通過提供高吞吐量效率,計算節點之間的超快速互連,或提升人工智能訓練的效率,為半導體價值鏈的參與者及其客戶帶來更多的革新和挑戰。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    454

    文章

    50460

    瀏覽量

    421962
  • 人工智能
    +關注

    關注

    1791

    文章

    46896

    瀏覽量

    237658
  • 奇異摩爾
    +關注

    關注

    0

    文章

    45

    瀏覽量

    3372

原文標題:Kiwi Talks | DSA專用領域芯片正在重塑人工智能與高性能計算

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    德晟達推出高性能醫療專用AI一體機

    隨著AI人工智能技術的飛速發展,醫療行業正迎來一場前所未有的變革,德晟達提供的硬件解決方案,服務客戶圍繞“AI人工智能+醫療”的行業創新發展方向,深度研發,將AI人工智能診斷技術與
    的頭像 發表于 11-26 16:25 ?184次閱讀

    機智云入選廣州市“人工智能+”優秀解決方案

    人工智能+”優秀解決方案冊。該方案融合了人工智能與物聯網技術,旨在顯著提升工業生產中的質量檢測效率和準確性,助力企業實現智能化轉型。
    的頭像 發表于 11-19 09:45 ?141次閱讀

    嵌入式和人工智能究竟是什么關系?

    學習和更新提供了可能,從而使人工智能應用能夠不斷適應和優化。 總的來說,嵌入式系統在人工智能中的作用不容忽視。它不僅為人工智能硬件加速提供了強大的支持,還在邊緣
    發表于 11-14 16:39

    《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感

    和國際合作等多個層面。這些內容讓我更加認識到,在推動人工智能與能源科學融合的過程中,需要不斷探索和創新,以應對各種挑戰和機遇。 最后,通過閱讀這一章,我深刻感受到人工智能對于能源科學的重要性。人工智能
    發表于 10-14 09:27

    《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術,AI能夠處理和分析海量數據,發現傳統方法難以捕捉的模式和規律。這不僅極大地提高了數據處理
    發表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    滿足人工智能圖像處理中對于高性能、低功耗和特定功能的需求。 低功耗 : 在人工智能圖像處理中,低功耗是一個重要的考量因素。RISC-V架構的設計使其在處理任務時能夠保持較低的功耗水平,這對于需要
    發表于 09-28 11:00

    FPGA在人工智能中的應用有哪些?

    定制化的硬件設計,提高了硬件的靈活性和適應性。 綜上所述,FPGA在人工智能領域的應用前景廣闊,不僅可以用于深度學習的加速和云計算加速,還可以針對特定應用場景進行定制化
    發表于 07-29 17:05

    人工智能與大模型的關系與區別

    在科技日新月異的今天,人工智能(AI)已成為推動社會進步的重要力量。而在人工智能的眾多分支中,大模型(Large Models)作為近年來興起的概念,以其巨大的參數數量和強大的計算能力,在多個領域展現出了非凡的潛力。本文旨在深入
    的頭像 發表于 07-04 16:07 ?3412次閱讀

    奇異摩爾上海總部進駐上海浦東科海大樓

    。 三年風雨兼程? 三年春華秋實 奇異摩爾于2021年在上海創立,依托于Chiplet和RDMA高性能網絡互聯技術,旨在打造了一整套全棧式AI智算集群互聯架構及產品解決方案。 過去年的
    的頭像 發表于 07-01 18:57 ?2276次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>上海總部進駐上海浦東科海大樓

    三星電子將為代工業務提供人工智能解決方案

    三星電子公司近日宣布,將為其代工客戶提供一套全面的“一站式”人工智能解決方案,以滿足市場對高性能、低功耗人工智能芯片技術的迫切需求。
    的頭像 發表于 06-15 09:42 ?512次閱讀

    人工智能數據中心的新型連接解決方案

    支持新型人工智能數據中心架構的先進連接解決方案不斷涌現。高速板對板連接器、下一代電纜、背板和近似集成電路連接器對電纜解決方案的運行速度高達224Gb/s-PAM4,將加速未來
    的頭像 發表于 06-13 08:26 ?520次閱讀
    <b class='flag-5'>人工智能</b>數據中心的新型連接<b class='flag-5'>解決方案</b>

    奇異摩爾攜手SEMiBAY Talk 邀您暢談互聯與計算

    2024年5月25日(本周六)19:30,由深圳市半導體與集成電路產業聯盟(SICA)主辦的 SEMiBAY Talk“Chiplet 與先進封裝技術和市場趨勢”將在線上舉行。奇異摩爾產品及解決方案
    的頭像 發表于 05-20 18:31 ?952次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>攜手SEMiBAY Talk 邀您暢談互聯與<b class='flag-5'>計算</b>

    摩爾線程攜手瑞萊智慧共同打造人工智能、大模型的整體解決方案

    近期,摩爾線程與北京瑞萊智慧科技有限公司(簡稱:瑞萊智慧)簽署戰略合作協議,雙方將依托各自在人工智能領域的優勢與資源,共同打造人工智能、大模型的整體解決方案,共筑安全可控大模型新生態。
    的頭像 發表于 04-08 11:32 ?988次閱讀
    <b class='flag-5'>摩爾</b>線程攜手瑞萊智慧共同打造<b class='flag-5'>人工智能</b>、大模型的整體<b class='flag-5'>解決方案</b>

    Cadence與NVIDIA聯合推出利用加速計算和生成式AI重塑設計

    中國上海,2024 年 3 月 25 日——楷登電子(美國 Cadence 公司,NASDAQ:CDNS)近日宣布,公司將深化與 NVIDIA 在 EDA、系統設計與分析、數字生物學和人工智能領域的多年合作,推出兩款變革性解決方案,利用
    的頭像 發表于 03-25 14:36 ?569次閱讀

    人工智能服務器高性能計算需求

    人工智能(AI)服務器是一種專門為了運行人工智能應用和提供大數據處理能力而設計的高性能計算機。它既可以支持本地應用程序和網頁,也可以為云和本地服務器提供復雜的AI模型和服務。
    的頭像 發表于 12-08 09:44 ?495次閱讀