精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

升騰910和含光800性能對比 昇騰910和含光800性能對比

工程師鄧生 ? 2023-08-31 17:31 ? 次閱讀

有網友關注升騰910和含光800性能對比;升騰910一般認為就是華為的昇騰910;而含光800則是阿里巴巴發布的含光800AI芯片。

2019年9月25日,阿里巴巴發布含光800AI芯片;含光800是高性能的AI推理芯片。該芯片推理性能達到78563 IPS,能效比500 IPS/W。

含光800AI芯片基于RISC-V和阿里自有算法,含光800芯片性能的突破得益于軟硬件的協同創新:硬件層面采用自研芯片架構,通過推理加速等技術有效解決芯片性能瓶頸問題;軟件層面集成了達摩院先進算法,針對CNN及視覺類算法深度優化計算、存儲密度,可實現大網絡模型在一顆NPU上完成計算。

含光800AI芯片相比傳統GPU算力,性價比提升100%。根據云棲大會的現場演示結果顯示,比如拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800后可縮減至5分鐘。

據阿里介紹含光NPU采用TSMC 12nm工藝制程,可提供全球最高單芯片AI推理性能。 在HGAI模型的推理應用中,含光NPU每秒鐘可處理高達78000 IPS的圖片,是同類處理器的數十倍性能。

目前含光800目前已被應用到阿里巴巴旗下的的多個業務場景,比如圖像視頻分析、城市大腦、搜索優化等等。

2019年8月23日,華為發布AI芯片Ascend 910(昇騰910)。

據華為官方介紹,昇騰910AI處理器,基于自研華為達芬奇架構3D Cube技術,實現業界最佳AI性能與能效,架構靈活伸縮,支持云邊端全棧全場景應用。

除了基于達芬奇架構的AI核外,昇騰910還集成了多個CPU、DVPP和任務調度器(Task Scheduler),因而具有自我管理能力,可以充分發揮其高算力的優勢。

昇騰910集成了HCCS、PCIe 4.0和RoCE v2接口,為構建橫向擴展(Scale Out)和縱向擴展(Scale Up)系統提供了靈活高效的方法。HCCS是華為自研的高速互聯接口,片內RoCE可用于節點間直接互聯。最新的PCIe 4.0的吞吐量比上一代提升一倍。

昇騰910算力是國際頂尖AI芯片的2倍,相當50個當前最新最強的CPU;其訓練速度,也比當前最新最強的芯片提升了50%-100%。同時華為還發布了配套的新一代AI開源計算框架MindSpore。兩者搭配性能最大化利用芯片算力。

新一代的AI開源計算框架MindSpore創新編程范式,使得工程師更容易使用;該計算框架可滿足終端、邊緣計算、云全場景需求,能更好保護數據隱私;可開源,形成廣闊應用生態。

昇騰910半精度(FP16)算力達256 TFLOPS。(還有一個說法是昇騰910的半精度(FP16)算力達到320 TFLOPS);而整數精度(INT8)算力達到 640 TOPS,(還有一個說法是整數精度(INT8)算力達到512 Tera-OPS;小編認為一個數值可能是設計參數值,一個可能是極值)功耗 310W,采用 7nm 先進工藝。此外,昇騰 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,為構建橫向擴展 (Scale Out)和縱向擴展(Scale Up)系統提供了靈活高效的方法。

比如華為的Atlas 900 AI訓練集群,算力達到了256 PFLOPS。要實現這樣的算力,如果采用通用CPU需要6195個機柜,用GPU需要208個機柜,而NPU如昇騰只要128個機柜,這歸功于昇騰架構對深度學習業務的優化。而且最終,華為只用了16個機柜來實現。

此外,昇騰910為國產AI芯片助力,華為盤古大模型從算力(昇騰算力,昇騰的底層架構也是華為自創的)、芯片使能、AI框架(MindSpore AI計算框架)到AI平臺(AI開發生產線ModelArts)實現了全棧自主創新。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19178

    瀏覽量

    229201
  • RISC-V
    +關注

    關注

    44

    文章

    2233

    瀏覽量

    46045
  • AI芯片
    +關注

    關注

    17

    文章

    1860

    瀏覽量

    34920
  • 昇騰910
    +關注

    關注

    0

    文章

    14

    瀏覽量

    6783
  • 含光800
    +關注

    關注

    0

    文章

    3

    瀏覽量

    1701
收藏 人收藏

    評論

    相關推薦

    800G模塊:超算中心、智算中心、大規模數據中心基石

    800G模塊廠家提供的800G模塊支持IEE802.3ck和QSFP-DD 800 MSA等標準,封裝有QSFP-DD、OSFP、QSF
    的頭像 發表于 11-25 11:58 ?140次閱讀

    未來網絡的高速引擎:800G模塊市場預測與應用前景

    近年來,VR、物聯網、云計算等新業務的出現,對網絡帶寬、并發、實時性能提出了更高的要求。隨著帶寬需求持續飆升,100G、200G和400G模塊將保持重要的市場份額,800G模塊也將
    的頭像 發表于 11-15 09:25 ?272次閱讀

    NPU與GPU的性能對比

    NPU(Neural Processing Unit,神經網絡處理單元)與GPU(Graphics Processing Unit,圖形處理單元)在性能上各有千秋,它們各自的設計初衷和優化方向決定了
    的頭像 發表于 11-14 15:19 ?482次閱讀

    華迅光通AI計算加速800G模塊部署

    ,對人工智能服務器集群的需求也急劇上升。隨著數據中心基礎設施的不斷擴大,模塊的使用量呈指數級增長。目前,200G和400G模塊已經大規模部署,800G模塊已經開始進入量產和引進階
    發表于 11-13 10:16

    fg910a-60光纖有些什么應用

    詳細描述其在光纖中的具體應用,因此以下回答將基于一般性的光纖應用知識和可能的推測來構建。 在光纖通信領域,類似的產品(如光纖連接器、光纖適配器、光纖收發器等)通常用于實現信號的傳輸、轉換和連接。因此,如果FG910A-60是一款與光纖相關的產品
    的頭像 發表于 11-12 10:08 ?93次閱讀

    PCIe 4.0與PCIe 3.0的性能對比

    隨著科技的快速發展,計算機硬件也在不斷地更新換代。PCI Express(PCIe)作為一種高速串行計算機擴展總線標準,廣泛應用于計算機硬件連接,如顯卡、固態硬盤等。 1. 帶寬對比 PCIe
    的頭像 發表于 11-06 09:22 ?1230次閱讀

    DLPC910的datasheet中未看到pindelay數據,DLPC910和DMD之間的LVDS總線是否要考慮pindelay的影響?

    如標題所述,DLPC910的datasheet中未看到pindelay數據,DLPC910和DMD之間的LVDS總線是否要考慮pindelay的影響
    發表于 08-16 06:18

    ICL5101與ICL5102性能對比

    ICL5101與ICL5102性能對比-中文
    發表于 06-17 14:26 ?1次下載

    800G模塊面對AI發展的增長之路

    800G的需求量龐大,客戶需求沒有減少。根據交付計劃的進展,預計未來幾個季度的出貨量將進一步增加。 根據多家機構的研究報告,800G模塊在人工智能算力產業鏈中扮演著至關重要的角色,被認為是其中確定性最高的環節之一。
    的頭像 發表于 04-28 18:07 ?766次閱讀
    <b class='flag-5'>800</b>G<b class='flag-5'>光</b>模塊面對AI發展的增長之路

    800G模塊的兩種主流封裝

    隨著信息時代的快速發展,網絡通信的數據傳輸速率也在不斷提升。800G模塊作為當前網絡通信領域的重要組件,其封裝類型對于模塊的性能和可靠性具有重要影響。本文小易將為大家介紹800G
    的頭像 發表于 04-24 16:20 ?781次閱讀

    易天800G OSFP SR8模塊最新產品解決方案

    800G OSFP SR8模塊是一種可熱插拔的光纖收發模塊,它被設計用于數據中心800G SR8以太網鏈路。該模塊采用了最新的100G PAM4和VCSEL技術,可以實現100m以內的800
    的頭像 發表于 03-22 17:51 ?1090次閱讀
    易天<b class='flag-5'>800</b>G OSFP SR8<b class='flag-5'>光</b>模塊最新產品解決方案

    賽勒科技新型高性能800G硅引擎即將亮相OFC 2024

    南通賽勒光電科技有限公司(簡稱“賽勒科技”)在近日重磅推出了專為AI集群和數據中心設計的新一代產品——新型高性能800G硅引擎。這款備受矚目的創新產品即將在盛大的2024年度光纖通信大會(OFC)上亮相,展出時間定于3月26日
    的頭像 發表于 03-22 10:07 ?835次閱讀

    800G模塊的應用場景

    隨著科技發展,數據中心對光模塊需求大增。800G模塊作為一種高速傳輸技術,應用場景擴展并引起廣泛關注。主要應用于數據中心、云計算和網絡通信等領域,滿足現代社會對高帶寬、快速數據傳輸的需求。
    的頭像 發表于 03-11 15:30 ?615次閱讀

    英偉達和華為/海思主流GPU型號性能參考

    一句話總結,H100 vs. A100:3 倍性能,2 倍價格 值得注意的是,HCCS vs. NVLINK的GPU 間帶寬。 對于 8 卡 A800910B 模塊而言,910
    發表于 12-29 11:43 ?5497次閱讀
    英偉達和華為/海思主流GPU型號<b class='flag-5'>性能</b>參考

    以太網通訊與485通訊性能對比

    以太網通訊與485通訊性能對比? 以太網通訊和485通訊是兩種常用的工業通訊方式,它們在性能方面有著不同的特點和優勢。本文將對以太網通訊和485通訊的性能進行詳盡、詳實、細致的對比,以
    的頭像 發表于 12-11 17:07 ?2287次閱讀