国产a∨精品一区二区三区不卡_国产成人精品免费视频大全麻豆_亚洲国产精品毛片Aⅴ不卡在线_天堂不卡一区二区在线网站

蓬勃發展的機器學習和人工智能新興用例有望通過加速信息處理和提高決策準確性為行業創造重大價值。但機器學習模型是計算密集型、需要高頻和實時 AI 分析場景，這導致企業依賴于使用每秒萬億次操作 (TOPS) 指標的性能指導。TOPS 捕捉到“加速器在一秒鐘內可以提供多少數學運算？” 比較和確定給定推理任務的最佳加速器。

雖然 TOPS 是一個“容易”計算的指標，但它通常無法為實際工作負載提供可靠的性能指標。受限于加速器中乘法器和加法器的數量，該指標無法考慮處理神經網絡模型的計算硬件結構。隨著數據網絡模型更快地處理數據，企業如何通過更快、更可靠的決策進行擴展，尤其是在邊緣？

在這篇文章中，我們將回顧 TOPS、它在測量延遲方面的挑戰以及它與現實世界的性能計算有何不同，并提供一種通過基準測試來計算性能的替代方法，它提供了一種更可靠的方法來解釋計算硬件結構。

TOPS 作為績效衡量標準的現實

TOPS 是一個簡化指標：它告訴您 AI 加速器在一秒鐘內可以處理多少計算操作，并且利用率為 100%。本質上，它著眼于加速器可以在很短的時間內解決多少數學運算問題。

例如，如果一個 AI 加速器提供 5 TOPS，另一個提供 15 TOPS，則推斷后者比前者快三倍。但是，就像 CPU 速度的兆赫茲和千兆赫茲一樣，TOPS 也失去了確定整體計算機性能的相關性。隨著人們對 AI 應用的興趣日益濃厚，最新的 AI 加速器可以比簡單的算術更快地處理數據，并且更復雜。

然而，TOPS 很少準確地捕捉到 AI 處理器在整個硬件設備中的重要性。如今，相機、邊緣服務器和計算機中的 AI 處理器通常是決定計算能力和能源效率的關鍵組件之一。事實上，TOPS 未能考慮到現實世界的工作量。通常，由于諸如空閑計算機單元等待來自內存的數據、加速器不同部分之間的同步開銷和控制開銷等因素，實際性能可能會顯著低于 TOPS 值。根據加速器的架構和工作負載特性，

更高的 TOPS 不等于更高的性能

雖然較高的 TOPS 值可以表示具有更多計算元素的更大 AI 加速器，但現實情況可能恰恰相反。更高的 TOPS 通常會導致更大的加速器具有更多的計算元素和內存塊，以將數據饋送到這些計算單元，這會導致更高的成本和功耗。另一方面，高效的加速器使用較少數量的計算資源提供更高的性能，因此 TOPS 評級較低。最終，理想的 AI 加速器是使用低 TOPS 提供高性能的加速器。

TOPS 不包括所有計算類型

TOPS 指標考慮了加速器的乘法器和加法器，這通常會導致性能指標不準確，因為加速器可以擁有除此之外的其他計算資源。例如，Kinara 的架構采用歸約樹而不是加法器陣列，從而顯著降低能耗。由于在此計算中未捕獲歸約樹的計算能力，TOPS 指標將不夠準確。ResNet50、MobileNet V1 和 YOLO_v3 等標準神經網絡在比較不同的加速器時非常有用，因為它們也可以用作“猜測”給定加速器是否能夠滿足開發人員自身工作負載需求的代理。

推理延遲是評估 AI 加速器性能的指標

對于在 Edge AI 上進行投資的企業，通過基準測試計算性能提供了一種可靠的方法來計算計算硬件結構與 TOPS。由于大多數實際應用程序需要極快的推理時間，因此衡量性能的最佳方法是運行特定的工作負載，通常是 ResNet-50、EfficientDet、Transformer 或自定義模型，以了解加速器的效率。使用不同類型、大小、拓撲和輸入分辨率的網絡進行實時處理，可以得出推理延遲度量。該指標計算加速器完成一個特定 AI 模型的干擾的執行時間。

隨著 AI 工作負載及其支持計算架構的發展，通過準確的性能測量確保其可預測性具有重大影響，可以引導開發人員做出更優化的決策。通過使用推理延遲計算，它有助于處理和預測現代 AI 工作負載中的數據流，即使這些工作負載碎片化并且新架構的發展導致更多的不可預測性。最終，基準測試應用程序提供了一種可信且更可靠的 TOPS 替代方案，而 AI 加速器支持更有效的評估。

審核編輯黃昊宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

加速器

加速器

+關注

關注
2

文章
795

瀏覽量
37758
AI

AI

+關注

關注
87

文章
30117

瀏覽量
268403

IBM與AMD攜手部署MI300X加速器，強化AI與HPC能力

舉措預計將于2025年上半年正式推出。此次合作的核心目標是提升通用人工智能(AI)模型的性能與能效，并為企業客戶提供高性能計算(HPC)應用的強大支持。AMD的Instinct MI300X

發表于 11-21 11:07 ?131次閱讀

IBM將在云平臺部署AMD加速器

IBM與AMD近期宣布了一項重要合作協議，根據協議，IBM將在其云平臺上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業客戶在生成式AI模型方面的性能和能效，進一步推動A

發表于 11-19 16:24 ?135次閱讀

樹莓派新推AI HAT+:26 TOPS高性能版本震撼登場

供了兩種性能配置供用戶選擇。其中，基礎版配備了Hailo-8L加速器，性能達到13 TOPS（每秒萬億次操作），售價為70美元；而更為強大的高端版本則采用了Hailo-8

發表于 11-07 13:44 ?302次閱讀

SiFive發布MX系列高性能AI加速器IP

在AI技術日新月異的今天，RISC-V IP設計領域的領軍企業SiFive再次引領行業潮流，正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。這

發表于 09-24 14:46 ?304次閱讀

TDA4 Edge AI處理器的性能和效率基準測試

電子發燒友網站提供《TDA4 Edge AI處理器的性能和效率基準測試.pdf》資料免費下載

發表于 09-11 09:21 ?0次下載

刷新AI PC NPU算力，AMD銳龍AI 9 HX 375領銜55 TOPS

電子發燒友網報道（文/黃晶晶）最近AMD官網上線了銳龍AI 300系列中的最新成員銳龍AI 9 HX 375處理器。原本Ryzen AI 9 HX 370的NPU達到了50

發表于 08-07 00:28 ?3214次閱讀

NPU和AI TOPS是什么？它們有哪些性能？

可運行AI模型的性能、準確性和效率。如今，TOPS(每秒萬億次運算)是衡量處理器AI性能的主要方

發表于 06-13 10:33 ?739次閱讀

Arm推動生成式AI落地邊緣！全新Ethos-U85 AI加速器支持Transformer 架構，性能提升四倍

滿足更高性能和更復雜的 AI 工作負載。Ethos-U NPU系列是業界首款 AI 微加速器，英飛凌、恩智浦半導體、奇景光電 (Himax)、Alif Semiconductor 和

發表于 04-16 09:10 ?4520次閱讀

Hitek Systems開發基于PCIe的高性能加速器以滿足行業需求

Hitek Systems 使用開放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA，以開發基于最新 PCIe 的高性能加速器 (HiPrAcc)，旨在滿足網絡、計算和高容量存儲應用的需求。

發表于 03-22 14:02 ?575次閱讀

瑞薩發布下一代動態可重構人工智能處理器加速器

瑞薩最新發布的動態可重構人工智能處理器（DRP-AI）加速器，在業界引起了廣泛關注。這款加速器擁有卓越的10 TOPS/W高功率效率，相比傳

發表于 03-08 13:45 ?724次閱讀

瑞薩電子宣布推出一款面向高性能機器人應用的新產品—RZ/V2H

具有10TOPS/W能效的新一代AI加速器無需冷卻風扇即可提供高達80TOPS的AI推理性能

發表于 03-01 10:41 ?797次閱讀

家居智能化，推動AI加速器的發展

電子發燒友網報道（文/黃山明）AI加速芯片，也稱為人工智能加速器（AI Accelerator），是一種專為執行機器學習和深度學習任務而設計的ASIC或定制化處理

發表于 02-23 00:18 ?4537次閱讀

回旋加速器原理回旋加速器的影響因素

回旋加速器（Cyclotron）是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強磁場中的運動。本文將詳細介紹回旋加速器的原理以及影響因素。一、回旋

發表于 01-30 10:02 ?3574次閱讀

粒子加速器的加速原理是啥呢？

粒子加速器的加速原理是啥呢？粒子加速器是一種重要的實驗設備，用于研究粒子物理學、核物理學等領域。其主要原理是通過電場和磁場的作用，對帶電粒子進行加速，在高速運動過程中使其獲得較大的動

發表于 12-18 13:52 ?1981次閱讀

英特爾Gaudi 3系列AI加速器明年上市

英特爾總裁帕特·基辛格（Pat Gelsinger）認為，鑒于英特爾Gaudi3具備的持續加強的性能優勢和極具競爭性的TCO及定價機制，預測該產品有望在2024年憑借領先的AI加速器套件占據更大的市場份額。

發表于 12-15 11:07 ?771次閱讀