最近,英特爾發(fā)布了一組基準(zhǔn)測(cè)試,比較了英特爾至強(qiáng) 8462Y+ CPU 與 AMD EPYC? 9354 CPU 在多個(gè)工作負(fù)載中的性能。本出版物圍繞 所使用的方法提出了幾個(gè)問題。 與 AMD EPYC(霄龍)配置相比,為什么至強(qiáng)配置使用了較新版本的操作系統(tǒng)(?幾乎總是具有更好的性能)?為什么將高性能至強(qiáng)處理器 8462Y+ 與主流 AMD EPYC? 9354 處理器相對(duì)應(yīng)?AMD EPYC? 9374F 在許多工作負(fù)載上一直表現(xiàn)出色,本來是“可比”的處理器。最后,為什么使用非行業(yè)標(biāo)準(zhǔn)基準(zhǔn),因?yàn)橹挥袛?shù)量有限的可核查行業(yè)基準(zhǔn),沒有透明度?如果沒有更多的透明度,就不清楚 AMD EPYC(霄龍)系統(tǒng)是否按照已發(fā)布的 AMD EPYC(霄龍)?調(diào)優(yōu)指南中的建議進(jìn)行了調(diào)校以獲得最佳性能。
行業(yè)合作伙伴針對(duì)基于聯(lián)盟的標(biāo)準(zhǔn)基準(zhǔn)發(fā)布的結(jié)果代表了展示來自各種供應(yīng)商的計(jì)算系統(tǒng)性能的一致方式。這些基準(zhǔn)要求嚴(yán)格遵守基準(zhǔn)測(cè)試工具包、審計(jì)方法和審查流程,以確保合規(guī)性以及系統(tǒng)類型和配置之間一致和公平的比較方式。
主流計(jì)算
以下是業(yè)界廣泛使用的標(biāo)準(zhǔn)、可驗(yàn)證基準(zhǔn)的幾個(gè)示例,這些基準(zhǔn)用于評(píng)估主流用例的實(shí)際性能。重要的是要了解所有這些測(cè)試都是由我們的合作伙伴執(zhí)行的。結(jié)果不言自明:
SPECcpu? 2017 是衡量處理器性能的最流行的基準(zhǔn)測(cè)試。它由一套由行業(yè)和學(xué)術(shù)界委員會(huì)選擇的計(jì)算密集型微基準(zhǔn)組成。表 1 顯示了 AMD EPYC(霄龍)處理器在 32 核和堆棧頂部均具有無可爭(zhēng)議的性能領(lǐng)先地位。
32 核 (8462Y+ 與 9374F) |
堆棧 頂部(8490H 與 9654) |
|
規(guī)格率?2017_int_基數(shù) | 676 與 827(快 1.22 倍) | 1010 與 1800(快 1.78 倍) |
規(guī)格率?2017_fp_基數(shù) | 782 與 964(快 1.23 倍) | 1020 與 1480(快 1.45 倍) |
表 1:SPECcpu? 2017 性能比較
SPECjbb? 2015 是一種流行的衡量標(biāo)準(zhǔn),可以對(duì)基于服務(wù)器端 Java 的應(yīng)用程序進(jìn)行公平的性能測(cè)量。SPECjbb? 2015 模擬了一家擁有 IT 基礎(chǔ)架構(gòu)的公司,該基礎(chǔ)架構(gòu)處理銷售點(diǎn)請(qǐng)求、在線購買和數(shù)據(jù)挖掘操作的組合。在過去的二十年中,Java在整個(gè)行業(yè)中的迅速采用使該基準(zhǔn)與所有受眾相關(guān),包括Java虛擬機(jī)(JVM)供應(yīng)商,硬件開發(fā)人員,Java應(yīng)用程序開發(fā)人員,研究人員和學(xué)術(shù)界成員。表 2 顯示了 AMD EPYC 在 32 個(gè)內(nèi)核和堆棧頂部無可爭(zhēng)議的性能領(lǐng)先地位的另一個(gè)示例。
32 核 (8462Y+ 與 9374F) |
堆棧 頂部(8490H 與 9654) |
|
SPECjbb2015 MultiJVM max-jOPS | 279,312 與 359,294 (快 1.29 倍) | 505,379 與 828,952 (快 1.64 倍) |
表 2:SPECjbb? 2015 性能比較
RDBMS: 讓我們看一下關(guān)系數(shù)據(jù)庫基準(zhǔn)測(cè)試。SAP-SD 是一種流行的基準(zhǔn)測(cè)試,旨在幫助客戶為其 IT 解決方案找到合適的硬件配置。采用 2 核 AMD EPYC 96 處理器的 9654P 系統(tǒng)可提供 809,570 SAPS,而采用英特爾至強(qiáng)鉑金 2H 處理器的 8490P 系統(tǒng)可提供 428,730 SAPS,在系統(tǒng)級(jí)別性能提升 ~1.88 倍 [4]。TPC Benchmark? E (TPC-E) 是用于對(duì)交易處理系統(tǒng)進(jìn)行基準(zhǔn)測(cè)試的行業(yè)標(biāo)準(zhǔn)。由 96 核 AMD EPYC 9654 處理器提供支持的單插槽服務(wù)器的性能優(yōu)于由兩個(gè) 60 核英特爾至強(qiáng)鉑金 8490H 處理器提供支持的雙插槽服務(wù)器,這兩個(gè)處理器都運(yùn)行Microsoft? SQL Server。
虛擬化:VMware? VMmark3? 是業(yè)界領(lǐng)先的企業(yè)虛擬化整合基準(zhǔn)測(cè)試,可衡量 VMware vSphere? 虛擬機(jī)管理程序在各種硬件供應(yīng)商平臺(tái)上的性能和可擴(kuò)展性。近年來,AMD 在這一領(lǐng)域占據(jù)主導(dǎo)地位,在對(duì)客戶最重要的配置中創(chuàng)造了世界紀(jì)錄的虛擬化性能:2 節(jié)點(diǎn) 4 總插槽 SAN、4 節(jié)點(diǎn) 8 總插槽 vSAN 和整體領(lǐng)先地位。當(dāng)前一代 96 核 AMD EPYC 9654 提供了 40.51 @ 43 個(gè)模塊,而堆棧頂部的 60 核英特爾至強(qiáng)鉑金 8490 在類似的 23 節(jié)點(diǎn)、38 個(gè)插槽配置中提供了 23.2 @ 4 個(gè)模塊,具有 ~1.73 倍的性能優(yōu)勢(shì)。這種性能領(lǐng)先地位不僅限于第四代AMD EPYC(霄龍)處理器:第三代AMD EPYC 4X處理器的性能也優(yōu)于英特爾至強(qiáng)鉑金3H[7773]。
? 2008 SPECpower_ssj:SPECpower_ssj2008基準(zhǔn)測(cè)試套件可測(cè)量系統(tǒng)的功耗和性能特征。雙處理器 AMD EPYC 9654 系統(tǒng)的能效為 30,602,而雙處理器英特爾至強(qiáng) 8490H 系統(tǒng)的能效為 16,902,在比較總體ssj_ops/瓦指標(biāo)時(shí)為 SPECpower_ssj2008,根據(jù) spec.org 年公布的結(jié)果 - 基于 AMD EPYC 的服務(wù)器的能效提高了 ~1.81 倍。
人工智能 (AI) 生態(tài)系統(tǒng)不斷發(fā)展。基準(zhǔn)測(cè)試和工作負(fù)載在不斷變化。加速器(如英特爾的 AMX)可以幫助工作負(fù)載的某些計(jì)算受限部分。相比之下,AMD 戰(zhàn)略側(cè)重于提供性能最高的通用內(nèi)核,可在最廣泛的工作負(fù)載中提供高性能。許多 AI 工作負(fù)載受內(nèi)存限制(例如許多大型語言模型或 LLM),因此要么無法從 AMX 中受益,要么由于阿姆達(dá)爾定律而只能看到有限的加速。
成為應(yīng)用程序密集部分的AI周期通常會(huì)卸載到加速器,例如AMD Instinct MI250或AMD Alveo V70。持續(xù)的市場(chǎng)演變將推動(dòng)未來任何為我們的通用設(shè)備增加加速的決策。AMD 利用我們強(qiáng)大的 IP 和軟件產(chǎn)品組合,例如我們的 7040U CPU。推理通常只占整個(gè)工作流程的一小部分;即使是較大的推理加速通常也只能提供較小的整體加速。
具有代表性的 AI 基準(zhǔn)可全面衡量整個(gè)工作流程的性能。事務(wù)處理性能委員會(huì)的TPC Express Benchmark AI(TPCx-AI)旨在通過測(cè)量數(shù)據(jù)中心和云中具有代表性的端到端數(shù)據(jù)AI用例,成為行業(yè)標(biāo)準(zhǔn)。該基準(zhǔn)測(cè)試涵蓋了不同比例因子(數(shù)據(jù)集大小)的 10 個(gè)真實(shí)用例:客戶細(xì)分、客戶保護(hù)轉(zhuǎn)錄、銷售預(yù)測(cè)、垃圾郵件檢測(cè)、價(jià)格預(yù)測(cè)、硬件故障、產(chǎn)品評(píng)級(jí)、旅行分類、面部識(shí)別和欺詐檢測(cè)。AMD 以在比例因子 3、10、30、100、300、1000 和 <> 中擁有領(lǐng)先的性能和性價(jià)比而感到自豪。
高性能計(jì)算
自 1 年推出第一代 AMD EPYC 處理器以來,高性能計(jì)算 (HPC) 一直是 AMD 的優(yōu)先事項(xiàng)。在這方面,AMD EPYC(霄龍)處理器繼續(xù)為企業(yè)和國家實(shí)驗(yàn)室提供領(lǐng)先的性能。AMD EPYC(霄龍)處理器在 2017 核和堆棧頂級(jí)處理器上均提供領(lǐng)先的性能,優(yōu)于競(jìng)爭(zhēng)對(duì)手。AMD 工程師通過正確調(diào)整所有 AMD 和競(jìng)爭(zhēng)系統(tǒng)以獲得最佳性能,例如類似的硬件設(shè)置和 BIOS 設(shè)置,并在所有系統(tǒng)中使用相同的操作系統(tǒng)和選項(xiàng),努力確保所有平臺(tái)都以最佳狀態(tài)呈現(xiàn)。圖 32 和圖 1 顯示了相對(duì)性能數(shù)字,作為每個(gè)測(cè)試應(yīng)用程序的基準(zhǔn)測(cè)試的綜合平均值。
圖 1:32 核性能比較
圖 2:堆棧頂部性能比較
結(jié)論
AMD 依賴于由我們的生態(tài)系統(tǒng)合作伙伴執(zhí)行、審核和發(fā)布的獨(dú)立測(cè)試以及我們自己的內(nèi)部測(cè)試。我們還執(zhí)行自己的內(nèi)部測(cè)試,投入時(shí)間和資源來表征系統(tǒng),了解細(xì)微差別,并調(diào)整系統(tǒng)(包括我們自己和競(jìng)爭(zhēng)對(duì)手的系統(tǒng))以獲得最佳性能。在 AMD,我們的客戶對(duì)我們很重要,因此展示我們的處理器在相關(guān)工作負(fù)載下的表現(xiàn)對(duì)我們很重要。了解系統(tǒng)級(jí)性能至關(guān)重要的縱向擴(kuò)展工作負(fù)載的堆棧頂部與堆棧頂部性能,以及與虛擬機(jī)密度很重要的云部署類似的性能比較對(duì)我們的客戶來說意義重大。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19160瀏覽量
229115 -
amd
+關(guān)注
關(guān)注
25文章
5441瀏覽量
133934 -
AI
+關(guān)注
關(guān)注
87文章
30107瀏覽量
268401
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論