Arm Neoverse V1 性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf)現(xiàn)在可以下載了,它可以幫助您為基于V1的產品系統(tǒng)優(yōu)化應用程序代碼。
白皮書是對上一篇“Arm Neoverse N1:性能分析方法”(https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/arm-neoverse-n1-performance-analysis-methodology)的更新,涵蓋了從N1到V1內核的新功能和更新。此資源可用于了解和優(yōu)化V1平臺上應用程序的性能。
為了充分利用您花費的分析和優(yōu)化時間,選擇正確的PMU事件并遵循具有用戶友好軟件度量的結構化方法是非常重要的。在白皮書中,我們介紹了Neoverse V1的Arm自頂向下分析方法。
在本博客中,我們概述了從N1到V1內核的更新,并概述了本白皮書的內容。我們還引用了其他有用的資源,以充分利用Neoverse V1平臺。
ArmNeoverse V1支持自上而下的1級指標。
Arm Neoverse V1平臺是第一個Arm核心,為自上而下的方法學1級指標支持全套事件和指標。這些指標對于性能分析和優(yōu)化是一個巨大的增值。
這些指標提供了SLOT級別處理器流水線利用率的詳細細分,從而能夠評估處理器效率和識別瓶頸。該功能是Arm Neoverse V1平臺性能分析功能的一個主要增強,此外還有其他可用于進一步分析的微架構探索指標。
Arm Neoverse V1遙測規(guī)范:性能分析的事件和指標。
Arm Neoverse V1遙測規(guī)范,包括軟件產品特定事件描述和衍生分析指標,可在Arm Neovere V1性能分析方法白皮書附錄B和C中找到。
Arm遙測解決方案庫
白皮書中引用的機器可讀JSON文件中提供的遙測數(shù)據(jù)和壓力工作負載套件現(xiàn)在可以在GitLab遙測解決方案庫(https://gitlab.arm.com/telemetry-solution/telemetry-solution)中找到。
Neoverse V1 PMU事件和指標備忘單
在這個過程中,熟悉Arm Neoverse微體系結構,包括其復雜的管道和多級內存層次結構,可能會有所幫助。由于Neoverse內核提供了100多個硬件計數(shù)器可供選擇,因此確定重點關注的事件的優(yōu)先級非常重要。為了幫助完成這項任務,我們創(chuàng)建了列出事件及其相應派生度量的備忘單。
表1。Neoverse V1核心活動備忘單
主要參考文獻
以下兩份文件提供了對Neoverse V1進行性能分析所需的所有信息,是我們推薦的參考文件:
1) Arm Neoverse V1性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf):本白皮書介紹了一種性能分析方法,并介紹了如何在Arm Neovere V1平臺上進行工作負載表征。這是對上一篇Neoverse N1白皮書的更新,該白皮書介紹了性能分析方法,并展示了如何在Arm Neoverse N1平臺上進行工作負載表征。如果您是Arm平臺和性能分析工具(如Linuxperf)的新手,我們建議您先閱讀本白皮書。
2) Arm Neoverse V1 PMU指南(直接下載):本文檔全面概述了所有硬件PMU事件,包括在性能分析中有效使用事件所需的微架構和架構細節(jié)。
Arm Neoverse V1核心
Arm Neoverse V1是一個核心,旨在為苛刻的云、HPC和AI/ML輔助工作負載提供最大的單線程性能。Neoverse V1是第一個包含可擴展向量擴展(SVE)的Neoverse處理器,可實現(xiàn)最大向量性能、HPC代碼重用和使用壽命。Neoverse V1支持Bfloat16和Int8 MatMul指令。與Neoverse N1相比,這些指令可以為TensorFlow、PyTorch、OneDNN等機器學習框架提供高達3倍的性能。Neoverse V1 CPU目前可用于AWS EC2實例,由AWS Graviton3和AWS Graviton 3E處理器提供支持。
結論
我們自上而下的方法分析和遙測規(guī)范現(xiàn)在可用于Neoverse V1平臺。我們將很快開始將這些信息上傳到Linux perf工具。V系列內核,如V1,旨在在Neoverse系列CPU IP中提供最大的單線程性能。Neoverse V1性能分析方法白皮書和V1 PMU指南可以幫助開發(fā)人員從V1架構中獲得最大性能。我們鼓勵所有使用基于V1的平臺(包括AWS Graviton3和Graviton3E)的開發(fā)人員學習和使用它。
白皮書下載地址:https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf
審核編輯 :李倩
-
處理器
+關注
關注
68文章
19178瀏覽量
229200 -
ARM
+關注
關注
134文章
9057瀏覽量
366872 -
應用程序
+關注
關注
37文章
3245瀏覽量
57614
原文標題:Arm Neoverse V1–性能分析和遙測規(guī)范的自頂向下方法
文章出處:【微信號:Arm軟件開發(fā)者,微信公眾號:Arm軟件開發(fā)者】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論