Arm Neoverse V1 性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf)現在可以下載了,它可以幫助您為基于V1的產品系統優(yōu)化應用程序代碼。
白皮書是對上一篇“Arm Neoverse N1:性能分析方法”(https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/arm-neoverse-n1-performance-analysis-methodology)的更新,涵蓋了從N1到V1內核的新功能和更新。此資源可用于了解和優(yōu)化V1平臺上應用程序的性能。
為了充分利用您花費的分析和優(yōu)化時間,選擇正確的PMU事件并遵循具有用戶友好軟件度量的結構化方法是非常重要的。在白皮書中,我們介紹了Neoverse V1的Arm自頂向下分析方法。
在本博客中,我們概述了從N1到V1內核的更新,并概述了本白皮書的內容。我們還引用了其他有用的資源,以充分利用Neoverse V1平臺。
ArmNeoverse V1支持自上而下的1級指標。
Arm Neoverse V1平臺是第一個Arm核心,為自上而下的方法學1級指標支持全套事件和指標。這些指標對于性能分析和優(yōu)化是一個巨大的增值。
這些指標提供了SLOT級別處理器流水線利用率的詳細細分,從而能夠評估處理器效率和識別瓶頸。該功能是Arm Neoverse V1平臺性能分析功能的一個主要增強,此外還有其他可用于進一步分析的微架構探索指標。
Arm Neoverse V1遙測規(guī)范:性能分析的事件和指標。
Arm Neoverse V1遙測規(guī)范,包括軟件產品特定事件描述和衍生分析指標,可在Arm Neovere V1性能分析方法白皮書附錄B和C中找到。
Arm遙測解決方案庫
白皮書中引用的機器可讀JSON文件中提供的遙測數據和壓力工作負載套件現在可以在GitLab遙測解決方案庫(https://gitlab.arm.com/telemetry-solution/telemetry-solution)中找到。
Neoverse V1 PMU事件和指標備忘單
在這個過程中,熟悉Arm Neoverse微體系結構,包括其復雜的管道和多級內存層次結構,可能會有所幫助。由于Neoverse內核提供了100多個硬件計數器可供選擇,因此確定重點關注的事件的優(yōu)先級非常重要。為了幫助完成這項任務,我們創(chuàng)建了列出事件及其相應派生度量的備忘單。
表1。Neoverse V1核心活動備忘單
主要參考文獻
以下兩份文件提供了對Neoverse V1進行性能分析所需的所有信息,是我們推薦的參考文件:
1) Arm Neoverse V1性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf):本白皮書介紹了一種性能分析方法,并介紹了如何在Arm Neovere V1平臺上進行工作負載表征。這是對上一篇Neoverse N1白皮書的更新,該白皮書介紹了性能分析方法,并展示了如何在Arm Neoverse N1平臺上進行工作負載表征。如果您是Arm平臺和性能分析工具(如Linuxperf)的新手,我們建議您先閱讀本白皮書。
2) Arm Neoverse V1 PMU指南(直接下載):本文檔全面概述了所有硬件PMU事件,包括在性能分析中有效使用事件所需的微架構和架構細節(jié)。
Arm Neoverse V1核心
Arm Neoverse V1是一個核心,旨在為苛刻的云、HPC和AI/ML輔助工作負載提供最大的單線程性能。Neoverse V1是第一個包含可擴展向量擴展(SVE)的Neoverse處理器,可實現最大向量性能、HPC代碼重用和使用壽命。Neoverse V1支持Bfloat16和Int8 MatMul指令。與Neoverse N1相比,這些指令可以為TensorFlow、PyTorch、OneDNN等機器學習框架提供高達3倍的性能。Neoverse V1 CPU目前可用于AWS EC2實例,由AWS Graviton3和AWS Graviton 3E處理器提供支持。
結論
我們自上而下的方法分析和遙測規(guī)范現在可用于Neoverse V1平臺。我們將很快開始將這些信息上傳到Linux perf工具。V系列內核,如V1,旨在在Neoverse系列CPU IP中提供最大的單線程性能。Neoverse V1性能分析方法白皮書和V1 PMU指南可以幫助開發(fā)人員從V1架構中獲得最大性能。我們鼓勵所有使用基于V1的平臺(包括AWS Graviton3和Graviton3E)的開發(fā)人員學習和使用它。
白皮書下載地址:https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf
審核編輯 :李倩
-
處理器
+關注
關注
68文章
19406瀏覽量
231163 -
ARM
+關注
關注
134文章
9165瀏覽量
369165 -
應用程序
+關注
關注
38文章
3292瀏覽量
57911
原文標題:Arm Neoverse V1–性能分析和遙測規(guī)范的自頂向下方法
文章出處:【微信號:Arm軟件開發(fā)者,微信公眾號:Arm軟件開發(fā)者】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
深度解析Neoverse V1對Arm的重要意義

Arm Neoverse家族新增V1和N2兩大平臺,突破高性能計算瓶頸
基于自頂向下技術的工程機械Digital Prototyping設計方法及應用
Arm Neoverse V1的AWS Graviton3在深度學習推理工作負載方面的作用
ARM Neoverse N1 Core性能分析方法
Arm Neoverse V1 PMU指南
Arm Neoverse? N1 PMU指南
ARM Neoverse?V1參考設計軟件開發(fā)人員指南
互聯網巨頭紛紛啟用Arm CPU架構,Arm最新Neoverse V1和N2平臺加速云服務器芯片自研
計算機網絡:自頂向下
eda自頂向下的設計方法 eda自頂向下設計優(yōu)點
Arm新Arm Neoverse計算子系統(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

評論