對于性能分析,通常我們會使用Perf工具。而perf中的硬件事件,則需要硬件的支持——性能監(jiān)視單元PMU。RISC-V u64內(nèi)核支持PMU,使得我們可以通過perf來統(tǒng)計程序運行所產(chǎn)生的cycle、cache hit、cache miss等事件的次數(shù),從而進一步分析、優(yōu)化性能。
在SiFive U64內(nèi)核中,把PMU稱作HPM,實際是一個東西。另外,u64內(nèi)核的hpm增加了一個新的特性——hpm計數(shù)溢出中斷。
下面詳細介紹SiFive U64的HPM。
HPM簡介HPM:Hardware Performance Monitor。U6 處理器內(nèi)核支持基本的硬件性能監(jiān)控 (HPM) 設施。性能監(jiān)視工具分為兩類計數(shù)器:固定功能計數(shù)器和事件可編程計數(shù)器。這些類包括一組固定計數(shù)器及其計數(shù)器使能寄存器,以及一組事件可編程計數(shù)器及其事件選擇器寄存器。寄存器可用于控制計數(shù)器的行為。性能監(jiān)控可用于多種用途,從優(yōu)化到調(diào)試。
性能監(jiān)控計數(shù)器重置行為instret 和循環(huán)計數(shù)器在系統(tǒng)復位時被初始化為零。硬件性能監(jiān)視器事件計數(shù)器不會在系統(tǒng)重置時初始化,因此具有任意值。用戶可以將所需值寫入計數(shù)器控制和狀態(tài)寄存器 (CSR),以在給定的已知值開始計數(shù)。
固定功能性能監(jiān)控計數(shù)器一個固定功能的性能監(jiān)視器計數(shù)器是硬件連接的,只計算一種特定的事件類型。也就是說,它們不能根據(jù)它們計數(shù)的事件類型進行重新配置。唯一的可以對固定功能性能監(jiān)控計數(shù)器進行的修改是啟用或禁用計數(shù),并寫入計數(shù)器值本身。
U6 處理器內(nèi)核包含兩個固定功能的性能監(jiān)控計數(shù)器
Fixed-Function Cycle Counter (mcycle)
固定功能性能監(jiān)控計數(shù)器 mcycle 保存自過去某個任意時間以來 hart 執(zhí)行的時鐘周期數(shù)的計數(shù)。mcycle 計數(shù)器是可讀寫的,64 位寬。讀取 mcycle 返回 mcycle CSR 的所有 64 位。
Fixed-Function Instructions-Retired Counter (minstret)
固定功能性能監(jiān)控計數(shù)器 minstret 保存 hart 自過去某個任意時間以來退役的指令數(shù)。minstret 計數(shù)器是可讀寫的并且是 64 位寬的。讀取 minstret 返回 minstret CSR 的所有 64 位。
事件可編程性能監(jiān)控計數(shù)器一組可編程事件計數(shù)器與固定功能計數(shù)器相輔相成。U6 HPM 包括兩個額外的事件計數(shù)器,mhpmcounter3 和 mhpmcounter4。這些可編程事件計數(shù)器是可讀寫的,寬度為 64 位。硬件計數(shù)器本身在 U6 內(nèi)核系列上實現(xiàn)為 40 位計數(shù)器??梢詫懭脒@些硬件計數(shù)器以初始化計數(shù)器值。
-
內(nèi)核
+關注
關注
3文章
1382瀏覽量
40425 -
Linux
+關注
關注
87文章
11345瀏覽量
210399 -
HMP
+關注
關注
0文章
2瀏覽量
5849 -
sifive
+關注
關注
0文章
36瀏覽量
9473
發(fā)布評論請先 登錄
相關推薦
評論