Arm Neoverse V1 性能分析方法白皮書(shū)(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf)現(xiàn)在可以下載了,它可以幫助您為基于V1的產(chǎn)品系統(tǒng)優(yōu)化應(yīng)用程序代碼。
白皮書(shū)是對(duì)上一篇“Arm Neoverse N1:性能分析方法”(https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/arm-neoverse-n1-performance-analysis-methodology)的更新,涵蓋了從N1到V1內(nèi)核的新功能和更新。此資源可用于了解和優(yōu)化V1平臺(tái)上應(yīng)用程序的性能。
為了充分利用您花費(fèi)的分析和優(yōu)化時(shí)間,選擇正確的PMU事件并遵循具有用戶(hù)友好軟件度量的結(jié)構(gòu)化方法是非常重要的。在白皮書(shū)中,我們介紹了Neoverse V1的Arm自頂向下分析方法。
在本博客中,我們概述了從N1到V1內(nèi)核的更新,并概述了本白皮書(shū)的內(nèi)容。我們還引用了其他有用的資源,以充分利用Neoverse V1平臺(tái)。
ArmNeoverse V1支持自上而下的1級(jí)指標(biāo)。
Arm Neoverse V1平臺(tái)是第一個(gè)Arm核心,為自上而下的方法學(xué)1級(jí)指標(biāo)支持全套事件和指標(biāo)。這些指標(biāo)對(duì)于性能分析和優(yōu)化是一個(gè)巨大的增值。
這些指標(biāo)提供了SLOT級(jí)別處理器流水線利用率的詳細(xì)細(xì)分,從而能夠評(píng)估處理器效率和識(shí)別瓶頸。該功能是Arm Neoverse V1平臺(tái)性能分析功能的一個(gè)主要增強(qiáng),此外還有其他可用于進(jìn)一步分析的微架構(gòu)探索指標(biāo)。
Arm Neoverse V1遙測(cè)規(guī)范:性能分析的事件和指標(biāo)。
Arm Neoverse V1遙測(cè)規(guī)范,包括軟件產(chǎn)品特定事件描述和衍生分析指標(biāo),可在Arm Neovere V1性能分析方法白皮書(shū)附錄B和C中找到。
Arm遙測(cè)解決方案庫(kù)
白皮書(shū)中引用的機(jī)器可讀JSON文件中提供的遙測(cè)數(shù)據(jù)和壓力工作負(fù)載套件現(xiàn)在可以在GitLab遙測(cè)解決方案庫(kù)(https://gitlab.arm.com/telemetry-solution/telemetry-solution)中找到。
Neoverse V1 PMU事件和指標(biāo)備忘單
在這個(gè)過(guò)程中,熟悉Arm Neoverse微體系結(jié)構(gòu),包括其復(fù)雜的管道和多級(jí)內(nèi)存層次結(jié)構(gòu),可能會(huì)有所幫助。由于Neoverse內(nèi)核提供了100多個(gè)硬件計(jì)數(shù)器可供選擇,因此確定重點(diǎn)關(guān)注的事件的優(yōu)先級(jí)非常重要。為了幫助完成這項(xiàng)任務(wù),我們創(chuàng)建了列出事件及其相應(yīng)派生度量的備忘單。
表1。Neoverse V1核心活動(dòng)備忘單
主要參考文獻(xiàn)
以下兩份文件提供了對(duì)Neoverse V1進(jìn)行性能分析所需的所有信息,是我們推薦的參考文件:
1) Arm Neoverse V1性能分析方法白皮書(shū)(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf):本白皮書(shū)介紹了一種性能分析方法,并介紹了如何在Arm Neovere V1平臺(tái)上進(jìn)行工作負(fù)載表征。這是對(duì)上一篇Neoverse N1白皮書(shū)的更新,該白皮書(shū)介紹了性能分析方法,并展示了如何在Arm Neoverse N1平臺(tái)上進(jìn)行工作負(fù)載表征。如果您是Arm平臺(tái)和性能分析工具(如Linuxperf)的新手,我們建議您先閱讀本白皮書(shū)。
2) Arm Neoverse V1 PMU指南(直接下載):本文檔全面概述了所有硬件PMU事件,包括在性能分析中有效使用事件所需的微架構(gòu)和架構(gòu)細(xì)節(jié)。
Arm Neoverse V1核心
Arm Neoverse V1是一個(gè)核心,旨在為苛刻的云、HPC和AI/ML輔助工作負(fù)載提供最大的單線程性能。Neoverse V1是第一個(gè)包含可擴(kuò)展向量擴(kuò)展(SVE)的Neoverse處理器,可實(shí)現(xiàn)最大向量性能、HPC代碼重用和使用壽命。Neoverse V1支持Bfloat16和Int8 MatMul指令。與Neoverse N1相比,這些指令可以為TensorFlow、PyTorch、OneDNN等機(jī)器學(xué)習(xí)框架提供高達(dá)3倍的性能。Neoverse V1 CPU目前可用于AWS EC2實(shí)例,由AWS Graviton3和AWS Graviton 3E處理器提供支持。
結(jié)論
我們自上而下的方法分析和遙測(cè)規(guī)范現(xiàn)在可用于Neoverse V1平臺(tái)。我們將很快開(kāi)始將這些信息上傳到Linux perf工具。V系列內(nèi)核,如V1,旨在在Neoverse系列CPU IP中提供最大的單線程性能。Neoverse V1性能分析方法白皮書(shū)和V1 PMU指南可以幫助開(kāi)發(fā)人員從V1架構(gòu)中獲得最大性能。我們鼓勵(lì)所有使用基于V1的平臺(tái)(包括AWS Graviton3和Graviton3E)的開(kāi)發(fā)人員學(xué)習(xí)和使用它。
白皮書(shū)下載地址:https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf
審核編輯 :李倩
-
處理器
+關(guān)注
關(guān)注
68文章
19395瀏覽量
230673 -
ARM
+關(guān)注
關(guān)注
134文章
9150瀏覽量
368469 -
應(yīng)用程序
+關(guān)注
關(guān)注
38文章
3287瀏覽量
57814
原文標(biāo)題:Arm Neoverse V1–性能分析和遙測(cè)規(guī)范的自頂向下方法
文章出處:【微信號(hào):Arm軟件開(kāi)發(fā)者,微信公眾號(hào):Arm軟件開(kāi)發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論