作者:Arm 終端事業部產品管理高級總監 Stefan Rosinger
在之前有關 Arm Cortex-X925 CPU 的文章中,Arm 技術專家曾探討了每時鐘周期指令數 (IPC) 作為評估 CPU 性能的關鍵指標的重要性。與主要將頻率作為性能指標的做法不同,IPC 衡量的是 CPU 每個時鐘周期內能處理的指令數。對于移動設備而言,電池續航和散熱管理是影響實際應用、用戶體驗和設備處理復雜工作負載的關鍵所在。因而,IPC 對于評估移動設備性能而言,至關重要。
更高的頻率 ≠ 最優表現
IPC 越高,表示在一個時鐘周期內執行的指令越多;即便時鐘速度較慢,也能帶來更好的性能。這對于內存受限的工作負載尤為重要,因為其性能會受到 CPU 外部因素的制約。更高的 IPC 使得 CPU 能以更低的頻率運行,從而減少電量消耗和功耗,設備發熱也會緩解。這對于需要保持穩定性能的移動設備來說,尤為有利。
雖然高頻 CPU 乍聽起來很有吸引力,但它并不能反映性能的全貌。頻率表示 CPU 每秒完成的時鐘周期數量,而 IPC 則表示每個周期所完成的工作量。事實上,最高頻率很少會用到。例如,對于游戲和其他算力要求較高的工作負載來說,并不會以最大頻率使用 CPU,大多數時間反而是以中檔頻率運行。此時的能效更高,可以延長電池續航時間并降低設備溫度,而這兩者是提升整體用戶體驗的重要指標。
在相同的時間周期內,具有更高 IPC 的 CPU 在處理實際應用和復雜工作負載時會表現出更優的性能。即便是當今具有復雜計算需求的 AI 應用(例如聊天機器人、實時語言翻譯和虛擬助手),在 IPC 更高的 CPU 上運行時也會表現得更加出色。此外,就能效而言,在一個周期內執行更多的指令意味著可以更快地完成任務,使得 CPU 處于高能耗狀態的時間減少,從而節省電池電量。
卓越的架構設計
在基于 Armv9 架構的 CPU 設計中,可伸縮向量擴展 (SVE2) 是提高 IPC 的關鍵所在。這一架構特性采用新的專用向量指令,是加速智能手機關鍵工作負載和應用的理想之選。
SVE2 可將 HDR 視頻解碼速度提高約 10%,這樣用戶在主流應用上觀看點播視頻時,能獲得更長的電池續航時間。此外,通過加速常用的圖像處理庫,SVE2 還增強了視頻通話期間用戶體驗的流暢度,同時提高了畫面質量。其中包括更好的攝像頭旋轉體驗,以及圖像濾鏡的切換和使用體驗。
不僅如此,SVE2 還不受向量長度的影響,這意味著代碼開發將支持更大的向量長度,例如 256 位。由此可確保與移動計算未來發展的兼容性,包括未來更注重邏輯擴展,而非 RAM 的先進工藝節點。移動端市場將因此能夠適應更大的向量長度,有利于游戲和 AI 模型中 SVE 代碼的呈現。
通過深入研究設計,IPC 性能可借助一系列特定的微架構改進得以提高。其中包括但不限于:
超標量亂序執行
分支預測和預取器
數據推測
適當的緩存選擇
Arm Cortex CPU 一直在逐年推進各種類似的微架構改進,以實現更高的性能水平。
面向移動端的最新 Armv9 CPU
上述的架構特性和微架構提升是 Arm 面向移動端市場的最新 Armv9 CPU 的核心所在。作為 MediaTek 天璣 9400(已被搭載于 vivo X200 系列等旗艦智能手機)的核心,Cortex-X925 對私有 L2 緩存進行了升級,從 2MB 增加到 3MB。再加上 Cortex-X925 能夠更加快速、高效地預取數據和復雜指令,從而顯著增強了 CPU 的整體性能和能效。得益于此,Arm 計算平臺在 2024 年實現了驚人的兩位數 IPC 性能提升。
如此一來,終端用戶能夠享受到一系列實際性能的提升,包括更快的應用響應速度、更好的游戲體驗、更流暢的視頻流媒體傳輸、更快的網頁瀏覽和順暢的多任務處理。同時,更高的 IPC 也帶來了能效的提升,延長了用戶的沉浸式體驗。
與此同時,Cortex-A725 作為 CPU 工作負載的主力,也進行了一系列針對性更新,著力于需要持續出色性能的關鍵 AI 和游戲用例。與 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。
在 Armv9.2 集群中,每個 CPU 組件都能應對廣泛的實際用例和復雜的工作負載。例如,Cortex-X925 可處理應用啟動和網頁瀏覽的“突發”工作負載,而 Cortex-A725 則可以在常見的移動端用例(包括游戲、網頁瀏覽、基于攝像頭的應用和視頻流媒體)中持續提供穩定性能,以延長設備的使用時間(即電量耗盡之前,用戶可在設備上使用某些用例的平均時間)。
打造無可比擬的移動端體驗
從根本上說,移動設備需要兼具性能與能效,而 IPC 的提升恰好能同時滿足這個需求。用戶因而能更長時間體驗各種需要高算力的應用。最新的 Armv9 CPU 將卓越的 IPC 水平與高時鐘頻率相結合,將性能和能效提升到一個更高的水平,從而為最終用戶帶來更加出色的用戶體驗。這也正是為什么全球 99% 的智能手機都基于 Arm 計算平臺打造的原因之一。
-
ARM
+關注
關注
134文章
9270瀏覽量
373435 -
cpu
+關注
關注
68文章
11011瀏覽量
215142 -
IPC
+關注
關注
3文章
359瀏覽量
52687 -
移動計算
+關注
關注
0文章
30瀏覽量
10348
原文標題:內有劇透!打造高性能、高能效移動計算的關鍵是?
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
Arm 推出 Armv9 邊緣 AI 計算平臺,以超高能效與先進 AI 能力賦能物聯網革新

搶先試用此芯Armv9 AI PC開發套件瑞莎“星睿O6”

Arm Cortex-A320 CPU助力嵌入式設備實現高能效AI計算

詳解Arm Cortex-A320 CPU的特性
Arm發布基于Armv9架構的Cortex-A320處理器
Arm推出全球首個Armv9邊緣AI計算平臺
MediaTek天璣8350移動芯片賦能榮耀平板V9
基于Armv9架構的MediaTek天璣8400移動芯片問世
Arm發布針對旗艦智能手機的新一代CPU和GPU IP
Arm推出AI優化的Arm終端CSS以及新的Arm Kleidi軟件

評論