Arm Cortex-M85 RA8系列于2024年11月推出RA8E1和RA8E2兩款新產品。這兩款新產品已正式量產上市,將高算力的RA8系列擴展到入門級領域的應用,降低BOM成本,擴大RA8高性能產品線。
● RA8E1:面向高性能入門級通用型應用。360MHz Arm Cortex-M85內核,集成Helium、TrustZone及優化的外設接口。
● RA8E2:面向高性能入門級圖形顯示應用。480MHz Arm Cortex-M85內核,集成Helium、TrustZone及TFT-LCD顯示控制單元,2D繪圖引擎等圖形功能模塊。
RA產品陣容
Helium
Helium技術是Arm公司為Cortex-M系列處理器引入的向量擴展,正式名稱是Armv8.1-M M-Profile Vector Extension(MVE)向量擴展。Helium技術適用于需要高效數據處理的嵌入式設備,特別是物聯網、可穿戴設備、音頻處理、圖像處理、邊緣AI等領域。目的是提升它們的數字信號處理(DSP)和機器學習(ML)任務的性能,同時保持低功耗。通過Helium,Cortex-M處理器可以在保持低功耗的同時執行高效的計算任務,拓寬了嵌入式系統的應用場景。
Helium和Cortex-A內核MPU中的Neon有很多相似之處。Neon和Helium都使用FPU中的寄存器作為矢量寄存器。兩者都使用128位向量,并且許多向量處理指令對于兩種體系結構都是通用的。然而,Helium是一種全新的設計,可在小型處理器中實現高效的信號處理性能。它為嵌入式用例提供了許多新的架構功能,因為它針對面積(成本)和功耗進行了優化,為M-Profile架構帶來了類似Neon的功能(Cortex-A的SIMD注指令)。Helium經過優化,可有效利用較小Cortex-M內核中的所有可用硬件。下表詳細的給出了Helium和Neon之間的對比信息。
Helium與Neon對比表
注:SIMD(Single Instruction Multiple Data)即單指令多數據,表示在該硬件中的多個處理單元中可以同時對多個數據項執行相同的操作,也就是說,CPU可以同時執行并行計算,但只有一個指令正在執行。這是數據級的并行。
目前有許多系統將Cortex-M處理器和專用可編程的DSP處理器結合來使用。Helium允許這樣的系統只用一個處理器來實現。這樣做有如下優點:
● 從軟件開發的角度來看,它允許使用單個工具鏈,而不是分別對CPU和DSP使用各自的編譯器和調試器。這就意味著程序員只需要熟悉一種架構。
●消除了對處理器間通信的需求,這點可能非常重要,因為要對實時交互的兩個正在運行的處理器中的不同軟件進行調試,既困難也耗時。
● Cortex-M系列的CPU相比專用DSP而言,更易于編程。
在硬件設計層面,使用一個處理器(而不是兩個處理器)可以簡化系統,從而減少芯片面積和成本,并縮短開發周期。
Helium寄存器是128位的,一共有8個,寄存器數量不可修改。它和浮點單元(FPU)共用硬件物理單元。在FPU中使用S0~S31來訪問32個單精度(32位)寄存器,同樣的硬件寄存器也可看做16個雙精度(64位)寄存器D0~D15。D0和S0、S1共用64位相同的硬件寄存器。在Helium架構中,Helium使用8個矢量寄存器Q0~Q7。這就意味著,Helium寄存器Q0和浮點寄存器S0~S3,D0~D1使用相同的物理寄存器,Q1和浮點寄存器S4~S7,D2~D3使用相同的物理寄存器,其他Helium寄存器以此類推。因為Helium寄存器重用了標量FPU寄存器,所以當發生異常時無須使用額外的資源去保存和恢復這些寄存器(同樣不影響中斷延遲)。
每個Helium寄存器都可以劃分為8位,16位,32位寬的通道。每個通道可以被一條指令看作:
● 整型數值(8/16/32位寬)
● 定點飽和值(Q7/Q15/Q31)
● 浮點數值(半精度FP16/單精度FP32)
下圖是一個矢量寄存器相加的示例。Helium寄存器q5和q0都是8個int16的元素數據(8個通道),將他們相加的結果存在q0中。
矢量寄存器相加示例
Helium允許矢量中的每個通道有條件地執行,這稱作通道預測。矢量預測狀態和控制寄存器(VPR)保存每個通道的條件值。某些矢量指令(比如矢量比較VCMP)可以改變VPR中的條件值,當這些條件值被設置好以后,接下來就可以使用VPT(矢量條件預測)指令,以每個通道為基礎在矢量預測中實現條件執行。
TCM
TCM(Tightly Coupled Memory,緊耦合內存)是一種用于嵌入式系統中的高性能內存結構,主要用于存儲關鍵的數據或代碼,減少訪問延遲。TCM通常與處理器內核緊密連接,能夠實現快速訪問,與主存(如SRAM)相比,它具有更低的延遲和更高的帶寬。
TCM的關鍵特性
1. 低延遲高帶寬
TCM直接連接到CPU核心(通過高帶寬、低延遲的路徑),允許處理器以更高的速度訪問數據,適合實時性要求高的應用,如電機控制算法,數字電源,通信,視頻/音頻信號處理等。
2. 可預測性
TCM是一種確定性內存,與緩存不同,它沒有不確定的替換策略或不確定的訪問延遲。這種特性對于實時系統非常重要,可以確保系統的響應時間。
3. 代碼和數據分離
TCM通常分為ITCM(指令緊耦合內存)和DTCM(數據緊耦合內存),分別用于存儲代碼和數據。這種分離可以有效避免代碼和數據訪問之間的資源爭用,進一步提高性能。
CPU框圖
2D Drawing Engine(RA8E2特有)
2D Drawing Engine(二維繪圖引擎,DRW)是一種專門設計的硬件模塊,用于加速圖形界面的繪制任務,尤其是在嵌入式系統、工業控制、家電顯示屏等圖形密集型應用中。這種引擎能夠顯著提高圖形處理的效率,同時減輕MCU的運算負擔。
2D Drawing Engine的關鍵功能
1. 基本圖形繪制加速
2D繪圖引擎通常可以加速基本的圖形繪制操作,比如線條、矩形、圓形、多邊形等。通過硬件加速,這些圖形能夠快速呈現在屏幕上,而不必依賴軟件逐點繪制。
2. 圖像和紋理的拷貝與縮放
2D繪圖引擎能夠對圖像或紋理進行高效的拷貝、縮放、旋轉等操作。比如在用戶界面上實現圖標縮放、背景圖的平滑移動等效果。
3. 位塊傳輸(BitBLT)
用于將圖像數據從一個區域快速復制到另一個區域。這對UI界面更新非常重要,可以加速圖形元素的刷新和移動,減少閃爍感。
4. 顏色填充和漸變填充
可以快速填充顏色或實現顏色漸變填充。漸變填充可以幫助設計更豐富的UI界面,比如背景的漸變效果和按鈕的漸變光澤。
5. 抗鋸齒和銳化
2D繪圖引擎支持抗鋸齒技術,確保圖形邊緣更加平滑,提升視覺效果。
繪圖對象示例
2D繪圖引擎規格
典型應用場景
1. 用戶界面
在智能家電、工業儀表、汽車信息娛樂系統等需要GUI界面的設備上,2D繪圖引擎可以加速圖形元素的繪制,使得界面更加流暢。
2. 圖像渲染
2D繪圖引擎可以用于小型圖像渲染任務,比如顯示簡單的動畫或圖形效果。
2D繪圖引擎通過硬件加速圖形處理,大幅提升繪圖速度,降低CPU負載,適合資源受限的嵌入式環境。
總的來說,MCU的2D繪圖引擎提供了高效的圖形處理能力,適用于需要快速繪制的圖形界面應用。它在嵌入式系統中起到了平衡性能和功耗的關鍵作用。
綜上所述,RA8E1和RA8E2作為新質生產力在嵌入式系統領域的杰出代表,以其高算力、高性能、高性價比以及豐富的功能和安全性特點,成為安全控制、工業HMI、智能家電、建筑自動化和醫療監護儀等應用領域的理想選擇。
-
處理器
+關注
關注
68文章
19293瀏覽量
229914 -
ARM
+關注
關注
134文章
9097瀏覽量
367665 -
嵌入式系統
+關注
關注
41文章
3593瀏覽量
129493 -
內核
+關注
關注
3文章
1372瀏覽量
40295 -
瑞薩
+關注
關注
35文章
22309瀏覽量
86344
原文標題:瑞薩高性能家族入門新品RA8E1,RA8E2性能優勢介紹
文章出處:【微信號:瑞薩MCU小百科,微信公眾號:瑞薩MCU小百科】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論