設計的初始估計功率通常小于硅上的功耗。這是因為沒有可用的功率估計流可以準確地將功率估計結果與硅結果相關聯。此外,對于涉及許多新設計功能的部件和IP塊,確切的門數詳細信息很難在流程的早期預測。
除了更準確的功率估算流程外,還需要RTL級功耗估算,提供減少的機會在設計初期就有力量。本文討論了功率估計的基礎知識,以及RTL級的功率估計流程,每個設計IP和IP的人都應該知道。 SoC。
首先我們將討論功率估算流程中使用的一些術語:
靜態泄漏功率:它是門時消耗的功率沒有轉換。它是由流過晶體管的電流引起的,即使它們被關閉也是如此。它不僅取決于電路的物理參數,還取決于提供給電路的輸入,這意味著當輸入狀態變化時泄漏功率會發生變化,從而導致狀態相關的泄漏功率。
動態電源:當電路處于活動狀態時執行某些功能時消耗的功率。它進一步分為兩個部分:開關和內部。
開關電源:在電池輸出端對負載電容進行充電和放電時會耗散。負載電容由互連(凈)電容和網絡連接的柵極電容組成。
內部或短路電源:電池內消耗內部電池電容的功率。在邏輯轉換期間,P和N型晶體管都在短時間內同時導通,從而導致從Vdd軌到地軌的直接連接。
標準單元庫:標準單元庫是低級電子邏輯功能的集合,例如AND,OR ,INVERT,觸發器,鎖存器和緩沖器。使用技術庫的單元,綜合工具執行將寄存器傳輸級別(RTL)描述轉換為依賴于技術的網表的過程。此過程類似于將高級C程序列表轉換為依賴于處理器的匯編語言列表的軟件編譯器。網表是邏輯視圖級別的RTL的標準單元表示。它由標準單元庫門的實例和門之間的端口連接組成。適當的合成技術確保了合成網表和原始RTL描述之間的數學等價。網表不包含未映射的RTL語句和聲明。典型的標準單元庫包含兩個主要組件:
a)庫數據庫 - 由許多視圖組成,通常包括布局,原理圖,符號,抽象和其他邏輯或模擬視圖。
b)時序摘要 - 通常采用Liberty格式,為每個單元提供功能定義,時序,功率和噪聲信息。
線負載模型:它用于綜合以解決物理延遲。它包含一個查找表,可以提供線電阻,線電容和每單位長度的面積,可以從扇出中進行插值。
功率估算流程
對于RTL功率估算,我們需要以下輸入:
a)設計文件
b)包含在合成設計時使用的標準單元的庫
c)線載模型給出寄生信息(電容和電阻值)
d)模擬信息:VCD/FSDB/SAIF
e)功率估算工具
本文采用簡單的AND門設計,并應用估計流程,以便更深入地了解數字的計算方式。針對相同的AND門采用各種活動簡檔并比較結果。所有分析均在C55FG技術的標準單元庫上進行,在溫度(150°C),電壓(1.08V)和最壞情況下運行。
情況1:采樣周期為2ns(與AND門(A,B)的輸入和AND門(Z)的輸出相比,被認為是最快的切換信號)計算輸入和輸出的活動。
活動定義為信號相對于最快信號周期數的周期數。例如,
A,B,Z的1個周期是5個最快信號周期(采樣信號)= 1/5 = 0.2
概率定義為信號的時間在整個模擬期間(高)。
A,B,Z在10個采樣信號周期中(高)一半時間。
案例2:在此職責周期中,輸入A(25%)發生變化。
因此,活動與周期數保持一致A的采樣周期相同。 A的概率由于現在在10個采樣信號周期中為25%(高)并且類似地為Z,因為Z = A& B。
案例3:在這種情況下,輸入B反轉為A.因此,Z的活動為0而A和B的活動是相同。概率相同。
注意:由于輸入A和輸入A在Z上觀察到毛刺,可能會有一些開關功率AND門上的B同時切換。 RTL級別的模擬不會處理因輸入延遲不同而發生的故障。
以下是上述情況的結果:
Case1 | Case2 | Case3 | |
總計 | 605.880nW | 605.862nW | 0.25267nW |
泄漏 | 0.25267nW | 0.234753nW | 0.25267nW |
切換 | 415.198nW | 415.198nW | 0 |
內部 | 190.430nW | 190.430nW | 0 |
活動(A) |
A = 0.2 B = 0.2 Z = 0.2 |
A = 0.2 B = 0.2 Z = 0.2 |
A = 0.2 B = 0.2 Z = 0 |
概率 |
A = 0.5 B = 0.5 Z = 0.5 |
A = 0.25 B = 0.5 Z = 0.25 |
A = 0.5 B = 0.5 Z = 0 |
觀察
1)切換功率取決于輸出(Z)的切換,因此在情況3中,當Z的活動為0(在主輸入存在的情況下)為0時,它為0。
2)此外,通過從與index1對應的庫中的查找表中選取值來計算內部功率:轉換速率和index2:電容值。
3)在查找表中用于計算p的庫ower數,A和B的內部功率為0,因此內部功率取決于凈Z(輸出)的內部功率。
4)內部功率也取決于活動;因此,當Z的活動為0時,它為0。
5)使用的庫具有狀態相關的泄漏功率,當我們改變信號A的占空比以包括不同的AND狀態時,在情況2中可以看到門。
RTL功率估算與門級網表功率估算
以下電路用于分析:
RTL功率估算 | GATE LEVEL NETLIST POWER ESTIMATION |
Gate mapping :HS55_LH_AND4X3 功能:a& b& c& d 映射的單元格數量:1 漏電功率:0.282nW 動態功率:270.991nW 總計:271.273nW 面積:5.2 |
門映射:HS55_LHLOLK_NAND2X1 功能:(c& d)' 門映射:HS55_LHLOLK_AND3AX4 功能: ((c& d)')'& a& b 映射的單元數量:2 泄漏功率:0.129 nW 動態功率:125.468 nW 總計:125.597 nW 面積:6.24 |
觀察
RTL級使用的綜合算法與門級網表不同。
在RTL級別估計時,遵循區域最小化算法。因此,與實際網表相比,在RTL合成中選取的單元面積較小。
在網表級別,遵循泄漏功率最小化算法。因此,與實際網表相比,在RTL合成時拾取的單元的泄漏功率更大。
與門級功率估算相比,我們有網表,由標準單元組成,自由文件具有這些標準單元的功率數,線負載模型具有互連電容信息,切換活動,時鐘樹信息和操作條件。在RTL級別,缺少一些信息,特別是門級網表,時鐘樹信息,布局,時序等。
對于RTL功率估算流程,我們使用可以創建門的邏輯綜合引擎設計的水平模型以與實際合成相同的方式在設計周期中創建。這是因為功率估計工具進行粗略綜合,而不是綜合工具可以做的詳盡。因此,需要向RTL功率估計工具提供如上所述的進一步信息,以便復制門級流的實際合成環境。
例如,為了估計時鐘樹功率,我們需要來自綜合工程師。我們需要知道將使用哪些緩沖區以及它們的扇出將是什么。如果我們可以從網表中獲得每個時鐘域的觸發器數量,那么我們可以計算出驅動觸發器的緩沖器數量,即觸發器除以扇出數量,將是最終數量時鐘緩沖區。然后我們可以重復相同的過程來獲得時鐘樹的其余部分。這當然不是最準確的方法,但這有助于建立實際的合成環境。
結論
精確的功率估算在RTL中至關重要水平,以便找到耗電的細分市場,并應用低功耗架構和技術。雖然RTL的數字不如合成后的數字準確,但趨勢與兩者相關。
-
soc
+關注
關注
38文章
4181瀏覽量
218497 -
PCB打樣
+關注
關注
17文章
2968瀏覽量
21744 -
華強PCB
+關注
關注
8文章
1831瀏覽量
27819 -
華強pcb線路板打樣
+關注
關注
5文章
14629瀏覽量
43089
發布評論請先 登錄
相關推薦
評論