一、gcc 內聯匯編
內聯匯編即在C中直接使用匯編語句進行編程,使程序可以在C程序中實現C語言不能完成的一些工作,例如,在下面幾種情況中必須使用內聯匯編或嵌入型匯編。
程序中使用飽和算術運算(Saturating Arithmetic)
程序需要對協處理器進行操作
在C程序中完成對程序狀態寄存器的操作
格式:
__asm__ __volatile__(“asm code” :output :input :changed registers);
asm或__asm__開頭,小括號+分號,括號內容寫匯編指令。指令+ 用雙引號引上。
「asm code」主要填寫匯編代碼:
“mov r0, r0 ” “mov r1,r1 ” “mov r2,r2”
「output(asm-》C)」用于定義輸出的參數,通常只能是變量:
:“constraint” (variable) “constraint”用于定義variable的存放位置: r 表示使用任何可用的寄存器 m 表示使用變量的內存地址 + 可讀可寫 = 只寫 & 表示該輸出操作數不能使用輸入部分使用過的寄存器,只能用“+&”或“=&”的方式使用
「input(C-》asm)」用于定義輸入的參數,可以是變量也可以是立即數:
:“constraint” (variable/immediate) “constraint”用于定義variable的存放位置: r 表示使用任何可用的寄存器(立即數和變量都可以) m 表示使用變量的內存地址 i 表示使用立即數
Note:
使用__asm__和__volatile__表示編譯器將不檢查后面的內容,而是直接交給匯編器。
如果希望編譯器為你優化,__volatile__可以不加
沒有asm code也不能省略“”
沒有前面的和中間的部分,不可以相應的省略:
沒有changed 部分,必須相應的省略:
最后的;不能省略,對于C語言來說這是一條語句
匯編代碼必須放在一個字符串內,且字符串中間不能直接按回車換行,可以寫成多個字符串,注意中間不能有任何符號,這樣就會將兩個字符串合并為一個
指令之間必須要換行,還可以使用 使指令在匯編中保持整齊
舉例
例1:無參數,無返回值這種情況,output和input可以省略:
asm ( //匯編指令 “mrs r0,cpsr ” “bic r0,r0,#0x80 ” “msr cpsr,r0 ” );
例2:有參數 ,有返回值讓內聯匯編做加法運算,求a+b,結果存在c中
int a =100, b =200, c =0; asm ( “add %0,%1,%2 ” : “=r”(c) : “r”(a),“r”(b) : “memory” );
%0 對應變量c%1 對應變量a%2 對應變量b
例3:有參數 2 ,有返回值
讓內聯匯編做加法運算,求a+b,結果存在sum中,把a-b的存在d中
asm volatile ( “add %[op1],%[op2],%[op3] ” “sub %[op4],%[op2],%[op3] ” :[op1]“=r”(sum),[op4]“=r”(d) :[op2]“r”(a),[op3]“r”(b) :“memory” );
%0 對應變量c%1 對應變量a%2 對應變量b
三、ATPCS規則:(ARM、thumber程序調用規范)
為了使單獨編譯的C語言程序和匯編程序之間能夠相互調用,必須為子程序之間的調用規定一定的規則.ATPCS就是ARM程序和THUMB程序中子程序調用的基本規則。
基本ATPCS規定了在子程序調用時的一些基本規則,包括下面3方面的內容:
各寄存器的使用規則及其相應的名稱。
數據棧的使用規則。
參數傳遞的規則。
1. 寄存器的使用必須滿足下面的規則:
1)子程序間通過寄存器R0一R3來傳遞參數,這時,寄存器R0~R3可以記作A1-A4。被調用的子程序在返回前無需恢復寄存器R0~R3的內容。
2)在子程序中,使用寄存器R4~R11來保存局部變量.這時,寄存器 R4 ~ R11可以記作V1 ~ V8。如果在子程序中使用到了寄存器V1~V8中的某些寄存器,子程序進入時必須保存這些寄存器的值,在返回前必須恢復這些寄存器的值;對于子程序中沒有用到的寄存器則不必進行這些操作。在Thumb程序中,通常只能使用寄存器R4~R7來保存局部變量。
3)寄存器R12用作過程調用時的臨時寄存器(用于保存SP,在函數返回時使用該寄存器出棧), 記作ip。在子程序間的連接代碼段中常有這種使用規則。
4)寄存器R13用作數據棧指針,記作sp。在子程序中寄存器R13不能用作其他用途。寄存器sp在進入子程序時的值和退出子程序時的值必須相等。
5)寄存器R14稱為連接寄存器,記作lr。它用于保存子程序的返回地址。如果在子程序中保存了返回地址,寄存器R14則可以用作其他用途。
6)寄存器R15是程序計數器,記作pc。它不能用作其他用途。
ATPCS下ARM寄存器的命名:
R0a1工作寄存器
R1a2工作寄存器
R2a3工作寄存器
R3a4工作寄存器
R4v1必須保護;局部變量寄存器
R5v2必須保護;局部變量寄存器
R6v3必須保護;局部變量寄存器
R7v4必須保護;局部變量寄存器
R8v5必須保護;局部變量寄存器
R9v6必須保護;局部變量寄存器
R10sl棧限制
R11fp幀指針
R12ip指令指針
R13sp棧指針
R14lr連接寄存器
寄存器別名功能
2、堆棧使用規則:
ATPCS規定堆棧為FD類型,即滿遞減堆棧。并且堆棧的操作是8字節對齊。
而對于匯編程序來說,如果目標文件中包含了外部調用,則必須滿足以下條件:
外部接口的數據棧一定是8位對齊的,也就是要保證在進入該匯編代碼后,直到該匯編程序調用外部代碼之間,數據棧的棧指針變化為偶數個字;
在匯編程序中使用PRESERVE8偽操作告訴連接器,本匯編程序是8字節對齊的。
3、參數的傳遞規則:
根據參數個數是否固定,可以將子程序分為參數個數固定的子程序和參數個數可變的子程序。這兩種子程序的參數傳遞規則是不同的。
1.參數個數可變的子程序參數傳遞規則
對于參數個數可變的子程序,當參數不超過4個時,可以使用寄存器R0~R3來進行參數傳遞,當參數超過4個時,還可以使用數據棧來傳遞參數。
在參數傳遞時,將所有參數看做是存放在連續的內存單元中的字數據。然后,依次將各名字數據傳送到寄存器R0,R1,R2,R3; 如果參數多于4個,將剩余的字數據傳送到數據棧中,入棧的順序與參數順序相反,即最后一個字數據先入棧。
按照上面的規則,一個浮點數參數可以通過寄存器傳遞,也可以通過數據棧傳遞,也可能一半通過寄存器傳遞,另一半通過數據棧傳遞。
舉例:
void func(a,b,c,d,e) a -- r0 b -- r1 c -- r2 d -- r3 e -- 棧
2.參數個數固定的子程序參數傳遞規則
對于參數個數固定的子程序,參數傳遞與參數個數可變的子程序參數傳遞規則不同,如果系統包含浮點運算的硬件部件。
浮點參數將按照下面的規則傳遞:(1)各個浮點參數按順序處理;(2)為每個浮點參數分配FP寄存器;
分配的方法是,滿足該浮點參數需要的且編號最小的一組連續的FP寄存器。第一個整數參數通過寄存器R0~R3來傳遞,其他參數通過數據棧傳遞。
3、子程序結果返回規則
1.結果為一個32位的整數時,可以通過寄存器R0返回。
2.結果為一個64位整數時,可以通過R0和R1返回,依此類推。
3.對于位數更多的結果,需要通過調用內存來傳遞。
舉例:
使用r0 接收返回值
int func1(int m, int n) m -- r0 n -- r1 返回值給 r0
「為什么有的編程規范要求自定義函數的參數不要超過4個?」答:因為參數超過4個就需要壓棧退棧,而壓棧退棧需要增加很多指令周期。對于參數比較多的情況,我們可以把數據封裝到結構體中,然后傳遞結構體變量的地址。
四、C語言和匯編相互調用
C和匯編相互調用要特別注意遵守相應的ATPCS規則。
1. C調用匯編
例1:c調用匯編文件中函數帶返回值簡化代碼如下,代碼架構可以參考《7. 從0開始學ARM-GNU偽指令、代碼編譯,lds使用》。
;.asm add: add r2,r0,r1 mov r0,r2 MOV pc, lr
main.c
extern int add(int a,int b); printf(“%d ”,add(2,3));
a-》r0,b-》r1
返回值通過r0返回計算結果給c代碼
例2,用匯編實現一個strcopy函數
;.asm .global strcopy strcopy: ;R0指向目的字符串 ;R1指向源字符串 LDRB R2, [R1], #1 ;加載字字符并更新源字符串指針地址 STRB R2, [R0], #1 ;存儲字符并更新目的字符串指針地址 CMP R2, #0 ;判斷是否為字符串結尾 BNE strcopy ;如果不是,程序跳轉到strcopy繼續循環 MOV pc, lr ;程序返回//.c #include 《stdio.h》 extern void strcopy(char* des, const char* src); int main(){ const char* srcstr = “yikoulinux”; char desstr[]=“test”; strcopy(desstr, srcstr); return 0; }
2. 匯編調用C
//.c int fcn(int a, int b , int c, int d, int e) { return a+b+c+d+e; };.asm ; .text .global _start _start: STR lr, [sp, #-4]! ;保存返回地址lr ADD R1, R0, R0 ;計算2*i(第2個參數) ADD R2, R1, R0 ;計算3*i(第3個參數) ADD R3, R1, R2 ;計算5*i STR R3, [SP, #-4]! ;第5個參數通過堆棧傳遞 ADD R3, R1, R1 ;計算4*i(第4個參數) BL fcn ;調用C程序 ADD sp, sp, #4 ;從堆棧中刪除第五個參數 .end
假設程序進入f時,R0中的值為i ;
int f(int i){ return fcn(i, 2*i, 3*i, 4*i, 5*i); }
五、內核實例
為了讓讀者有個更加深刻的理解, 以內核中的例子為例:
arch/arm/kernel/setup.c
void notrace cpu_init(void) { unsigned int cpu = smp_processor_id();----獲取CPU ID struct stack *stk = &stacks[cpu];----獲取該CPU對于的irq abt和und的stack指針 …… #ifdef CONFIG_THUMB2_KERNEL #define PLC “r”----Thumb-2下,msr指令不允許使用立即數,只能使用寄存器。 #else #define PLC “I” #endif __asm__ ( “msr cpsr_c, %1 ”----讓CPU進入IRQ mode “add r14, %0, %2 ”----r14寄存器保存stk-》irq “mov sp, r14 ”----設定IRQ mode的stack為stk-》irq “msr cpsr_c, %3 ” “add r14, %0, %4 ” “mov sp, r14 ”----設定abt mode的stack為stk-》abt “msr cpsr_c, %5 ” “add r14, %0, %6 ” “mov sp, r14 ”----設定und mode的stack為stk-》und “msr cpsr_c, %7”---回到SVC mode :----上面是code,下面的output部分是空的 : “r” (stk),----對應上面代碼中的%0 PLC (PSR_F_BIT | PSR_I_BIT | IRQ_MODE),----對應上面代碼中的%1 “I” (offsetof(struct stack, irq[0])),----對應上面代碼中的%2 PLC (PSR_F_BIT | PSR_I_BIT | ABT_MODE),----以此類推,下面不贅述 “I” (offsetof(struct stack, abt[0])), PLC (PSR_F_BIT | PSR_I_BIT | UND_MODE), “I” (offsetof(struct stack, und[0])), PLC (PSR_F_BIT | PSR_I_BIT | SVC_MODE) : “r14”);----上面是input操作數列表,r14是要clobbered register列表 }
文章出處:【微信公眾號:玩轉單片機】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
嵌入式
+關注
關注
5090文章
19176瀏覽量
306934 -
C語言
+關注
關注
180文章
7614瀏覽量
137438
原文標題:C和匯編如何互相調用?嵌入式工程師必須掌握
文章出處:【微信號:mcu168,微信公眾號:硬件攻城獅】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論