一、前言
一直以來,我都有這樣一種感覺:當(dāng)我學(xué)習(xí)一個(gè)新領(lǐng)域的知識時(shí),如果其中的某個(gè)知識點(diǎn)在剛開始接觸時(shí),我感覺比較難懂、不好理解,那么以后不論我花多長時(shí)間去研究這個(gè)知識點(diǎn),心里會(huì)一直認(rèn)為該知識點(diǎn)比較難,也就是說第一印象特別的重要。
就比如 C 語言中的宏定義,好像跟我犯沖一樣,我一直覺得宏定義是 C 語言中最難的部分,就好比有有些小伙伴一直覺得指針是 C 語言中最難的部分一樣。
宏的本質(zhì)就是代碼生成器,在預(yù)處理器的支持下實(shí)現(xiàn)代碼的動(dòng)態(tài)生成,具體的操作通過條件編譯和宏擴(kuò)展來實(shí)現(xiàn)。我們先在心中建立這么一個(gè)基本的概念,然后通過實(shí)際的描述和代碼來深入的體會(huì):如何駕馭宏定義。
所以,今天我們就來把宏定義所有的知識點(diǎn)進(jìn)行匯總、深挖,希望經(jīng)過這篇文章,我能夠擺脫心理的這個(gè)魔障。看完這篇總結(jié)文章后,我相信你也一定能夠?qū)甓x有一個(gè)總體、全局的把握。
二、預(yù)處理器的操作
1. 宏的生效環(huán)節(jié):預(yù)處理
一個(gè) C 程序在編譯的時(shí)候,從源文件開始到最后生成二進(jìn)制可執(zhí)行文件,一共經(jīng)歷 4 個(gè)階段:
我們今天討論的內(nèi)容就是在第一個(gè)環(huán)節(jié):預(yù)處理,由預(yù)處理器來完成這個(gè)階段的工作,包括下面這 4 項(xiàng)工作:
文件引入(#include);
條件編譯(#if..#elif..#endif);
宏擴(kuò)展(macro expansions);
行控制(line control)。
2. 條件編譯
一般情況下,C 語言文件中的每一行代碼都是要被編譯的,但是有時(shí)候出于對程序代碼優(yōu)化的考慮,希望只對其中的一部分代碼進(jìn)行編譯,此時(shí)就需要在程序中加上條件,讓編譯器只對滿足條件的代碼進(jìn)行編譯,將不滿足條件的代碼舍棄,這就是條件編譯。
簡單的說:就是預(yù)處理器根據(jù)我們設(shè)置的條件,對代碼進(jìn)行動(dòng)態(tài)的處理,把有效的代碼輸出到一個(gè)中間文件,然后送給編譯器進(jìn)行編譯。
條件編譯基本上在所有的項(xiàng)目代碼中都被使用到,例如:當(dāng)你需要考慮下面的幾種情況時(shí),就一定會(huì)使用條件編譯:
需要把程序編譯成不同平臺下的可執(zhí)行程序;
同一套代碼需要運(yùn)行在同一平臺上的不同功能產(chǎn)品上;
在程序中存在著一些測試目的的代碼,不想污染產(chǎn)品級的代碼,需要屏蔽掉。
這里舉 3 個(gè)例子,在代碼中經(jīng)常看到的關(guān)于條件編譯:
示例1:用來區(qū)分 C 和 C++ 代碼
#ifdef __cplusplus extern “C” { #endif void hello(); #ifdef __cplusplus } #endif
這樣的代碼幾乎在每個(gè)開源庫中都可能見到,主要的目的就是 C 和 C++ 混合編程,具體來說就是:
如果使用 gcc 來編譯,那么宏 __cplusplus 將不存在,其中的 extern “C” 將會(huì)被忽略;
如果使用 g++ 來編譯,那么宏 __cplusplus 就存在,其中的 extern “C” 就發(fā)生作用,編譯出來的函數(shù)名 hello 就不會(huì)被 g++ 編譯器改寫,因此就可以被 C 代碼來調(diào)用;
示例2:用來區(qū)分不同的平臺
#if defined(linux) || defined(__linux) || defined(__linux__) sleep(1000 * 1000); // 調(diào)用 Linux 平臺下的庫函數(shù)#elif defined(WIN32) || defined(_WIN32) Sleep(1000 * 1000); // 調(diào)用 Windows 平臺下的庫函數(shù)(第一個(gè)字母是大寫)#endif
那么,這些 linux, __linux, __linux__, WIN32, _WIN32 是從哪里來的呢?我們可以認(rèn)為是編譯目標(biāo)平臺(操作系統(tǒng))為我們預(yù)先準(zhǔn)備好的。
示例3:在編寫 Windows 平臺下的動(dòng)態(tài)庫時(shí),聲明導(dǎo)出和導(dǎo)入函數(shù)
#if defined(linux) || defined(__linux) || defined(__linux__) #define LIBA_API #else #ifdef LIBA_STATIC #define LIBA_API #else #ifdef LIBA_API_EXPORTS #define LIBA_API __declspec(dllexport) #else #define LIBA_API __declspec(dllimport) #endif #endif#endif // 函數(shù)聲明LIBA_API void hello();
這段代碼是直接從我之前在 B 站錄制的一個(gè)小視頻里的示例拿過來的,當(dāng)時(shí)主要是演示如何如何在 Linux 平臺下使用 make 和 cmake 構(gòu)建工具來編譯,后來又小伙伴讓我在 Windows 平臺下也用 make 和 cmake 來構(gòu)建,所以就寫了上面這段宏定義。
在使用 MSVC 編譯動(dòng)態(tài)庫時(shí),需要在編譯選項(xiàng)(Makefle 或者 CMakeLists.txt)中定義宏 LIBA_API_EXPORTS,那么導(dǎo)出函數(shù) hello 的最前面的宏 LIBA_API 就會(huì)被替換成:__declspec(dllexport),表示導(dǎo)出操作;
在編譯應(yīng)用程序的時(shí)候,使用動(dòng)態(tài)庫,需要 include 動(dòng)態(tài)庫的頭文件,此時(shí)在編譯選項(xiàng)中不需要定義宏 LIBA_API_EXPORTS,那么 hello 函數(shù)最前面的 LIBA_API 就會(huì)被替換成 __declspec(dllimport),表示導(dǎo)入操作;
補(bǔ)充一點(diǎn):如果使用靜態(tài)庫,編譯選項(xiàng)中不需要任何宏定義,那么宏 LIBA_API 就為空。
3. 平臺預(yù)定義的宏
上面已經(jīng)看到了,目標(biāo)平臺會(huì)為我們預(yù)先定義好一些宏,方便我們在程序中使用。除了上面的操作系統(tǒng)相關(guān)宏,還有另一類宏定義,在日志系統(tǒng)中被廣泛的使用:
FILE:當(dāng)前源代碼文件名;
LINE:當(dāng)前源代碼的行號;
FUNCTION:當(dāng)前執(zhí)行的函數(shù)名;
DATE:編譯日期;
TIME:編譯時(shí)間;
例如:
printf(“file name: %s, function name = %s, current line:%d ”, __FILE__, __FUNCTION__, __LINE__);
三、宏擴(kuò)展
所謂的宏擴(kuò)展就是代碼替換,這部分內(nèi)容也是我想表達(dá)的主要內(nèi)容。宏擴(kuò)展最大的好處有如下幾點(diǎn):
減少重復(fù)的代碼;
完成一些通過 C 語法無法實(shí)現(xiàn)的功能(字符串拼接);
動(dòng)態(tài)定義數(shù)據(jù)類型,實(shí)現(xiàn)類似 C++ 中模板的功能;
程序更容易理解、修改(例如:數(shù)字、字符串常亮);
我們在寫代碼的時(shí)候,所有使用宏名稱的地方,都可以理解為一個(gè)占位符。在編譯程序的預(yù)處理環(huán)節(jié),這些宏名將會(huì)被替換成宏定義中的那些代碼段,注意:僅僅是單純的文本替換。
1. 最常見的宏
為了方便后面的描述,先來看幾個(gè)常見的宏定義:
(1) 數(shù)據(jù)類型的定義
#ifndef BOOL typedef char BOOL;#endif #ifndef TRUE #define TRUE#endif #ifndef FALSE #define FALSE#endif
在數(shù)據(jù)類型定義中,需要注意的一點(diǎn)是:如果你的程序需要用不同平臺下的編譯器來編譯,那么你要去查一下所使用的編譯器對這些宏定義控制的數(shù)據(jù)類型是否已經(jīng)定義了。例如:在 gcc 中沒有 BOOL 類型,但是在 MSVC 中,把 BOOL 類型定義為 int 型。
(2) 獲取最大、最小值
#define MAX(a, b) (((a) 》 (b)) ? (a) : (b))#define MIN(a, b) (((a) 《 (b)) ? (a) : (b))
(3) 計(jì)算數(shù)組中的元素個(gè)數(shù)
#define ARRAY_SIZE(x) (sizeof(x) / sizeof((x)[0]))
(4) 位操作
#define BIT_MASK(x) (1 《《 (x))#define BIT_GET(x, y) (((x) 》》 (y)) & 0x01u)#define BIT_SET(x, y) ((x) | (1 《《 (y)))#define BIT_CLR(x, y) ((x) & (~(1 《《 (y))))#define BIT_INVERT(x, y) ((x) ^ (1 《《 (y)))
2. 與函數(shù)的區(qū)別
從上面這幾個(gè)宏來看,所有的這些操作都可以通過函數(shù)來實(shí)現(xiàn),那么他們各有什么優(yōu)缺點(diǎn)呢?
通過函數(shù)來實(shí)現(xiàn):
形參的類型需要確定,調(diào)用時(shí)對參數(shù)進(jìn)行檢查;
調(diào)用函數(shù)時(shí)需要額外的開銷:操作函數(shù)棧中的形參、返回值等;
通過宏來實(shí)現(xiàn):
不需要檢查參數(shù),更靈活的傳參;
直接對宏進(jìn)行代碼擴(kuò)展,執(zhí)行時(shí)不需要函數(shù)調(diào)用;
如果同一個(gè)宏在多處調(diào)用,會(huì)增加代碼體積;
還是舉一個(gè)例子來說明比較好,就拿上面的比較大小來說吧:
(1) 使用宏來實(shí)現(xiàn)
#define MAX(a, b) (((a) 》 (b)) ? (a) : (b)) int main(){ printf(“max: %d ”, MAX(1, 2));}
(2) 使用函數(shù)來實(shí)現(xiàn)
int max(int a, int b){ if (a 》 b) return a; return b;} int main(){ printf(“max: %d ”, max(1, 2));}
除了函數(shù)調(diào)用的開銷,其它看起來沒有差別。這里比較的是 2 個(gè)整型數(shù)據(jù),那么如果還需要比較 2 個(gè)浮點(diǎn)型數(shù)據(jù)呢?
使用宏來調(diào)用:MAX(1.1, 2.2);一切 OK;
使用函數(shù)調(diào)用:max(1.1, 2.2); 編譯報(bào)錯(cuò):類型不匹配。
此時(shí),使用宏來實(shí)現(xiàn)的優(yōu)勢就體現(xiàn)出來了:因?yàn)楹曛袥]有類型的概念,調(diào)用者傳入任何數(shù)據(jù)類型都可以,然后在后面的比較操作中,大于或小于操作都是利用了 C 語言本身的語法來執(zhí)行。
如果使用函數(shù)來實(shí)現(xiàn),那么就必須再定義一個(gè)用來操作浮點(diǎn)型的函數(shù),以后還有可能比較:char 型、long 型數(shù)據(jù)等等。
在 C++ 中,這樣的操作可以通過參數(shù)模板來實(shí)現(xiàn),所謂的模板也是一種代碼動(dòng)態(tài)生成機(jī)制。當(dāng)定義了一個(gè)函數(shù)模板后,根據(jù)調(diào)用者的實(shí)參,來動(dòng)態(tài)產(chǎn)生多個(gè)函數(shù)。例如定義下面這個(gè)函數(shù)模板:
template《typename T》 T max(T a, T b){ if (a 》 b) return a; return b;} max(1, 2); // 實(shí)參是整型max(1.1, 2,2); // 實(shí)參是浮點(diǎn)型
當(dāng)編譯器看到 max(1, 2) 時(shí),就會(huì)動(dòng)態(tài)生成一個(gè)函數(shù) int max(int a, int b) { 。.. };
當(dāng)編譯器看到 max(1.1, 2.2) 時(shí),又會(huì)動(dòng)態(tài)生成另一個(gè)函數(shù) float max(float a, float b) { 。.. }。
所以,從代碼的動(dòng)態(tài)生成角度看,宏定義和 C++ 中的模板參數(shù)有點(diǎn)神似,只不過宏定義僅僅是代碼擴(kuò)展而已。
下面這個(gè)例子也比較不錯(cuò),利用宏的類型無關(guān),來動(dòng)態(tài)生成結(jié)構(gòu)體:
#define VEC(T) struct vector_##T { T *data; size_t size; }; int main(){ VEC(int) vec_1 = { .data = NULL, .size = 0 }; VEC(float) vec_2 = { .data = NULL, .size = 0 };}
這個(gè)例子中用到了 ##,下面會(huì)解釋這個(gè)知識點(diǎn)。在前面的例子中,宏的參數(shù)傳遞的都是一些變量,而這里傳遞的宏參數(shù)是數(shù)據(jù)類型,通過宏的類型無關(guān)性,達(dá)到了“動(dòng)態(tài)”創(chuàng)建結(jié)構(gòu)體的目的:
struct vector_int { int *data; size_t size;} struct vector_float { float *data; size_t size;}
這里有一個(gè)陷阱需要注意:傳遞的數(shù)據(jù)類型中不能有空格,如果這樣使用:VEC(long long),那替換之后得到:
struct vector_long long { // 語法錯(cuò)誤 long long *data; size_t size;}
四、符號:# 與 ##
這兩個(gè)符號在編程中的作用也是非常巧妙,夸張的說一句:在任何框架性代碼中,都能見到它們的身影!作用如下:
#:把參數(shù)轉(zhuǎn)換成字符串;
##:連接參數(shù)。
1. #: 字符串化
直接看最簡單的例子:
#define STR(x) #xprintf(“string of 123: %s ”, STR(123));
傳入的是一個(gè)數(shù)字 123,輸出的結(jié)果是字符串 “123”,這就是字符串化。
2. ##:參數(shù)連接
把宏中的參數(shù)按照字符進(jìn)行拼接,從而得到一個(gè)新的標(biāo)識符,例如:
#define MAKE_VAR(name, no) name##no int main(void){ int MAKE_VAR(a, 1) = 1; int MAKE_VAR(b, 2) = 2; printf(“a1 = %d ”, a1); printf(“b2 = %d ”, b2); return 0;}
當(dāng)調(diào)用宏 MAKE_VAR(a, 1) 后,符號 ## 把兩側(cè)的 name 和 no 首先替換為 a 和 1,然后連接得到 a1。然后在調(diào)用語句中前面的 int 數(shù)據(jù)類型就說明了 a1 是一個(gè)整型數(shù)據(jù),最后初始化為 1。
五、可變參數(shù)的處理
1. 參數(shù)名的定義和使用
宏定義的參數(shù)個(gè)數(shù)可以是不確定的,就像調(diào)用 printf 打印函數(shù)一樣,在定義的時(shí)候,可以使用三個(gè)點(diǎn)(。..)來表示可變參數(shù),也可以在三個(gè)點(diǎn)的前面加上可變參數(shù)的名稱。
如果使用三個(gè)點(diǎn)(。..)來接收可變參數(shù),那么在使用的時(shí)候就需要使用__VA_ARGS__來表示可變參數(shù),如下:
#define debug1(。..) printf(__VA_ARGS__) debug1(“this is debug1: %d ”, 1);
如果在三個(gè)點(diǎn)(。..)的前面加上了一個(gè)參數(shù)名,那么在使用時(shí)就一定要使用這個(gè)參數(shù)名,而不能使用__VA_ARGS__來表示可變參數(shù),如下:
#define debug2(args.。.) printf(args) debug1(“this is debug2: %d ”, 2);
2. 可變參數(shù)個(gè)數(shù)為零的處理
看一下這個(gè)宏:
#define debug3(format, 。..) printf(format, __VA_ARGS__) debug3(“this is debug4: %d ”, 4);
編譯、執(zhí)行都沒有問題。但是如果這樣來使用宏:
debug3(“hello ”);
編譯的時(shí)候,會(huì)出現(xiàn)錯(cuò)誤: error: expected expression before ‘)’ token。為什么呢?
看一下宏擴(kuò)展之后的代碼(__VA_ARGS__為空):
printf(“hello ”,);
看出問題了吧?在格式化字符串的后面多了一個(gè)逗號!為了解決問題,預(yù)處理器給我們提供了一個(gè)方法:通過 ## 符號把這個(gè)多余的逗號給自動(dòng)刪掉。于是宏定義改成下面這樣就沒有問題了。
#define debug3(format, 。..) printf(format, ##__VA_ARGS__)
類似的,如果自己定義了可變參數(shù)的名字,也在前面加上 ##,如下:
#define debug4(format, args.。.) printf(format, ##args)
六、奇思妙想的宏
宏擴(kuò)展的本質(zhì)就是文本替換,但是一旦加上可變參數(shù)(__VA_ARGS__)和 ## 的連接功能,就能夠變化出無窮的想象力。
我一直堅(jiān)信,模仿是成為高手的第一步,只有見多識廣、多看、多學(xué)習(xí)別人是怎么來使用宏的,然后拿來為己所用,按照“先僵化-再優(yōu)化-最后固化”這個(gè)步驟來訓(xùn)練,總有一天你也能成為高手。
這里我們就來看幾個(gè)利用宏定義的巧妙實(shí)現(xiàn)。
1. 日志功能
在代碼中添加日志功能,幾乎是每個(gè)產(chǎn)品的標(biāo)配了,一般見到最普遍的是下面這樣的用法:
#ifdef DEBUG #define LOG(。..) printf(__VA_ARGS__)#else #define LOG(。..) #endif int main(){ LOG(“name = %s, age = %d ”, “zhangsan”, 20); return 0;}
在編譯的時(shí)候,如果需要輸出日志功能就傳入宏定義 DEBUG,這樣就能打印輸出調(diào)試信息,當(dāng)然實(shí)際的產(chǎn)品中需要寫入到文件中。如果不需要打印語句,通過把打印日志信息那條語句定義為空語句來達(dá)到目的。
換個(gè)思路,我們還可以通過條件判斷語句來控制打印信息,如下:
#ifdef DEBUG #define debug if(1)#else #define debug if(0)#endif int main(){ debug { printf(“name = %s, age = %d ”, “zhangsan”, 20); } return 0;}
這樣控制日志信息的看到的不多,但是也能達(dá)到目的,放在這里只是給大家開闊一下思路。
2. 利用宏來迭代每個(gè)參數(shù)
#define first(x, 。..) #x#define rest(x, 。..) #__VA_ARGS__ #define destructive(。..) do { printf(“first is: %s ”, first(__VA_ARGS__)); printf(“rest are: %s ”, rest(__VA_ARGS__)); } while (0) int main(void){ destructive(1, 2, 3); return 0;}
主要的思想就是:每次把可變參數(shù)VA_ARGS中的第一個(gè)參數(shù)給分離出來,然后把后面的參數(shù)再遞歸處理,這樣就可以分離出每一個(gè)參數(shù)了。我記得侯杰老師在 C++ 的視屏中,利用可變參數(shù)模板這個(gè)語法,也實(shí)現(xiàn)了類似的功能。
剛才在有道筆記中居然找到了侯杰老師演示的代碼,熟悉 C++ 的小伙伴可以研究下下面這段代碼:
// 遞歸的最后一次調(diào)用void myprint(){} template 《typename T, typename.。. Types》void myprint(const T &first, const Types&.。. args){ std::cout 《《 first 《《 std::endl; std::cout 《《 “remain args size = ” 《《 sizeof.。.(args) 《《 std::endl; // 把其他參數(shù)遞歸調(diào)用 myprint(args.。.);} int main(){ myprint(“aaa”, 7.5, 100); return 0;}
3. 動(dòng)態(tài)的調(diào)用不同的函數(shù)
// 普通的枚舉類型enum { ERR_One, ERR_Two, ERR_Three}; // 利用 ## 的拼接功能,動(dòng)態(tài)產(chǎn)生 case 中的比較值,以及函數(shù)名。#define TEST(no) case ERR_##no: Func_##no(); break; void Func_One(){ printf(“this is Func_One ”);} void Func_Two(){ printf(“this is Func_Two ”);} void Func_Three(){ printf(“this is Func_Three ”);} int main(){ int c = ERR_Two; switch (c) { TEST(One); TEST(Two); TEST(Three); }; return 0;}
在這個(gè)例子中,核心在于 TEST 宏定義,通過 ## 拼接功能,構(gòu)造出 case 分支的比較目標(biāo),然后動(dòng)態(tài)拼接得到對應(yīng)的函數(shù),最后調(diào)用這個(gè)函數(shù)。
4. 動(dòng)態(tài)創(chuàng)建錯(cuò)誤編碼與對應(yīng)的錯(cuò)誤字符串
這也是一個(gè)非常巧妙的例子,利用了 #(字符串化) 和 ##(拼接) 這 2 個(gè)功能來動(dòng)態(tài)生成錯(cuò)誤編碼碼和相應(yīng)的錯(cuò)誤字符串:
#define MY_ERRORS E(TOO_SMALL) E(TOO_BIG) E(INVALID_VARS) #define E(e) Error_## e,typedef enum { MY_ERRORS} MyEnums;#undef E #define E(e) #e,const char *ErrorStrings[] = { MY_ERRORS};#undef E int main(){ printf(“%d - %s ”, Error_TOO_SMALL, ErrorStrings[0]); printf(“%d - %s ”, Error_TOO_BIG, ErrorStrings[1]); printf(“%d - %s ”, Error_INVALID_VARS, ErrorStrings[2]); return 0;}
我們把宏展開之后,得到一個(gè)枚舉類型和一個(gè)字符串常量數(shù)組:
typedef enum { Error_TOO_SMALL, Error_TOO_BIG, Error_INVALID_VARS,} MyEnums; const char *ErrorStrings[] = { “TOO_SMALL”, “TOO_BIG”, “INVALID_VARS”,};
宏擴(kuò)展之后的代碼是不是很簡單啊。編譯、執(zhí)行結(jié)果如下:
0 - TOO_SMALL 1 - TOO_BIG 2 - INVALID_VARS
七、總結(jié)
有些人對宏愛之要死,多到濫用的程度;而有些人對宏恨之入骨,甚至用上了邪惡(evil)這個(gè)詞!其實(shí)宏對于 C 來說,就像菜刀對于廚師和歹徒一樣:用的好,可以讓代碼結(jié)構(gòu)簡潔、后期維護(hù)特別方便;用的不好,就會(huì)引入晦澀的語法、難以調(diào)試的 Bug。
對于我們開發(fā)人員來說,只要在程序的執(zhí)行效率、代碼的可維護(hù)性上做好平衡就可以了。
編輯:jq
-
代碼
+關(guān)注
關(guān)注
30文章
4823瀏覽量
68897 -
C 語言
+關(guān)注
關(guān)注
0文章
18瀏覽量
14250
原文標(biāo)題:提高代碼逼格的利器:宏定義-從入門到放棄
文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論