最近在做通信協(xié)議相關(guān)項目,在通信過程中一般都會有包長,數(shù)據(jù)緩沖等等信息,而實際場景中,數(shù)據(jù)包長度是不確定的,使用數(shù)組的定長包或者指針數(shù)據(jù)包都有一定的缺陷,那么可變長的數(shù)據(jù)緩存方法有嗎?
有的,這就是0長度數(shù)組,又稱為柔性數(shù)組(flexible array),通常用來實現(xiàn)變長數(shù)組。
變長數(shù)組簡介
變長數(shù)組是數(shù)組大小待定的數(shù)組,C語言中結(jié)構(gòu)體的最后一個元素可以是大小未知的數(shù)組,也就是所謂的0長度。
在標(biāo)準(zhǔn)C/C++中,不允許用0長度數(shù)組,但在GNU C中,卻可以定義0長度數(shù)組(在C99之前寫成長度為0,C99中可以直接不寫索引),我們可以用結(jié)構(gòu)體來創(chuàng)建變長數(shù)組。
?
typedef?struct?{ ????int?len; ????int?array[0];//int?array[]; }SoftArray;
?
它的主要用途是為了滿足需要變長度的結(jié)構(gòu)體,為了解決使用數(shù)組時內(nèi)存的冗余和數(shù)組的越界問題。
sizeof(SoftArray);的值在32位操作系統(tǒng)下剛好為4,也就是一個int型變量大小,這說明結(jié)構(gòu)體中的數(shù)組沒有占用內(nèi)存。
對于編譯器來說,此時長度為0的數(shù)組并不占用空間,因為數(shù)組名本身不占空間,它只是一個偏移量,數(shù)組名這個符號本身代表了一個不可修改的地址常量 (注意:數(shù)組名永遠(yuǎn)都不會是指針!)
對于這個數(shù)組的大小,我們可以進行動態(tài)分配!
對于變長數(shù)組的這個特點,很容易構(gòu)造出變成結(jié)構(gòu)體,如緩沖區(qū),數(shù)據(jù)包等等
變長度數(shù)組的優(yōu)缺點
這次的通信協(xié)議項目,假如使用數(shù)組來傳遞數(shù)據(jù),那么一般定義如下,其中包的長度maxLen是一個定值,假設(shè)為1024。
?
typedef?struct?{ ????int?len; ????int?array[maxLen]; }SoftArray;
?
這包數(shù)據(jù)的大小為sizeof(int) + sizeof(int) * maxLen,由于考慮到數(shù)據(jù)的溢出, maxLen一般會設(shè)置得足夠長足以容納最大的數(shù)據(jù), 因此數(shù)組很多情況下可能都沒有填滿數(shù)據(jù), 造成了浪費。
而使用指針的話,則定義如下
?
typedef?struct? { ????int?len; ????char?*array; };
?
數(shù)據(jù)結(jié)構(gòu)的大小為sizeof(int) + sizeof(int *),使用指針結(jié)果作為緩沖區(qū), 只多使用了一個指針大小的空間,不會造成空間的大量浪費,但需要額外開辟和釋放數(shù)據(jù)域的空間,我們并不能假定使用者了解我們開辟的細(xì)節(jié), 并按照約定的操作釋放空間, 因此使用起來多有不便, 甚至造成內(nèi)存泄漏。
變成數(shù)組可以節(jié)約空間,解決使用數(shù)組時內(nèi)存的冗余和數(shù)組的越界問題。但也有一個缺點就是結(jié)構(gòu)體中的變長數(shù)組只能放在最后面。
?
typedef?struct?{ ????int?len; ????int?array[]; ????int?CRC; }SoftArray;
?
這種用法是不行的,不支持,會報以下錯誤,如果后續(xù)要加上一些其他的數(shù)據(jù)就不能用了。
其實柔性數(shù)組成員在實現(xiàn)跳躍表時有它特別的用法,在Redis的SDS數(shù)據(jù)結(jié)構(gòu)中和跳躍表的實現(xiàn)上,也使用柔性數(shù)組成員。
為什么0長度數(shù)組不占用存儲空間
由于0長度數(shù)組是GNU C的擴展,有一些巧妙編寫的詭異代碼, 其執(zhí)行結(jié)果就是依賴于編譯器和優(yōu)化策略的實現(xiàn)的,我們來看看以下代碼
?
#include?#include? int?main(void) { ????char?a[0]; ????printf("%p ",?a); ????char?b[0]; ????printf("%p ",?b); ????const?char?*c=?"Hello"; ????printf("%p ",?c); ????const?char?*d?=?"Hello"; ????printf("%p ",?d); ????return?EXIT_SUCCESS; }
?
編譯結(jié)果是:
可以看到a和b的地址就會被編譯器優(yōu)化到一處, 因為a[0] 和 b[0] 對于程序來說是無法使用的, 同樣編譯器對于相同字符串常量, 往往地址也是優(yōu)化到一處, 減少空間占用。
所以其本質(zhì)上涉及到的是一個C語言里面的數(shù)組和指針的區(qū)別問題,Programming Abstractions in C一書中提到:
“arr is defined to be identical to &arr[0]”.
也就是說,char a[1]里面的a實際是一個常量,即a = &a[0]。而char *b是有一個實實在在的指針變量b存在。所以,a=b是不允許的,而b=a是允許的。
?
#include?char?a[1]; char?*b; int?main?()?{ ?b?=?a;? ??//a=b會報錯,incompatible?types?when?assigning?to?type?‘char[1]’?from?type?‘char?*’ ?a?=?b; ?return?0; }
?
兩種變量都支持下標(biāo)式的訪問,那么對于a[0]和b[0]本質(zhì)上是否有區(qū)別?我們可以通過一個例子來說明。
變長數(shù)組和動態(tài)數(shù)組有什么區(qū)別?
動態(tài)數(shù)組是指在聲明時,沒有確定數(shù)組大小的數(shù)組,它可以隨程序需要而重新指定大小。動態(tài)數(shù)組的內(nèi)存空間是從堆動態(tài)分配的,當(dāng)程序執(zhí)行到我們編寫的分配語句時,才為其分配存儲空間。
使用動態(tài)數(shù)組的優(yōu)點是可以根據(jù)用戶需要,有效利用存儲空間。
?
int?a[10];//靜態(tài)數(shù)組,在堆棧上創(chuàng)建 int?n; //C語言的malloc函數(shù)進行書寫 int?*p?=?(int?*)malloc(n?*?sizeof(int));
?
變長數(shù)組的實際意思是以變量作為長度的數(shù)組,區(qū)別于以常數(shù)作為長度的數(shù)組。英文Variable-Length Array(后續(xù)都縮寫成VLA),注意這里有一個連接號。
連接號-代表的意思是,Variable不是一個用于修飾Length的形容詞,而是一個名字名詞(即變量的意思)。
了解了正確的含義后,不難理解VLA的目的就是數(shù)組的長度是由一個變量指定的,而非常數(shù)。
小結(jié)
實際工程中不推薦使用VLA,程序中棧的大小是有限的,若需要的數(shù)組長度很大,有造成爆棧的危險。
審核編輯:劉清
評論
查看更多