主循環調用的三個不同的函數
函數replacer():指示了一個用來分配內存塊并且直到出現循環迭代才釋放的指針。如果檢驗主循環中的迭代,可以發現分配的內存塊并未釋放。通過監控總數為20的內存塊,從表1可以看出,每次迭代之后的內存塊總數都為1,因此沒有出現內存丟失。
函數growAndShrink():管理長度為24個結構體的鏈表,該鏈表的長度將隨時間發生變化,但我們并不希望鏈表無限增長。通過檢驗總數為24的內存塊,我們可以發現,雖然任意時間內存塊的數目都可能發生變化,但決不會超過25個。
函數growForever():處理內存塊長度為44的情形。這里我們可以非常清晰地看到,分配的內存塊數目在持續增長。當首次觀察該表時,可能無法找到表的源頭。我們首先只能快速而粗略對mMalloc()上的條件斷點進行檢驗,該斷點只有當長度參數達到44時才觸發。當到達該斷點時,可以檢驗堆棧,以確定進行內存分配的地方。工程師完全能夠多次執行這樣的操作,因為這種長度的內存塊可在多處進行分配。
嚴格地說,在函數growForever()中分配的內存不是丟失,因為所有分配的內存塊均帶有引用,因此理論上可以在后來釋放。如果特定應用這樣做,那么結果就非常明顯。
長度是關鍵因素
當不同類型的對象共享相同長度的內存時,上述技術就不那么有效了。實際中碰到這樣的情形并不多,但即便可能引發問題,仍然還有很多別的選擇。
更為先進的方法則是為每個記錄存儲類型信息。這并不困難,但我卻不愿采用這種方法,因為該方法要求為函數mMalloc()的標記添加一些新東西。我們可以定義一個列出所有可能分配的類型的枚舉類型。在每次調用函數mMalloc()時,將傳遞一個附加的參數,并且該參數為枚舉類型中的一個元素。如果在表中該參數連同地址一起被存儲,那么總能識別出這類對象。
這也使得我們可以將分配長度不同,但類型相關(如可變長度的字符數組)的內存塊鏈接起來。
C++通過使我們重載或刪除按類基(per-class basis)而使得這種方法更加簡便易行。盡管這是一種有效的方法,但這里我仍然不會采用這種方法,因為我更傾向采用適合C語言環境的技術。
分配位置
有時,位置信息比類型信息更為有效。幸而我們能夠靈活地使用宏定義,從而無須更換標記即可選擇這些信息。
==========================
#define mMalloc(size_t size)
mMallocLineNo(size, __LINE__,
__FILE__)
=========================
mMallocLineNo()函數是程序清單1中函數mMalloc()的變異。現在我們期望像程序清單3那樣存儲行號和文件名信息,為保持額外信息,結構BlockEntry將具有如下形式:
=========================
typedef struct
{
void * addr;
size_t size;
int line;
char * file;
} BlockEntry;
==========================
通過為每個內存塊存儲行號和文件名,就能精確地定位任何分配的內存塊。可以為所有特定長度的表項設計一個輸出行號和文件名為mDisplayLocation()的函數,這樣就能輕易地識別出長度可疑的內存塊的來源。
再次回到表1,可能我們會擔心長度為44的內存塊。為了更多地了解這些內存的來源,可以在函數main()的末尾添加如下代碼:
========================
mDisplayLocation(44);
=======================
這能將行44輸出50遍。
=======================
line = 162, file = listing2.c
=======================
這清晰地表明內存塊在函數growForever()中分配。
可變的長度
某些內存分配的長度可以發生急劇變化,例如:
==========================
char *p = malloc(strlen(name)+1);
==========================
是分配一塊足以存儲字符串名和字符串截止符的內存的通用方法。在嵌入式系統中,不會經常對字符串和文件進行操作;數據結構的分配則不是這樣,例如:
==========================
Motor *m = malloc(sizeof(Motor));
==========================
如果假定Motor為存儲結構,那么上述分配將總是得到相同長度的內存塊,在上面描述的函數中,將在輸出中更簡便地識別出這些內存塊。
在分配可變長度內存塊時,可以行號和文件名的組合為核心計算內存分配的計數。示例中,我們存儲了行號和文件名,但打印的總數則取決于長度。通過行號和文件名的聚合分配將有助于在相同的位置將所有的分配組合起來,而不管分配的長度如何。某些情況下,即便可變的長度不成問題,這樣的分析仍然能帶給我們更多的啟發。
內存表
任何含有內存丟失的代碼都將導致這里給出的內存表不斷增大,而且并非所有的丟失都能像growForever()示例那樣清晰無誤地進行識別。即便采用其它技術進行丟失檢測和消除,這些輸出表仍將有助于確定丟失是否已被消除。
這里給出的循環并不處理可變的輸入數據。在實際項目中,通常插入一些調用(如仿真鍵盤敲擊序列的調用)以模擬輸入。在實際系統中,還必須創建一些適當的輸入。除非自己希望改變代碼,否則完全無須訪問導致內存丟失的代碼段。因此,這里的示例或許向大家提供了一個良好的開端,但任何內存丟失仍然需要進行一些檢測。
內存使用率的測量
如果需要修改malloc(),理想情況下應當采用不同的名稱取代所有的malloc()調用。我將其取名為mmalloc(),意即“measured malloc”。這樣我們就能編寫一個執行一些額外工作并調用常規malloc()的函數,這也可以通過其他途徑實現,如采用#define取代malloc(),或在編譯庫中利用鏈接程序重命名malloc()函數。
這種方法的一個缺陷在于,不能對從我無法更改或重新編譯的庫函數中調用的malloc()進行監控。例如,標準庫包含一個依次調用malloc()的函數strdup(),我們無法用malloc()調用加以取代,除非我們擁有正在使用的庫的源代碼。
測量使用率的第一步是簡單地添加需要分配的內存并減去任何已經釋放的內存。對于malloc(),這當然微不足道。假定定義了一個靜態值G_inUse,那么下面的代碼就能跟蹤內存的分配:
==========================
void *mmalloc(size_t size){
G_inUse += size;
return malloc(size);
}
==========================
mfree()略微復雜一些,因為free()并不傳遞表示內存大小的變量。函數free()傳遞指向內存塊的指針。通常表示釋放內存大小的量隱藏在指針所指向數據塊之前的數據頭中,所以可以得到下面的函數:
==========================
void mfree(void *p)
{
size_t *sizePtr=((size_t *) p)-1;
G_inUse -= *sizePtr;
free(p);
}
==========================
因為在釋放過程中或許不會使用這種轉換,或者需要在略微不同的偏移位置存儲表示釋放內存大小的量,因此這種方法是無法移植的。
釋放的內存大小或許并不與分配的內存匹配,malloc()的某些實現方法向上舍入為最接近的一個值。例如,如果要求分配11字節,而實際上卻接收到了12字節。在這種情況下,12將存儲在數據頭中。因此分配和釋放的數據塊就能通過使用G_inUse-1實現平衡。
評論
查看更多