Linux下面,目標文件、共享對象文件、可執行文件都是使用ELF文件格式來存儲的。程序經過編譯之后會輸出目標文件,然后經過鏈接可以產生可執行文件或者共享對象文件。linux下面使用的ELF文件和Windows操作系統使用的PE文件都是從Unix系統的COFF文件格式演化來的。?
我們先來了解一些基本的想法。
首先,最重要的思路是一個程序從人能讀懂的格式轉換為供操作系統執行的二進制格式之后,代碼和數據是分開存放的,之所以這樣設計有這么幾個原因:
1、程序執行之后,代碼和數據可以被映射到不同屬性的虛擬內存中。因為代碼一般是只讀的,而數據是可讀可寫的;
2、現代CPU有強大的緩存體系。程序和代碼分離可以提高程序的局部性,增加緩存命中的概率;
3、還有最重要的一個原因是當有多個程序副本在運行的時候,只讀部分可以只在內存中保留一份,這樣大大節省了內存。
在ELF的定義中,把他們分開存放的地方稱為一個 Section ,就是一個段。
一個ELF文件中重要的段包括:
.text 段:存儲 只讀程序
.data 段:存儲 已經初始化的全局變量和靜態變量
.bss 段:存儲 未初始化的全局變量和靜態變量,因為這些變量的值為0,所以這個段在文件當中不占據空間
.rodata 段:存儲 只讀數據,比如字符串常量
我們用一個例子來看一下ELF文件的格式到底是什么。首先,在Linux下編寫一個C程序:SimpleSection.c
[cpp]?view plain?copy
int?printf(const?char?*format,?...?);??
int?global_init_var?=?16;??
int?global_unint_var;??
void?func1?(int?);??
int?main()??
{??
static?int?static_var?=?-32;??
static?int?static_var_uninit;??
int?a?=?1;??
int?b;??
func1(static_var?+?global_init_var?+?a?+?b);??
return?a;??
}??
void?func1?(int?i)??
{??
printf("%d\n",?i);??
}??
然后,產生目標文件:
[cpp]?view plain?copy
[root@xuxingwang-centos?Program]#?gcc?-c?SimpleSection.c??
[root@xuxingwang-centos?Program]#?file?SimpleSection.o??
SimpleSection.o:?ELF?32-bit?LSB?relocatable,?Intel?80386,?version?1?(SYSV),?not?stripped??
file命令的結果也告訴我們,這是一個32位ELF的文件,類型是 relocatable ,就是可重定位。所以目標文件又叫做可重定位文件。
elf文件的最開始是elf文件頭信息,32位有52個字節組成。我們可以使用 readelf 工具來查看一下:
[cpp]?view plain?copy
[root@xuxingwang-centos?Program]#?readelf?-h?SimpleSection.o??
ELF?Header:??
Magic:???7f?45?4c?46?01?01?01?00?00?00?00?00?00?00?00?00??
Class:?????????????????????????????ELF32??
Data:??????????????????????????????2's?complement,?little?endian??
Version:???????????????????????????1?(current)??
OS/ABI:????????????????????????????UNIX?-?System?V??
ABI?Version:???????????????????????0??
Type:??????????????????????????????REL?(Relocatable?file)??
Machine:???????????????????????????Intel?80386??
Version:???????????????????????????0x1??
Entry?point?address:???????????????0x0??
Start?of?program?headers:??????????0?(bytes?into?file)??
Start?of?section?headers:??????????224?(bytes?into?file)??
Flags:?????????????????????????????0x0??
Size?of?this?header:???????????????52?(bytes)??
Size?of?program?headers:???????????0?(bytes)??
Number?of?program?headers:?????????0??
Size?of?section?headers:???????????40?(bytes)??
Number?of?section?headers:?????????11??
Section?header?string?table?index:?8??
Entry point address 指的是程序入口地址,如果是可執行文件,這個字段會有值;
他之前的字段是一些說明字段;
Start of program headers 指的是 程序頭表 的起始位置。程序頭表 是從裝載視圖的角度對elf的各個段進行的分類信息;結構和段表相似;
Start of section headers 指出了elf除文件頭以外的最重要的信息:段表 的起始位置。段表包含了各個段的名稱、屬性、大小、位置等重要信息。操作系統首先找到段表,然后根據段表的信息去找到各個段。段表是一個類似數組的結構,一個段的信息是這個數組的一個元素。
Size of this header 指的是頭文件大小,32位都是 52 個字節,0x34個字節。
Size of program headers 指的是每個 程序頭表 的大小。
Number of program headers 指的是 程序頭表 的數目。
Size of sections headers 指的是每個 段表 的大小;
Number of section headers 指的是 段表的數量;
Section header string table index 指出了段表當中用到的字符串表在段表中的下標。
文件頭之后,緊跟著的是 程序頭,因為目標文件沒有鏈接,所以沒有裝載信息。我們這里可以先不理會這個東西,以后專門再說他。
程序頭之后就是各個段的數據,我們用工具查看一下:
[cpp]?view plain?copy
[root@xuxingwang-centos?Program]#?readelf?-S?SimpleSection.o??
There?are?11?section?headers,?starting?at?offset?0xe0:??
Section?Headers:??
[Nr]?Name??????????????Type????????????Addr?????Off????Size???ES?Flg?Lk?Inf?Al??
[?0]???????????????????NULL????????????00000000?000000?000000?00??????0???0??0??
[?1]?.text?????????????PROGBITS????????00000000?000034?000020?00??AX??0???0??4??
[?2]?.rel.text?????????REL?????????????00000000?0003f4?000010?08??????9???1??4??
[?3]?.data?????????????PROGBITS????????00000000?000054?000008?00??WA??0???0??4??
[?4]?.bss??????????????NOBITS??????????00000000?00005c?000004?00??WA??0???0??4??
[?5]?.rodata???????????PROGBITS????????00000000?00005c?000004?00???A??0???0??1??
[?6]?.comment??????????PROGBITS????????00000000?000060?00002d?01??MS??0???0??1??
[?7]?.note.GNU-stack???PROGBITS????????00000000?00008d?000000?00??????0???0??1??
[?8]?.shstrtab?????????STRTAB??????????00000000?00008d?000051?00??????0???0??1??
[?9]?.symtab???????????SYMTAB??????????00000000?000298?0000f0?10?????10??10??4??
[10]?.strtab???????????STRTAB??????????00000000?000388?00006b?00??????0???0??1??
Key?to?Flags:??
W?(write),?A?(alloc),?X?(execute),?M?(merge),?S?(strings)??
I?(info),?L?(link?order),?G?(group),?x?(unknown)??
O?(extra?OS?processing?required)?o?(OS?specific),?p?(processor?specific)??
各個字段意思依次是:段序號、段名稱、段類型、段虛擬地址、偏移量、大小、ES、標志、Lk、Inf、對齊。
沒有解釋的列可以先不考慮,我們先關注其他幾個列。
第0個段是為了讀取的時候下標不用減1。
緊跟著的就是代碼段,偏移量為0x34,就是說在文件頭結尾之后馬上就是代碼段;
代碼段之后,偏移量 0x54 的地方就是 數據段,占8個字節,就是程序中已經被賦值的一個全局變量和一個靜態變量;
緊接著是.bss段,這里只存儲了一個static變量,因為 未初始化的那個全局變量被一種優化機制存儲到了 .common 段,這里可以不做理會;
然后是只讀數據段.rodata,這里存儲的是 printf 里面的 %d\n 這三個字符,外加結束符\0,總共4個字節的空間
我們根據Size這一列來算一下這些段總共占據的空間,(.bss由于不占空間,不用算進來):
.text 0x20
.data 0x8
.rodata 0x4
.comment 0x2d
.shstrtab 0x51
.rel.text 0x10
.symtab 0xf0
.strtab 0x6b
這里的每一個段都有一個段表元素來描述,總共11個。從頭文件得知,每個元素的大小為40字節。也就是說段表總共占了 0x1b8 個字節的空間。而且段表的開始地址由于內存對齊需要,中間空了2個字節。因為段表的開始地址是第224個字節;
.rel.text 的開始地址也由于內存對齊的要求,補了一個空字節。
在加上頭文件的 0x34 個字節,總共加起來是 ? 1028 字節。
[cpp]?view plain?copy
[root@xuxingwang-centos?Program]#?ls?-al?SimpleSection.o??
-rw-r--r--?1?root?root?1028?Aug?21?16:09?SimpleSection.o??
這個目標文件的大小恰好是1028個字節。
?
評論
查看更多