過去的一周有點魔幻,有印象的有三個新聞:天貓總裁緋聞事件,蘑菇街裁員,不可能打工的周某也放出來了。三件事,兩件和互聯網行業相關,好像外面的世界很是精彩啊!吃瓜歸吃瓜,學習還是不能落下。
連續寫了兩周的「微服務」有點膩,不過這個系列還會繼續寫。今天來帶大家研究一下Linux內存管理。
對于精通CURD的業務同學,內存管理好像離我們很遠,但這個知識點雖然冷門(估計很多人學完根本就沒機會用上)但絕對是基礎中的基礎。
這就像武俠小說中的內功修煉,學完之后看不到立竿見影的效果,但對你日后的開發工作是大有裨益的,因為你站的更高了。
文中所有示例圖都是我親手畫的,畫圖比碼字還費時間,但大家看圖理解比文字更直觀,所以還是畫了。需要高清示例圖片的同學,文末有獲取方式自取。
再功利點的說,面試的時候不經意間透露你懂這方面知識,并且能說出個一二三來,也許能讓面試官對你更有興趣,離升職加薪,走上人生巔峰又近了一步。
前提約定:本文討論技術內容前提,操作系統環境都是x86架構的 32 位Linux系統。
虛擬地址
即使是現代操作系統中,內存依然是計算機中很寶貴的資源,看看你電腦幾個T固態硬盤,再看看內存大小就知道了。
為了充分利用和管理系統內存資源,Linux采用虛擬內存管理技術,利用虛擬內存技術讓每個進程都有4GB互不干涉的虛擬地址空間。
進程初始化分配和操作的都是基于這個「虛擬地址」,只有當進程需要實際訪問內存資源的時候才會建立虛擬地址和物理地址的映射,調入物理內存頁。
打個不是很恰當的比方,這個原理其實和現在的某某網盤一樣。假如你的網盤空間是1TB,真以為就一口氣給了你這么大空間嗎?那還是太年輕,都是在你往里面放東西的時候才給你分配空間,你放多少就分多少實際空間給你,但你和你朋友看起來就像大家都擁有1TB空間一樣。
虛擬地址的好處
避免用戶直接訪問物理內存地址,防止一些破壞性操作,保護操作系統
每個進程都被分配了4GB的虛擬內存,用戶程序可使用比實際物理內存更大的地址空間
4GB的進程虛擬地址空間被分成兩部分:「用戶空間」和「內核空間」
用戶空間內核空間
物理地址
上面章節我們已經知道不管是用戶空間還是內核空間,使用的地址都是虛擬地址,當需進程要實際訪問內存的時候,會由內核的「請求分頁機制」產生「缺頁異常」調入物理內存頁。
把虛擬地址轉換成內存的物理地址,這中間涉及利用MMU內存管理單元(Memory Management Unit ) 對虛擬地址分段和分頁(段頁式)地址轉換,關于分段和分頁的具體流程,這里不再贅述,可以參考任何一本計算機組成原理教材描述。
段頁式內存管理地址轉換
Linux內核會將物理內存分為3個管理區,分別是:
ZONE_DMA
DMA內存區域。包含0MB~16MB之間的內存頁框,可以由老式基于ISA的設備通過DMA使用,直接映射到內核的地址空間。
ZONE_NORMAL
普通內存區域。包含16MB~896MB之間的內存頁框,常規頁框,直接映射到內核的地址空間。
ZONE_HIGHMEM
高端內存區域。包含896MB以上的內存頁框,不進行直接映射,可以通過永久映射和臨時映射進行這部分內存頁框的訪問。
物理內存區劃分
用戶空間
用戶進程能訪問的是「用戶空間」,每個進程都有自己獨立的用戶空間,虛擬地址范圍從從0x00000000至0xBFFFFFFF總容量3G 。
用戶進程通常只能訪問用戶空間的虛擬地址,只有在執行內陷操作或系統調用時才能訪問內核空間。
進程與內存
進程(執行的程序)占用的用戶空間按照「 訪問屬性一致的地址空間存放在一起 」的原則,劃分成5個不同的內存區域。訪問屬性指的是“可讀、可寫、可執行等 。
代碼段
代碼段是用來存放可執行文件的操作指令,可執行程序在內存中的鏡像。代碼段需要防止在運行時被非法修改,所以只準許讀取操作,它是不可寫的。
數據段
數據段用來存放可執行文件中已初始化全局變量,換句話說就是存放程序靜態分配的變量和全局變量。
BSS段
BSS段包含了程序中未初始化的全局變量,在內存中bss段全部置零。
堆heap
堆是用于存放進程運行中被動態分配的內存段,它的大小并不固定,可動態擴張或縮減。當進程調用malloc等函數分配內存時,新分配的內存就被動態添加到堆上(堆被擴張);當利用free等函數釋放內存時,被釋放的內存從堆中被剔除(堆被縮減)
棧stack
棧是用戶存放程序臨時創建的局部變量,也就是函數中定義的變量(但不包括static聲明的變量,static意味著在數據段中存放變量)。除此以外,在函數被調用時,其參數也會被壓入發起調用的進程棧中,并且待到調用結束后,函數的返回值也會被存放回棧中。由于棧的先進先出特點,所以棧特別方便用來保存/恢復調用現場。從這個意義上講,我們可以把堆棧看成一個寄存、交換臨時數據的內存區。
上述幾種內存區域中數據段、BSS段、堆通常是被連續存儲在內存中,在位置上是連續的,而代碼段和棧往往會被獨立存放。堆和棧兩個區域在i386體系結構中棧向下擴展、堆向上擴展,相對而生。
你也可以在linux下用size命令查看編譯后程序的各個內存區域大小:
[lemon ~]# size /usr/local/sbin/sshd text data bss dec hexfilename1924532 12412 4268962363840 2411c0/usr/local/sbin/sshd
內核空間
在x86 32位系統里,Linux 內核地址空間是指虛擬地址從0xC0000000開始到0xFFFFFFFF為止的高端內存地址空間,總計1G的容量, 包括了內核鏡像、物理頁面表、驅動程序等運行在內核空間 。
內核空間細分區域.
直接映射區
直接映射區Direct Memory Region:從內核空間起始地址開始,最大896M的內核空間地址區間,為直接內存映射區。
直接映射區的896MB的「線性地址」直接與「物理地址」的前896MB進行映射,也就是說線性地址和分配的物理地址都是連續的。內核地址空間的線性地址0xC0000001所對應的物理地址為0x00000001,它們之間相差一個偏移量PAGE_OFFSET = 0xC0000000
該區域的線性地址和物理地址存在線性轉換關系「線性地址 =PAGE_OFFSET+ 物理地址」也可以用virt_to_phys()函數將內核虛擬空間中的線性地址轉化為物理地址。
高端內存線性地址空間
內核空間線性地址從 896M 到 1G 的區間,容量 128MB 的地址區間是高端內存線性地址空間,為什么叫高端內存線性地址空間?下面給你解釋一下:
前面已經說過,內核空間的總大小 1GB,從內核空間起始地址開始的 896MB 的線性地址可以直接映射到物理地址大小為 896MB 的地址區間。
退一萬步,即使內核空間的1GB線性地址都映射到物理地址,那也最多只能尋址 1GB 大小的物理內存地址范圍。
請問你現在你家的內存條多大?快醒醒都 0202 年了,一般 PC 的內存都大于 1GB 了吧!
所以,內核空間拿出了最后的 128M 地址區間,劃分成下面三個高端內存映射區,以達到對整個物理地址范圍的尋址。而在 64 位的系統上就不存在這樣的問題了,因為可用的線性地址空間遠大于可安裝的內存。
動態內存映射區
vmalloc Region該區域由內核函數vmalloc來分配,特點是:線性空間連續,但是對應的物理地址空間不一定連續。vmalloc分配的線性地址所對應的物理頁可能處于低端內存,也可能處于高端內存。
永久內存映射區
Persistent Kernel Mapping Region該區域可訪問高端內存。訪問方法是使用alloc_page (_GFP_HIGHMEM)分配高端內存頁或者使用kmap函數將分配到的高端內存映射到該區域。
固定映射區
Fixing kernel Mapping Region該區域和 4G 的頂端只有 4k 的隔離帶,其每個地址項都服務于特定的用途,如ACPI_BASE等。
內核空間物理內存映射
回顧一下
上面講的有點多,先別著急進入下一節,在這之前我們再來回顧一下上面所講的內容。如果認真看完上面的章節,我這里再畫了一張圖,現在你的腦海中應該有這樣一個內存管理的全局圖。
內核空間用戶空間全圖
內存數據結構
要讓內核管理系統中的虛擬內存,必然要從中抽象出內存管理數據結構,內存管理操作如「分配、釋放等」都基于這些數據結構操作,這里列舉兩個管理虛擬內存區域的數據結構。
用戶空間內存數據結構
在前面「進程與內存」章節我們提到,Linux進程可以劃分為 5 個不同的內存區域,分別是:代碼段、數據段、BSS、堆、棧,內核管理這些區域的方式是,將這些內存區域抽象成vm_area_struct的內存管理對象。
vm_area_struct是描述進程地址空間的基本管理單元,一個進程往往需要多個vm_area_struct來描述它的用戶空間虛擬地址,需要使用「鏈表」和「紅黑樹」來組織各個vm_area_struct。
鏈表用于需要遍歷全部節點的時候用,而紅黑樹適用于在地址空間中定位特定內存區域。內核為了內存區域上的各種不同操作都能獲得高性能,所以同時使用了這兩種數據結構。
用戶空間進程的地址管理模型:
wm_arem_struct
內核空間動態分配內存數據結構
在內核空間章節我們提到過「動態內存映射區」,該區域由內核函數vmalloc來分配,特點是:線性空間連續,但是對應的物理地址空間不一定連續。vmalloc分配的線性地址所對應的物理頁可能處于低端內存,也可能處于高端內存。
vmalloc分配的地址則限于vmalloc_start與vmalloc_end之間。每一塊vmalloc分配的內核虛擬內存都對應一個vm_struct結構體,不同的內核空間虛擬地址之間有4k大小的防越界空閑區間隔區。
與用戶空間的虛擬地址特性一樣,這些虛擬地址與物理內存沒有簡單的映射關系,必須通過內核頁表才可轉換為物理地址或物理頁,它們有可能尚未被映射,當發生缺頁時才真正分配物理頁面。
動態內存映射
總結一下
Linux內存管理是一個非常復雜的系統,本文所述只是冰山一角,從宏觀角度給你展現內存管理的全貌,但一般來說,這些知識在你和面試官聊天的時候還是夠用的,當然也希望大家能夠通過讀書了解更深層次的原理。
本文可以作為一個索引一樣的學習指南,當你想深入某一點學習的時候可以在這些章節里找到切入點,以及這個知識點在內存管理宏觀上的位置。
-
Linux
+關注
關注
87文章
11342瀏覽量
210153 -
固態硬盤
+關注
關注
12文章
1474瀏覽量
57499
原文標題:別再說你不懂 Linux 內存管理了,10 張圖給你安排的明明白白
文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論