inode是一個(gè)重要概念,是理解Unix/Linux文件系統(tǒng)和硬盤儲(chǔ)存的基礎(chǔ)。
我覺得,理解inode,不僅有助于提高系統(tǒng)操作水平,還有助于體會(huì)Unix設(shè)計(jì)哲學(xué),即如何把底層的復(fù)雜性抽象成一個(gè)簡(jiǎn)單概念,從而大大簡(jiǎn)化用戶接口。
下面就是我的inode學(xué)習(xí)筆記,盡量保持簡(jiǎn)單。
一、inode是什么?
理解inode,要從文件儲(chǔ)存說起。
文件儲(chǔ)存在硬盤上,硬盤的最小存儲(chǔ)單位叫做"扇區(qū)"(Sector)。每個(gè)扇區(qū)儲(chǔ)存512字節(jié)(相當(dāng)于0.5KB)。
操作系統(tǒng)讀取硬盤的時(shí)候,不會(huì)一個(gè)個(gè)扇區(qū)地讀取,這樣效率太低,而是一次性連續(xù)讀取多個(gè)扇區(qū),即一次性讀取一個(gè)"塊"(block)。這種由多個(gè)扇區(qū)組成的"塊",是文件存取的最小單位。"塊"的大小,最常見的是4KB,即連續(xù)八個(gè) sector組成一個(gè) block。
文件數(shù)據(jù)都儲(chǔ)存在"塊"中,那么很顯然,我們還必須找到一個(gè)地方儲(chǔ)存文件的元信息,比如文件的創(chuàng)建者、文件的創(chuàng)建日期、文件的大小等等。這種儲(chǔ)存文件元信息的區(qū)域就叫做inode,中文譯名為"索引節(jié)點(diǎn)"。
每一個(gè)文件都有對(duì)應(yīng)的inode,里面包含了與該文件有關(guān)的一些信息。
二、inode的內(nèi)容
inode包含文件的元信息,具體來說有以下內(nèi)容:
可以用stat命令,查看某個(gè)文件的inode信息:
總之,除了文件名以外的所有文件信息,都存在inode之中。至于為什么沒有文件名,下文會(huì)有詳細(xì)解釋。
三、inode的大小
inode也會(huì)消耗硬盤空間,所以硬盤格式化的時(shí)候,操作系統(tǒng)自動(dòng)將硬盤分成兩個(gè)區(qū)域。一個(gè)是數(shù)據(jù)區(qū),存放文件數(shù)據(jù);另一個(gè)是inode區(qū)(inode table),存放inode所包含的信息。
每個(gè)inode節(jié)點(diǎn)的大小,一般是128字節(jié)或256字節(jié)。inode節(jié)點(diǎn)的總數(shù),在格式化時(shí)就給定,一般是每1KB或每2KB就設(shè)置一個(gè)inode。假定在一塊1GB的硬盤中,每個(gè)inode節(jié)點(diǎn)的大小為128字節(jié),每1KB就設(shè)置一個(gè)inode,那么inode table的大小就會(huì)達(dá)到128MB,占整塊硬盤的12.8%。
查看每個(gè)硬盤分區(qū)的inode總數(shù)和已經(jīng)使用的數(shù)量,可以使用df命令。
由于每個(gè)文件都必須有一個(gè)inode,因此有可能發(fā)生inode已經(jīng)用光,但是硬盤還未存滿的情況。這時(shí),就無法在硬盤上創(chuàng)建新文件。
四、inode號(hào)碼
每個(gè)inode都有一個(gè)號(hào)碼,操作系統(tǒng)用inode號(hào)碼來識(shí)別不同的文件。
這里值得重復(fù)一遍,Unix/Linux系統(tǒng)內(nèi)部不使用文件名,而使用inode號(hào)碼來識(shí)別文件。對(duì)于系統(tǒng)來說,文件名只是inode號(hào)碼便于識(shí)別的別稱或者綽號(hào)。
表面上,用戶通過文件名,打開文件。實(shí)際上,系統(tǒng)內(nèi)部這個(gè)過程分成三步:首先,系統(tǒng)找到這個(gè)文件名對(duì)應(yīng)的inode號(hào)碼;其次,通過inode號(hào)碼,獲取inode信息;最后,根據(jù)inode信息,找到文件數(shù)據(jù)所在的block,讀出數(shù)據(jù)。
使用ls -i命令,可以看到文件名對(duì)應(yīng)的inode號(hào)碼:
五、目錄文件
Unix/Linux系統(tǒng)中,目錄(directory)也是一種文件。打開目錄,實(shí)際上就是打開目錄文件。
目錄文件的結(jié)構(gòu)非常簡(jiǎn)單,就是一系列目錄項(xiàng)(dirent)的列表。每個(gè)目錄項(xiàng),由兩部分組成:所包含文件的文件名,以及該文件名對(duì)應(yīng)的inode號(hào)碼。
ls命令只列出目錄文件中的所有文件名:
如果要查看文件的詳細(xì)信息,就必須根據(jù)inode號(hào)碼,訪問inode節(jié)點(diǎn),讀取信息。ls -l命令列出文件的詳細(xì)信息。
理解了上面這些知識(shí),就能理解目錄的權(quán)限。目錄文件的讀權(quán)限(r)和寫權(quán)限(w),都是針對(duì)目錄文件本身。由于目錄文件內(nèi)只有文件名和inode號(hào)碼,所以如果只有讀權(quán)限,只能獲取文件名,無法獲取其他信息,因?yàn)槠渌畔⒍純?chǔ)存在inode節(jié)點(diǎn)中,而讀取inode節(jié)點(diǎn)內(nèi)的信息需要目錄文件的執(zhí)行權(quán)限(x)。
六、硬鏈接
一般情況下,文件名和inode號(hào)碼是"一一對(duì)應(yīng)"關(guān)系,每個(gè)inode號(hào)碼對(duì)應(yīng)一個(gè)文件名。但是,Unix/Linux系統(tǒng)允許,多個(gè)文件名指向同一個(gè)inode號(hào)碼。
這意味著,可以用不同的文件名訪問同樣的內(nèi)容;對(duì)文件內(nèi)容進(jìn)行修改,會(huì)影響到所有文件名;但是,刪除一個(gè)文件名,不影響另一個(gè)文件名的訪問。這種情況就被稱為"硬鏈接"(hard link)。
ln命令可以創(chuàng)建硬鏈接:
運(yùn)行上面這條命令以后,源文件與目標(biāo)文件的inode號(hào)碼相同,都指向同一個(gè)inode。inode信息中有一項(xiàng)叫做"鏈接數(shù)",記錄指向該inode的文件名總數(shù),這時(shí)就會(huì)增加1。
反過來,刪除一個(gè)文件名,就會(huì)使得inode節(jié)點(diǎn)中的"鏈接數(shù)"減1。當(dāng)這個(gè)值減到0,表明沒有文件名指向這個(gè)inode,系統(tǒng)就會(huì)回收這個(gè)inode號(hào)碼,以及其所對(duì)應(yīng)block區(qū)域。
這里順便說一下目錄文件的"鏈接數(shù)"。創(chuàng)建目錄時(shí),默認(rèn)會(huì)生成兩個(gè)目錄項(xiàng):"."和".."。前者的inode號(hào)碼就是當(dāng)前目錄的inode號(hào)碼,等同于當(dāng)前目錄的"硬鏈接";后者的inode號(hào)碼就是當(dāng)前目錄的父目錄的inode號(hào)碼,等同于父目錄的"硬鏈接"。所以,任何一個(gè)目錄的"硬鏈接"總數(shù),總是等于2加上它的子目錄總數(shù)(含隱藏目錄)。
七、軟鏈接
除了硬鏈接以外,還有一種特殊情況。
文件A和文件B的inode號(hào)碼雖然不一樣,但是文件A的內(nèi)容是文件B的路徑。讀取文件A時(shí),系統(tǒng)會(huì)自動(dòng)將訪問者導(dǎo)向文件B。因此,無論打開哪一個(gè)文件,最終讀取的都是文件B。這時(shí),文件A就稱為文件B的"軟鏈接"(soft link)或者"符號(hào)鏈接(symbolic link)。
這意味著,文件A依賴于文件B而存在,如果刪除了文件B,打開文件A就會(huì)報(bào)錯(cuò):"No such file or directory"。這是軟鏈接與硬鏈接最大的不同:文件A指向文件B的文件名,而不是文件B的inode號(hào)碼,文件B的inode"鏈接數(shù)"不會(huì)因此發(fā)生變化。
ln -s命令可以創(chuàng)建軟鏈接。
八、inode的特殊作用
由于inode號(hào)碼與文件名分離,這種機(jī)制導(dǎo)致了一些Unix/Linux系統(tǒng)特有的現(xiàn)象。
1. 有時(shí),文件名包含特殊字符,無法正常刪除。這時(shí),直接刪除inode節(jié)點(diǎn),就能起到刪除文件的作用。
2. 移動(dòng)文件或重命名文件,只是改變文件名,不影響inode號(hào)碼。
3. 打開一個(gè)文件以后,系統(tǒng)就以inode號(hào)碼來識(shí)別這個(gè)文件,不再考慮文件名。因此,通常來說,系統(tǒng)無法從inode號(hào)碼得知文件名。
第3點(diǎn)使得軟件更新變得簡(jiǎn)單,可以在不關(guān)閉軟件的情況下進(jìn)行更新,不需要重啟。因?yàn)橄到y(tǒng)通過inode號(hào)碼,識(shí)別運(yùn)行中的文件,不通過文件名。更新的時(shí)候,新版文件以同樣的文件名,生成一個(gè)新的inode,不會(huì)影響到運(yùn)行中的文件。等到下一次運(yùn)行這個(gè)軟件的時(shí)候,文件名就自動(dòng)指向新版文件,舊版文件的inode則被回收。
(完)
原文標(biāo)題:理解inode
文章出處:【微信公眾號(hào):Linuxer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
Linux
+關(guān)注
關(guān)注
87文章
11342瀏覽量
210146 -
操作系統(tǒng)
+關(guān)注
關(guān)注
37文章
6889瀏覽量
123598
原文標(biāo)題:理解inode
文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場(chǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論