文件儲存在硬盤上,硬盤的最小存儲單位叫做扇區Sector。每個扇區儲存512字節相當于0.5KB。
操作系統讀取硬盤的時候,不會一個個扇區地讀取,這樣效率太低,而是一次性連續讀取多個扇區,即一次性讀取一個塊block。
這種由多個扇區組成的塊,是文件存取的最小單位。塊的大小,最常見的是4KB,即連續八個扇區組成一個塊。
文件數據都儲存在塊中,那么很顯然,我們還必須找到一個地方儲存文件的元信息。
比如文件的創建者、文件的創建日期、文件的大小等等。這種儲存文件元信息的區域就叫做inode,中文譯名為索引節點。
inode 信息
inode包含文件的元信息,具體來說有這些內容。Size
文件的字節數。Uid
文件擁有者的用戶ID。Gid
文件的Group ID。
Access: (0664/-rw-rw-r--)
文件的讀、寫、執行權限。Links
鏈接數,即有多少文件指向這個inode。
Blocks
文件所使用的總塊數。IO Block
文件數據block的大小,此數據是在分區的時候指定,單位是字節。
文件的時間戳,共有三個。Change: 2022-12-19 21:15:11.119221489 +0800
也就是ctime指inode上一次改變的時間。
Modify: 2022-12-19 21:15:11.119221489 +0800
也就是mtime指文件內容上一次修改的時間。
Access: 2022-12-19 21:15:11.119221489 +0800
也就是atime指文件上一次打開的時間。
我們可以運行stat
命令查看某個文件的inode信息,例如命令stat example.txt
查看example.txt文件的元信息。
stat example.txt
File: example.txt
Size: 0 Blocks: 0 IO Block: 4096 regular empty file
Device: 814h/2068d Inode: 855322 Links: 1
Access: (0664/-rw-rw-r--) Uid: ( 1000/ myfreax) Gid: ( 1000/ myfreax)
Access: 2022-12-19 21:15:11.119221489 +0800
Modify: 2022-12-19 21:15:11.119221489 +0800
Change: 2022-12-19 21:15:11.119221489 +0800
Birth: -
總之,除了文件名以外的所有文件信息,都存在inode之中。至于為什么沒有文件名,是因為文件名存儲在目錄中。
目錄是一個特殊的文件,它存儲文件名與inode的一一對應關系。目錄包含的信息包括inode號碼,文件名,文件名稱的長度。
inode 大小
inode也會消耗硬盤空間,所以硬盤格式化的時候,操作系統自動將硬盤分成兩個區域。
一個是數據區,存放文件數據。另一個是inode區,通常稱為inode table,存放inode所包含的信息。
每個inode節點的大小,一般是128字節或256字節。inode節點的總數,在格式化時就指定,一般是每1KB或每2KB就設置一個inode。
假設在一塊1GB的硬盤中,每個inode節點的大小為128字節,每1KB就設置一個inode,那么inode table的大小就會達到128MB,占整塊硬盤的12.8%。
要查看每個硬盤分區的inode總數和已經使用的數量,可以運行df命令df -i
。
df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
udev 2029095 655 2028440 1% /dev
tmpfs 2039243 1272 2037971 1% /run
/dev/sdb4 3383296 836357 2546939 25% /
tmpfs 2039243 1249 2037994 1% /dev/shm
tmpfs 2039243 8 2039235 1% /run/lock
tmpfs 2039243 19 2039224 1% /sys/fs/cgroup
由于每個文件都必須有一個inode,因此有可能發生inode已經用光,但是硬盤還未存滿的情況。這時,就無法在硬盤上創建新文件。
inode 號碼
每個inode都有一個號碼,操作系統用inode號碼來識別不同的文件。
這里值得重復一遍,Unix/Linux系統內部不使用文件名,而使用inode號碼來識別文件。對于系統來說,文件名只是inode號碼便于識別的別稱或者綽號。
表面上,用戶通過文件名打開文件。實際上,系統內部將這個過程分成三步。首先,系統找到這個文件名對應的inode號碼。
其次通過inode號碼,獲取inode信息,最后,根據inode信息,找到文件數據所在的block,讀出數據。
如果你需要知道文件對應的inode編碼,可以運行命令ls -i
命令。
ls -i example.txt
鏈接文件
一般情況下,文件和inode號碼是一一對應關系,每個inode號碼對應一個文件。但是,Unix/Linux系統允許多個文件名指向同一個inode號碼。
這意味著,可以以不同的文件名訪問文件。對文件內容進行修改,會影響到原始文件。
但是刪除一個文件,不影響另一個文件的訪問。這種情況就被稱為硬鏈接hard link。要創建文件的硬鏈接,可以運行ln命令ln example.txt example1.txt
。
ls -i example1.txt example.txt
828860 example1.txt 828860 example.txt
當對文件創建硬鏈接后,源文件與目標文件的inode號碼相同,都指向同一個inode。這一點決定了硬鏈接不能跨分區創建。
每個分區都有自己的inode表,如果硬鏈接可以跨分區創建的話,可能就是出現目標分區沒有相同inode號碼或者覆蓋已經存在文件等等。
在inode保護的信息中有一項叫做鏈接數,記錄指向inode的文件名總數,當為文件創建硬鏈接時就會加1。
反過來,刪除鏈接文件,就會使得inode節點中的鏈接數減1。當這個值減到0,表明沒有文件名指向這個inode,系統就會回收這個inode 號碼以及其所對應block區域。
軟鏈接并不像硬鏈接那樣,擁有相同的inode號碼,軟鏈接文件有自己的獨立的inode號碼。
當你為你文件創建軟鏈接時,原始文件inode信息的鏈接數也不會增加,刪除文件的軟鏈接原始文件inode也不會減少。
inode 特殊作用
由于inode號碼與文件名分離,這種機制導致了一些Unix/Linux系統特有的現象。
有時,文件名包含特殊字符,無法正常刪除。這時,直接刪除inode節點,就能起到刪除文件的作用。
移動文件或重命名文件,只是改變文件名,不影響inode號碼。
打開一個文件以后,系統就以inode號碼來識別這個文件,不再考慮文件名。因此,通常來說,系統無法從inode號碼得知文件名。
第3點使得軟件更新變得簡單,可以在不關閉軟件的情況下進行更新,不需要重啟。因為系統通過inode號碼,識別運行中的文件,不通過文件名。
更新的時候,新版文件以同樣的文件名,生成一個新的inode,不會影響到運行中的文件。
等到下一次運行這個軟件的時候,文件名就自動指向新版文件,舊版文件的inode則被回收。
-
硬盤
+關注
關注
3文章
1292瀏覽量
57236 -
存儲
+關注
關注
13文章
4265瀏覽量
85676 -
Linux
+關注
關注
87文章
11230瀏覽量
208935
發布評論請先 登錄
相關推薦
評論