前不久組內又有一次我比較期待的分享:”Linux 的虛擬內存”。是某天晚上加班時,我們討論虛擬內存的概念時,leader 發現幾位同事對虛擬內存認識不清后,特意給這位同學挑選的主題(笑)。
之前了解一些操作系統的概念,主要是畢業后對自己大學四年的荒廢比較懊惱,覺得自己有些對不起計算機專業出身,于是在工作之余抽出時間看了哈工大在網易云課堂的操作系統公開課,自己也讀了一本講操作系統比較淺的書 《Linux內核設計與實現》,而且去年自己用 C 寫簡單的服務器時,也追根究底了解了更多的系統底層知識。多虧了這些知識,讓我對應用層的知識更有掌控感,也在上次排查問題時助了我一臂之力。
前幾天另一位同事來問另一個虛擬內存相關的問題,我才發現對于虛擬內存,我的理解還不夠深刻,一些概念還有些矛盾。于是翻一下資料重新整理一下這些知識,希望下次在用到它們時能更順暢。
由來
虛擬內存
毋庸置疑,虛擬內存絕對是操作系統中最重要的概念之一。我想主要是由于內存的重要”戰略地位”。CPU太快,但容量小且功能單一,其他 I/O 硬件支持各種花式功能,可是相對于 CPU,它們又太慢。于是它們之間就需要一種潤滑劑來作為緩沖,這就是內存大顯身手的地方。
而在現代操作系統中,多任務已是標配。多任務并行,大大提升了 CPU 利用率,但卻引出了多個進程對內存操作的沖突問題,虛擬內存概念的提出就是為了解決這個問題。
上圖是虛擬內存最簡單也是最直觀的解釋。
操作系統有一塊物理內存(中間的部分),有兩個進程(實際會更多)P1 和 P2,操作系統偷偷地分別告訴 P1 和 P2,我的整個內存都是你的,隨便用,管夠。可事實上呢,操作系統只是給它們畫了個大餅,這些內存說是都給了 P1 和 P2,實際上只給了它們一個序號而已。只有當 P1 和 P2 真正開始使用這些內存時,系統才開始使用輾轉挪移,拼湊出各個塊給進程用,P2 以為自己在用 A 內存,實際上已經被系統悄悄重定向到真正的 B 去了,甚至,當 P1 和 P2 共用了 C 內存,他們也不知道。
操作系統的這種欺騙進程的手段,就是虛擬內存。對 P1 和 P2 等進程來說,它們都以為自己占用了整個內存,而自己使用的物理內存的哪段地址,它們并不知道也無需關心。
分頁和頁表
虛擬內存是操作系統里的概念,對操作系統來說,虛擬內存就是一張張的對照表,P1 獲取 A 內存里的數據時應該去物理內存的 A 地址找,而找 B 內存里的數據應該去物理內存的 C 地址。
我們知道系統里的基本單位都是 Byte 字節,如果將每一個虛擬內存的 Byte 都對應到物理內存的地址,每個條目最少需要 8字節(32位虛擬地址->32位物理地址),在 4G 內存的情況下,就需要 32GB 的空間來存放對照表,那么這張表就大得真正的物理地址也放不下了,于是操作系統引入了頁(Page)的概念。
在系統啟動時,操作系統將整個物理內存以 4K 為單位,劃分為各個頁。之后進行內存分配時,都以頁為單位,那么虛擬內存頁對應物理內存頁的映射表就大大減小了,4G 內存,只需要 8M 的映射表即可,一些進程沒有使用到的虛擬內存,也并不需要保存映射關系,而且Linux 還為大內存設計了多級頁表,可以進一頁減少了內存消耗。操作系統虛擬內存到物理內存的映射表,就被稱為頁表。
內存尋址和分配
我們知道通過虛擬內存機制,每個進程都以為自己占用了全部內存,進程訪問內存時,操作系統都會把進程提供的虛擬內存地址轉換為物理地址,再去對應的物理地址上獲取數據。CPU 中有一種硬件,內存管理單元 MMU(Memory Management Unit)專門用來將翻譯虛擬內存地址。CPU 還為頁表尋址設置了緩存策略,由于程序的局部性,其緩存命中率能達到 98%。
以上情況是頁表內存在虛擬地址到物理地址的映射,而如果進程訪問的物理地址還沒有被分配,系統則會產生一個缺頁中斷,在中斷處理時,系統切到內核態為進程虛擬地址分配物理地址。
功能
虛擬內存不僅通過內存地址轉換解決了多個進程訪問內存沖突的問題,還帶來更多的益處。
進程內存管理
它有助于進程進行內存管理,主要體現在:
內存完整性:由于虛擬內存對進程的”欺騙”,每個進程都認為自己獲取的內存是一塊連續的地址。我們在編寫應用程序時,就不用考慮大塊地址的分配,總是認為系統有足夠的大塊內存即可。
安全:由于進程訪問內存時,都要通過頁表來尋址,操作系統在頁表的各個項目上添加各種訪問權限標識位,就可以實現內存的權限控制。
數據共享
通過虛擬內存更容易實現內存和數據的共享。
在進程加載系統庫時,總是先分配一塊內存,將磁盤中的庫文件加載到這塊內存中,在直接使用物理內存時,由于物理內存地址唯一,即使系統發現同一個庫在系統內加載了兩次,但每個進程指定的加載內存不一樣,系統也無能為力。
而在使用虛擬內存時,系統只需要將進程的虛擬內存地址指向庫文件所在的物理內存地址即可。如上文圖中所示,進程 P1 和 P2 的 B 地址都指向了物理地址 C。
而通過使用虛擬內存使用共享內存也很簡單,系統只需要將各個進程的虛擬內存地址指向系統分配的共享內存地址即可。
SWAP
虛擬內存可以讓幫進程”擴充”內存。
我們前文提到了虛擬內存通過缺頁中斷為進程分配物理內存,內存總是有限的,如果所有的物理內存都被占用了怎么辦呢?
Linux 提出 SWAP 的概念,Linux 中可以使用 SWAP 分區,在分配物理內存,但可用內存不足時,將暫時不用的內存數據先放到磁盤上,讓有需要的進程先使用,等進程再需要使用這些數據時,再將這些數據加載到內存中,通過這種”交換”技術,Linux 可以讓進程使用更多的內存。
常見問題
在了解虛擬內存時,我也有過很多的問題。
32位和64位
最常見的就是 32位和64位的問題了。
CPU 通過物理總線訪問內存,那么訪問地址的范圍就受限于機器總線的數量,在32位機器上,有32條總線,每條總線有高低兩種電位分別代表 bit 的 1 和 0,那么可訪問的最大地址就是 2^32bit = 4GB,所以說 32 位機器上插入大于 4G 的內存是無效的,CPU 訪問不到多于 4G 的內存。
但 64位機器并沒有 64位總線,而且其最大內存還要受限于操作系統,Linux 目前支持最大 256G 內存。
根據虛擬內存的概念,在 32 位系統上運行 64 位軟件也并無不可,但由于系統對虛擬內存地址的結構設計,64位的虛擬地址在32位系統內并不能使用。
直接操作物理內存
操作系統使用了虛擬內存,我們想要直接操作內存該怎么辦呢?
Linux 會將各個設備都映射到/dev/目錄下的文件,我們可以通過這些設備文件直接操作硬件,內存也不例外。在 Linux 中,內存設置被映射為/dev/mem,root 用戶通過對這個文件讀寫,可以直接操作內存。
JVM 進程占用虛擬內存過多
使用 TOP 查看系統性能時,我們會發現在 VIRT 這一列,Java 進程會占用大量的虛擬內存。
導致這種問題的原因是 Java 使用 Glibc 的 Arena 內存池分配了大量的虛擬內存并沒有使用。此外,Java 讀取的文件也會被映射為虛擬內存,在虛擬機默認配置下 Java 每個線程棧會占用 1M 的虛擬內存。具體可以查看為什么linux下多線程程序如此消耗虛擬內存。
而真實占用的物理內存要看RES(resident) 列,這一列的值才是真正被映射到物理內存的大小。
常用管理命令
我們也可以自己來管理 Linux 的虛擬內存。
查看系統內存狀態
查看系統內存情況的方式有很多,free、vmstat等命令都可輸出當前系統的內存狀態,需要注意的是可用內存并不只是 free 這一列,由于操作系統的 lazy 特性,大量的 buffer/cache 在進程不再使用后,不會被立即清理,如果之前使用它們的進程再次運行還可以繼續使用,它們在必要時也是可以被利用的。
此外,通過cat /proc/meminfo可以查看系統內存被使用的詳細情況,包括臟頁狀態等。詳情可參見:/PROC/MEMINFO之謎。
pmap
如果想單獨查看某一進程的虛擬內存分布情況,可以使用pmap pid命令,它會把虛擬內存各段的占用情況從低地址到高地址都列出來。
修改內存配置
我們也可以修改 Linux 的系統配置,使用sysctl vm [-options] CONFIG或 直接讀寫/proc/sys/vm/目錄下的文件來查看和修改配置。
SWAP 操作
虛擬內存的 SWAP 特性并不總是有益,放任進程不停地將數據在內存與磁盤之間大量交換會極大地占用 CPU,降低系統運行效率,所以有時候我們并不希望使用 swap。
我們可以修改vm.swappiness=0來設置內存盡量少使用 swap,或者干脆使用swapoff命令禁用掉 SWAP。
小結
虛擬內存的概念非常容易理解,但是它會衍生出來的一系列非常復雜的知識。本文只講了些基本原理,略過了很多細節,比如虛擬內存尋址中段寄存器的使用,操作系統使用虛擬內存增強緩存、緩沖區的應用等,有機會單獨拿出來說。
責任編輯:lq6
-
Linux
+關注
關注
87文章
11232瀏覽量
208952 -
虛擬內存
+關注
關注
0文章
70瀏覽量
8052
原文標題:Linux虛擬內存,你理解到位了嗎?
文章出處:【微信號:gh_c472c2199c88,微信公眾號:嵌入式微處理器】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論