精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ARM64 Linux內核頁表的塊映射

Linux閱碼場 ? 來源:Linuxer ? 作者:Linuxer ? 2021-01-04 13:37 ? 次閱讀

內核文檔Documentation/arm64/memory.rst描述了ARM64 Linux內核空間的內存映射情況,應該是此方面最權威文檔。

以典型的4K頁和48位虛擬地址為例,整個內核空間的虛擬地址分布如下:

173d710c-4e4d-11eb-8b86-12bb97331649.png

從ffff000000000000到ffff7fffffffffff是一段針對物理地址的線性映射區,最大支持128TB的物理地址空間,這一段地址非常類似ARM32的low memory映射區。

我們看看這種情況下的頁表,我們既可以用最終的【20:12】對應的PTE映射項,以4K為單位,進行虛擬地址到物理地址的映射;又可以以【29:21】對應的PMD映射項,以2M為單位,進行虛擬地址到物理地址的映射。

1764476e-4e4d-11eb-8b86-12bb97331649.png

對于用戶空間的虛擬地址而言,當我們進行的是PMD映射的時候,我們得到的是Huge Page,ARM64的2MB的huge page,在虛擬和物理上都連續,它在實踐工程中的好處是,可以減小TLB miss,因為,如果進行了2MB的映射,整個2MB不再需要PTE,映射關系大為減小。

178dd1ce-4e4d-11eb-8b86-12bb97331649.png

對于內核空間而言,從ffff000000000000到ffff7fffffffffff的這段虛擬地址,如果與物理地址進行的是一種PMD映射的話,顯然也可以達到同樣的效果。但是,這不意味著它們就是Huge Page。眾所周知,內核開機把物理地址往虛擬地址進行線性映射,并不意味著這片內存被內核拿走了,它只是進行了一種映射,以便日后調用kmalloc(),get_free_pages()等API申請的內存是直接已經有虛實映射的。所以,即便內核進行的就是PMD映射,在內存的分割上,還是可以以4K為單位的:

17c8ca68-4e4d-11eb-8b86-12bb97331649.png

所以,即便我們在內核空間進行PMD映射,里面的每個藍色圓圈(一個4K頁),還是可以被單獨分配的,這種分配可以是kmalloc、vmalloc,用戶態的malloc等。內核態進行的PMD映射,不意味著相關的2MB成為了huge page,它純粹只是為了服務于當內核以線性映射的虛擬地址訪問該物理地址的時候(我們認為內核大多數時候是用這個線性映射的虛擬地址的),減小TLB miss。

當然,更牛逼的情況下,內核應該也可以直接用【38:30】位的PUD來進行映射,這樣映射關系是1GB的,則整個1GB后面占TLB的時候,只需要占一個入口。

1835a250-4e4d-11eb-8b86-12bb97331649.png

當然,如果用戶態的虛實映射是這樣的,用戶實際得到了一個1GB的巨頁。但是對于內核的線性映射區域而言,即便我們進行了1GB的PUD映射,這1G內部就可以進一步切割為4KB頁或者2MB的巨頁。記?。簝群藨B的線性映射區的映射只是個映射關系,不是個分配關系。比如下面的1GB的內核線性映射的1GB區域,仍然可以被4K分配走,或者被用戶以huge page以2MB為單位分配走:

185868b2-4e4d-11eb-8b86-12bb97331649.png

我們需要一個真實的調試手段來驗證我們的想法,這個調試手段就是PTDUMP(Page Table Dump),相關的代碼在ARM64內核的:

arch/arm64/mm/ptdump.c和ptdump_debugfs.c

我們把它們全部選中,這樣我們可以得到一個debugfs接口

/sys/kernel/debug/kernel_page_tables

來獲知內核態頁表的情況。

我用qemu啟動了一個4GB內存的ARM64虛擬機,可以看到前1GB的虛擬地址空間大多數是PMD和PTE映射,后面的3GB,全是PUD映射:

188ac456-4e4d-11eb-8b86-12bb97331649.png

我的內核啟動參數加了rodata=0:

$ cat/proc/cmdlineroot=/dev/vda2 rw console=ttyAMA0 ip=dhcp rodata=0

原因是內核在幾種情況下,是不會做這種PMD和PUD映射的,相關代碼見于:

18d0ee68-4e4d-11eb-8b86-12bb97331649.png

191e8b00-4e4d-11eb-8b86-12bb97331649.png

rodata_full在默認情況下總是成立的,它對應著內核的一個Config選項CONFIG_RODATA_FULL_DEFAULT_ENABLED, "Apply r/o permissions of VM areas also to their linear aliases",這個選項提高了內核的安全性,但是減小了內核的性能。

197a2640-4e4d-11eb-8b86-12bb97331649.png

我在內核啟動參數加的rodata=0實際上是讓rodata_full為false。如果我把這個kernel啟動選項去掉,我得到的內核頁表是完全不一樣,線性映射區也全部是PTE映射:

199d2ee2-4e4d-11eb-8b86-12bb97331649.png

最后,值得一提的是,不僅線性映射區可以使用PMD映射,vmemmap映射區也是在4K頁面情況下,默認用PMD映射的:

1a0676fe-4e4d-11eb-8b86-12bb97331649.png

字節跳動的宋牧春童鞋發了一個patchset,企圖在用戶分得巨頁的情況下,刪除巨頁內部的4KB的小page占用的page struct的內存消耗,這個patchset在圣誕節前目前發到了V11:

https://lore.kernel.org/linux-mm/20201222142440.28930-1-songmuchun@bytedance.com/

1a6a8f18-4e4d-11eb-8b86-12bb97331649.png

在這個patchset中,它就需要拆分vmemmap的PMD映射為PTE映射:

1b367c4a-4e4d-11eb-8b86-12bb97331649.png

這個patchset的原理建立在,當內核以4KB分頁的時候,每個page需要64字節的page struct。但是,當用戶把它分配為巨頁的時候,時候,我們不再需要一個個4KB單獨用page struct描述,對于這種compound page的情況,我們應該可以把后面的page struct的內存直接釋放掉,因為情況完全是雷同的,這樣可以剩下不少內存。

責任編輯:xj

原文標題:宋寶華: ARM64 Linux內核頁表的塊映射

文章出處:【微信公眾號:Linuxer】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    134

    文章

    9046

    瀏覽量

    366817
  • 內核
    +關注

    關注

    3

    文章

    1363

    瀏覽量

    40228
  • Linux
    +關注

    關注

    87

    文章

    11229

    瀏覽量

    208927
  • 板塊
    +關注

    關注

    0

    文章

    3

    瀏覽量

    7574

原文標題:宋寶華: ARM64 Linux內核頁表的塊映射

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    linux驅動程序如何加載進內核

    Linux系統中,驅動程序是內核與硬件設備之間的橋梁。它們允許內核與硬件設備進行通信,從而實現對硬件設備的控制和管理。 驅動程序的編寫 驅動程序的編寫是Linux驅動開發的基礎。在編
    的頭像 發表于 08-30 15:02 ?381次閱讀

    Linux內核測試技術

    Linux 內核Linux操作系統的核心部分,負責管理硬件資源和提供系統調用接口。隨著 Linux 內核的不斷發展和更新,其復雜性和代碼規
    的頭像 發表于 08-13 13:42 ?436次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內核</b>測試技術

    Linux內核映射的基礎知識

    大家在看內核代碼時會經常看的以上術語,但在ARM的芯片手冊中并沒有用到這些術語,而是使用L1,L2,L3這種術語。
    的頭像 發表于 08-07 15:53 ?663次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內核</b>中<b class='flag-5'>頁</b><b class='flag-5'>表</b><b class='flag-5'>映射</b>的基礎知識

    3568F-Linux系統使用手冊

    userspace主頻 模式使能的主頻,請修改Linux內核源碼"arch/arm64/boot/dts/rockchip/"目錄下的內核設 備樹文件
    發表于 07-25 15:45

    Linux 6.10集成RISC-V更新,支持Rust編程語言

    本次補丁升級中,Linux內核進一步擴展了對應于RISC-V架構的Rust編程語言支持。在此之前,Rust已可應用在x86_64、龍芯LoongArch以及ARM64等多種架構之上。
    的頭像 發表于 05-23 17:16 ?908次閱讀

    【鴻蒙】OpenHarmony運行docker詳細步驟

    check-config.sh 2.在編譯命令 ./build.sh --product-name rk3568 --ccache --target-cpu arm64 編譯 arm64 位系統情況下 進入
    的頭像 發表于 03-02 15:10 ?2462次閱讀
    【鴻蒙】OpenHarmony運行docker詳細步驟

    向后移植了cypress-fmac-v5.15.58-2023_0801到arm64內核 5.10.104,insmod brcmfmac崩潰怎么解決?

    向后移植了 cypress-fmac-v5.15.58-2023_0801 到 arm64 內核 5.10.104。 在加載內核模塊 brcmfmac.ko 時,按照自述文件中的說明進行操作, 我
    發表于 03-01 09:00

    Linux內核內存管理之內核非連續物理內存分配

    的主要優點是避免了外部碎片,而缺點是需要修改內核。顯然,非連續內存區域的大小必須是4096的倍數。Linux使用非連續物理內存區的場景有幾種:(1)為swap區分配數據結構;(2)
    的頭像 發表于 02-23 09:44 ?871次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內核</b>內存管理之<b class='flag-5'>內核</b>非連續物理內存分配

    Linux內核中信號詳解

    ? 1 信號的角色 1.1 x86/64架構信號定義 1.2 ARM架構信號定義 1.3 RISC-V架構信號定義 1.4 信號的系統調用 1.5 信號工作原理 2 信號的響應行為 3 POSIX
    的頭像 發表于 01-13 09:40 ?1331次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內核</b>中信號詳解

    TQT507開發板如何修改和保存內核配置

    ,如果不存在,則使用默認配置單。編譯前請使用原廠的配置單配置內核。 進入/Embedsky/TQT507/CoreA/longan/kernel/linux-4.9/arch/arm64
    的頭像 發表于 12-28 14:13 ?422次閱讀
    TQT507開發板如何修改和保存<b class='flag-5'>內核</b>配置

    【飛騰派4G版免費試用】2.手把手實戰編譯Linux內核

    /phytium-linux-kernel-master-Uboot-V1.0.0$ ls ./arch/arm64/boot/Image 這行命令用于列出目錄內容,顯示了編譯后的內核鏡像的位置。 zero@pc:~/work
    發表于 12-16 23:28

    如何修改內核設備樹

    longan/kernel/linux-4.9/arch/arm64/boot/dts/sunxi/sun50iw9p1-pinctrl.dtsi longan/kernel/linux-4.9/arch
    發表于 12-14 13:42

    基于Debian的Sparky Linux 7.2的亮點

    Linux kernel 6.1 LTS 提供支持,Sparky Linux 7.2采用 LXQt 1.2.0 和 KDE Plasma 5.27.5,現在提供 ARMHF 和 ARM64 鏡像。
    的頭像 發表于 12-14 10:13 ?570次閱讀
    基于Debian的Sparky <b class='flag-5'>Linux</b> 7.2的亮點

    【飛騰派4G版免費試用】如何定制飛騰平臺的ubuntu rootfs 根文件系統(1)

    ; export CROSS_COMPILE=aarch64-linux-gnu- export ARCH=arm64 source 腳本生效:yu@yu-HP-EliteBook-745-G3
    發表于 12-10 19:13

    瑞芯微RK3568J如何“調節主頻”,實現功耗降低?一文教會您!

    ,如需修改performance或userspace主頻模式使能的主頻,請修改Linux內核源碼”arch/arm64/boot/dts/rockchip/”目錄下的內核設備樹文件
    發表于 12-01 09:48