手机在线看永久av片免费_男人的天堂在线视频_亚洲av无码潮喷在线观看_中文在线а天堂

java io操作中通常采用BufferedReader，BufferedInputStream等帶緩沖的IO類處理大文件，不過(guò)java nio中引入了一種基于MappedByteBuffer操作大文件的方式，其讀寫性能極高，本文會(huì)介紹其性能如此高的內(nèi)部實(shí)現(xiàn)原理。

內(nèi)存管理

在深入MappedByteBuffer之前，先看看計(jì)算機(jī)內(nèi)存管理的幾個(gè)術(shù)語(yǔ)：

MMC：CPU的內(nèi)存管理單元。

物理內(nèi)存：即內(nèi)存條的內(nèi)存空間。

虛擬內(nèi)存：計(jì)算機(jī)系統(tǒng)內(nèi)存管理的一種技術(shù)。它使得應(yīng)用程序認(rèn)為它擁有連續(xù)的可用的內(nèi)存（一個(gè)連續(xù)完整的地址空間），而實(shí)際上，它通常是被分隔成多個(gè)物理內(nèi)存碎片，還有部分暫時(shí)存儲(chǔ)在外部磁盤存儲(chǔ)器上，在需要時(shí)進(jìn)行數(shù)據(jù)交換。

頁(yè)面文件：操作系統(tǒng)反映構(gòu)建并使用虛擬內(nèi)存的硬盤空間大小而創(chuàng)建的文件，在windows下，即pagefile.sys文件，其存在意味著物理內(nèi)存被占滿后，將暫時(shí)不用的數(shù)據(jù)移動(dòng)到硬盤上。

缺頁(yè)中斷：當(dāng)程序試圖訪問(wèn)已映射在虛擬地址空間中但未被加載至物理內(nèi)存的一個(gè)分頁(yè)時(shí)，由MMC發(fā)出的中斷。如果操作系統(tǒng)判斷此次訪問(wèn)是有效的，則嘗試將相關(guān)的頁(yè)從虛擬內(nèi)存文件中載入物理內(nèi)存。

為什么會(huì)有虛擬內(nèi)存和物理內(nèi)存的區(qū)別？
如果正在運(yùn)行的一個(gè)進(jìn)程，它所需的內(nèi)存是有可能大于內(nèi)存條容量之和的，如內(nèi)存條是256M，程序卻要?jiǎng)?chuàng)建一個(gè)2G的數(shù)據(jù)區(qū)，那么所有數(shù)據(jù)不可能都加載到內(nèi)存（物理內(nèi)存），必然有數(shù)據(jù)要放到其他介質(zhì)中（比如硬盤），待進(jìn)程需要訪問(wèn)那部分?jǐn)?shù)據(jù)時(shí)，再調(diào)度進(jìn)入物理內(nèi)存。

什么是虛擬內(nèi)存地址和物理內(nèi)存地址？
假設(shè)你的計(jì)算機(jī)是32位，那么它的地址總線是32位的，也就是它可以尋址00xFFFFFFFF（4G）的地址空間，但如果你的計(jì)算機(jī)只有256M的物理內(nèi)存0x0x0FFFFFFF（256M），同時(shí)你的進(jìn)程產(chǎn)生了一個(gè)不在這256M地址空間中的地址，那么計(jì)算機(jī)該如何處理呢？回答這個(gè)問(wèn)題前，先說(shuō)明計(jì)算機(jī)的內(nèi)存分頁(yè)機(jī)制。

計(jì)算機(jī)會(huì)對(duì)虛擬內(nèi)存地址空間（32位為4G）進(jìn)行分頁(yè)產(chǎn)生頁(yè)（page），對(duì)物理內(nèi)存地址空間（假設(shè)256M）進(jìn)行分頁(yè)產(chǎn)生頁(yè)幀（page frame），頁(yè)和頁(yè)幀的大小一樣，所以虛擬內(nèi)存頁(yè)的個(gè)數(shù)勢(shì)必要大于物理內(nèi)存頁(yè)幀的個(gè)數(shù)。在計(jì)算機(jī)上有一個(gè)頁(yè)表（page table），就是映射虛擬內(nèi)存頁(yè)到物理內(nèi)存頁(yè)的，更確切的說(shuō)是頁(yè)號(hào)到頁(yè)幀號(hào)的映射，而且是一對(duì)一的映射。
問(wèn)題來(lái)了，虛擬內(nèi)存頁(yè)的個(gè)數(shù) > 物理內(nèi)存頁(yè)幀的個(gè)數(shù)，豈不是有些虛擬內(nèi)存頁(yè)的地址永遠(yuǎn)沒(méi)有對(duì)應(yīng)的物理內(nèi)存地址空間？不是的，操作系統(tǒng)是這樣處理的。操作系統(tǒng)有個(gè)頁(yè)面失效（page fault）功能。操作系統(tǒng)找到一個(gè)最少使用的頁(yè)幀，使之失效，并把它寫入磁盤，隨后把需要訪問(wèn)的頁(yè)放到頁(yè)幀中，并修改頁(yè)表中的映射，保證了所有的頁(yè)都會(huì)被調(diào)度。

現(xiàn)在來(lái)看看什么是虛擬內(nèi)存地址和物理內(nèi)存地址：

虛擬內(nèi)存地址：由頁(yè)號(hào)（與頁(yè)表中的頁(yè)號(hào)關(guān)聯(lián)）和偏移量（頁(yè)的小大，即這個(gè)頁(yè)能存多少數(shù)據(jù)）組成。

舉個(gè)例子，有一個(gè)虛擬地址它的頁(yè)號(hào)是4，偏移量是20，那么他的尋址過(guò)程是這樣的：首先到頁(yè)表中找到頁(yè)號(hào)4對(duì)應(yīng)的頁(yè)幀號(hào)（比如為8），如果頁(yè)不在內(nèi)存中，則用失效機(jī)制調(diào)入頁(yè)，接著把頁(yè)幀號(hào)和偏移量傳給MMC組成一個(gè)物理上真正存在的地址，最后就是訪問(wèn)物理內(nèi)存的數(shù)據(jù)了。

MappedByteBuffer是什么

從繼承結(jié)構(gòu)上看，MappedByteBuffer繼承自ByteBuffer，內(nèi)部維護(hù)了一個(gè)邏輯地址address。

示例

通過(guò)MappedByteBuffer讀取文件

JAVA中NIO通過(guò)MappedByteBuffer操作大文件

map過(guò)程

FileChannel提供了map方法把文件映射到虛擬內(nèi)存，通常情況可以映射整個(gè)文件，如果文件比較大，可以進(jìn)行分段映射。

FileChannel中的幾個(gè)變量：MapMode mode：內(nèi)存映像文件訪問(wèn)的方式，共三種： MapMode.READ_ONLY：只讀，試圖修改得到的緩沖區(qū)將導(dǎo)致拋出異常。 MapMode.READ_WRITE：讀/寫，對(duì)得到的緩沖區(qū)的更改最終將寫入文件；但該更改對(duì)映射到同一文件的其他程序不一定是可見(jiàn)的。 MapMode.PRIVATE：私用，可讀可寫,但是修改的內(nèi)容不會(huì)寫入文件，只是buffer自身的改變，這種能力稱之為”copy on write”。position：文件映射時(shí)的起始位置。allocationGranularity：Memory allocation size for mapping buffers，通過(guò)native函數(shù)initIDs初始化。

接下去通過(guò)分析源碼，了解一下map過(guò)程的內(nèi)部實(shí)現(xiàn)。

通過(guò)RandomAccessFile獲取FileChannel。

JAVA中NIO通過(guò)MappedByteBuffer操作大文件

上述實(shí)現(xiàn)可以看出，由于synchronized ，只有一個(gè)線程能夠初始化FileChannel。

通過(guò)FileChannel.map方法，把文件映射到虛擬內(nèi)存，并返回邏輯地址address，實(shí)現(xiàn)如下：

JAVA中NIO通過(guò)MappedByteBuffer操作大文件

上述代碼可以看出，最終map通過(guò)native函數(shù)map0完成文件的映射工作。
1. 如果第一次文件映射導(dǎo)致OOM，則手動(dòng)觸發(fā)垃圾回收，休眠100ms后再次嘗試映射，如果失敗，則拋出異常。
2. 通過(guò)newMappedByteBuffer方法初始化MappedByteBuffer實(shí)例，不過(guò)其最終返回的是DirectByteBuffer的實(shí)例，實(shí)現(xiàn)如下：

JAVA中NIO通過(guò)MappedByteBuffer操作大文件

由于FileChannelImpl和DirectByteBuffer不在同一個(gè)包中，所以有權(quán)限訪問(wèn)問(wèn)題，通過(guò)AccessController類獲取DirectByteBuffer的構(gòu)造器進(jìn)行實(shí)例化。

DirectByteBuffer是MappedByteBuffer的一個(gè)子類，其實(shí)現(xiàn)了對(duì)內(nèi)存的直接操作。

get過(guò)程

MappedByteBuffer的get方法最終通過(guò)DirectByteBuffer.get方法實(shí)現(xiàn)的。

JAVA中NIO通過(guò)MappedByteBuffer操作大文件

map0()函數(shù)返回一個(gè)地址address，這樣就無(wú)需調(diào)用read或write方法對(duì)文件進(jìn)行讀寫，通過(guò)address就能夠操作文件。底層采用unsafe.getByte方法，通過(guò)（address + 偏移量）獲取指定內(nèi)存的數(shù)據(jù)。

第一次訪問(wèn)address所指向的內(nèi)存區(qū)域，導(dǎo)致缺頁(yè)中斷，中斷響應(yīng)函數(shù)會(huì)在交換區(qū)中查找相對(duì)應(yīng)的頁(yè)面，如果找不到（也就是該文件從來(lái)沒(méi)有被讀入內(nèi)存的情況），則從硬盤上將文件指定頁(yè)讀取到物理內(nèi)存中（非jvm堆內(nèi)存）。

如果在拷貝數(shù)據(jù)時(shí)，發(fā)現(xiàn)物理內(nèi)存不夠用，則會(huì)通過(guò)虛擬內(nèi)存機(jī)制（swap）將暫時(shí)不用的物理頁(yè)面交換到硬盤的虛擬內(nèi)存中。

性能分析

從代碼層面上看，從硬盤上將文件讀入內(nèi)存，都要經(jīng)過(guò)文件系統(tǒng)進(jìn)行數(shù)據(jù)拷貝，并且數(shù)據(jù)拷貝操作是由文件系統(tǒng)和硬件驅(qū)動(dòng)實(shí)現(xiàn)的，理論上來(lái)說(shuō)，拷貝數(shù)據(jù)的效率是一樣的。
但是通過(guò)內(nèi)存映射的方法訪問(wèn)硬盤上的文件，效率要比read和write系統(tǒng)調(diào)用高，這是為什么？

read()是系統(tǒng)調(diào)用，首先將文件從硬盤拷貝到內(nèi)核空間的一個(gè)緩沖區(qū)，再將這些數(shù)據(jù)拷貝到用戶空間，實(shí)際上進(jìn)行了兩次數(shù)據(jù)拷貝；

map()也是系統(tǒng)調(diào)用，但沒(méi)有進(jìn)行數(shù)據(jù)拷貝，當(dāng)缺頁(yè)中斷發(fā)生時(shí)，直接將文件從硬盤拷貝到用戶空間，只進(jìn)行了一次數(shù)據(jù)拷貝。

所以，采用內(nèi)存映射的讀寫效率要比傳統(tǒng)的read/write性能高。

總結(jié)

MappedByteBuffer使用虛擬內(nèi)存，因此分配(map)的內(nèi)存大小不受JVM的-Xmx參數(shù)限制，但是也是有大小限制的。

如果當(dāng)文件超出1.5G限制時(shí)，可以通過(guò)position參數(shù)重新map文件后面的內(nèi)容。

MappedByteBuffer在處理大文件時(shí)的確性能很高，但也存在一些問(wèn)題，如內(nèi)存占用、文件關(guān)閉不確定，被其打開(kāi)的文件只有在垃圾回收的才會(huì)被關(guān)閉，而且這個(gè)時(shí)間點(diǎn)是不確定的。
javadoc中也提到：A mapped byte buffer and the file mapping that it represents remain valid until the buffer itself is garbage-collected.*

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

內(nèi)存

內(nèi)存

+關(guān)注

關(guān)注
8

文章
3004

瀏覽量
73900
JAVA

JAVA

+關(guān)注

關(guān)注
19

文章
2960

瀏覽量
104563

評(píng)論

相關(guān)推薦

如何使用SFTP傳輸大文件

在當(dāng)今的數(shù)字化時(shí)代，大文件傳輸變得越來(lái)越常見(jiàn)。無(wú)論是企業(yè)數(shù)據(jù)遷移、遠(yuǎn)程備份還是內(nèi)容分發(fā)，都需要一種既安全又高效的文件傳輸方式。SFTP作為一種基于SSH的文件傳輸協(xié)議，提供了一種加密的傳輸方式，確保

發(fā)表于 11-13 14:11 ?341次閱讀

Windows連接P2Link的FTP服務(wù)——遠(yuǎn)程操作文件

FTP協(xié)議允許用戶通過(guò)客戶端軟件連接到FTP服務(wù)器，進(jìn)行文件的上傳、下載、刪除、重命名等操作。P2Link可快速為本地文件目錄提供公網(wǎng)FTP服務(wù)地址，用于遠(yuǎn)程

發(fā)表于 11-13 11:48 ?167次閱讀

Windows連接P2Link的FTP服務(wù)——遠(yuǎn)程<b class='flag-5'>操作文件</b>

Java中時(shí)間戳的使用

Java中時(shí)間戳的使用

發(fā)表于 11-06 16:04 ?147次閱讀

<b class='flag-5'>Java</b><b class='flag-5'>中</b>時(shí)間戳的使用

java反編譯能拿到源碼嗎

Java反編譯是一種將編譯后的Java字節(jié)碼（.class文件）轉(zhuǎn)換回Java源代碼的過(guò)程。雖然反編譯可以幫助理解代碼的邏輯和結(jié)構(gòu)，但它并不總是能完美地還原原始源代碼。反編譯工具通常會(huì)

發(fā)表于 09-02 11:03 ?754次閱讀

如何修改buildroot和debian文件系統(tǒng)

本文檔主要介紹在沒(méi)有編譯環(huán)境的情況下，如何修改buildroot和debian文件系統(tǒng)方法，如在buildroot文件系統(tǒng)中添加文件、修改目錄等文件

發(fā)表于 07-22 17:46 ?423次閱讀

如何實(shí)現(xiàn)Python復(fù)制文件操作

Python 中有許多“開(kāi)蓋即食”的模塊（比如 os，subprocess 和 shutil）以支持文件 I/O 操作。在這篇文章中，你將會(huì)看到一些用 Python 實(shí)現(xiàn)文件復(fù)制的特殊

發(fā)表于 07-18 14:53 ?382次閱讀

esp32如何一次性讀取大文件數(shù)據(jù)？

esp32沒(méi)有提供數(shù)據(jù)庫(kù)讀寫的例子，最近有個(gè)大文件，無(wú)法一次性讀出，請(qǐng)問(wèn)，怎么讀取，json中一部分json數(shù)組。然后修改完了以后，在寫入進(jìn)去？

發(fā)表于 06-25 06:52

使用ESP32-S3開(kāi)發(fā)板http post請(qǐng)求發(fā)送SD卡上的大文件，如何循環(huán)邊讀取文件邊分塊發(fā)送文件呢？

您和，我準(zhǔn)備使用ESP32-S3開(kāi)發(fā)板http post請(qǐng)求發(fā)送SD卡上的大文件，但是使用esp_http_client_set_post_field的buffer太小，內(nèi)存不能一次性申請(qǐng)?zhí)螅?qǐng)問(wèn)

發(fā)表于 06-06 06:19

java環(huán)境配置成功后怎么運(yùn)行

Java環(huán)境配置成功后，我們可以使用幾種方式來(lái)運(yùn)行Java程序。下面將詳細(xì)介紹這幾種方式以及其使用方法。命令行運(yùn)行方式在成功配置Java環(huán)境后，我們可以通過(guò)命令行來(lái)運(yùn)行

發(fā)表于 12-06 15:57 ?2081次閱讀

java環(huán)境配置成功后能執(zhí)行哪些操作

Java環(huán)境配置成功后，您可以進(jìn)行以下操作：編寫和運(yùn)行Java程序：配置成功后，您可以使用Java編寫程序，運(yùn)行并測(cè)試它們。您可以使用任何文本編輯器編寫

發(fā)表于 12-06 15:55 ?729次閱讀

java環(huán)境下如何使用hash函數(shù)

在Java環(huán)境下使用散列函數(shù)（hash function）是一種常見(jiàn)的操作。散列函數(shù)是將任意大小的數(shù)據(jù)轉(zhuǎn)換為固定大小的輸出值的函數(shù)。在Java中，散列函數(shù)經(jīng)常用于數(shù)據(jù)結(jié)構(gòu)

發(fā)表于 12-06 15:52 ?413次閱讀

idea的java運(yùn)行配置怎么弄

Java是一種跨平臺(tái)的編程語(yǔ)言，可以通過(guò)Java虛擬機(jī)（JVM）在不同的操作系統(tǒng)和硬件上運(yùn)行。在運(yùn)行Java程序之前，需要進(jìn)行一些配置。本文

發(fā)表于 12-06 14:04 ?2070次閱讀

idea要配置java環(huán)境變量嗎

環(huán)境變量的步驟及其重要性。在開(kāi)始之前，我們先了解一下環(huán)境變量的概念。環(huán)境變量是操作系統(tǒng)定義的一些值，用于指定操作系統(tǒng)及其應(yīng)用程序如何運(yùn)行。通過(guò)設(shè)置環(huán)境變量，我們可以指定操作系統(tǒng)查找可

發(fā)表于 12-06 14:02 ?735次閱讀

eclipse怎么運(yùn)行java項(xiàng)目

在Eclipse中運(yùn)行Java項(xiàng)目是非常簡(jiǎn)單的。下面了解一下如何在Eclipse中運(yùn)行Java項(xiàng)目。首先，確保您已經(jīng)在Eclipse中創(chuàng)建

發(fā)表于 12-06 11:25 ?1955次閱讀

Java怎么排查oom異常

據(jù)量的應(yīng)用中。要排查OOM異常，需要經(jīng)過(guò)以下幾個(gè)步驟：理解OOM異常的原因：OOM異常通常有以下幾個(gè)原因：內(nèi)存泄露、內(nèi)存溢出、內(nèi)存不足以容納所需的數(shù)據(jù)等。理解OOM異常的原因?qū)ε挪閱?wèn)題非常重要。配置Java堆內(nèi)存：要解決OOM異常，可以嘗試增加

發(fā)表于 12-05 13:47 ?1214次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

JAVA中NIO通過(guò)MappedByteBuffer操作大文件

評(píng)論

如何使用SFTP傳輸大文件

Windows連接P2Link的FTP服務(wù)——遠(yuǎn)程操作文件

Java中時(shí)間戳的使用

java反編譯能拿到源碼嗎

如何修改buildroot和debian文件系統(tǒng)

如何實(shí)現(xiàn)Python復(fù)制文件操作

esp32如何一次性讀取大文件數(shù)據(jù)？

使用ESP32-S3開(kāi)發(fā)板http post請(qǐng)求發(fā)送SD卡上的大文件，如何循環(huán)邊讀取文件邊分塊發(fā)送文件呢？

java環(huán)境配置成功后怎么運(yùn)行

java環(huán)境配置成功后能執(zhí)行哪些操作

java環(huán)境下如何使用hash函數(shù)

idea的java運(yùn)行配置怎么弄

idea要配置java環(huán)境變量嗎

eclipse怎么運(yùn)行java項(xiàng)目

Java怎么排查oom異常