亚洲精品无码永久在线观看,国产精品一区久久久久久,免费a级毛片无码免费视频120软件,国产在线国偷精品免费看,国产精品99无码一区二区,天天躁日日躁狠狠躁一区,91视频一区二区

編者按：筆者遇到一個非常典型的問題，應用在 X86 正常運行，在 AArch64 上 JVM 就會崩潰。這個典型的 JVM 內部問題。筆者通過分析最終定位到是由于 JVM 中模板解釋器代碼存在 bug 導致在弱內存模型的平臺上 Crash。

在分析過程中，涉及到非常多的 JVM 內部知識，比如對象頭、GC 復制算法操作、CAS 操作、字節碼執行、內存序等，希望對讀者有所幫助。本文介紹了一般分析 JVM crash 的方法，并且深入介紹了為什么在 aarch64 平臺上引起這樣的問題，最后還給出了修改方法并推送到上游社區中。**對于使用非畢昇 JDK 的其他 JDK 只有在 jdk8u292、jdk11.0.9、jdk15以后的版本才得到修復，讀者使用時需要注意版本選擇避免這類問題發生。

背景知識

java 程序在發生 crash 時，會生成 hs_err_pid.log 文件，以及 core 文件（需要操作系統開啟相關設置），其中 hs_err 文件以文本格式記錄了 crash 發生位置的小范圍精確現場信息（調用棧、寄存器、線程棧、致命信號、指令上下文等）、jvm 各組件狀態信息（java 堆、jit 事件、gc 事件）、系統層面信息（環境變量、入參、內存使用信息、系統版本）等，精簡記錄了關鍵信息。而 core 文件是程序崩潰時進程的二進制快照，完整記錄了崩潰現場信息，可以使用 gdb 工具來打開 core 文件，恢復出一個崩潰現場，方便分析。

約束

文中描述的問題適用于 jdk8u292 之前的版本。

現象

某業務線隔十天半個月總會報過來 crash 問題，crash 位置比較統一，都是在某處執行 young gc 的上下文中，crash 的直接原因是 java 對象的頭被寫壞了，比如這樣：

而正常的對象頭由 markoop 和 metadata 兩部分組成，前者存放該對象的 hash 值、年齡、鎖信息等，后者存放該對象所屬的 Klass 指針。這里關注的是 markoop，64 位機器上它的具體布局如下：

每種布局中每個字段的詳細含義可以在 jdk 源碼 jdk8u/hotspot/src/share/vm/oops/markOop.hpp 中找到，這里簡單給出結論就是 gc 階段一個正常對象頭中的 markoop 不可能是全 0，而是比如這樣：

此外，crash 時間上也有個特點：基本每次都發生在程序剛啟動時的幾秒內。

分析

發生 crash 的 java 對象有個一致的特點，就是總位于 eden 區，我們仔細分析了 crash 位置的 gc 過程邏輯，特別是會在 gc 期間修改對象頭的相關源碼更是重點關注對象，因為那塊代碼為了追求性能，使用了無鎖編程：

補充介紹一下 CAS（Compare And Swap），CAS 的完整意思是比較并替換，并且確保整個操作原子性。CAS 需要 3 個操作數：內存地址 dst，比較值 cmp，要更新的目標值 value。當且僅當內存地址 dst 上的值跟比較值 cmp 相等時，將內存地址 dst 上的值改寫為 value，否則就什么都不做，其在 aarch64 上的匯編實現類似如下：

然而我們經過反復推敲，這塊 gc 邏輯似乎無懈可擊，而且位于 eden 區也意味著沒有被 gc 搬移過的可能性，這個問題在很長時間里陷入了停滯……

直到某一天又收到了一個類似的 crash，這個問題才迎來了轉機。在這個 crash 里，也是 java 對象的頭被寫壞了，但特殊的地方在于，頭上的錯誤值是 0x2000，憑著職業敏感，我們猜測這個特殊的錯誤值是否來自這個 java 對象本身呢？這個對象的 Java 名字叫 DynamicByteBuffer，來自某個基礎組件。反編譯得到了問題類 DynamicByteBuffer 的代碼：

再結合 core 信息中其他正常 DynamicByteBuffer 對象的布局，確定了這個特殊的 0x2000 值原本應該位于 segmentSize 字段上，而且從代碼中注意到這個 segmentSize 字段是 final 屬性，意味著其值只可能在實例構造函數中被設置，使用 jdk 自帶的命令 javap 進行反匯編，得到對應的字節碼如下：

putfield 這條字節碼的作用是給 java 對象的一個字段賦值，在紅框中的語義就是給 DynamicByteBuffer 對象的 segmentSize 字段賦值。

分析到這里，我們做一下小結，crash 的第一現場并非在 gc 上下文中，而是得往前追溯，發生在這個 java 對象被初始化期間，這期間在初始化它的 segmentSize 字段時，因為某種原因，0x2000 被寫到了對象頭上。

接下來繼續分析， JDK 在發生 crash 時會自動生成的 hs_err 日志，其中有記錄最近發生的編譯事件 “Compilation events （250 events）”，從中沒有發現 DynamicByteBuffer 構造函數相關的編譯事件，所以可以推斷 crash 時 DynamicByteBuffer 這個類的構造函數尚未被編譯過（由于 crash 發生在程序啟動那幾秒，JIT 往往需要預熱后才會介入，所以可以假設記錄的比較完整），這意味著，它的構造函數只會通過模板解釋器去執行，更具體地說，是去執行模板解釋器中的 putfield 指令來把 0x2000 寫到 segmentSize 字段位置。

具體怎么寫其實很簡單，就是先拿到 segmentSize 字段的偏移量，根據偏移量定位到寫的位置，然后寫入。然而 JVM 的模板解釋器在實現這個 putfield 指令時，額外增加了一條快速實現路徑，在 runtime 期間會自動（具體的時間點是 “完整” 執行完第一次 putfield 指令后）從慢速路徑切到快速路徑上，這個切換操作的實現全程沒有加鎖，同步完全依賴 barrier。

注：圖中 bcp 指的是 bytecode pointer，就是讀字節碼。

上圖表示接近同一時間點前后，兩條并行流分別構建一個 DynamicByteBuffer 類型的對象過程中，各自完成 segmentSize 字段賦值的過程，用 Java 代碼簡單示意如下：

其中第一條執行流走的慢速路徑，第二條走的快速路徑，可以留意到，紅色標識的是幾次公共內存的訪存操作，barrier 就分布在這些位置前后（標在下圖中）。

接下來再給一個更加精確一點的指令流模型

簡單介紹一下這個設計模型：

線程從記錄了指令的內存地址 bcp（bytecode pointer）上取出指令，然后跳轉到該指令地址上執行，當取出的指令是 bcp1（比如 putfeild 指令的慢速路徑）時就是圖中左邊的指令流；

左邊的指令流就是計算出字段的 offset 并 str 到指定內存地址，然后插入 barrier，最后將 bcp2 指令（比如 putfeild 指令的快速路徑）覆寫到步驟 1 中的內存地址 addr 上；

后續線程繼續執行步驟 1 時，由于取出的指令變成了 bcp2，就改為跳轉到圖中右邊的指令流；

右邊的指令流就是直接取出步驟 2 中已經存到指定內存地址中的 offset。

回顧整個設計模型，左邊的指令流通過一個等效于完整 dmb 的 barrier 來保證 str offset 和 str bcp2 這兩條 str 指令的執行順序并且全局可見；而右邊的指令流中，ldr bcp 和 ldr offset 這兩條 ldr 指令之間沒有任何 barrier，設計者可能認為一個無條件跳轉指令可以為兩條 ldr 指令建立依賴，從而保證執行順序，然而從實測結果來看是不成立的。

這里先來簡單補充介紹一下內存順序模型的概念，現代 CPU 為了提高執行效率，在指令的執行順序上擁有很大的自主權，對每個獨立的 CPU 來說，只要確保語義不變，實際如何執行都有可能，這種方式對于單個 CPU 來說沒有問題，當放到多個 CPU 共享數據的時候，這種亂序執行的行為就會引發每個 CPU 看到數據的順序不一致問題，導致跨 CPU 的程序邏輯亂套了。這就需要對讀、寫內存指令進行約束，來規范每個 CPU 看到的內存生效行為，由此提出了內存順序模型的概念：

其中 ARM 采用的是一種弱內存模型，這種模型默認對讀、寫指令沒有任何約束，需要由程序員自己通過插入 barrier 來手動保證。

再回到這個問題上，測試方式是在 ldr offset 指令后額外加了檢測指令：

就是檢查 offset 值是否為 0，如果為 0 則直接強制 crash（設計上保證了 java 對象的任何實例字段的 offset 不可能是 0）。

經過長時間測試，程序果然在這個位置觸發了 crash！這說明上面提到的兩條 ldr 指令不存在依賴關系，或者說這種依賴關系類似 ARMv8 手冊中描述的條件依賴，并不能保證執行順序。ldr offset 指令先于 ldr bcp 執行，使得讀到一個非法的 offset 值 0。更說明了，這才是這個案例的第一案發現場！

找到了問題的根因后，解決方法也就順利出爐了，那就是在兩條 ldr 指令之間插入 barrier 來確保這兩條 ldr 指令不發生亂序。實測證明，這種修復方案非常有效，這類 crash 現象消失。

詳細的修復 patch 見 https://hg.openjdk.java.net/jdk/jdk/rev/b9529fcbbd33 。目前已經 backport 到 jdk8u292、jdk11.0.9、jdk15。

總結

Java 虛擬機（JVM）為了追求性能，大量使用了無鎖編程進行設計，而且這么多年以來 JDK（特別是 JDK8）主要都是面向 X86 平臺開發的，如今才慢慢的開始支持 aarch64 平臺，所以 aarch64 弱內存序問題是我們面臨的一個比較嚴峻的挑戰。

后記

如果遇到相關技術問題（包括不限于畢昇 JDK），可以進入畢昇 JDK 社區查找相關資源（點擊原文進入官網），包括二進制下載、代碼倉庫、使用教學、安裝、學習資料等。畢昇 JDK 社區每雙周周二舉行技術例會，同時有一個技術交流群討論 GCC、LLVM、JDK 和 V8 等相關編譯技術，感興趣的同學可以添加如下微信小助手，回復 Compiler 入群。

責任編輯：haq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

應用

應用

+關注

關注
2

文章
438

瀏覽量
34137
JVM

JVM

+關注

關注
0

文章
157

瀏覽量
12207

原文標題：一個 JVM 解釋器 bug 在 AArch64 平臺導致應用崩潰的問題分析

文章出處：【微信號：wireless-tag，微信公眾號：啟明云端科技】歡迎添加關注！文章轉載請注明出處。

IAR仿真時崩潰了怎么解決？

發現IAR有個BUG，程序中定義一個unsigned char型的變量，如果在代碼中給變量賦某些值（比如0xEC,0xE0），在IAR仿真環境下查看該變量時會導致IAR奔潰退出。不查看該值就不會崩潰；如果賦的值是0x13或者其他

發表于 04-22 07:57

什么是電壓崩潰？產生電壓崩潰的原因

探討電壓崩潰的原因以及可能的解決方案。第一部分：電壓崩潰的原因 1. 電源故障：電源崩潰是導致電壓崩潰的最常見原因之一。電源可能會由于內部

發表于 12-20 17:05 ?1791次閱讀

eclipse設置jvm內存大小

內存大小，并對其背后的原理進行解釋。 JVM（Java虛擬機）是Java程序的運行環境，它負責將Java字節碼翻譯成機器碼，以便在不同的平臺上執行。JVM使用內存來存儲運行時對象和執行過程中的臨時數據。如果

發表于 12-06 11:43 ?1818次閱讀

weblogic設置jvm內存大小

WebLogic是一種Java EE應用服務器，用于構建和部署企業級Java應用程序。在配置WebLogic服務器時，設置JVM的內存大小非常重要，這可以提高應用程序的性能和可靠性。本文將詳細介紹

發表于 12-05 14:44 ?2972次閱讀

jvm和jmm的區別

JVM（Java Virtual Machine）和JMM（Java Memory Model）是 Java 開發者非常熟悉的概念。JVM 是 Java 程序的運行環境，而 JMM 則定義了多線程

發表于 12-05 14:27 ?1291次閱讀

jvm配置的mx

JVM配置中的mx參數主要用于設置JVM的最大堆內存大小。本文將詳細介紹mx參數的作用、配置方法以及如何選擇合適的值。一、mx參數的作用在JVM中，堆內存用于存放對象實例以及相關數據。mx參數

發表于 12-05 14:24 ?676次閱讀

jvm配置堆內存初始值參數

JVM（Java Virtual Machine）是Java語言的運行環境，它通過解釋字節碼并執行相應的指令來運行Java程序。在JVM中，堆（Heap）是用于存儲對象實例的內存區域。而在Java

發表于 12-05 14:17 ?738次閱讀

jvm運行時內存區域劃分

的內存區域劃分對于了解Java程序的內存使用非常重要，本文將詳細介紹JVM運行時的內存區域劃分。 JVM運行時內存區域主要劃分為以下幾個部分：程序計數器（Program Counter

發表于 12-05 14:08 ?504次閱讀

jvm哪些區域會發生oom

of Memory，OOM），本文將詳細介紹 JVM 內容可能發生 OOM 的區域。OOM 是指應用程序在申請分配內存時，沒有足夠的內存供其使用，導致程序無法正常執行。堆（Heap）區域：堆是 JVM 中最大的一塊內存區域

發表于 12-05 11:51 ?1358次閱讀

jvm參數的設置和jvm調優

JVM（Java虛擬機）參數的設置和調優對于提高Java應用程序的性能和穩定性非常重要。在本文中，我們將詳細介紹JVM參數的設置和調優方法。一、JVM參數的設置內存參數： -Xms：設置J

發表于 12-05 11:36 ?1421次閱讀

jvm調優參數

JVM（Java虛擬機）是Java程序的運行環境，它負責解釋Java字節碼并執行相應的指令。為了提高應用程序的性能和穩定性，我們可以調優JVM的參數。 JVM調優主要涉及到堆內存、垃圾

發表于 12-05 11:29 ?598次閱讀

什么場景需要jvm調優

，如果JVM的性能不夠優越，可能會導致應用程序的性能下降甚至崩潰。此時需要對JVM進行調優，以提高應用程序的并發處理能力。例如，調整線程池的大小、調整垃圾收集

發表于 12-05 11:14 ?1376次閱讀

jvm內存模型和內存結構

內存模型是指Java程序在運行時，JVM對內存空間的組織和管理方式。它包括了線程私有的部分和線程共享的部分。線程私有部分線程私有部分主要包含了棧（Stack）和程序計數器（Program Counter Register）。棧是每個線程獨立擁有的，用于存儲方法的局部

發表于 12-05 11:08 ?893次閱讀

jvm內存溢出該如何定位解決

在Java應用程序中，JVM（Java虛擬機）內存溢出是指Java應用程序試圖分配的內存超過了JVM所允許的最大內存大小，導致程序無法正常執行。內存溢出通常是由以下幾個原因引起的：內存泄漏、對象大小

發表于 12-05 11:05 ?1292次閱讀

jvm的dump太大了怎么分析

分析大型JVM dump文件可能會遇到的一些挑戰。首先，JVM dump文件通常非常大，可能幾百MB或幾個GB。這是因為它們包含了JVM的完整內存快照，包括堆和棧的所有對象和線程信息。分析這種大型

發表于 12-05 11:01 ?2459次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

如何解決JVM解釋器導致應用崩潰的bug

評論

IAR仿真時崩潰了怎么解決？

什么是電壓崩潰？產生電壓崩潰的原因

eclipse設置jvm內存大小

weblogic設置jvm內存大小

jvm和jmm的區別

jvm配置的mx

jvm配置堆內存初始值參數

jvm運行時內存區域劃分

jvm哪些區域會發生oom

jvm參數的設置和jvm調優

jvm調優參數

什么場景需要jvm調優

jvm內存模型和內存結構

jvm內存溢出該如何定位解決

jvm的dump太大了怎么分析