編者按:目前許多公司同時使用 x86 和 AArch64 2 種主流的服務器。這兩種環境的算力相當,內存相同的情況下:相同版本的 JVM 和 Java 應用,相同的 JVM 參數,應用性能在不同的平臺中表現相差 30%,x86 遠好于 AArch64 平臺。本文分析了一個應用在 AArch64 平臺上性能下降的例子,發現 JVM 的 CodeCache 大小是引起這個性能問題的根源,進而研究什么導致了不同平臺上 CodeCache 大小的不同。最后筆者給出了不同平臺中該如何設置參數規避該問題。希望本文能給讀者一些啟示:當使用不同的硬件平臺時需要關注底層硬件對于上層應用的影響。
業務在 x86 和 AArch64 上同時部署時(相同的 JDK 和 Java 應用版本),發現 AArch64 平臺性能下降嚴重問題。進一步查看日志,發現在 AArch64 平臺中偶有如下情況:
這代表 JVM 中的 CodeCache 滿了,導致編譯停止,未編譯的方法只能解釋執行,進而嚴重影響應用性能。那什么是 CodeCache?
CodeCache 是什么
簡單來說,CodeCache 用于存放編譯后的方法,主要分為三部分:
Non-nmethods:包括運行時 Stub,Adapter 等;
Profiled nmethod:包括會采集信息的方法,即分層編譯中第 2、3 層的方法;
Non-Profiled nmethods:包括不采集信息的方法,即分層編譯中第 1、4 層的方法,也包括 JNI 的方法。
注:分層編譯指的是 JVM 同時存在 C1 和 C2 兩種編譯器,C1 做一些簡單的編譯優化,耗時較短,C2 做更多復雜的編譯優化,性能較好,編譯耗時較多。分層編譯的觸發在 JVM 內會根據相應的條件進行觸發,關于更多分層編譯相關知識可以參考相關資料 [1]。
在 JDK 9 之后 [2],這些會分配到不同的區域(使用不同區域的優點:查找、回收等),JDK 8 中會分配到同一塊區域。
JVM 平時會清理一些不可達的方法,例如由于退優化等產生的死方法,另外 UseCodeCacheFlushing 選項(默認開啟),還會清理較老以及執行較少的方法。一旦 CodeCache 滿了之后,會停止編譯,直到 CodeCache 有空間,若關閉了 UseCodeCacheFlushing 選項,則會直接永久停止編譯。
不同的 JVM 版本以及不同的參數,默認的 CodeCache 大小不同。JDK 11 中默認參數下 CodeCache 大小為 240M,若想獲取(確認)默認情況下的 CodeCache 大小,建議使用 - XX:+PrintFlagsFinal 選項獲取 ReservedCodeCache 的大小。
CodeCache 大小主要通過以下選項調節:
InitialCodeCacheSize | 初始的 CodeCache 大?。▎挝蛔止潱?/td> |
ReservedCodeCacheSize | 預留的 CodeCache 大小,即最大CodeCache 大小(單位字節) |
CodeCacheExpansionSize | CodeCache 每次擴展大小(單位字節) |
Option | Description |
---|
使用–XX:+PrintCodeCache 選項可以打印應用使用的 CodeCache 情況,如下:
其中 max_used 表示應用中使用到的 CodeCache 大小,據此可以設置合適的 ReservedCodeCacheSize 值。
AArch64 vs x86_64
我們都知道 AArch64 和 x86 分別為 RISC 和 CISC 架構,因此代碼密度方面存在一定差異,在這篇文章 [3] 中比較了不同指令集下手寫匯編的大小,可以看到 AArch64 的代碼密度是 RISC 架構中較優的,但相比 x86_64 仍稍差些(其中 RISC 最差,m68k 最好)。
另外筆者選用業界通用的 java 測試套 dacapo[4] 比較 AArch64 和 x86_64 下 CodeCache 占用的大小。
可以看到,在 AArch64 架構下,CodeCache 均比 x86_64 要大,但根據不同場景,大小差距不同,在 5%-20% 之間。因此在我們發現相同應用在 x86 和 AArch64 上時,CodeCache 大小需要進行相應的調節。
除此之外,還需要注意 InlineSmallCode 選項,JVM 只會 inline 代碼體積比該值小的方法。JVM 通過 inline 可以觸發更多的優化,因此 inline 對于性能提升也很重要。在 JDK 11 中,InlineSmallCode 在 x86 下的默認值為 2000 字節,在 AArch64 下的默認值為 2500 字節。而 JDK 8 中,InlineSmallCode 在 x86 和 AArch64 下默認值均為 2000 字節。因此建議遷移時也相應修改 InlineSmallCode 的值。業務通過對 CodeCache 相關參數的調整,達到助力 JIT 的最佳編譯效果。
后記
如果遇到相關技術問題(包括不限于畢昇 JDK),可以進入畢昇 JDK 社區查找相關資源(點擊原文進入官網),包括二進制下載、代碼倉庫、使用教學、安裝、學習資料等。畢昇 JDK 社區每雙周周二舉行技術例會,同時有一個技術交流群討論 GCC、LLVM、JDK 和 V8 等相關編譯技術,感興趣的同學可以添加如下微信小助手,回復 Compiler 入群。
責任編輯:haq
-
服務器
+關注
關注
12文章
9021瀏覽量
85183 -
JAVA
+關注
關注
19文章
2958瀏覽量
104546 -
JVM
+關注
關注
0文章
157瀏覽量
12207
原文標題:相同版本 JVM 和 Java 應用,在 x86 和AArch64 平臺性能相差30%,何故?
文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論