日本理论片在线观看_久久成年免费电影_99国产精品永久免费视频_国产成人精品无码一区二区三区_日本理论午夜中文字幕第一页_亚洲手机在线看片av_性色av一二三天美传媒_男女做爰猛烈叫床视频免费网站_国产偷录视频叫床高潮

編者按：目前許多公司同時使用 x86 和 AArch64 2 種主流的服務器。這兩種環境的算力相當，內存相同的情況下：相同版本的 JVM 和 Java 應用，相同的 JVM 參數，應用性能在不同的平臺中表現相差 30%，x86 遠好于 AArch64 平臺。本文分析了一個應用在 AArch64 平臺上性能下降的例子，發現 JVM 的 CodeCache 大小是引起這個性能問題的根源，進而研究什么導致了不同平臺上 CodeCache 大小的不同。最后筆者給出了不同平臺中該如何設置參數規避該問題。希望本文能給讀者一些啟示：當使用不同的硬件平臺時需要關注底層硬件對于上層應用的影響。

業務在 x86 和 AArch64 上同時部署時（相同的 JDK 和 Java 應用版本），發現 AArch64 平臺性能下降嚴重問題。進一步查看日志，發現在 AArch64 平臺中偶有如下情況：

這代表 JVM 中的 CodeCache 滿了，導致編譯停止，未編譯的方法只能解釋執行，進而嚴重影響應用性能。那什么是 CodeCache？

CodeCache 是什么

簡單來說，CodeCache 用于存放編譯后的方法，主要分為三部分：

Non-nmethods：包括運行時 Stub，Adapter 等；

Profiled nmethod：包括會采集信息的方法，即分層編譯中第 2、3 層的方法；

Non-Profiled nmethods：包括不采集信息的方法，即分層編譯中第 1、4 層的方法，也包括 JNI 的方法。

注：分層編譯指的是 JVM 同時存在 C1 和 C2 兩種編譯器，C1 做一些簡單的編譯優化，耗時較短，C2 做更多復雜的編譯優化，性能較好，編譯耗時較多。分層編譯的觸發在 JVM 內會根據相應的條件進行觸發，關于更多分層編譯相關知識可以參考相關資料 [1]。

在 JDK 9 之后 [2]，這些會分配到不同的區域（使用不同區域的優點：查找、回收等），JDK 8 中會分配到同一塊區域。

JVM 平時會清理一些不可達的方法，例如由于退優化等產生的死方法，另外 UseCodeCacheFlushing 選項（默認開啟），還會清理較老以及執行較少的方法。一旦 CodeCache 滿了之后，會停止編譯，直到 CodeCache 有空間，若關閉了 UseCodeCacheFlushing 選項，則會直接永久停止編譯。

不同的 JVM 版本以及不同的參數，默認的 CodeCache 大小不同。JDK 11 中默認參數下 CodeCache 大小為 240M，若想獲取（確認）默認情況下的 CodeCache 大小，建議使用 - XX:+PrintFlagsFinal 選項獲取 ReservedCodeCache 的大小。

CodeCache 大小主要通過以下選項調節：

Option	Description
InitialCodeCacheSize	初始的 CodeCache 大?。▎挝蛔止潱?/td>
ReservedCodeCacheSize	預留的 CodeCache 大小，即最大CodeCache 大小（單位字節）
CodeCacheExpansionSize	CodeCache 每次擴展大小（單位字節）

使用–XX:+PrintCodeCache 選項可以打印應用使用的 CodeCache 情況，如下：

其中 max_used 表示應用中使用到的 CodeCache 大小，據此可以設置合適的 ReservedCodeCacheSize 值。

AArch64 vs x86_64

我們都知道 AArch64 和 x86 分別為 RISC 和 CISC 架構，因此代碼密度方面存在一定差異，在這篇文章 [3] 中比較了不同指令集下手寫匯編的大小，可以看到 AArch64 的代碼密度是 RISC 架構中較優的，但相比 x86_64 仍稍差些（其中 RISC 最差，m68k 最好）。

另外筆者選用業界通用的 java 測試套 dacapo[4] 比較 AArch64 和 x86_64 下 CodeCache 占用的大小。

可以看到，在 AArch64 架構下，CodeCache 均比 x86_64 要大，但根據不同場景，大小差距不同，在 5%-20% 之間。因此在我們發現相同應用在 x86 和 AArch64 上時，CodeCache 大小需要進行相應的調節。

除此之外，還需要注意 InlineSmallCode 選項，JVM 只會 inline 代碼體積比該值小的方法。JVM 通過 inline 可以觸發更多的優化，因此 inline 對于性能提升也很重要。在 JDK 11 中，InlineSmallCode 在 x86 下的默認值為 2000 字節，在 AArch64 下的默認值為 2500 字節。而 JDK 8 中，InlineSmallCode 在 x86 和 AArch64 下默認值均為 2000 字節。因此建議遷移時也相應修改 InlineSmallCode 的值。業務通過對 CodeCache 相關參數的調整，達到助力 JIT 的最佳編譯效果。

后記

如果遇到相關技術問題（包括不限于畢昇 JDK），可以進入畢昇 JDK 社區查找相關資源（點擊原文進入官網），包括二進制下載、代碼倉庫、使用教學、安裝、學習資料等。畢昇 JDK 社區每雙周周二舉行技術例會，同時有一個技術交流群討論 GCC、LLVM、JDK 和 V8 等相關編譯技術，感興趣的同學可以添加如下微信小助手，回復 Compiler 入群。

責任編輯：haq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

服務器

服務器

+關注

關注
12

文章
9021

瀏覽量
85183
JAVA

JAVA

+關注

關注
19

文章
2958

瀏覽量
104546
JVM

JVM

+關注

關注
0

文章
157

瀏覽量
12207

原文標題：相同版本 JVM 和 Java 應用，在 x86 和AArch64 平臺性能相差30%，何故？

文章出處：【微信號：LinuxDev，微信公眾號：Linux閱碼場】歡迎添加關注！文章轉載請注明出處。

在基于TMS320C64x的DSP平臺上運行TMS320C64x編解碼器

電子發燒友網站提供《在基于TMS320C64x的DSP平臺上運行TMS320C64x編解碼器.pdf》資料免費下載

發表于 10-14 11:16 ?0次下載

<b class='flag-5'>在</b>基于TMS320C<b class='flag-5'>64</b>x的DSP<b class='flag-5'>平臺上</b>運行TMS320C<b class='flag-5'>64</b>x編解碼器

【飛凌嵌入式OK3576-C開發板體驗】RKNN神經網絡-YOLO目標檢測

使用yolov5s_relu.rknn 五、RKNN C Demo程序 5.1、板端linux系統以 Linux 系統（aarch64 架構）的 RK356x 平臺為例，需要使用 rknn_model_zoo 目錄

發表于 10-10 09:33

請問TLV320ADC6140在NXP的iMX6UL平臺上如何配置route？

我正在嘗試在NXP的iMX6UL平臺上，在Linux 4.1.15版本上，使用TLV320ADC6140作為音頻的codec輸入。此外，我同時使用了兩個TLV320ADC6140做

發表于 09-30 06:09

STM32平臺新選擇：Nand Flash（貼片TF卡）的應用解析

MK米客方德SD NAND的高性能和高可靠性，使其成為STM32平臺上理想的存儲解決方案。它的廣泛應用不僅提升了嵌入式系統的性能，也為未來的技術創新和應用拓展提供了堅實的基礎。

發表于 09-18 11:04 ?648次閱讀

STM32<b class='flag-5'>平臺</b>新選擇：Nand Flash（貼片TF卡）的應用解析

MK米客方德SD NAND：STM32平臺上的存儲方案

在STM32平臺上，SD卡的重要性不言而喻，它為嵌入式系統提供了必要的數據存儲和讀寫能力。MK米客方德SD作為市場上的一種選擇，因其耐用性、較小的體積以及高速的傳輸性能，在STM32

發表于 08-26 10:23 ?610次閱讀

MK米客方德SD NAND：STM32<b class='flag-5'>平臺上</b>的存儲方案

第四章：在 PC 交叉編譯 aarch64 的 tensorflow 開發環境并測試

本文介紹了在 PC 端交叉編譯 aarch64 平臺的 tensorflow 庫而非 tensorflow lite 的心酸過程。

發表于 08-25 11:38 ?821次閱讀

第四章：<b class='flag-5'>在</b> PC 交叉編譯 <b class='flag-5'>aarch64</b> 的 tensorflow 開發環境并測試

飛凌OK-全志T527開發板nbench性能測試

和一臺運行Linux的AMD K6-233電腦比較，得到的比值作為性能指數。由于是完全開源的，愛好者可以在各種平臺和操作系統上運行Nbenc

發表于 08-20 10:25

深度學習算法在嵌入式平臺上的部署

隨著人工智能技術的飛速發展，深度學習算法在各個領域的應用日益廣泛。然而，將深度學習算法部署到資源受限的嵌入式平臺上，仍然是一個具有挑戰性的任務。本文將從嵌入式平臺的特點、深度學習算法的優化、部署流程、代碼示例以及面臨的挑戰和未來

發表于 07-15 10:03 ?1178次閱讀

在arduino平臺上開發esp32c3，twai隊列異常的原因？

我在arduino平臺上開發esp32c3。采用了freertos創建了幾個任務。主要有主循環loop和CAN數據讀寫任務。主循環的優先級高于CAN讀寫任務。現在的問題是我在CAN任務執行完畢檢查

發表于 06-11 06:16

用ISD平臺建立工程后，有軟件可以把在ISD平臺上編譯后生成的文件用imontionlink直接燒錄進芯片嗎？

用ISD平臺建立工程后，在ISD平臺上有燒錄程序的入口，有軟件可以把在ISD平臺上編譯后生成的文件用imontionlink直接燒錄進芯片嗎

發表于 05-20 07:44

在Arm Neoverse驅動的基礎設施上構建云軟件的未來

為了向開發者提供一個支持 AArch64 架構的開源項目和獨立軟件開發商 (ISV) 資源庫，我們很高興地推出 Software Ecosystem Dashboard（軟件生態系統可視化工具）。

發表于 05-14 14:06 ?393次閱讀

<b class='flag-5'>在</b>Arm Neoverse驅動的基礎設施<b class='flag-5'>上</b>構建云軟件的未來

能在Meteor Lake平臺上使用SDK 3.5嗎？

SDK 是 3.6 版，不支持 CYPD6127 部件。那么，我能在 Meteor Lake 平臺上使用 SDK 3.5 嗎？ SDK 3.5 - 平臺選擇有"MTL" 關鍵字：

發表于 03-04 06:32

把CY8C4146平臺上工程移植到CY8C4147平臺上，用戶程序沒運行的原因？

客戶現在想把CY8C4146平臺上工程移植到CY8C4147平臺上，在topdesign重新選擇4147，管腳也調整了一下，編譯重新生成底層代碼，creator4.2IDE編譯沒報錯，同時同步更新

發表于 02-21 06:04

探索aarch64架構上使用ftrace的BPF LSM

，aarch64跟x86_64的內核功能有差異。在筆者嘗試定位這些差異時，看到這篇文章，可以讓大家更直觀地了解LSM eBPF在兩種CPU 內核上

發表于 01-25 09:30 ?674次閱讀

中興車用操作系統SafetyLinux在A1000平臺上的適配

近日，黑芝麻智能A1000芯片基礎軟件開發在線研討會在順利完結直播。研討會由黑芝麻智能李坤、中興通訊李玉鵬兩位技術專家主講，主題分別為《視覺感知數據流在A1000平臺上的基礎軟件開發》，以及《中興車用操作系統SafetyLinux在A1000

發表于 12-19 15:51 ?897次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

在AArch64平臺上性能下降的例子

評論