欧美激情视频一区二区三区免费|欧美日韩国产蜜桃传媒|一本一本久久a久久精品综合|亚洲欧美日韩在线一区国产

提高指令緩存命中率

前面說的是數據緩存，現在看看指令緩存命中率該如何提高。

有一個數組array，數組元素內容為0-255之間的隨機數：

int array[N];
for (i = 0; i < TESTN; i++) 
 array[i] = rand() % 256;

現在，要把數組中數字小于128的元素置為0，并且對數組排序。

大家應該都能想到，有兩種方法：

先遍歷數組，把小于128的元素置為0，然 后排序 。
先對數組排序 ， 再遍歷數組 ，把小于128的元素置為0。

for(i = 0; i < N; i++) {
 if (array [i] < 128) 
  array[i] = 0;
}
sort(array, array +N);

先排序后遍歷的速度會比較快，為什么？

因為在for循環中會執行很多次if分支判斷語句，而CPU擁有分支預測器。

如果分支預測器可以預測接下來要執行的分支（執行if還是執行else），那么就可以提前把這些指令放到緩存中，CPU執行的時候就會很快了。

如果一個數組的內容完全隨機的話，那么分支預測器就很難進行正確的預測。但如果數組內容是有序的，它就會根據歷史命中數據的情況對未來進行預測，那命中率就會很高，所以先排序后遍歷的速度會比較快。

怎么驗證指令緩存命中率的情況呢？

在Linux下，可以使用Perf性能分析工具進行驗證。通過-e選項，指定branch-loads和branch-loads-misses事件，可以分別統計出分支預測成功的次數和 分支預測失敗的次數 ，通過L1-icache-load-misses事件也能統計一級緩存中指令未命中的次數。但是，這些性能事件都屬于硬件事件，perf工具能否統計這些事件取決于CPU是否支持以及芯片原廠是否去實現了該接口，我看很多都是不支持或者沒實現的。

另外，在Linux內核中，可以看到大量的likely和unlikely宏，并且它們都出現if語句中，這 兩個宏的作用就是為了提高性能 。

這是顯示預測概率的宏，如果你覺得CPU的分支預測不準，但if中條件為"真"的概率很高，那么你就可以使用likely()括起來，以此提升性能。

#define likely(x) __builtin_expect(!!(x), 1)
#define unlikely(x) __builtin_expect(!!(x), 0)
if (likely(a == 1)) …

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

Linux

Linux

+關注

關注
87

文章
11123

瀏覽量
207919
指令

指令

+關注

關注
1

文章
598

瀏覽量
35507
緩存

緩存

+關注

關注
1

文章
223

瀏覽量
26580
數組

數組

+關注

關注
1

文章
411

瀏覽量
25822

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

Linux中提高指令緩存命中率

提高指令緩存命中率

評論

CPU一級緩存與二級緩存深度分析

AM335x SDK關于cache的命中率，請問有能改善cache命中率的有效方法嗎？請問怎么才能控制RAM映射到cache？

緩存命中率低的原因是什么？

緩存的作用和設計模式

架構設計應用級緩存回收策略

一種高能效的結構不對稱指令緩存

基于節點中心性度量的緩存機制

基于概率存儲的啟發式住處中心網絡內容緩存方法

Web代理服務器緩存優化

基于節點熱度與緩存替換率的ICN協作緩存

Linux文件緩存使用情況和命中率查看的工具詳細概述

一種基于內容優先級的緩存替換策略PFC

把進程綁定到某個 CPU 上運行是怎么實現？

一個GPU工作負載的調查

CPU緩存那些事兒