本文將研究 CPU 緩存設(shè)計的原則,包括局部性、邏輯組織和啟發(fā)式管理。
1980 年代 CPU 性能有了顯著提高,盡管這受到板載內(nèi)存訪問速度增長緩慢的阻礙。隨著這種差異的加劇,工程師們發(fā)現(xiàn)了一種通過新的設(shè)計技術(shù)——緩存來緩解這個問題的方法。
本文將幫助您了解更多關(guān)于緩存是什么、它是如何工作的以及如何設(shè)計 CPU 緩存的信息。
什么是 CPU 硬件緩存?
CPU 硬件緩存是一個較小的內(nèi)存,位于更靠近處理器的位置,用于存儲最近引用的數(shù)據(jù)或指令,以便在需要時可以快速檢索它們。通過減少訪問速度較慢的主內(nèi)存的代價高昂的讀取和寫入,緩存對 CPU 的性能產(chǎn)生了巨大的影響。幾乎所有現(xiàn)代處理器都采用某種形式的緩存。
第一個緩存在芯片外或外部。這些很快被通常由 SRAM 制成的片上高速緩存存儲器所取代。為了進(jìn)一步提高性能,這些片上緩存被分成指令和數(shù)據(jù)分區(qū)。
圖 1 顯示了一個分區(qū)示例。
圖 1. Intel 80486 使用通用高速緩存,而其后繼 Pentium P5 具有分區(qū)高速緩存(總線寬度已省略)
高速緩存分區(qū)導(dǎo)致了多級高速緩存層次結(jié)構(gòu)的誕生,其中處理器內(nèi)核將擁有自己的小型私有高速緩存 (L1),位于較大的共享高速緩存 (L2) 之上,一些處理器包括第三級高速緩存 (L3) 和偶爾是第四個(L4)。
局部性(又名緩存如何工作?)
為什么緩存有效?緩存通過引用的局部性原則工作。引用位置是指處理器在運行應(yīng)用程序時訪問相同內(nèi)存位置的趨勢。因為這些內(nèi)存訪問是可預(yù)測的,所以可以通過緩存來利用它們。
局部性通常分為兩個子集——時間局部性和空間局部性——有時還有第三個子集,稱為算法局部性。
時間局部性
時間局部性是指在短時間內(nèi)重復(fù)使用特定數(shù)據(jù)項。這依賴于這樣一個事實,即在處理器上運行的程序傾向于在短時間內(nèi)使用相同的變量和數(shù)據(jù)結(jié)構(gòu)。在從主內(nèi)存中獲取一個項目并將其存儲在緩存中之后,對該數(shù)據(jù)的任何后續(xù)調(diào)用都可以更快地完成。
空間局部性
空間局部性是指將很快需要的數(shù)據(jù)項駐留在現(xiàn)在需要的項附近或相鄰的內(nèi)存位置中的趨勢。這可能是程序員或編譯器對內(nèi)存中的項目進(jìn)行聚類的結(jié)果。
例如,使用數(shù)組(一種數(shù)據(jù)結(jié)構(gòu))的應(yīng)用程序會將數(shù)組的元素存儲在相鄰的內(nèi)存位置。通過緩存當(dāng)前正在使用的數(shù)據(jù)項旁邊的數(shù)據(jù)項,處理器可以在必要時快速訪問那些相鄰的項。
算法局部性
一種較少討論的局部性類型是算法局部性。算法局部性是應(yīng)用程序?qū)ο嚓P(guān)數(shù)據(jù)項執(zhí)行操作的趨勢,盡管不是在任何短時間內(nèi),并且盡管這些項目在內(nèi)存中并不彼此靠近。
使用鏈表(另一種類型的數(shù)據(jù)結(jié)構(gòu))的應(yīng)用程序可能會出現(xiàn)這種行為。這種類型的局部性可能出現(xiàn)在圖形處理或迭代模擬中。
邏輯緩存組織
緩存存儲和檢索數(shù)據(jù)的方式和位置取決于緩存的組織方式。這稱為緩存的邏輯組織。確定存儲的內(nèi)容由緩存中內(nèi)置的管理啟發(fā)式方法控制,但它也受到邏輯組織的嚴(yán)重影響。因此,緩存的布局方式對其性能起著重要作用。
有三種主要的方式來組織緩存:
完全關(guān)聯(lián)
直接映射
設(shè)置關(guān)聯(lián)
緩存塊
當(dāng) CPU 需要訪問主存中的某個項目時,它會使用一個地址來定位該項目。CPU 硬件緩存通常透明地工作,這意味著程序員無需以任何方式確認(rèn)緩存。因此,用于訪問內(nèi)存的地址首先由緩存處理。該地址用于識別數(shù)據(jù)項是否位于緩存中。
術(shù)語“緩存命中”表示在緩存中找到了數(shù)據(jù)項,“緩存未命中”表示未在緩存中找到。
緩存被組織成稱為緩存塊的數(shù)據(jù)組。每個地址都被劃分為多個位域,以便可以識別正確的高速緩存塊。這些字段是緩存標(biāo)記、集合編號和字節(jié)偏移量。圖 2 顯示了一個地址拆分為緩存可以解釋的字段。
圖 2. 尋址緩存塊
當(dāng)給 CPU 緩存一個地址時,它會將這個地址分成必要的字段并開始檢查它的緩存條目。一個緩存條目由一個緩存標(biāo)簽(這里是標(biāo)簽標(biāo)簽)和一個緩存塊(標(biāo)簽數(shù)據(jù))組成。
緩存標(biāo)簽是一個標(biāo)識符,它表示正在引用哪個緩存塊。
緩存塊是存儲在該標(biāo)簽上的實際數(shù)據(jù),代表主內(nèi)存中的一個項目塊。為了獲取該塊中的單個單詞,使用了偏移量。
直接映射
在直接映射緩存中,緩存條目被組織成多個集合。地址中的集合編號用于索引每組條目。一旦識別出該集合,就比較緩存標(biāo)簽。如果它們匹配,則這是緩存命中并輸出指定的數(shù)據(jù)。
理解直接映射緩存的關(guān)鍵是每個集合只有一個緩存條目。這使得直接映射緩存非???,同時消耗最少的功率。
圖 3。直接映射緩存
由于每組只能包含一個條目,因此直接映射緩存確實具有更高的爭用率,這意味著多個數(shù)據(jù)項將希望存儲在同一位置。這會導(dǎo)致緩存未命中。解決此問題的一種方法是使用完全關(guān)聯(lián)的緩存。
完全關(guān)聯(lián)
全關(guān)聯(lián)緩存與直接映射緩存相反。與包含單個條目的多個集合不同,完全關(guān)聯(lián)緩存具有多個緩存條目,它們都包含在一個集合中。因此,集合編號不再提供任何信息并且不被使用。相反,當(dāng)緩存處理內(nèi)存地址時,會檢查每個緩存條目是否有匹配的標(biāo)記。如果找到,則使用字節(jié)偏移量輸出緩存塊內(nèi)的正確數(shù)據(jù)。
檢查每個緩存條目使得完全關(guān)聯(lián)緩存比直接映射緩存消耗更多的功率。通過使用一組關(guān)聯(lián)高速緩存來在功耗和更高的爭用率之間找到平衡點。
圖 4. 全關(guān)聯(lián)緩存
設(shè)置關(guān)聯(lián)
一組關(guān)聯(lián)緩存提供了兩全其美的優(yōu)勢。它由多個集合組成,每個集合具有多個緩存條目。它是如何工作的?首先,集合編號允許緩存跳轉(zhuǎn)到適當(dāng)?shù)臈l目集合。接下來,在每組條目中搜索匹配的標(biāo)簽。如果找到,則使用字節(jié)偏移量輸出請求的數(shù)據(jù)。這種方法允許緩存提供功耗和爭用率的優(yōu)化平衡。
圖 5 顯示了一個 4 路組關(guān)聯(lián)緩存。之所以稱為 4-way,是因為每組最多可以包含四個緩存條目。如果每個集合只能保存兩個緩存條目,那么它將是 2-way。因此,直接映射緩存實際上只是一個單路組關(guān)聯(lián)緩存,而完全關(guān)聯(lián)緩存是一個單組多路組關(guān)聯(lián)緩存,其中 m 是緩存條目的數(shù)量。
圖 5. 設(shè)置關(guān)聯(lián)緩存
管理啟發(fā)式
一旦確定了緩存的邏輯組織,就需要確定一組管理啟發(fā)式方法。啟發(fā)式管理只是一組確定緩存如何執(zhí)行其職責(zé)的規(guī)則。這些通常在位于緩存上方的緩存控制器中實現(xiàn),并充當(dāng)它與 CPU 之間的接口。緩存管理啟發(fā)式可以分為兩個不同的類別:內(nèi)容管理和一致性管理。
內(nèi)容管理
內(nèi)容管理啟發(fā)式正是它們聽起來的樣子。它們是一組規(guī)則,用于確定緩存的時間和內(nèi)容。這些啟發(fā)式方法識別已從內(nèi)存請求的重要項目,并將這些項目復(fù)制到緩存中。內(nèi)容啟發(fā)式的兩個示例是預(yù)取被認(rèn)為重要或即將使用的數(shù)據(jù)項,以及決定在緩存集已滿或接近容量時替換哪些項目的替換策略。
一致性管理
一致性管理啟發(fā)式方法都是關(guān)于保持緩存與其他內(nèi)存同步。這可能意味著主內(nèi)存、層次結(jié)構(gòu)中的其他緩存級別,甚至緩存本身。例如,緩存不應(yīng)該在其緩存塊中包含相同數(shù)據(jù)的多個副本。此外,如果高速緩存和主存儲器具有應(yīng)該是相同數(shù)據(jù)的不同副本,則應(yīng)用程序可能會收到過時或陳舊的數(shù)據(jù)項。這在多核系統(tǒng)中尤其可能。因此,一致性管理啟發(fā)式可能會定期使用更新版本的緩存數(shù)據(jù)更新主內(nèi)存。
CPU 硬件緩存基礎(chǔ)知識回顧
本文介紹了 CPU 硬件緩存的一些基本原理。CPU 緩存的工作原理是參考局部性,即處理器傾向于在短時間內(nèi)或在相鄰的內(nèi)存位置對內(nèi)存進(jìn)行可預(yù)測的讀取和寫入。討論的其他設(shè)計原則是如何在邏輯上組織緩存以及需要定義以管理該緩存的規(guī)則。幾乎所有 CPU 中都可以找到緩存,并且緩存設(shè)計技術(shù)已擴(kuò)展到軟件緩存和基于 Web 的緩存,用于存儲瀏覽器數(shù)據(jù)或 Web 文檔。我希望這篇文章能幫助您更好地理解和欣賞這項重要的技術(shù)。
-
cpu
+關(guān)注
關(guān)注
68文章
10825瀏覽量
211155 -
緩存
+關(guān)注
關(guān)注
1文章
233瀏覽量
26649
發(fā)布評論請先 登錄
相關(guān)推薦
評論