探索推理時KV Cache的動態(tài)內(nèi)存壓縮方法

摘要：Transformers已成為大型語言模型（LLM）的支柱。然而，由于需要在內(nèi)存中存儲過去標(biāo)記的鍵值表示緩存，其大小與輸入序列長度和批量大小成線性比例，因此生成效率仍然很低。作為解決方案，我們提出了動態(tài)內(nèi)存壓縮（DMC），這是一種在推理時在線壓縮鍵值緩存的方法。最重要的是，該模型可以學(xué)習(xí)在不同的頭和層中應(yīng)用不同的壓縮率。我們將預(yù)訓(xùn)練的 LLM（如 Llama 2（7B、13B 和 70B））改裝成 DMC Transformers，在英偉達 H100 GPU 上實現(xiàn)了高達 ~3.7 倍的自動回歸推理吞吐量提升。DMC 通過持續(xù)預(yù)訓(xùn)練應(yīng)用于可忽略不計的原始數(shù)據(jù)百分比，而不添加任何額外參數(shù)。我們發(fā)現(xiàn)，DMC 保持了原有的下游性能，緩存壓縮率高達 4 倍，優(yōu)于向上訓(xùn)練的分組查詢注意（GQA）。GQA 和 DMC 甚至可以結(jié)合使用，以獲得復(fù)合增益。因此，在任何給定的內(nèi)存預(yù)算內(nèi)，DMC 都能適應(yīng)更長的上下文和更大的批次。

Q1: 這篇論文試圖解決什么問題？

A：這篇論文提出了一種名為動態(tài)內(nèi)存壓縮（Dynamic Memory Compression，簡稱DMC）的方法，旨在解決大型語言模型（Large Language Models，簡稱LLMs）在推理（inference）階段的內(nèi)存效率和生成效率問題。具體來說，論文關(guān)注的問題包括：

內(nèi)存消耗：在自回歸生成過程中，Transformer模型需要在內(nèi)存中存儲過去token的鍵值（key-value）表示，這些表示的內(nèi)存消耗與輸入序列長度和批量大小線性相關(guān)，導(dǎo)致內(nèi)存負載隨序列長度增加而迅速增長。

生成效率：由于上述的內(nèi)存消耗問題，使用Transformer模型進行長序列生成（如對話和故事生成）或同時服務(wù)大量用戶查詢時，會變得非常低效，因為內(nèi)存限制了批量大小和序列長度。

現(xiàn)有解決方案的局限性：雖然已有一些方法（如Grouped Query Attention，GQA）通過減少內(nèi)存中的token數(shù)量來提高Transformer模型的內(nèi)存效率，但這些方法往往會犧牲下游任務(wù)的性能。

為了解決這些問題，論文提出了DMC方法，它允許模型在推理時動態(tài)地壓縮鍵值緩存，并且能夠?qū)W習(xí)在不同頭（heads）和層（layers）中應(yīng)用不同的壓縮率。這種方法旨在在不增加額外參數(shù)的前提下，通過少量的繼續(xù)預(yù)訓(xùn)練（continued pre-training）來實現(xiàn)，從而在保持原有下游性能的同時，顯著提高模型的內(nèi)存效率和生成速度。

Q2: 有哪些相關(guān)研究？

A：這篇論文提到了與動態(tài)內(nèi)存壓縮（DMC）相關(guān)的幾個研究領(lǐng)域和具體工作，包括：

Transformer模型和大型語言模型（LLMs）：Transformer作為LLMs的骨干網(wǎng)絡(luò)結(jié)構(gòu)，是當(dāng)前生成式和對話式AI的最新進展。例如，Touvron et al. (2023) 和 Jiang et al. (2023) 等人的工作展示了LLMs在各種任務(wù)上的應(yīng)用。

內(nèi)存效率的Transformer變體：為了提高Transformer在推理階段的內(nèi)存效率，研究者們提出了多種方法，如Grouped Query Attention (GQA)，它通過參數(shù)共享減少鍵值頭的數(shù)量。其他方法包括token合并和token剪枝，但這些方法往往會犧牲性能。

硬件/IO感知和子二次方算法：Dao et al. (2022) 和 Kwon et al. (2023) 等人的研究關(guān)注于如何使注意力機制更加高效，但這些方法并沒有直接減輕鍵值緩存的內(nèi)存負擔(dān)。

動態(tài)壓縮方法：Anagnostidis et al. (2023) 和 Kim & Cho (2020) 等人提出了動態(tài)壓縮方法，這些方法在推理時決定哪些token應(yīng)該從鍵值緩存中丟棄。與DMC不同，這些方法通過丟棄token來減少內(nèi)存消耗，而不是合并它們。

非學(xué)習(xí)型緩存驅(qū)逐策略：Zhang et al. (2023) 和 Sheng et al. (2023) 等人研究了基于啟發(fā)式的緩存驅(qū)逐策略，這些策略不依賴于額外的訓(xùn)練，但缺乏學(xué)習(xí)壓縮機制的能力。

動態(tài)令牌池：Nawrot et al. (2022) 提出了動態(tài)令牌池（Dynamic Token Pooling），這是一種在中間層對token表示進行合并的方法，DMC在這一基礎(chǔ)上進行了改進，將其應(yīng)用于KV緩存，并在訓(xùn)練期間引入了池化決策的連續(xù)放松。

這些相關(guān)研究為DMC的提出提供了背景和對比，DMC通過在保持原有模型性能的同時減少內(nèi)存消耗，為提高大型語言模型的推理效率提供了一種新的解決方案。

Q3: 論文如何解決這個問題？

A：論文提出了一種名為動態(tài)內(nèi)存壓縮（Dynamic Memory Compression，DMC）的方法來解決大型語言模型（LLMs）在推理階段的內(nèi)存效率和生成效率問題。具體解決方案包括以下幾個關(guān)鍵步驟：

在線鍵值緩存壓縮：DMC在自回歸推理過程中動態(tài)地決定是否將當(dāng)前的鍵（key）和值（value）表示追加到緩存中，或者與緩存中的頂部元素進行加權(quán)平均。這種機制允許模型根據(jù)輸入序列的當(dāng)前部分來調(diào)整緩存的大小。

端到端學(xué)習(xí)：DMC通過在繼續(xù)預(yù)訓(xùn)練（continued pre-training）過程中逐漸增加全局壓縮率（global Compression Ratio，CR），讓模型學(xué)習(xí)如何應(yīng)用不同的壓縮策略。這個過程不需要引入額外的參數(shù)。

分段機制：DMC通過一個決策變量（α）來有效地對輸入序列進行分段，每個段落可以獨立地決定是繼續(xù)追加還是進行累積。這允許模型在不同段落之間動態(tài)調(diào)整內(nèi)存使用。

重要性評分：DMC還引入了一個重要性變量（ω），用于在累積操作中計算當(dāng)前token與緩存頂部元素的加權(quán)平均，這樣模型可以學(xué)習(xí)保留更重要的信息。

訓(xùn)練策略：為了訓(xùn)練DMC模型，論文提出了一種隨機重參數(shù)化（stochastic reparametrization）的方法來處理離散的決策變量，以及一種中間壓縮步驟（intermediate compression steps）來處理連續(xù)的α值。此外，還設(shè)計了一個全局一邊損失（global one-sided loss）來激勵模型達到目標(biāo)壓縮率。

實際考慮：為了在不使用填充張量（padded tensors）的情況下實現(xiàn)變長緩存，論文提供了一個基于PyTorch的自定義注意力機制實現(xiàn)，該實現(xiàn)允許不同的頭學(xué)習(xí)不同的壓縮率，同時避免了填充的需要。

通過這些方法，DMC能夠在保持原有LLMs性能的同時顯著提高內(nèi)存效率和推理速度，使得模型能夠適應(yīng)更長的上下文和更大的批量大小，同時減少內(nèi)存消耗。論文通過在不同規(guī)模的Llama 2模型上進行實驗，證明了DMC的有效性。

Q4: 論文做了哪些實驗？

A：論文中進行了一系列實驗來驗證動態(tài)內(nèi)存壓縮（DMC）方法的有效性和效率。以下是實驗的主要內(nèi)容：

基線模型：選擇了不同規(guī)模的Llama 2模型（7B、13B和70B）作為基線模型，并與原始模型進行了比較。

壓縮率（CR）目標(biāo)：針對不同的壓縮率（2×、3×和4×）訓(xùn)練DMC模型，并通過繼續(xù)預(yù)訓(xùn)練（continued pre-training）逐步增加壓縮率。

性能評估：在多個下游任務(wù)上評估DMC模型的性能，包括MMLU（用于事實性）、QA數(shù)據(jù)集（用于常識推理）和HumanEval（用于代碼生成）。

與GQA的比較：將DMC與Grouped Query Attention（GQA）進行比較，GQA是一種廣泛使用的減少KV緩存大小的方法。

樣本效率：比較DMC和GQA在不同壓縮率下的樣本效率，即在達到相同性能時所需的訓(xùn)練步驟數(shù)量。

吞吐量和延遲測量：使用NVIDIA Megatron-LM框架在NVIDIA A100和H100 GPU上測量DMC模型的推理吞吐量和延遲，以評估其在實際硬件上的性能提升。

每層和每頭的壓縮率分析：分析DMC模型在不同層和頭中學(xué)習(xí)到的壓縮率分布，以了解模型如何動態(tài)調(diào)整壓縮策略。

訓(xùn)練策略的消融研究：研究不同的訓(xùn)練策略（如不同的目標(biāo)CR調(diào)度和訓(xùn)練步驟數(shù)）對DMC模型性能的影響。

DMC變體的評估：評估DMC的一個變體（DMC-C），它強制在同一層中的頭保持相似的壓縮率，以減少填充并比較其與標(biāo)準(zhǔn)DMC的性能差異。

這些實驗結(jié)果表明，DMC模型能夠在保持或甚至提高原始模型下游任務(wù)性能的同時，顯著提高推理效率，減少內(nèi)存消耗，并允許更大的批量大小和更長的序列處理。此外，DMC模型還能夠與GQA結(jié)合使用，以獲得更高的壓縮率和進一步的性能提升。

Q5: 有什么可以進一步探索的點？

A：盡管論文提出了一種有效的動態(tài)內(nèi)存壓縮（DMC）方法并進行了廣泛的實驗驗證，但仍有一些潛在的研究方向和可以進一步探索的點：

不同模型架構(gòu)的適用性：研究DMC方法在不同類型的Transformer模型或其他序列處理模型中的應(yīng)用，例如BERT、GPT、T5等。

從頭開始訓(xùn)練的模型：探索在模型預(yù)訓(xùn)練階段直接集成DMC機制的可能性，而不是僅在預(yù)訓(xùn)練模型上進行改造。

更深層次的解釋性分析：對DMC模型學(xué)習(xí)到的壓縮模式進行更深入的分析，以理解模型如何根據(jù)輸入序列的不同特征進行壓縮。

壓縮策略的優(yōu)化：研究是否可以進一步優(yōu)化壓縮策略，以提高內(nèi)存效率和推理速度，同時保持或提高模型性能。

長序列和復(fù)雜任務(wù)的性能：在更長的序列和更復(fù)雜的任務(wù)上評估DMC模型的性能，以測試其在實際應(yīng)用中的有效性。

不同硬件配置下的性能：在不同的硬件配置上測試DMC模型，包括CPU、不同的GPU型號以及其他加速器，以評估其通用性和可擴展性。

實時或在線生成場景：研究DMC在實時或在線生成場景中的應(yīng)用，例如聊天機器人、語音識別和翻譯系統(tǒng)。

環(huán)境影響和能效：評估DMC在減少計算資源消耗和降低環(huán)境影響方面的潛力，特別是在大規(guī)模AI模型訓(xùn)練和部署中。

與其他技術(shù)的結(jié)合：探索將DMC與其他模型壓縮和效率提升技術(shù)（如量化、剪枝、知識蒸餾等）結(jié)合使用的可能性。

開源實現(xiàn)和社區(qū)貢獻：鼓勵開源DMC的實現(xiàn)，并與研究社區(qū)合作，以促進方法的改進和應(yīng)用。

這些潛在的研究方向可以幫助進一步提升DMC方法的性能和實用性，同時為大型語言模型的高效推理提供新的思路。

Q6: 總結(jié)一下論文的主要內(nèi)容？

A：這篇論文的主要內(nèi)容可以總結(jié)如下：

背景: 大型語言模型（LLMs）如Transformer在生成任務(wù)中表現(xiàn)出色，但在推理階段存在內(nèi)存消耗大和生成效率低的問題，因為需要存儲過去token的鍵值（key-value）表示。

問題: 隨著輸入序列長度的增加，鍵值緩存的大小線性增長，導(dǎo)致內(nèi)存消耗和生成延遲增加，限制了模型在長序列生成和高并發(fā)查詢場景中的應(yīng)用。

方法: 提出了動態(tài)內(nèi)存壓縮（DMC），一種在推理時在線壓縮鍵值緩存的方法。DMC允許模型根據(jù)輸入序列動態(tài)決定是追加新的鍵值表示到緩存中，還是與緩存中的頂部元素進行加權(quán)平均。

實現(xiàn): 通過在原有預(yù)訓(xùn)練模型上進行少量的繼續(xù)預(yù)訓(xùn)練，DMC能夠在不增加額外參數(shù)的情況下學(xué)習(xí)不同的壓縮策略，實現(xiàn)高達4倍的緩存壓縮。

實驗: 在不同規(guī)模的Llama 2模型上進行實驗，包括7B、13B和70B版本，評估了DMC在多個下游任務(wù)上的性能，如MMLU、QA數(shù)據(jù)集和HumanEval。

結(jié)果: DMC在保持或提高原始模型性能的同時，顯著提高了推理速度和內(nèi)存效率。與Grouped Query Attention（GQA）相比，DMC展現(xiàn)了更高的性能和樣本效率。

結(jié)論: DMC是一種有效的技術(shù)，可以加速大型語言模型的推理過程，減少內(nèi)存消耗，并允許模型處理更長的上下文和更大的批量大小。此外，DMC的壓縮策略可以與GQA結(jié)合，實現(xiàn)進一步的性能提升。

未來工作: 論文提出了一些潛在的研究方向，包括將DMC應(yīng)用于不同的模型架構(gòu)、在預(yù)訓(xùn)練階段集成DMC、以及在不同硬件配置下測試DMC的性能。

審核編輯：黃飛

閱讀全文

AI(263628) AI(263628)
動態(tài)內(nèi)存(7916) 動態(tài)內(nèi)存(7916)
DMC(19017) DMC(19017)
大模型(810) 大模型(810)

動態(tài)內(nèi)存管理模塊的設(shè)計原理與實現(xiàn)

Fense 通過設(shè)立一個雙向鏈表（struct Head *stHead）來保存所有被分配的動態(tài)內(nèi)存塊的信息。鏈表中的每個節(jié)點對應(yīng)一個動態(tài)內(nèi)存塊，節(jié)點中包括此內(nèi)存大小、分配發(fā)生時所在的源文件名和行號

2020-06-30 08:05:00

2088

linux內(nèi)核主流的內(nèi)存壓縮技術(shù)介紹

zSwap是在memory與flash之間的一層“cache”,當(dāng)內(nèi)存需要swap出去磁盤的時候，先通過壓縮放到zSwap中去，zSwap空間按需增長。

2020-09-18 15:40:00

5434

C語言知識總結(jié):動態(tài)內(nèi)存分配

動態(tài)內(nèi)存分配就是指在程序執(zhí)行的過程中動態(tài)地分配或者回收存儲空間的分配內(nèi)存的方法。動態(tài)內(nèi)存分配不像數(shù)組等靜態(tài)內(nèi)存分配方法那樣需要預(yù)先分配存儲空間，而是由系統(tǒng)根據(jù) 程序的需要即時分配，且分配的大小就是程序要求的大小。

2022-10-24 15:52:05

630

使用C語言實現(xiàn)簡單動態(tài)內(nèi)存分配

首先要明白為何需要動態(tài)內(nèi)存分配，熟悉C語言的讀者應(yīng)該對這個比較熟悉，需要一段內(nèi)存時會使用malloc函數(shù)來申請所需要大小的內(nèi)存，函數(shù)返回一段內(nèi)存的首地址。

2023-07-28 16:26:01

360

C語言程序設(shè)計中動態(tài)內(nèi)存分配如何實現(xiàn)

C語言程序設(shè)計中，動態(tài)內(nèi)存分配如何實現(xiàn)，需要注意哪些問題？

2023-09-28 16:53:41

803

51單片機能實現(xiàn)動態(tài)的內(nèi)存管理嗎？

怎么用51單片機實現(xiàn)動態(tài)內(nèi)存管理

2023-10-15 12:43:05

內(nèi)存分配及Cache優(yōu)化

內(nèi)存分配及Cache優(yōu)化　　與PC機相比，DSP的程序數(shù)據(jù)存儲空間非常有限。因此，對于視頻編碼這種需要處理大量數(shù)據(jù)的程序而言，必須合理安排數(shù)據(jù)和程序的存儲方式，實現(xiàn)對存儲器的優(yōu)化。實驗表明，合理

2011-08-10 14:54:23

內(nèi)存的動態(tài)內(nèi)存分配實現(xiàn)

第27章 STM32H7的TCM，SRAM等五塊內(nèi)存的動態(tài)內(nèi)存分配實現(xiàn)本章教程為大家分享一種DTCM，SRAM1，SRAM2，SRAM3和SRAM4可以獨立管理的動態(tài)內(nèi)存管理方案，在實際項目中有一定的實用價值，比如MP3編解碼，JPEG...

2021-08-03 07:14:25

動態(tài)內(nèi)存分配是什么意思

2021-12-17 08:17:47

動態(tài)內(nèi)存管理是什么？動態(tài)內(nèi)存管理算法有哪幾種

詳細描述動態(tài)內(nèi)存堆接口動態(tài)內(nèi)存管理是一個真實的堆內(nèi)存管理模塊，可以在當(dāng)前資源滿足的情況下，根據(jù)用戶的需求分配任意大小的內(nèi)存塊。而當(dāng)用戶不需要再使用這些內(nèi)存塊時，又可以釋放回堆中供其他應(yīng)用分配

2022-08-29 15:23:12

動態(tài)內(nèi)存管理的原理詳解

C/C++語言與其他語言不同，它需要開發(fā)者自己管理內(nèi)存資源。對于動態(tài)內(nèi)存的使用不當(dāng)容易造成段錯誤或者內(nèi)存泄漏。尤其是內(nèi)存泄漏，內(nèi)存泄漏往往是在程序運行一段時間才會被發(fā)現(xiàn)，使得開發(fā)人員無法第一時間定位

2020-11-02 09:25:31

動態(tài)內(nèi)存管理該怎樣去移植呢

動態(tài)內(nèi)存管理該怎樣去移植呢？如何去使用動態(tài)內(nèi)存呢？

2021-10-09 06:04:16

壓縮模型會加速推理嗎？

位壓縮和“無”配置下都運行了 115 毫秒，盡管精度有所下降。我認為將 float 網(wǎng)絡(luò)參數(shù)壓縮為 uint8_t 不僅可以節(jié)省內(nèi)存，還可以加快推理速度。那么，壓縮模型是否應(yīng)該加速推理？

2023-01-29 06:24:08

CC2541 osal_mem_alloc和malloc申請動態(tài)內(nèi)存

我用CC2541單片機這樣申請和釋放動態(tài)內(nèi)存是正確的嗎？int *flag = (int *)osal_mem_alloc(sizeof(int)* max);osal_mem_free(flag

2022-05-29 17:33:06

DMA開辟緩存怎么使用動態(tài)內(nèi)存？

開辟20kb左右的緩存空間，如果直接用全局變量數(shù)組，在不需要用到DMA時，那這20k的內(nèi)存就一直不能釋放，好浪費。若使用malloc來開辟動態(tài)內(nèi)存，應(yīng)該是放在堆區(qū)吧？堆區(qū)不是默認只有512字節(jié)？還要修改啟動文件的堆大小？

2023-10-23 06:53:54

DMA開辟緩存，怎么使用動態(tài)內(nèi)存？

2018-04-20 14:30:30

ESP-IDF內(nèi)核中的內(nèi)存管理如何驗證？

包括靜態(tài)內(nèi)存、動態(tài)內(nèi)存的所有接口的驗證

2023-02-16 07:03:15

FreeRTOS內(nèi)存管理例子中，用了malloc和heap4兩套動態(tài)內(nèi)存管理，是否可以統(tǒng)一？

看到原子的FreeRTOS內(nèi)存管理例子中，用了malloc和heap4兩套動態(tài)內(nèi)存管理，是否可以統(tǒng)一？有什么好處？

2020-08-03 22:51:27

Keil C動態(tài)內(nèi)存管理機制分析及改進，不看肯定后悔

2021-04-25 08:48:42

Nano項目使用動態(tài)內(nèi)存出現(xiàn)錯誤如何解決？

默認的項目配置是不使用動態(tài)內(nèi)存的，運行正常改用動態(tài)內(nèi)存，然后運行就不正常了仿真的時候，控制臺顯示這樣的錯誤。這是什么原因，怎么解決？

2023-01-30 10:59:44

RT-Thread系統(tǒng)動態(tài)內(nèi)存堆有哪幾種管理算法呢

每種 RTOS 均有內(nèi)存管理機制，RT-Thread 的內(nèi)存管理分為兩類：動態(tài)內(nèi)存堆管理、內(nèi)存池管理。本篇文章先來介紹一下動態(tài)內(nèi)存堆管理相關(guān)的內(nèi)容。內(nèi)存堆管理機制RT-Thread 操作系統(tǒng)在內(nèi)存

2022-03-31 13:53:33

RTThread的動態(tài)內(nèi)存空間該如何去分配呢

關(guān)于rtt的動態(tài)內(nèi)存空間分配，想問一下以下我的幾點理解是對的嗎1、我看RTT NANO和MASTER版本的動態(tài)內(nèi)存分配好像不太一樣，我的理解是MASTER版本的動態(tài)內(nèi)存位置是從ZI段結(jié)束地址到RAM

2022-08-31 14:34:26

arduino 動態(tài)內(nèi)存不足怎么處理

arduino Mega2560 加入第一個 Serial 串口，動態(tài)內(nèi)存是2000 字節(jié)，加入第2個Serial 串口 動態(tài)內(nèi)存是 4000字節(jié)，現(xiàn)在我需要加入第3個Serial 串口， 動態(tài)內(nèi)存是 6000字節(jié)，再加上程序本身好多變量，動態(tài)內(nèi)存顯示不足。請教如何節(jié)省動態(tài)內(nèi)存？

2019-06-18 08:29:39

ucos ii動態(tài)內(nèi)存使用一直是遞增的

);OSTimeDlyHMSM(0,0,2,0); }}這3個任務(wù)分別是Mytask Youtask Hertask。在應(yīng)用程序中創(chuàng)建一個動態(tài)內(nèi)存分區(qū)該分區(qū)有8個內(nèi)存塊，每個內(nèi)存塊的長度是6字節(jié)

2019-07-03 04:35:45

【rtthread學(xué)習(xí)筆記系列】第五篇：內(nèi)存分配的概念

一、內(nèi)存分配概念計算機系統(tǒng)中，變量存放在ram中，只有在使用時才將它調(diào)入cpu運行，rtthread提供了兩類內(nèi)存分配方法：動態(tài)內(nèi)存堆靜態(tài)內(nèi)存池。動態(tài)內(nèi)存堆根據(jù)系統(tǒng)資源的情況有3種分配算法：小內(nèi)存

2022-04-22 14:10:22

【原創(chuàng)】C語言中的動態(tài)內(nèi)存-----棧內(nèi)存

作者：蔡琰老師（張飛實戰(zhàn)電子高級工程師）C語言程序的動態(tài)內(nèi)存分為棧內(nèi)存區(qū)域和堆內(nèi)存區(qū)域兩種。棧內(nèi)存是由編譯器管理的，而堆內(nèi)存是由程序調(diào)用具體的庫函數(shù)管理的。我們今天分析下棧內(nèi)存的概念。棧內(nèi)存的使用在

2021-07-07 14:18:13

使用動態(tài)內(nèi)存分配安全嗎

[導(dǎo)讀]想在C語言程序員之間開始一個激烈的，或者說有爭議的討論很簡單，只需要問：“使用動態(tài)內(nèi)存分配安全嗎？”想在C語言程序員之間開始一個激烈的，或者說有爭議的討論很簡單，只需要問：“使用動態(tài)內(nèi)存分配

2021-12-15 07:44:54

關(guān)于RT-Thread的動態(tài)內(nèi)存堆管理簡析

堆管理算法只能啟用一個，但是提供給用戶的接口完全相同。注意事項：內(nèi)存堆管理為了滿足多線程場景下的安全分配，考慮多線程間的互斥問題。因此，不要在中斷服務(wù)程序中分配或釋放動態(tài)內(nèi)存塊。否則，會引起當(dāng)前上下文

2022-04-06 17:11:23

基于SRAM的方法可以加速AI推理

基于SRAM的方法可加速AI推理

2020-12-30 07:28:28

如何分配STM32H7中TCM，SRAM等五塊內(nèi)存的動態(tài)內(nèi)存

如何分配STM32H7中TCM，SRAM等五塊內(nèi)存的動態(tài)內(nèi)存

2021-10-13 07:23:22

如何在C語言查看可申請動態(tài)內(nèi)存的總大小代碼

C語言查看可申請動態(tài)內(nèi)存的總大小代碼：#include #include typedef unsigned char uint8;uint8* p; long long count1;int

2021-07-14 07:19:18

如何在單片機上也可正常使用動態(tài)內(nèi)存分配

51單片機內(nèi)存動態(tài)分配序言最近玩51單片機碰到一個問題，51中malloc函數(shù)并不能像在PC上一樣正常運行，這涉及到了內(nèi)存池的概念。下面就來演示一下如何在單片機上也可正常使用動態(tài)內(nèi)存分配。初始化內(nèi)存

2021-11-19 07:36:48

嵌入式C語言動態(tài)內(nèi)存分配

動態(tài)內(nèi)存分配：1、malloc、memset、free在日常寫代碼時需要注意以下幾點：malloc分配內(nèi)存時，需要 if語句判斷malloc是否成功動態(tài)內(nèi)存分配的空間也需要進行初始化，可以用

2021-12-14 06:37:07

怎樣去定義CDC所需要的動態(tài)內(nèi)存分配函數(shù)呢

為什么使用動態(tài)內(nèi)存分配的CDC驅(qū)動自動生成的代碼不能正常工作呢？怎樣去定義CDC所需要的動態(tài)內(nèi)存分配函數(shù)呢？

2021-12-06 07:04:01

用了動態(tài)內(nèi)存后編譯顯示cpu占用的內(nèi)存不正確

,是怎么回事? 我試下來只要用了動態(tài)內(nèi)存就有這個現(xiàn)象，實際程序能正常運行，但平時想看一下內(nèi)存占用了多少，就看不出來了，不是很方便 .

2019-04-15 03:12:05

第28章 FreeRTOS動態(tài)內(nèi)存管理

轉(zhuǎn)：本章節(jié)為大家講解FreeRTOS動態(tài)內(nèi)存管理，動態(tài)內(nèi)存管理是FreeRTOS非常重要的一項功能，前面章節(jié)講解的任務(wù)創(chuàng)建、信號量、消息隊列、事件標(biāo)志組、互斥信號量、軟件定時器組等需要的RAM空間

2016-09-11 07:15:36

請問ATK-ESP8266 WiFi模塊示例程序中SD卡和動態(tài)內(nèi)存管有什么作用？

最近買了塊ATK-ESP8266WiFi模塊想加到我的stm32實驗板上，然后看了整點原子附帶的例程，里面用到了SD卡，以及動態(tài)內(nèi)存管理，請問這些有什么作用，如果不用這兩個部分，WiFi模塊會怎樣，還可以通信嗎？？可以通信的話，效果如何？本人第一次接觸WiFi，還望大神不吝賜教，感激萬分！

2019-06-27 04:35:25

請問CCS下怎么使用malloc之類動態(tài)內(nèi)存函數(shù)？

決定。請教大家一下，CCS下可以使用malloc之類的動態(tài)內(nèi)存分配函數(shù)么？我在程序開頭#include，編譯后報錯：cannot open the file "malloc.h"!如果可以使用，如何使用？如果不能使用，還有什么其他的方法動態(tài)建立一維數(shù)組呢？

2019-05-23 16:31:29

請問C語言如何查看可申請動態(tài)內(nèi)存的總大小？

請問C語言如何查看可申請動態(tài)內(nèi)存的總大小？

2021-10-14 06:10:02

請問mymalloc函數(shù)申請的是動態(tài)內(nèi)存還是靜態(tài)內(nèi)存？

mymalloc函數(shù)申請的是動態(tài)內(nèi)存還是靜態(tài)內(nèi)存啊？求大神解答，謝謝

2019-10-30 04:35:50

請問使用動態(tài)內(nèi)存分配安全嗎？

想在C語言程序員之間開始一個激烈的，或者說有爭議的討論很簡單，只需要問：“使用動態(tài)內(nèi)存分配安全嗎？”使用動態(tài)內(nèi)存分配安全嗎？在C語言程序開發(fā)中，動態(tài)內(nèi)存分配允許程序在運行時向系統(tǒng)申請內(nèi)存使用，只不過

2021-12-15 06:10:18

請問大佬rt_malloc申請的動態(tài)內(nèi)存返回的是虛擬地址還是物理地址

請問各位大佬：如題，rt_malloc申請的動態(tài)內(nèi)存返回的是虛擬地址還是物理地址呢？為什么感覺直接就是返回了物理地址？如果返回的是物理地址，那MMU的意義在于？

2022-07-07 14:40:24

請問實驗17動態(tài)內(nèi)存管理例子是做什么的？

大家好：我想了解下“實驗17 動態(tài)內(nèi)存管理”，這個例子是做什么的？小白完全看不懂用意啊。。，下面是打印時的日志，然后呢？誰來解釋下這個例子想說明點什么？？\ | /- RT -Thread

2019-01-25 06:35:56

請問怎樣去設(shè)計Fense動態(tài)內(nèi)存管理模塊？

Fense的設(shè)計原理是什么？Fense有哪些功能？怎樣去設(shè)計Fense動態(tài)內(nèi)存管理模塊？

2021-04-26 07:18:33

一種基于動態(tài)建鏈推理的網(wǎng)絡(luò)攻擊過程分析方法

提出一種動態(tài)漏洞鏈構(gòu)造推理網(wǎng)絡(luò)攻擊過程的分析方法。以漏洞間推理關(guān)系為前提，從受害主機入手，構(gòu)造有色加權(quán)有向圖，在多日志中查找漏洞被利用的解釋信息，并由查找結(jié)

2009-02-28 16:50:53

基于修正LRU的壓縮Cache替換策略

以優(yōu)化壓縮cache的替換策略為目標(biāo)，提出一種優(yōu)化的基于修正LRU的壓縮cache替換策略MLRU-C。MLRU-C策略能利用壓縮cache中額外的tag資源，形成影子tag機制來探測并修正LRU替換策略的錯誤

2009-04-15 09:51:03

一個動態(tài)內(nèi)存管理模塊的實現(xiàn)

介紹一個動態(tài)內(nèi)存管理模塊，可以有效地檢測C程序中內(nèi)存泄漏和寫內(nèi)存越界等錯誤，適用于具有標(biāo)準(zhǔn)C 語言開發(fā)環(huán)境的各種平臺。

2009-04-16 14:18:53

一個動態(tài)內(nèi)存管理模塊的實現(xiàn)

2009-05-14 14:39:07

一種新的嵌入式實時動態(tài)內(nèi)存管理結(jié)構(gòu)

內(nèi)存資源是嵌入式操作系統(tǒng)中需要管理的重要資源之一。這種O(1)時間復(fù)雜度的嵌入式實時動態(tài)內(nèi)存管理結(jié)構(gòu)采用頁表結(jié)構(gòu)組織系統(tǒng)內(nèi)存信息，使

2009-09-10 10:20:18

Cache結(jié)構(gòu)的低功耗可重構(gòu)技術(shù)分析

Cache結(jié)構(gòu)的低功耗可重構(gòu)技術(shù)分析在分析Cache性能的基礎(chǔ)上介紹了當(dāng)前低功耗Cache的設(shè)計方法，提出了一種可重構(gòu)Cache模型和動態(tài)

2009-03-29 15:07:55

663

變頻壓縮/動態(tài)范圍,變頻壓縮/動態(tài)范圍是什么意思

變頻壓縮/動態(tài)范圍,變頻壓縮/動態(tài)范圍是什么意思變頻壓縮是混頻器線性運用狀態(tài)下最大射頻輸入偏離線性某一壓縮量來說明的

2010-03-22 16:14:43

2660

動態(tài)內(nèi)存錯誤的靜態(tài)檢測

內(nèi)存泄漏、空指針引用等動態(tài)內(nèi)存錯誤在/，/LL等支持動態(tài)內(nèi)存操作的程序中普遍存在在程序中，動態(tài)內(nèi)存管理錯誤是導(dǎo)致動態(tài)內(nèi)存錯誤的根本原因動態(tài)內(nèi)存錯誤的靜態(tài)檢測方法是在對程

2011-06-10 16:29:27

基于Core的動態(tài)內(nèi)存分配方案

為了解決基于C*Core系列芯片嵌入式開發(fā)過程中，C*Core系統(tǒng)在某些情況下由于受操作系統(tǒng)、數(shù)據(jù)格式差異等因素影響，不能動態(tài)分配C*Core系列芯片內(nèi)存的問題，采用數(shù)組與標(biāo)志位相結(jié)合的

2011-07-11 10:37:54

動態(tài)內(nèi)存管理在面向嵌入式實時系統(tǒng)中的研究

動態(tài)內(nèi)存管理的基本任務(wù)就是有效地對動態(tài)內(nèi)存進行分配、回收，并同時保證系統(tǒng)的快速性、可靠性和穩(wěn)定性。當(dāng)系統(tǒng)請求分配內(nèi)存時，系統(tǒng)需要從所有空閑塊中找到一個合適的空閑塊

2011-07-22 11:14:14

978

基于μCOS-II的TLSF動態(tài)內(nèi)存分配算法的應(yīng)用與仿真

以嵌入式實時系統(tǒng)為背景，深入研究了TLSF動態(tài)內(nèi)存分配算法原理及實現(xiàn)過程，并將TLSF移植到COS-II中，進行了基于x86平臺的仿真測試，取得了很好的效果，為以后學(xué)習(xí)和應(yīng)用TLSF算法提供

2013-09-25 10:42:05

MicroBlaze:malloc 函數(shù)動態(tài)分配內(nèi)存溢出

首先說明一點，MicroBlaze C函數(shù)庫支持標(biāo)準(zhǔn)的內(nèi)存管理函數(shù)，如malloc()，calloc(), free()，這些標(biāo)準(zhǔn)的C函數(shù)庫定義在libc.a中。動態(tài)內(nèi)存分配從內(nèi)存的程序的堆(heap)中提供。

2017-02-11 11:43:05

1607

Buddy算法在μC/OSII動態(tài)內(nèi)存管理改進中的應(yīng)用分析

管理策略主要有兩種--靜態(tài)內(nèi)存分配和動態(tài)內(nèi)存分配。靜態(tài)內(nèi)存分配：編譯或鏈接時將所需內(nèi)存分配好，程序運行起來后所分配的內(nèi)存不釋放。對于實時性和可靠性要求極高的系統(tǒng)，不允許延遲或者分配失效，必須采用靜態(tài)內(nèi)存分配的方式

2017-10-26 10:12:46

一種基于貝葉斯網(wǎng)絡(luò)的隨機測試方法在Cache一致性驗證中的設(shè)計與實現(xiàn)

基于貝葉斯網(wǎng)絡(luò)的隨機測試生成方法，解決Cache -致性協(xié)議狀態(tài)空間爆炸的問題。首先分析了Cache -致性協(xié)議及基于貝葉斯網(wǎng)絡(luò)推理的CDG方法，并將CDG方法應(yīng)用于Cache -致性的驗證。以FT處理器中的Cache -致性協(xié)議驗證為例，對比偽隨機測試，使用CDG方法將覆蓋率提

2017-11-17 17:24:07

動態(tài)內(nèi)存管理在面向嵌入式實時系統(tǒng)中的研究

2017-12-01 05:49:31

170

動態(tài)內(nèi)存分配舉例，以及動態(tài)數(shù)組的構(gòu)造

5：只能用free（p）來釋放p所指向的動態(tài)開辟的內(nèi)存空間。 6：對動態(tài)內(nèi)存空間的操作，用*p來操作。 7：可以用多個指針指向這個動態(tài)空間 8:當(dāng)有多個指針只向這個動態(tài)空間時，只能用free一個指針，多次重復(fù)釋放要被報錯 9：可以將動態(tài)開辟的的內(nèi)存指針作為函數(shù)參數(shù)

2018-07-10 16:41:37

6932

C語言動態(tài)內(nèi)存分配分析

將原來動態(tài)開辟的動態(tài)內(nèi)存重新開辟一個字節(jié)數(shù)，如果這個數(shù)比以前的大，前面的數(shù)據(jù)保存。如果比原來的小，保留前面的數(shù)據(jù)。

2019-01-07 11:02:40

4002

單片機系統(tǒng)進行動態(tài)內(nèi)存分配和任務(wù)調(diào)度思想的資料和代碼實例說明

內(nèi)存分配設(shè)計思想：我們設(shè)置動態(tài)內(nèi)存分配的初衷在于：有些單片機系統(tǒng)內(nèi)存資源比較少，便顯得特別珍貴，因此我們要實現(xiàn)內(nèi)存的反復(fù)利用，好像就像一個池子一樣，我們要循環(huán)利用池子里的水資源。比如說洗澡時，如果是

2019-09-30 17:13:00

51單片機如何使用動態(tài)內(nèi)存

本文檔的主要內(nèi)容詳細介紹的是51單片機如何使用動態(tài)內(nèi)存的詳細資料免費下載。

2019-06-14 17:44:00

嵌入式中需要用到動態(tài)內(nèi)存嗎

所謂動態(tài)內(nèi)存分配(Dynamic Memory Allocation)就是指在程序執(zhí)行的過程中動態(tài)地分配或者回收存儲空間的分配內(nèi)存的方法。動態(tài)內(nèi)存分配不像數(shù)組等靜態(tài)內(nèi)存分配方法那樣需要預(yù)先分配存儲空間，而是由系統(tǒng)根據(jù)程序的需要即時分配，且分配的大小就是程序要求的大小。

2019-07-27 08:11:00

2834

靜、動態(tài)內(nèi)存的優(yōu)劣比較

動態(tài)內(nèi)存分配不像數(shù)組等靜態(tài)內(nèi)存分配方法那樣需要預(yù)先分配存儲空間，而是由系統(tǒng)根據(jù)程序的需要即時分配，且分配的大小就是程序要求的大小。

2019-08-06 18:25:32

6025

嵌入式C語言中的動態(tài)內(nèi)存管理和動態(tài)內(nèi)存分配

動態(tài)內(nèi)存管理同時還具有一個優(yōu)點：當(dāng)程序在具有更多內(nèi)存的系統(tǒng)上需要處理更多數(shù)據(jù)時，不需要重寫程序。

2019-08-15 17:16:23

1946

嵌入式中是否使用動態(tài)內(nèi)存?

嵌入式中是否應(yīng)該使用動態(tài)內(nèi)存?

2020-02-28 17:03:51

1482

主流內(nèi)存壓縮技術(shù)那些事

zSwap是在memory與flash之間的一層“cache”,當(dāng)內(nèi)存需要swap出去磁盤的時候，先通過壓縮放到zSwap中去，zSwap空間按需增長。達到一定程度后則會按照LRU的順序(前提

2020-06-03 15:11:24

3596

EE-418：ADSP-2156x動態(tài)內(nèi)存控制器電路板設(shè)計指南

2021-03-23 05:56:21

C語言程序的動態(tài)內(nèi)存中棧內(nèi)存區(qū)域的概念

C語言程序的動態(tài)內(nèi)存分為棧內(nèi)存區(qū)域和堆內(nèi)存區(qū)域兩種。棧內(nèi)存是由編譯器管理的，而堆內(nèi)存是由程序調(diào)用具體的庫函數(shù)管理的。我們今天分析下棧內(nèi)存的概念。棧內(nèi)存的使用在很大程度上依賴于處理器的硬件機制

2021-06-29 10:34:48

1599

動態(tài)內(nèi)存分配的注意事項及本質(zhì)是什么

C語言中比較重要的就是指針，它可以用來鏈表操作，談到鏈表，很多時候為此分配內(nèi)存采用動態(tài)分配而不是靜態(tài)分配。本文分享自華為云社區(qū)《【云駐共創(chuàng)】C語言中動態(tài)內(nèi)存分配的本質(zhì) 》，作者

2021-10-13 15:37:09

3049

關(guān)于stm32 MCU申請動態(tài)內(nèi)存malloc的認識

首先，malloc( )屬于標(biāo)準(zhǔn)C語言函數(shù)，當(dāng)然可以在單片機上使用，如STM32可以先在啟動文件中設(shè)置heap的大小，再使用動態(tài)內(nèi)存分配： Heap_Size EQU 0x00000200 \\也就

2021-11-18 16:21:01

【STM32H7教程】第27章 STM32H7的TCM，SRAM等五塊內(nèi)存的動態(tài)內(nèi)存分配實現(xiàn)

的動態(tài)內(nèi)存分配實現(xiàn)本章教程為大家分享一種DTCM，SRAM1，SRAM2，SRAM3和SRAM4可以獨立管理的動態(tài)內(nèi)存管理方案，在實際項目中有一定的實用價值，比如MP3編解碼，JPEG...

2021-12-16 16:53:34

stm32 單片機的attribute ((at())絕對定位及首次適應(yīng)算法的動態(tài)內(nèi)存管理

中，一般用于固化的信息，如ID卡的ID號，flash標(biāo)記等等2、定位到RAM/SDRAM中，一般用于數(shù)據(jù)量比較大的緩存，如動態(tài)內(nèi)存分配的緩存，串口的接收緩存.由于單片機的內(nèi)存空間不夠...

2021-12-24 19:27:17

嵌入式開發(fā)是否應(yīng)該使用動態(tài)內(nèi)存分配

我遇到的許多嵌入式軟件開發(fā)人員提出的一個我覺得特別有趣的話題是動態(tài)內(nèi)存分配——在需要時獲取內(nèi)存塊。這種看似簡單和常規(guī)的操作會帶來大量問題。這些并不局限于嵌入式開發(fā)——許多桌面應(yīng)用程序都會出現(xiàn)內(nèi)存泄漏，這會影響性能，并且會使系統(tǒng)重新啟動很常見。但是，我擔(dān)心嵌入式開發(fā)環(huán)境。

2022-07-15 14:16:20

1242

什么是 Cache? Cache讀寫原理

由于寫入數(shù)據(jù)和讀取指令分別通過 D-Cache 和 I-Cache，所以需要同步 D-Cache 和 I-Cache，即復(fù)制后需要先將 D-Cache 寫回到內(nèi)存，而且還需要作廢當(dāng)前的 I-Cache 以確保執(zhí)行的是 Memory 內(nèi)更新的代碼

2022-12-06 09:55:56

1167

為什么需要動態(tài)分配內(nèi)存？

今天的文章會用到以下知識點，大家可以作為了解內(nèi)容去學(xué)習(xí)：靜態(tài)內(nèi)存、動態(tài)內(nèi)存、堆、棧、全局變量、指針等；

2023-02-17 10:02:21

1889

FreeRTOS內(nèi)存管理簡介

，比如任務(wù)創(chuàng)建函數(shù) xTaskCreateStatic（），使用此函數(shù)創(chuàng)建任務(wù)的時候需要由用戶定義任務(wù)堆棧，我們不討論這種靜態(tài)方法。使用動態(tài)內(nèi)存管理的時候 FreeRTOS 內(nèi)核在創(chuàng)建任務(wù)、隊列、信號量的時候會動態(tài)的申請 RAM。標(biāo)準(zhǔn) C 庫中的 malloc（）和 free（）也可以實現(xiàn)動態(tài)內(nèi)存管

2023-07-30 10:26:23

367