常見GPU利用率低原因分析

最近經(jīng)常有同學(xué)反饋 GPU 利用率低，嚴(yán)重浪費(fèi) GPU 資源的問題，經(jīng)過對(duì)一些實(shí)例分析后，借著這篇文檔和大家分享一下解決方案，希望能對(duì)使用 GPU 的同學(xué)有些幫助。

一、GPU 利用率的定義

本文的 GPU 利用率主要指 GPU 在時(shí)間片上的利用率，即通過 nvidia-smi 顯示的 GPU-util 這個(gè)指標(biāo)。統(tǒng)計(jì)方式為：在采樣周期內(nèi)，GPU 上面有 kernel 執(zhí)行的時(shí)間百分比。

二、GPU 利用率低的本質(zhì)

常見 GPU 任務(wù)運(yùn)行流程圖如下：

如上圖所示，GPU 任務(wù)會(huì)交替的使用 CPU 和 GPU 進(jìn)行計(jì)算，當(dāng) CPU 計(jì)算成為瓶頸時(shí)，就會(huì)出現(xiàn) GPU 等待的問題，GPU 空跑那利用率就低了。那么優(yōu)化的方向就是縮短一切使用 CPU 計(jì)算環(huán)節(jié)的耗時(shí)，減少 CPU 計(jì)算對(duì) GPU 的阻塞情況。常見的 CPU 計(jì)算操作如下：

數(shù)據(jù)加載

數(shù)據(jù)預(yù)處理

模型保存

loss 計(jì)算

評(píng)估指標(biāo)計(jì)算

日志打印

指標(biāo)上報(bào)

進(jìn)度上報(bào)

三、常見 GPU 利用率低原因分析

1、數(shù)據(jù)加載相關(guān)

1）存儲(chǔ)和計(jì)算跨城了，跨城加載數(shù)據(jù)太慢導(dǎo)致 GPU 利用率低

說明：例如數(shù)據(jù)存儲(chǔ)在“深圳 ceph”，但是 GPU 計(jì)算集群在“重慶”，那就涉及跨城使用了，影響很大。

優(yōu)化：要么遷移數(shù)據(jù)，要么更換計(jì)算資源，確保存儲(chǔ)及計(jì)算是同城的。

2）存儲(chǔ)介質(zhì)性能太差

說明：不同存儲(chǔ)介質(zhì)讀寫性能比較：本機(jī) SSD > ceph > cfs-1.5 > hdfs > mdfs

優(yōu)化：將數(shù)據(jù)先同步到本機(jī) SSD，然后讀本機(jī) SSD 進(jìn)行訓(xùn)練。本機(jī) SSD 盤為“/dockerdata”，可先將其他介質(zhì)下的數(shù)據(jù)同步到此盤下進(jìn)行測試，排除存儲(chǔ)介質(zhì)的影響。

3）小文件太多，導(dǎo)致文件 io 耗時(shí)太長

說明：多個(gè)小文件不是連續(xù)的存儲(chǔ)，讀取會(huì)浪費(fèi)很多時(shí)間在尋道上

優(yōu)化：將數(shù)據(jù)打包成一個(gè)大的文件，比如將許多圖片文件轉(zhuǎn)成一個(gè) hdf5/pth/lmdb/TFRecord 等大文件

lmdb 格式轉(zhuǎn)換樣例：

https://github.com/Lyken17/Efficient-PyTorch#data-loader

其他格式轉(zhuǎn)換方式請(qǐng)自行谷歌

4）未啟用多進(jìn)程并行讀取數(shù)據(jù)

說明：未設(shè)置 num_workers 等參數(shù)或者設(shè)置的不合理，導(dǎo)致 cpu 性能沒有跑起來，從而成為瓶頸，卡住 GPU

優(yōu)化：設(shè)置 torch.utils.data.DataLoader 方法的 num_workers 參數(shù)、tf.data.TFRecordDataset 方法的 num_parallel_reads 參數(shù)或者 tf.data.Dataset.map 的 num_parallel_calls 參數(shù)。

5）未啟用提前加載機(jī)制來實(shí)現(xiàn) CPU 和 GPU 的并行

說明：未設(shè)置 prefetch_factor 等參數(shù)或者設(shè)置的不合理，導(dǎo)致 CPU 與 GPU 在時(shí)間上串行，CPU 運(yùn)行時(shí) GPU 利用率直接掉 0

優(yōu)化：設(shè)置 torch.utils.data.DataLoader 方法的 prefetch_factor 參數(shù) 或者 tf.data.Dataset.prefetch()方法。prefetch_factor 表示每個(gè) worker 提前加載的 sample 數(shù)量（使用該參數(shù)需升級(jí)到 pytorch1.7 及以上），Dataset.prefetch()方法的參數(shù) buffer_size 一般設(shè)置為：tf.data.experimental.AUTOTUNE，從而由 TensorFlow 自動(dòng)選擇合適的數(shù)值。

6）未設(shè)置共享內(nèi)存 pin_memory

說明：未設(shè)置 torch.utils.data.DataLoader 方法的 pin_memory 或者設(shè)置成 False,則數(shù)據(jù)需從 CPU 傳入到緩存 RAM 里面，再給傳輸?shù)?GPU 上

優(yōu)化：如果內(nèi)存比較富裕，可以設(shè)置 pin_memory=True，直接將數(shù)據(jù)映射到 GPU 的相關(guān)內(nèi)存塊上，省掉一點(diǎn)數(shù)據(jù)傳輸時(shí)間

2、數(shù)據(jù)預(yù)處理相關(guān)

1）數(shù)據(jù)預(yù)處理邏輯太復(fù)雜

說明：數(shù)據(jù)預(yù)處理部分超過一個(gè) for 循環(huán)的，都不應(yīng)該和 GPU 訓(xùn)練部分放到一起

優(yōu)化：a、設(shè)置 tf.data.Dataset.map 的 num_parallel_calls 參數(shù)，提高并行度，一般設(shè)置為 tf.data.experimental.AUTOTUNE，可讓 TensorFlow 自動(dòng)選擇合適的數(shù)值。

b、將部分?jǐn)?shù)據(jù)預(yù)處理步驟挪出訓(xùn)練任務(wù)，例如對(duì)圖片的歸一化等操作，提前開啟一個(gè) spark 分布式任務(wù)或者 cpu 任務(wù)處理好，再進(jìn)行訓(xùn)練。

c、提前將預(yù)處理部分需要用到的配置文件等信息加載到內(nèi)存中，不要每次計(jì)算的時(shí)候再去讀取。

d、關(guān)于查詢操作，多使用 dict 加速查詢操作；減少 for、while 循環(huán)，降低預(yù)處理復(fù)雜度。

2）利用 GPU 進(jìn)行數(shù)據(jù)預(yù)處理 -- Nvidia DALI

說明：Nvidia DALI 是一個(gè)專門用于加速數(shù)據(jù)預(yù)處理過程的庫，既支持 GPU 又支持 CPU

優(yōu)化：采用 DALI，將基于 CPU 的數(shù)據(jù)預(yù)處理流程改造成用 GPU 來計(jì)算

DALI 文檔如下：https://zhuanlan.zhihu.com/p/105056158

3、模型保存相關(guān)

1）模型保存太頻繁

說明：模型保存為 CPU 操作，太頻繁容易導(dǎo)致 GPU 等待

優(yōu)化：減少保存模型(checkpoint)的頻率

4、指標(biāo)相關(guān)

1）loss 計(jì)算太復(fù)雜

說明：含有 for 循環(huán)的復(fù)雜 loss 計(jì)算，導(dǎo)致 CPU 計(jì)算時(shí)間太長從而阻塞 GPU

優(yōu)化：該用低復(fù)雜度的 loss 或者使用多進(jìn)程或多線程進(jìn)行加速

2）指標(biāo)上報(bào)太頻繁

說明：指標(biāo)上報(bào)操作太頻繁，CPU 和 GPU 頻繁切換導(dǎo)致 GPU 利用率低

優(yōu)化：改成抽樣上報(bào)，例如每 100 個(gè) step 上報(bào)一次

5、日志相關(guān)

1）日志打印太頻繁

說明：日志打印操作太頻繁，CPU 和 GPU 頻繁切換導(dǎo)致 GPU 利用率低

優(yōu)化：改成抽樣打印，例如每 100 個(gè) step 打印一次

四、常見數(shù)據(jù)加載方法說明

1、pytorch 的 torch.utils.data.DataLoader

DataLoader(dataset, batch_size=1, shuffle=False, sampler=None,

           batch_sampler=None, num_workers=0, collate_fn=None,
           pin_memory=False, drop_last=False, timeout=0,
           worker_init_fn=None, *, prefetch_factor=2,
           persistent_workers=False)

從參數(shù)定義中，我們可以看到 DataLoader 主要支持以下幾個(gè)功能:

支持加載 map-style 和 iterable-style 的 dataset，主要涉及到的參數(shù)是 dataset

自定義數(shù)據(jù)加載順序，主要涉及到的參數(shù)有 shuffle, sampler, batch_sampler, collate_fn

自動(dòng)把數(shù)據(jù)整理成 batch 序列，主要涉及到的參數(shù)有 batch_size, batch_sampler, collate_fn, drop_last

單進(jìn)程和多進(jìn)程的數(shù)據(jù)加載，主要涉及到的參數(shù)有 num_workers, worker_init_fn

自動(dòng)進(jìn)行鎖頁內(nèi)存讀取 (memory pinning)，主要涉及到的參數(shù) pin_memory

支持?jǐn)?shù)據(jù)預(yù)加載，主要涉及的參數(shù) prefetch_factor

參考文檔：https://pytorch.org/docs/stable/data.html

2、tensorflow 的 tf.data.Dataset

ds_train = tf.data.Dataset.from_tensor_slices((x,y))

    .shuffle(5000)
    .batch(batchs)
    .map(preprocess,num_parallel_calls=tf.data.experimental.AUTOTUNE)
    .prefetch(tf.data.experimental.AUTOTUNE)

Dataset.prefetch(): 可以讓數(shù)據(jù)集對(duì)象 Dataset 在 ? 訓(xùn)練時(shí)預(yù)取出若干個(gè)元素，使得在 GPU 訓(xùn)練的同時(shí) CPU 可以準(zhǔn)備數(shù)據(jù)，提升訓(xùn)練流程的效率

Dataset.map(f): 轉(zhuǎn)換函數(shù) f 映射到數(shù)據(jù)集每一個(gè)元素; 可以利用多 CPU 資源,充分利用多核心的優(yōu)勢對(duì)數(shù)據(jù)進(jìn)行并行化變換， num_parallel_calls 設(shè)置為 tf.data.experimental.AUTOTUNE 以讓 TensorFlow 自動(dòng)選擇合適的數(shù)值，數(shù)據(jù)轉(zhuǎn)換過程多進(jìn)程執(zhí)行，設(shè)置 num_parallel_calls 參數(shù)能發(fā)揮 cpu 多核心的優(yōu)勢

Dataset.shuffle(buffer_size): 將數(shù)據(jù)集打亂，取出前 buffer_size 個(gè)元素放入，并從緩沖區(qū)中隨機(jī)采樣，采樣后的數(shù)據(jù)用后續(xù)數(shù)據(jù)替換

Dataset.batch(batch_size)：將數(shù)據(jù)集分成批次，即對(duì)每 batch_size 個(gè)元素，使用 tf.stack() 在第 0 維合并，成為一個(gè)元素

參考文檔：https://www.tensorflow.org/api_docs/python/tf/data/Dataset#methods_2

五、分布式任務(wù)常見的 GPU 利用率低問題

分布式任務(wù)相比單機(jī)任務(wù)多了一個(gè)機(jī)器間通信環(huán)節(jié)。如果在單機(jī)上面運(yùn)行的好好的，擴(kuò)展到多機(jī)后出現(xiàn) GPU 利用率低，運(yùn)行速度慢等問題，大概率是機(jī)器間通信時(shí)間太長導(dǎo)致的。請(qǐng)排查以下幾點(diǎn)：

1、機(jī)器節(jié)點(diǎn)是否處在同一 modules？

答：機(jī)器節(jié)點(diǎn)處于不同 modules 時(shí)，多機(jī)間通信時(shí)間會(huì)長很多，deepspeed 組件已從平臺(tái)層面增加調(diào)度到同一 modules 的策略，用戶不需要操作；其他組件需聯(lián)系我們開啟。

2、多機(jī)時(shí)是否啟用 GDRDMA？

答：能否啟用 GDRDMA 和 NCCL 版本有關(guān)，經(jīng)測試，使用 PyTorch1.7（自帶 NCCL2.7.8）時(shí)，啟動(dòng) GDRDMA 失敗，和 Nvidia 的人溝通后確定是 NCCL 高版本的 bug，暫時(shí)使用的運(yùn)行注入的方式來修復(fù)；使用 PyTorch1.6（自帶 NCCL2.4.8）時(shí)，能夠啟用 GDRDMA。經(jīng)測試，“NCCL2.4.8 + 啟用 GDRDMA ” 比 “NCCL2.7.8 + 未啟用 GDRDMA”提升 4%。通過設(shè)置 export NCCL_DEBUG=INFO，查看日志中是否出現(xiàn)[receive] via NET/IB/0/GDRDMA 和 [send] via NET/IB/0/GDRDMA，出現(xiàn)則說明啟用 GDRDMA 成功，否則失敗。

3、pytorch 數(shù)據(jù)并行是否采用 DistributedDataParallel ？

答：PyTorch 里的數(shù)據(jù)并行訓(xùn)練，涉及 nn.DataParallel (DP) 和nn.parallel.DistributedDataParallel (DDP) ，我們推薦使用 nn.parallel.DistributedDataParallel (DDP)。

編輯：黃飛

閱讀全文

cpu(206162) cpu(206162)
gpu(126253) gpu(126253)
SSD(115269) SSD(115269)

評(píng)論

相關(guān)推薦

Q1面板產(chǎn)能利用率恐跌4年來低點(diǎn)

去年第四季面板廠大減產(chǎn)，平均產(chǎn)能利用率降至83％。第一季進(jìn)入傳統(tǒng)淡季，除了韓國面板廠投片沒有增加之外，SDP的10代廠也大幅減產(chǎn)。日韓面板廠帶頭大減產(chǎn)后，市場研究機(jī)構(gòu)DSCC估計(jì)，首季整體平均產(chǎn)能

2020-01-31 08:21:43

3680

SPWM與SVPWM—調(diào)制比與電壓利用率

學(xué)習(xí)調(diào)制方法時(shí)，**調(diào)制比**與**電壓利用率**是個(gè)重要的概念。我發(fā)現(xiàn)教材中卻對(duì)這兩個(gè)內(nèi)容介紹的很模糊，網(wǎng)上也沒有很多包含具體推導(dǎo)過程的公式。

2023-12-01 17:04:49

4238

解決算力需求的主流方法？數(shù)據(jù)流架構(gòu)讓AI芯片利用率提升10倍以上

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）現(xiàn)在各種應(yīng)用場景對(duì)算力的需求越來越大，為了滿足需求，各廠商不斷提升AI芯片的峰值算力，而傳統(tǒng)指令集架構(gòu)的芯片利用率卻難以提升，大多數(shù)在10-40%，這讓芯片的實(shí)測性能

2021-11-26 07:27:00

3963

NVIDIA A100張量核心GPU的內(nèi)部和新特性研究

A100 GPU 的新 MIG 功能可以將每個(gè) A100 劃分為多達(dá)七個(gè) GPU 加速器以實(shí)現(xiàn)最佳利用率，有效提高了 GPU 資源利用率和 GPU 訪問更多用戶和 GPU 加速應(yīng)用程序。

2022-04-06 09:54:45

7603

GPU-Z可以監(jiān)控每個(gè)vGPU的總GPU利用率嗎？

我同時(shí)運(yùn)行4個(gè)VM，每個(gè)vGPU是m60-2Q。所有虛擬機(jī)都運(yùn)行bechmark測試。我使用Techpowerup GPU-Z監(jiān)控每個(gè)vGPU。我發(fā)現(xiàn)了一個(gè)有趣的結(jié)果。如果我將所有vGPU利用率

2018-09-19 16:59:17

CPU利用率問題求解

“你能不能實(shí)現(xiàn)一個(gè)理想情況下應(yīng)該在每個(gè)時(shí)間片開始時(shí)執(zhí)行的監(jiān)控任務(wù)，并確定前一個(gè)時(shí)間片的利用率。如果利用率過高，則應(yīng)發(fā)出警告。如果我們可以使用空閑時(shí)間，那么我們就可以衡量利用率。為了設(shè)置這個(gè)監(jiān)視器

2022-12-06 06:00:31

CUP利用率怎么計(jì)算？

要計(jì)算當(dāng)前CUP利用率，是不是就使能OS_TASK_STAT_EN就可以了，并不要單獨(dú)建立一個(gè)任務(wù)去執(zhí)行OSTaskStat(),是這樣嗎？參看戰(zhàn)艦例程，沒有找到哪里執(zhí)行了OSTaskStat()！

2020-05-18 22:05:37

Post綜合后的利用率只不過是實(shí)施后的利用率？

嗨，Post綜合后的利用率只不過是實(shí)施后的利用率......？謝謝娜文G K.

2020-05-12 08:57:23

Qt6應(yīng)用程序的CPU使用率高是什么原因造成的？怎么解決？

imx6qsabresd 板上運(yùn)行單個(gè) qt6 應(yīng)用程序時(shí)，我可以看到 %CPU 利用率約為 220%，而在運(yùn)行 4 個(gè)類似的應(yīng)用程序時(shí)，每個(gè) CPU 利用率高達(dá) 75%，這看起來確實(shí)很大。在 Irix 模式

2023-05-29 07:39:31

RT-Thread CPU利用率的統(tǒng)計(jì)與測試步驟

1 CPU利用率統(tǒng)計(jì)全速運(yùn)行：不響應(yīng)中斷，也不去執(zhí)行其他任務(wù)，就單純讓它在一個(gè)地方持續(xù)運(yùn)行一段時(shí)間，這個(gè)值可以體現(xiàn)CPU的算力有多大。total_count：單位時(shí)間內(nèi)全速運(yùn)行下的變量值，表現(xiàn)了

2022-05-13 15:27:45

UCOS3的CPU利用率問題怎么解決

我在寫的CPU利用率程序：（改的原子哥的代碼）void census_task(void *p_arg){OS_ERR err;CPU_SR_ALLOC(); CPU_STK_SIZE free

2020-05-20 04:24:40

openEuler 資源利用率提升之道 01：概論

利用率低于 20%，存在巨大的資源浪費(fèi)。因此，提升數(shù)據(jù)中心資源利用率是當(dāng)前急需解決的一個(gè)重要問題[2]。問題成因資源利用率低下的主要原因是任務(wù)和資源調(diào)配失衡，這種失衡又有多種表現(xiàn)形式，例如：調(diào)度系統(tǒng)

2022-07-06 09:54:19

openEuler 資源利用率提升之道 03：rubik 混部引擎簡介

概述在云上業(yè)務(wù)類型和硬件資源越來越豐富的背景下，對(duì)云原生系統(tǒng)提出了更高的管理要求，例如在概論 ^[1]^ 中提到的資源利用率問題，服務(wù)質(zhì)量保障問題，黑盒泛化問題，異構(gòu)算力效率問題等等。為了讓多樣性

2022-09-01 11:00:18

openEuler 資源利用率提升之道 04：CPU 搶占和 SMT 隔離控制

將服務(wù)器的平均利用率保持在較低的水平，使得當(dāng)突發(fā)流量帶來請(qǐng)求洪峰時(shí)，仍有充足資源用于計(jì)算與響應(yīng)，從而避免了請(qǐng)求堆積造成的服務(wù)癱瘓，保證用戶能夠擁有良好的體驗(yàn)。但是這樣做造成了大批的空閑資源浪費(fèi)，提高了維護(hù)

2022-09-22 16:50:09

內(nèi)存之旅——如何提升CMA利用率？

cma_clear_bitmap() 更新 CMA 區(qū)域內(nèi)存使用情況。五、OpenHarmony對(duì)CMA的增強(qiáng)當(dāng)前，CMA 主要存在兩個(gè)問題：CMA 區(qū)域內(nèi)存利用率低。部分 Movable 內(nèi)存無法遷移

2022-03-22 16:26:14

在Vivado 2015.4和ISE 14.7中實(shí)現(xiàn)的相同設(shè)計(jì)之間的資源利用率是否會(huì)有任何差異？

嗨，在Vivado 2015.4和ISE 14.7中實(shí)現(xiàn)的相同設(shè)計(jì)之間的資源利用率是否會(huì)有任何差異？考慮到這樣的事實(shí)，IP在Artix-7 FPGA中重新生成FIFO（版本9.3到13.1）時(shí)鐘向?qū)?/div>

2019-04-24 09:12:08

地圖報(bào)告中沒有設(shè)備利用率

嗨，我試圖在xilinx中合成這個(gè)代碼。雖然合成成功了。但我無法理解為什么MAP REPORT中設(shè)備利用率為0％。謝謝您的幫助。

2020-03-16 10:03:41

如何利用UCOSII中的統(tǒng)計(jì)任務(wù) OS_TaskStat()知道了CPU利用率100%把利用率降下來？

冒昧的問一下各路大神，假如我們利用UCOSII中的統(tǒng)計(jì)任務(wù) OS_TaskStat()知道了CPU利用率100%，則應(yīng)該怎樣操作，把利用率降下來？另外，利用率太高的話會(huì)不會(huì)不太好？

2019-07-12 04:36:16

如何去實(shí)現(xiàn)一種CPU利用率及堆棧檢測統(tǒng)計(jì)

uCOS-III（16） CPU利用率及堆棧檢測統(tǒng)計(jì)基本概念代碼基本概念CPU的利用率是單位時(shí)間內(nèi)cpu在運(yùn)行的時(shí)間百分比。可用于衡量系統(tǒng)設(shè)計(jì)的好壞。可以讓 CPU 在空閑任務(wù)中一直做加法運(yùn)算，假設(shè)

2022-02-18 06:31:24

如何知道CPU利用率和內(nèi)存使用情況？

我在 MIMXRT1062 板上工作，我使用了“EVK-MIMXRT1060-guix_washing_machine”示例。我想要 CPU 利用率和內(nèi)存使用情況。請(qǐng)給我有關(guān)它的信息，我也想知道它是如何計(jì)算的。

2023-03-31 06:21:18

如何獲取棧利用率？

如何獲取棧利用率？

2022-02-16 07:34:32

如何獲得每個(gè)塊的路由資源利用率？

我想知道每個(gè)塊使用的詳細(xì)路由資源。 “設(shè)計(jì)路線狀態(tài)”僅提供整個(gè)設(shè)計(jì)的網(wǎng)絡(luò)總數(shù)。有誰知道如何獲得每個(gè)塊的路由資源利用率（網(wǎng)絡(luò)數(shù)量，交換機(jī)盒等）？

2020-05-21 15:35:14

如何解釋Xilinx ISE的資源利用率數(shù)據(jù)？

旁邊的數(shù)字意味著什么的文檔和資源的指針？具體來說：1）它們各自意味著什么？，2）它們是在VHDL代碼中明確使用的，還是選擇了ISE（例如DSP48的數(shù)量）來實(shí)現(xiàn)我的設(shè)計(jì)？3）如果我的設(shè)計(jì)在上面100％的資源利用率，如何更改我的VHDL代碼以依次減少每個(gè)資源的使用？謝謝！

2020-03-24 10:14:15

怎么查看GPU利用率（Tesla M10 + VMware）

我在三臺(tái)Cisco UCS主機(jī)上安裝了3個(gè)Tesla M10 GPU。它們被用于Horizo??n 7中的一個(gè)池中，覆蓋80多個(gè)獨(dú)立的VM。我的任務(wù)是看看GPU的使用量。當(dāng)我運(yùn)行nvidia-smi

2018-09-30 10:43:36

提升現(xiàn)網(wǎng)網(wǎng)絡(luò)資源的利用率和網(wǎng)絡(luò)承載能力的方法

需要比F小區(qū)A4小。　　表1 覆蓋方案實(shí)施效果　　頻段時(shí)間RRC連接平均數(shù)下行PRB利用率%上行PRB利用率%PDCCH信道CCE占用率%　　F1優(yōu)化前32378.5447.3032.25

2020-12-03 15:40:29

映射過程中映射到FPGA上的LUT時(shí)利用率都會(huì)達(dá)到0％是為什么？

嗨，大家好，我遇到了Xilinx ISE映射過程的棘手問題。當(dāng)我綜合我的設(shè)計(jì)時(shí)，我得到了一些FPGA資源的利用。雖然在映射過程中映射到FPGA上的LUT時(shí)，所有利用率都會(huì)達(dá)到0％。他很可能是由于

2020-06-13 09:57:50

是否可以看到每個(gè)VM的vGPU利用率

我想知道是否可以看到每個(gè)VM的vGPU利用率。不在操作系統(tǒng)內(nèi)，而是來自Grid K1卡。例如，如果GPU 0為80％，那么如果我知道45％的數(shù)字來自特定的VM，那就太棒了。我查看了論壇，但沒有

2018-09-21 11:06:06

毫米波雷達(dá)感應(yīng)模組，智慧停車位探測技術(shù)方案，提升停車空位利用率

，給居民出行帶來了極大的阻礙。相關(guān)數(shù)據(jù)顯示，我國新建停車位發(fā)展緩慢，停車位缺口越來越大；停車位利用率極低，一個(gè)車位的全天利用率平均值在30%左右，與國際先進(jìn)水平80%相差甚遠(yuǎn)。在這樣的背景下，智慧停車

2021-10-14 17:01:17

求大神解答有關(guān)DC中cell的利用率問題

在dc時(shí)綜合過后，report_area看到有cell 177705，面積為710417. 然后導(dǎo)入ICC，利用率設(shè)的0.6，做完floorplan后沒有問題，和DC報(bào)的信息基本一致，后面做完

2021-06-25 06:59:40

靈動(dòng)微課堂 (第138講) | 基于MM32 MCU的OS移植與應(yīng)用——RT-Thread CPU利用率統(tǒng)計(jì)

1. CPU利用率統(tǒng)計(jì)的方法當(dāng)前CPU利用率的統(tǒng)計(jì)，就是在相同時(shí)間內(nèi)，統(tǒng)計(jì)CPU在不調(diào)度的情況下和CPU在調(diào)度情況下的占用時(shí)間比例，得出CPU的空閑比例；那CPU占用率就等于（1 - 空閑率）。2.

2020-09-24 17:57:22

筆記本GS63\GS65的CPU利用率100%或者CPU頻率最高的原因

會(huì)由于WIN10的一些設(shè)置，出現(xiàn)CPU利用率100%情況，或者由此衍生出來的其他情況，也可參考本文，針對(duì)出現(xiàn)的共同問題，用本文方案進(jìn)行調(diào)整。原因：基本上都是因?yàn)槭褂昧宋⑿堑凝埗苤行模碝SI Dra...

2021-12-28 06:15:30

請(qǐng)問32GB Intel Optane內(nèi)存模塊利用率小于32GB的原因是什么？

GB”。缺少的4.7 GB是什么？在“Pinning”（字面翻譯）選項(xiàng)卡中，模塊利用率總和為（ 1.7系統(tǒng)文件+ 0個(gè)固定文件+ 5.4個(gè)用戶文件+ 0.1個(gè)可用空間）= 7.2 GB的總可用空間

2018-10-31 17:23:09

請(qǐng)問一下如何提高無線信道利用率？

影響無線信道利用率的因素有哪些？無線利用率與網(wǎng)絡(luò)質(zhì)量間的關(guān)系是什么？調(diào)整和提高無線信道利用率的建議有哪些？

2021-05-27 06:46:55

逆變器直流電壓利用率精選資料分享

逆變器直流電壓利用率①單相半橋逆變器對(duì)于直流輸入源為Ud的單相半橋逆變器，橋臂間輸出電壓uan波形為頻率f與驅(qū)動(dòng)頻率相同，占空比1/2、幅值1/2UD的方波。傅里葉分解可得uan=2Ud/π(sin

2021-07-09 06:44:25

提高客車生產(chǎn)鋼材利用率的途徑

客車是消耗鋼材較多的機(jī)電產(chǎn)品。多年來, 客車生產(chǎn)企業(yè)的鋼材利用率普遍較低, 致使產(chǎn)品成本較高, 經(jīng)濟(jì)效益較差。因此, 筆者就如何提高鋼材利用率、降低客車生產(chǎn)成本、提高經(jīng)濟(jì)

2009-07-25 16:16:03

DS31256的PCI總線利用率

要：本應(yīng)用筆記說明了如何計(jì)算DS31256 HDLC控制器的總線帶寬。并展示了一個(gè)實(shí)驗(yàn)室實(shí)測的結(jié)果。同時(shí)演示了一個(gè)總線利用率速算表，該速算表如果需要可以索要。

2009-04-18 11:24:11

1181

活性物質(zhì)利用率

活性物質(zhì)利用率 電池具有活性物質(zhì)的量與按法拉弟定律計(jì)算應(yīng)產(chǎn)生的電量稱為理論容量。要求電極給出一定的電量時(shí)，電極的活性物質(zhì)利用率可表示為

2009-11-06 11:02:42

2069

專家談如何提高服務(wù)器利用率

專家談如何提高服務(wù)器利用率 　如今，數(shù)據(jù)中心節(jié)能已成為熱點(diǎn)話題，為減少功耗，各大廠商紛紛推出相應(yīng)產(chǎn)品和解決方案。近日，Microsoft的utility

2010-01-27 11:46:23

651

什么是數(shù)據(jù)通信的頻帶利用率

什么是數(shù)據(jù)通信的頻帶利用率 系統(tǒng)效率單從信道的信息傳輸速率來評(píng)價(jià)是不夠的，而還要用系統(tǒng)信道中單位頻帶內(nèi)所實(shí)現(xiàn)的信息傳輸速率來衡量。

2010-03-17 17:23:40

7498

較高頻帶利用率的無線傳輸數(shù)字調(diào)制

文中對(duì)VWDK的調(diào)制方式進(jìn)行了理論分析,并給出了功率譜計(jì)算機(jī)仿真圖。對(duì)VWDK的頻帶利用率進(jìn)行估計(jì),給出了VWDK傳輸系統(tǒng)設(shè)計(jì)方案。

2011-10-19 15:15:36

pcb開料算利用率下載

資料介紹說明 PCB開料軟件，可算出板料利用率與做成品個(gè)算，有破解文件，可長期使用詳細(xì)看下圖：

2012-11-03 11:48:54

138

IHS：全球面板廠產(chǎn)能利用率維持在90%

市調(diào)機(jī)構(gòu)IHS今天表示，全球面板廠2016第4季的產(chǎn)能利用率將提升到90%的高檔，2017年第1季進(jìn)入淡季，將降到85%至90%，但仍較2016年第1季成長5%至10%，由于庫存仍在健康狀態(tài)，預(yù)期面板廠產(chǎn)能利用率不會(huì)大幅下降，仍維持在一定水準(zhǔn)。

2016-11-18 10:37:02

884

關(guān)于Swarm和Mesos資源利用率優(yōu)化實(shí)踐分析

在資源調(diào)度領(lǐng)域的優(yōu)秀經(jīng)驗(yàn)，以及他們?cè)贛esos社區(qū)為提升Mesos資源利用率而正在進(jìn)行的實(shí)踐活動(dòng)，深度剖析了Mesos資源的收集和調(diào)度原理，以及如何在Mesos中提供Revocable資源來提高M(jìn)esos

2017-10-10 11:54:22

安全約束的未來輸電網(wǎng)利用率評(píng)估

，在基于蒙特卡羅仿真的概率潮流計(jì)算過程中，引入考慮安全約束的發(fā)電調(diào)度算法，通過對(duì)未來輸電網(wǎng)運(yùn)行狀態(tài)的大量仿真，計(jì)算輸電設(shè)備的利用率指標(biāo)。利用IEEE RTS 24節(jié)點(diǎn)系統(tǒng)對(duì)本文提出的方法進(jìn)行驗(yàn)證，并定量分析了安全約束發(fā)電調(diào)度

2018-01-18 14:18:49

采用發(fā)電量可利用率指標(biāo)的意義

這是我們所熟悉的可利用率指標(biāo)，以時(shí)間為統(tǒng)計(jì)對(duì)象，根據(jù)將外部原因導(dǎo)致停機(jī)視為可用和不可用，區(qū)分為綜合發(fā)電小時(shí)可利用率(GHA)和技術(shù)發(fā)電小時(shí)可利用率(THA)。

2018-05-10 15:46:15

8835

如何檢查Linux中的磁盤利用率？

跟蹤磁盤利用率信息是系統(tǒng)管理員（和其他人）的日常待辦事項(xiàng)列表之一。Linux 有一些內(nèi)置的使用程序來幫助提供這些信息。

2018-07-25 15:18:13

5067

最大利用率的LED燈電路

這款LED燈只用三只晶體管，僅需0.71V電壓便可啟動(dòng)LED發(fā)光，一節(jié)5號(hào)堿性電池可供此燈連續(xù)點(diǎn)亮170小時(shí)，極大限度地提高了電池的利用率。

2019-02-07 05:28:00

3189

cpu利用率異常排查實(shí)踐與總結(jié)

昨天下午突然收到運(yùn)維郵件報(bào)警，顯示數(shù)據(jù)平臺(tái)服務(wù)器cpu利用率達(dá)到了98.94%，而且最近一段時(shí)間一直持續(xù)在70%以上，看起來像是硬件資源到瓶頸需要擴(kuò)容了，但仔細(xì)思考就會(huì)發(fā)現(xiàn)這個(gè)利用率有點(diǎn)太夸張，一定是哪里的業(yè)務(wù)代碼邏輯有問題。

2018-11-15 15:33:51

3448

STM32家族迎來新成員 STM32G0的I/O利用率超93%

STM32家族迎來新成員：STM32G0系列，I/O利用率超93%，內(nèi)置1%精度RC振蕩器的主流型MCU。

2019-01-04 09:35:28

7605

聯(lián)電第4季產(chǎn)能利用率逾9成并看好明年RF SOI的8英寸營收占比將達(dá)雙位數(shù)

晶圓代工廠聯(lián)電第4季受惠客戶需求回溫，產(chǎn)能利用率逾9成，法人估營收將季增1成，明年首季雖然適逢淡季，但受惠產(chǎn)能利用率持續(xù)提升，營收可望持平第4季，并看好明年RF SOI的8英寸營收占比將達(dá)雙位數(shù)，整體8英寸晶圓代工產(chǎn)能利用率將持續(xù)拉升。

2019-12-26 13:57:38

1988

中芯國際表示疫情期間產(chǎn)能利用率達(dá)到100%

3月2日，報(bào)道稱國內(nèi)最大的晶圓代工廠中芯國際表示，疫情期間公司生產(chǎn)經(jīng)營正常，產(chǎn)能利用率100%，在京員工零感染。

2020-03-21 09:02:37

3463

需求下滑導(dǎo)致臺(tái)積電28nm和40/45nm產(chǎn)能利用率下滑

據(jù)國外媒體報(bào)道，由于需求下滑，芯片代工商臺(tái)積電28nm、40/45nm的產(chǎn)能利用率有下滑。

2020-04-15 14:44:58

3348

2020上半年國家電網(wǎng)風(fēng)電、太陽能發(fā)電利用率達(dá)98.7%

據(jù)最新統(tǒng)計(jì)，今年1-6月國家電網(wǎng)有限公司經(jīng)營區(qū)風(fēng)電、太陽能發(fā)電量合計(jì)2947億千瓦時(shí)，同比增長15%，占總發(fā)電量的比例達(dá)11.4%，同比提高1.6個(gè)百分點(diǎn)。風(fēng)電、太陽能發(fā)電利用率96.9%，同比提高0.9個(gè)百分點(diǎn)。按照國家能源局要求，剔除一季度疫情影響后，利用率98.7%。

2020-07-10 17:32:16

1031

如何看待TMS推出高利用率RamSan閃存陣列

許多競爭對(duì)手如Violin Memory之前曾批評(píng)TMS RamSan閃存SAN陣列不能提供企業(yè)運(yùn)行業(yè)務(wù)關(guān)鍵應(yīng)用時(shí)所需求的高利用率功能。

2020-07-24 15:13:38

611

吉林省新能源發(fā)電量利用率達(dá)98.3%，五年內(nèi)提升29.1%

增長6.9%。國網(wǎng)吉林電力新能源利用率達(dá)98.3%（風(fēng)電利用率98.27%、光伏利用率98.34%），同比提升1個(gè)百分點(diǎn)。風(fēng)電利用小時(shí)數(shù)1293小時(shí)，光伏利用小時(shí)數(shù)897小時(shí)。

2020-08-04 16:05:26

1719

在freeRTOS環(huán)境下，如何用STM32配合CubeMonitor快速獲取CPU利用率

1. 摘要本篇筆記主要介紹，在freeRTOS環(huán)境下，以STM32為例介紹如何快速獲取CPU利用率，配合CubeMonitor測試 2. 準(zhǔn)備工作 1， IAR 8.32.1

2020-10-22 14:04:55

3658

日本LCD面板制造商的晶圓廠產(chǎn)能利用率大幅提高

據(jù)臺(tái)灣電子時(shí)報(bào)援引業(yè)內(nèi)人士消息報(bào)道，由于對(duì)IT和電視應(yīng)用的面板需求強(qiáng)勁，日本LCD面板制造商的晶圓廠產(chǎn)能利用率大幅提高，但晶圓廠產(chǎn)能利用率能否持續(xù)維持高利用率尚待觀察。消息人士透露，華為遭遇美國

2020-11-04 16:22:13

2060

深度學(xué)習(xí)的GPU共享工作

當(dāng)前機(jī)器學(xué)習(xí)訓(xùn)練中，使用GPU提供算力已經(jīng)非常普遍，對(duì)于GPU-based AI system的研究也如火如荼。在這些研究中，以提高資源利用率為主要目標(biāo)的GPU共享(GPU sharing)是當(dāng)下

2020-11-27 10:06:21

3270

如何增加半導(dǎo)體產(chǎn)能利用率?

為了滿足當(dāng)前全球芯片短缺期間不斷增長的需求，半導(dǎo)體行業(yè)正在大幅提高其晶圓廠產(chǎn)能利用率，該術(shù)語是指在任何給定時(shí)間使用的總可用制造能力的百分比。但是，提高半導(dǎo)體容量利用率需要時(shí)間。這并不像“翻轉(zhuǎn)開關(guān)”并在一夜之間增加芯片輸出那樣容易。

2021-03-01 15:07:56

2422

半導(dǎo)體行業(yè)正在大幅提高其晶圓廠產(chǎn)能利用率

當(dāng)市場需求高漲時(shí)，例如像現(xiàn)在這樣的周期性市場回升中，前端半導(dǎo)體制造設(shè)施或晶圓廠的產(chǎn)能利用率通常會(huì)超過80％，而某些個(gè)別晶圓廠的產(chǎn)能利用率可能會(huì)高達(dá)90-100％。

2021-03-05 11:51:13

2107

新型紅外光助力提升農(nóng)藥的有效利用率

據(jù)介紹，該工作為控制農(nóng)藥流失、提高農(nóng)藥利用率提供了一種新途徑，對(duì)保護(hù)農(nóng)業(yè)生態(tài)環(huán)境以及促進(jìn)綠色農(nóng)業(yè)可持續(xù)發(fā)展具有重要意義。相關(guān)成果已被農(nóng)業(yè)領(lǐng)域核心期刊Journal of Agricultural and Food Chemistry接收發(fā)表。

2021-06-19 10:16:54

1343

華為發(fā)布SD-WAN逐包負(fù)載分擔(dān)方案提升帶寬利用率

華為SD-WAN逐包負(fù)載分擔(dān)方案，提升帶寬利用率至90%，讓您的廣域網(wǎng)絡(luò)更加高效。

2021-10-15 16:44:53

2359

棧利用率的獲取

棧用于保存變量, 隨著函數(shù)調(diào)用深度和變量的數(shù)量而變化. 設(shè)置小了會(huì)出現(xiàn)棧溢出, 設(shè)置大了會(huì)浪費(fèi).利用率獲取RT-THREAD的統(tǒng)計(jì)方法是將線程棧都填充為’#’, 當(dāng)需要的時(shí)候, 檢查是否被修改為其他

2021-12-20 19:03:56

uCOS-III(16) CPU利用率及堆棧檢測統(tǒng)計(jì)

2021-12-23 19:54:02

GS63風(fēng)扇狂轉(zhuǎn)&CPU利用率100%&PC電源方案設(shè)置

，也會(huì)由于WIN10的一些設(shè)置，出現(xiàn)CPU利用率100%情況，或者由此衍生出來的其他情況，也可參考本文，針對(duì)出現(xiàn)的共同問題，用本文方案進(jìn)行調(diào)整。原因：基本上都是因?yàn)槭褂昧宋⑿堑凝埗苤行模碝SI Dra...

2022-01-05 15:03:06

CPU利用率過高的原因是什么

進(jìn)程來介紹CPU資源使用率為什么會(huì)達(dá)到那么高，以幫助大家排除服務(wù)器CPU使用率高的種種疑惑。一、硬件因素以下分別從CPU溫度，CPU超線程，硬件配置，硬件驅(qū)動(dòng)和待機(jī)方面分析。 1、CPU溫度過高如果CPU風(fēng)扇散熱不好，會(huì)導(dǎo)致CPU溫度太高，使C

2022-03-10 09:28:13

21221

提高Kubernetes的GPU利用率

　　在處理多個(gè) CUDA 應(yīng)用程序時(shí)，每個(gè)應(yīng)用程序都可能沒有充分利用 GPU 的資源，您可以使用簡單的超額訂閱策略來利用 GPU 的時(shí)間切片調(diào)度器。

2022-06-21 15:46:27

1920

高速激光熔覆粉末利用率與哪些因素有關(guān)?

成本占激光熔覆加工總成本的80%-90%，因此，提高粉末利用率是高速激光熔覆要解決的重要技術(shù)問題。為此，我們必須弄清楚高速激光熔覆的粉末利用率與哪些因素有關(guān)，下面對(duì)這些因素進(jìn)行一一探討，并討論如何提高高速激光熔覆的粉末

2022-08-19 14:34:46

840

臺(tái)積電7nm產(chǎn)能利用率下滑

臺(tái)積電7nm產(chǎn)能利用率下滑業(yè)界傳出消息說臺(tái)積電7 納米的產(chǎn)能利用率已跌至50% 以下，2023 年首季跌勢加劇，高雄7 納米擴(kuò)產(chǎn)亦已暫緩。對(duì)此消息臺(tái)積電表示不予置評(píng)。行業(yè)人士認(rèn)為臺(tái)積電高雄7nm

2022-11-16 17:31:11

3174

設(shè)計(jì)Zn2+溶劑化結(jié)構(gòu)/殼層提高鋅負(fù)極容量利用率

水系鋅離子電池具有大規(guī)模儲(chǔ)能潛力。然而，在水系電解質(zhì)中存在活性水分子易引起副反應(yīng)(腐蝕/死鋅/枝晶)，使鋅利用率較低。基于此，引入環(huán)丁砜(SL)到電解質(zhì)中構(gòu)造一種Zn2+溶劑化結(jié)構(gòu)/殼層，減少鋅負(fù)極副反應(yīng)，提高鋅負(fù)極容量利用率，意義非凡。

2022-11-28 10:17:41

1298

openEuler資源利用率提升之道：虛擬機(jī)混部介紹與功耗管理技術(shù)

隨著云計(jì)算市場規(guī)模的快速增長，各云廠商基礎(chǔ)設(shè)施投入也不斷增加，但行業(yè)普遍存在資源利用率低的問題，在上述背景下，提升資源利用率已經(jīng)成為了一個(gè)重要的技術(shù)課題。

2023-01-13 15:10:42

573

GPU利用率低常見原因分析及優(yōu)化

本文的 GPU 利用率主要指 GPU 在時(shí)間片上的利用率，即通過 nvidia-smi 顯示的 GPU-util 這個(gè)指標(biāo)。統(tǒng)計(jì)方式為：在采樣周期內(nèi)，GPU 上面有 kernel 執(zhí)行的時(shí)間百分比。

2023-04-04 09:52:32

2530

全球顯示面板廠家2023年第二季產(chǎn)能利用率回升至74%，然而OLED生產(chǎn)商平均未達(dá)60%

家的總產(chǎn)能利用率正從2023年第一季的66%回升至第二季的74%。然而，OLED面板生產(chǎn)商在提高產(chǎn)能利用率方面仍面臨挑戰(zhàn)，預(yù)計(jì)2023上半年OLED生產(chǎn)商的平均產(chǎn)能利用率將不足60%。 ? 依照主要應(yīng)用分類之工廠利用率 2022年的供過于求導(dǎo)致LCD和OLED工廠的產(chǎn)能利用率嚴(yán)重受創(chuàng)。繼2023年第一季

2023-04-18 16:30:56

758

GPU利用率低的本質(zhì)原因

最近經(jīng)常有同學(xué)反饋 GPU 利用率低，嚴(yán)重浪費(fèi) GPU 資源的問題，經(jīng)過對(duì)一些實(shí)例分析后，借著這篇文檔和大家分享一下解決方案，希望能對(duì)使用 GPU 的同學(xué)有些幫助。一、GPU 利用率的定義本文

2023-06-19 14:07:03

645

廣凌科技：構(gòu)建預(yù)約管理系統(tǒng)，助力高校資源利用率

廣凌科技基于此現(xiàn)象，應(yīng)用信息化管理手段，構(gòu)建廣凌預(yù)約管理系統(tǒng)，有效協(xié)助教室、座位、會(huì)議室、實(shí)訓(xùn)室以及公共場所等的使用進(jìn)行規(guī)范化、實(shí)時(shí)化管理，協(xié)助各大高校提高資源利用率。

2022-06-20 09:15:46

272

頻分復(fù)用可以提高通信線路的利用率？

頻分復(fù)用可以提高通信線路的利用率？? 頻分復(fù)用，英文名為Frequency Division Multiplexing（FDM），是一種多路復(fù)用技術(shù)，它可以將多個(gè)低速信號(hào)合成成一個(gè)高速信號(hào)進(jìn)行傳輸

2023-09-01 15:38:15

802

SPWM直流電壓利用率之過調(diào)制

本文學(xué)習(xí)介紹前面幾部分還未解決的重要問題提高直流電壓利用率之過調(diào)制。

2023-10-18 12:49:29

1482

利用率達(dá)到100%的SVPWM控制算法介紹

在Part4中得到SPWM在理想情況下調(diào)制比為1，直流電壓利用率為0.866即86.6%，電壓利用率也不高，還有13.4%的母線電壓沒有利用到。

2023-10-18 15:01:53

1506

晶圓代工產(chǎn)能利用率下降，降價(jià)大戰(zhàn)一觸即發(fā)

晶圓代工行業(yè)正面臨產(chǎn)能利用率的重大挑戰(zhàn)，據(jù)悉，聯(lián)電、世界先進(jìn)和力積電等主要代工廠紛紛降低明年首季的報(bào)價(jià)，幅度高達(dá)兩位數(shù)百分比，項(xiàng)目客戶降幅更高達(dá)15%至20%，各大晶圓代工廠深陷產(chǎn)能利用率六成保衛(wèi)戰(zhàn)。

2023-11-13 17:17:39

530

全球晶圓廠利用率，將降至67%

盡管情況有所改善，但芯片制造指標(biāo)仍然疲軟，預(yù)計(jì) 2023 年第四季度晶圓廠利用率將降至 67%，部分原因是庫存消耗增加了銷售額。因此，預(yù)計(jì) 2023 年下半年資本支出將下降。

2023-11-15 17:08:20

393

產(chǎn)能利用率低迷，傳臺(tái)積電7nm將降價(jià)10%！

早在今年10月的法說會(huì)上，臺(tái)積電總裁魏哲家就曾被外資當(dāng)面詢問7nm產(chǎn)能利用率不斷下滑的問題，臺(tái)積電7nm在總營收當(dāng)中的占比持續(xù)滑落，從第二季度的23%降至了第三季度17%，相比去年同期的26%更是下跌了近10個(gè)百分點(diǎn)。

2023-12-04 17:16:03

440

GPU占用率低的原因和解決方法

可能會(huì)遇到GPU占用率低的情況，這可能會(huì)造成性能下降和資源浪費(fèi)。本文將探討GPU占用率低的原因，并提出解決方法，以幫助我們充分利用GPU的計(jì)算能力。一、原因分析： 1. GPU計(jì)算任務(wù)不足：GPU通常被用于處理圖像、視頻和3D計(jì)算等復(fù)雜任務(wù)。如果當(dāng)前計(jì)算任務(wù)簡單，對(duì)GPU的計(jì)算需求較低

2023-12-09 14:32:26

5644