精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CVPR 2023:基于可恢復(fù)性度量的少樣本剪枝方法

jf_pmFSk4VX ? 來(lái)源:GiantPandaCV ? 2023-05-10 14:56 ? 次閱讀

2. 引言

近年來(lái),卷積神經(jīng)網(wǎng)絡(luò)(CNNs)取得了顯著的成功,但較高的計(jì)算成本阻礙了其實(shí)際應(yīng)用部署。為了實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)加速,許多模型壓縮方法被提出,如模型剪枝、知識(shí)蒸餾和模型量化。然而,大多數(shù)早期方法依賴于原始訓(xùn)練集(即所有訓(xùn)練數(shù)據(jù))來(lái)恢復(fù)模型的準(zhǔn)確性。然而,在數(shù)據(jù)隱私保護(hù)或?qū)崿F(xiàn)快速部署等場(chǎng)景中,可能只有稀缺的訓(xùn)練數(shù)據(jù)可用于模型壓縮。

例如,客戶通常要求算法提供商加速其CNN模型,但由于隱私問題,無(wú)法提供全部訓(xùn)練數(shù)據(jù)。只能向算法提供商提供未壓縮的原始模型和少量訓(xùn)練樣本。在一些極端情況下,甚至不提供任何數(shù)據(jù)。算法工程師需要自行合成圖像或收集一些域外的訓(xùn)練圖像。因此,僅使用極少樣本甚至零樣本情況下的模型剪枝正成為亟待解決的關(guān)鍵問題。

在這種少樣本壓縮場(chǎng)景中,大多數(shù)先前的工作采用了濾波器級(jí)剪枝。然而,這種方法在實(shí)際計(jì)算設(shè)備(如GPU)上無(wú)法實(shí)現(xiàn)高加速比。在沒有整個(gè)訓(xùn)練數(shù)據(jù)集的情況下,過往方法也很難恢復(fù)壓縮模型的準(zhǔn)確性。為解決上述問題,本文提出了三大改進(jìn):

關(guān)注延遲-準(zhǔn)確性的權(quán)衡而非FLOPs-準(zhǔn)確性

在少樣本壓縮場(chǎng)景中,塊級(jí)(block-level)剪枝在本質(zhì)上優(yōu)于濾波器級(jí)(filter-level)。在相同的延遲下,塊級(jí)剪枝可以保留更多原始模型的容量,其準(zhǔn)確性更容易通過微小的訓(xùn)練集恢復(fù)。如圖 1 所示,丟棄塊在延遲-準(zhǔn)確性權(quán)衡方面明顯優(yōu)于以前的壓縮方案。

提出“可恢復(fù)性”度量指標(biāo),代替過往“低損害性”度量指標(biāo)[1]。具體來(lái)講,過往很多剪枝方法優(yōu)先剪去對(duì)最終 loss 影響最小的模塊,而本文優(yōu)先剪去最易通過微調(diào)恢復(fù)性能的模塊。

184f0f00-ee6f-11ed-90ce-dac502259ad0.png

圖 1. 僅使用 500 個(gè)訓(xùn)練圖像的不同壓縮方案比較,Block-level 優(yōu)于 filter-level。

圖 1. 僅使用 500 個(gè)訓(xùn)練圖像的不同壓縮方案比較,Block-level 優(yōu)于 filter-level。

本文提出了PRACTISE(Practical networkacceleration withtinysets of images),以有效地使用少量數(shù)據(jù)加速網(wǎng)絡(luò)。PRACTISE 明顯優(yōu)于先前的少樣本剪枝方法。對(duì)于22.1%的延遲減少,PRACTISE 在 ImageNet-1k 上的 Top-1 準(zhǔn)確性平均超過先前最先進(jìn)方法 7.0%(百分點(diǎn),非相對(duì)改進(jìn))。它還具有很強(qiáng)的魯棒性和泛化能力,可以應(yīng)用于合成/領(lǐng)域外圖像。

3. 方法

1886e542-ee6f-11ed-90ce-dac502259ad0.png

圖 2. PRACTISE 算法偽代碼

圖 2. PRACTISE 算法偽代碼

本文所提出的方法思想非常樸素——即依次模擬每個(gè)塊去掉后的恢復(fù)效果,按照推理延遲的提速需求,去掉最易恢復(fù)的塊,最后再在少樣本數(shù)據(jù)集上微調(diào)。該方法有三個(gè)細(xì)節(jié)值得講一講:可恢復(fù)性度量指標(biāo)、評(píng)估可恢復(fù)性的過程和少樣本微調(diào)過程。

3.1 可恢復(fù)性度量指標(biāo)

18bb5d9a-ee6f-11ed-90ce-dac502259ad0.png

圖 3. 不同層微調(diào)前后的誤差及不同度量指標(biāo)的數(shù)值對(duì)比

圖 3. 不同層微調(diào)前后的誤差及不同度量指標(biāo)的數(shù)值對(duì)比

為了進(jìn)一步改進(jìn)塊剪枝,本文研究了選擇要丟棄哪些塊的策略,特別是在僅有少量訓(xùn)練樣本的情況下。作者注意到盡管丟棄某些塊會(huì)顯著改變特征圖,但它們很容易通過端到端微調(diào)(甚至使用極少的訓(xùn)練集)恢復(fù)。因此,簡(jiǎn)單地測(cè)量剪枝/原始網(wǎng)絡(luò)之間的差異是不合理的。為了解決這些問題,本文提出了一種新的概念,即可恢復(fù)性,以更好地指示要丟棄的塊。該指標(biāo)用于衡量修剪后的模型恢復(fù)精度的能力,相較于過去的低損害性指標(biāo),該指標(biāo)更能反映“哪些模塊更應(yīng)該被剪去“。圖 3 表明可恢復(fù)性指標(biāo)幾乎完美預(yù)測(cè)了微調(diào)后網(wǎng)絡(luò)的誤差。可恢復(fù)性計(jì)算公式可定義為:

其中, 是原始模型, 是丟棄 塊后的模型, 是模型參數(shù), 表示排除 的參數(shù), 為適配器參數(shù),適配器用于模擬恢復(fù)過程,只包括線性算子。

另一個(gè)影響因素是不同塊的延遲差異,在具有相同可恢復(fù)性的情況下,較高延遲的塊應(yīng)該被優(yōu)先丟棄,因此可定義加速比為:

最終的剪枝重要性得分為:

3.2 評(píng)估可恢復(fù)性的過程

1900f760-ee6f-11ed-90ce-dac502259ad0.png

圖 4. 塊丟棄及評(píng)估過程的模型結(jié)構(gòu)圖

圖 4. 塊丟棄及評(píng)估過程的模型結(jié)構(gòu)圖

在評(píng)估階段,PRACTISE 算法將依次去掉每一個(gè)塊,在去掉 塊后將在它之前的層后插入適配器,在之后的層前插入適配器,適配器均為 的卷積層。由于卷積操作是線性的,所有適配器都可以和相鄰的卷積層融合(如圖 4 右側(cè)所示),同時(shí)保持輸出不變。在評(píng)估階段,算法將凍結(jié)模型參數(shù),在少樣本數(shù)據(jù)集上更新適配器參數(shù),對(duì)比不同塊去掉后在相同訓(xùn)練輪次下的恢復(fù)損失,作為其可恢復(fù)性度量。

3.3 少樣本微調(diào)過程

最簡(jiǎn)單的微調(diào)方法就是利用交叉熵?fù)p失。然而,正如先前的工作指出的那樣,修剪后的模型很容易受到過擬合的影響[2]。因此本文采用知識(shí)蒸餾中的特征蒸餾來(lái)緩解過擬合問題,同時(shí)這樣的微調(diào)方法也可以在合成數(shù)據(jù)和域外數(shù)據(jù)上實(shí)現(xiàn)少樣本微調(diào)。具體微調(diào)損失函數(shù)為:

4. 實(shí)驗(yàn)

少樣本剪枝性能對(duì)比:如表 1 所示,PRACTISE 以顯著優(yōu)勢(shì)超過其余所有方法,最多提升了 7%的 Top-1 準(zhǔn)確率。該表也說(shuō)明,對(duì)于少樣本數(shù)據(jù)集來(lái)說(shuō),丟棄塊的延遲-準(zhǔn)確率權(quán)衡性價(jià)比優(yōu)于濾波器級(jí)剪枝。

19188d76-ee6f-11ed-90ce-dac502259ad0.png

表 1. ResNet-34 在 ImageNet-1k 上的 Top-1/Top-5 準(zhǔn)確率對(duì)比(Baseline 為 73.31%/91.42%)

表 1. ResNet-34 在 ImageNet-1k 上的 Top-1/Top-5 準(zhǔn)確率對(duì)比(Baseline 為 73.31%/91.42%)

Data-free 剪枝方法對(duì)比:表 2 顯示,在合成數(shù)據(jù)上,PRACTISE 也取得了最優(yōu)的延遲-準(zhǔn)確率權(quán)衡(更低延遲下更高性能)。

1932b098-ee6f-11ed-90ce-dac502259ad0.png

表 2. data-free 剪枝方法在 ImageNet-1k 上的性能對(duì)比

表 2. data-free 剪枝方法在 ImageNet-1k 上的性能對(duì)比

域外數(shù)據(jù)剪枝結(jié)果:如表 3 所示,PRACTISE 在域外數(shù)據(jù)上也有很強(qiáng)的魯棒性和泛化性。

194ea0be-ee6f-11ed-90ce-dac502259ad0.png

表 3. 域外訓(xùn)練數(shù)據(jù)下 ImageNet-1k 的剪枝性能展示

表 3. 域外訓(xùn)練數(shù)據(jù)下 ImageNet-1k 的剪枝性能展示

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 濾波器
    +關(guān)注

    關(guān)注

    160

    文章

    7728

    瀏覽量

    177685
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4599

    瀏覽量

    92643
  • 卷積神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    4

    文章

    366

    瀏覽量

    11851

原文標(biāo)題:CVPR 2023:基于可恢復(fù)性度量的少樣本剪枝方法

文章出處:【微信號(hào):GiantPandaCV,微信公眾號(hào):GiantPandaCV】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    可恢復(fù)保險(xiǎn)絲的工作原理

    可恢復(fù)保險(xiǎn)絲的工作原理 可恢復(fù)保險(xiǎn)絲是由高分子聚合物及導(dǎo)電材料等混合制成的,所以又把它稱為聚合開關(guān)。在正常狀態(tài)下,聚合物成結(jié)晶狀結(jié)構(gòu),導(dǎo)電材料通過
    發(fā)表于 09-19 17:56 ?3784次閱讀

    可恢復(fù)保險(xiǎn)絲的動(dòng)作原理及溫度對(duì)其的影響

    可恢復(fù)保險(xiǎn)絲的動(dòng)作原理及溫度對(duì)其的影響   RF/WHP
    發(fā)表于 11-28 10:54 ?2456次閱讀

    可恢復(fù)保險(xiǎn)絲是與自恢復(fù)保險(xiǎn)絲異同點(diǎn)

    `由經(jīng)過特殊處理的聚合樹脂(Polymer)及分布在里面的導(dǎo)電粒子(Carbon Black)組成。在正常操作下聚合樹脂緊密地將導(dǎo)電粒子束縛在結(jié)晶狀的結(jié)構(gòu)外,構(gòu)成鏈狀導(dǎo)電電通路,此時(shí)可恢復(fù)保險(xiǎn)絲為低
    發(fā)表于 04-26 15:14

    熔斷保險(xiǎn)絲和自恢復(fù)保險(xiǎn)絲性能差異

    恢復(fù)保險(xiǎn)絲的應(yīng)用范圍就相對(duì)比較小些。 最后,保險(xiǎn)絲的可恢復(fù)性,熔斷保險(xiǎn)絲無(wú)恢復(fù)性能,而自恢復(fù)保險(xiǎn)絲的特點(diǎn)就是其可恢復(fù)性能。由于自
    發(fā)表于 03-19 14:12

    可恢復(fù)保險(xiǎn)絲工作原理_可恢復(fù)保險(xiǎn)絲選擇方法

    大電流排除后或過熱現(xiàn)象消除后,元件中的導(dǎo)電鏈又重新建立,元件恢復(fù)到正常的低阻狀態(tài)。  圖1可恢復(fù)保險(xiǎn)絲的工作原理示意圖  可恢復(fù)保險(xiǎn)絲的選擇方法  根據(jù)PCB設(shè)計(jì)空間安裝的要求,確定D
    發(fā)表于 05-02 15:51

    RXE系列可恢復(fù)保險(xiǎn)絲主要參數(shù)是什么

    RXE系列可恢復(fù)保險(xiǎn)絲主要參數(shù)是什么
    發(fā)表于 05-12 06:27

    JDT可恢復(fù)保險(xiǎn)絲的原理是什么?有什么應(yīng)用?

    JDT可恢復(fù)保險(xiǎn)絲的原理是什么?有什么應(yīng)用?
    發(fā)表于 06-08 06:35

    可恢復(fù)保險(xiǎn)絲的特性

    可恢復(fù)保險(xiǎn)絲的特性 1. 阻抗與溫度特性可恢復(fù)保險(xiǎn)絲的阻抗與溫度特性曲線如圖8-9 所示。在1-2 點(diǎn)之間,由于流過元件的電流較小或環(huán)境溫度較低,元件產(chǎn)生的
    發(fā)表于 09-19 17:56 ?2382次閱讀

    膠體電池極板耐硫化、恢復(fù)性好的機(jī)理

    膠體電池極板耐硫化、恢復(fù)性好的機(jī)理 AGM型鉛酸蓄電池本身是貧液式設(shè)計(jì),在電池發(fā)生深度放電甚至過放電等濫用情況之后,電解液中的離子濃度會(huì)變
    發(fā)表于 11-06 09:03 ?1163次閱讀

    缺陷樣本的PCB焊點(diǎn)智能檢測(cè)方法_盧盛林

    缺陷樣本的PCB焊點(diǎn)智能檢測(cè)方法_盧盛林
    發(fā)表于 02-07 16:59 ?4次下載

    基于噴泉碼的數(shù)據(jù)恢復(fù)系統(tǒng)

    云存儲(chǔ)服務(wù)作為一種新的數(shù)據(jù)存儲(chǔ)和管理服務(wù)擁有便攜易用的特點(diǎn),但也伴隨著一個(gè)重要問題:如何確保數(shù)據(jù)的完整性和可恢復(fù)性。為了解決此問題,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于噴泉碼的數(shù)據(jù)恢復(fù)系統(tǒng)。該方案采用噴泉碼對(duì)數(shù)
    發(fā)表于 02-02 10:44 ?0次下載

    可恢復(fù)保險(xiǎn)絲工作原理_可恢復(fù)保險(xiǎn)絲選擇方法

    本文開始介紹了可恢復(fù)保險(xiǎn)絲的概念,其次闡述了可恢復(fù)保險(xiǎn)絲的工作原理和可恢復(fù)保險(xiǎn)絲的選擇方法,最后介紹了可恢復(fù)保險(xiǎn)絲應(yīng)用范圍。
    發(fā)表于 03-20 14:12 ?9196次閱讀

    中興處于“恢復(fù)性增長(zhǎng)”中 各個(gè)業(yè)務(wù)板塊的表現(xiàn)差異比較大

    視為相對(duì)中興去年上半年業(yè)績(jī)的恢復(fù)性增長(zhǎng),且毛利率達(dá)到39.21%,比去年同期上升了39.21%。但從營(yíng)收總量上看,距離2017年上半年540.11億元的高點(diǎn)還有近百億元的差距。
    的頭像 發(fā)表于 08-29 10:02 ?2120次閱讀

    高難度燒斷管腳的芯片如何解密?

    單片機(jī)通過燒斷管腳來(lái)加密的方法有通過編程器燒斷芯片管腳實(shí)現(xiàn)OTP不可恢復(fù)性加密,電壓型燒斷腳加密及采用特殊物理方法斷腳加密這3種方法
    的頭像 發(fā)表于 12-28 14:27 ?1004次閱讀

    48V電源系統(tǒng)可恢復(fù)eFuse的設(shè)計(jì)秘訣,在這里!

    48V電源系統(tǒng)可恢復(fù)eFuse的設(shè)計(jì)秘訣,在這里!
    的頭像 發(fā)表于 12-05 10:09 ?737次閱讀
    48V電源系統(tǒng)<b class='flag-5'>可恢復(fù)</b>eFuse的設(shè)計(jì)秘訣,在這里!