精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

北京郵電大學的研究人員開發了一種AI模型壓縮算法

DPVg_AI_era ? 來源:lq ? 2019-07-07 08:16 ? 次閱讀

來自北京郵電大學的研究人員開發了一種AI模型壓縮算法,可以讓深度學習的運算不再依賴高昂的計算和存儲設備,保持模型的識別精度無損的前提下,顯著降低模型的計算復雜度,本文帶來技術解讀。

人工智能在眾多計算機視覺領域都取得了很大的成功,然而深度學習(Deep Learning)因其計算復雜度或參數冗余,在一些場景和設備上限制了相應的模型部署,需要借助模型壓縮、優化加速、異構計算等方法突破瓶頸。

研究人員稱,模型壓縮算法能夠有效降低參數冗余,從而減少存儲占用、通信帶寬和計算復雜度,有助于深度學習的應用部署。通道剪枝(Channel Pruning)通過移除神經網絡中冗余通道,達到加速神經網絡推理過程和壓縮模型體積的效果,還可以獲得實際的加速效果,然而當前基于結構正則化的通道剪枝方法忽略了神經網絡中連續層之間的關聯關系。

人工智能領域頂會CVPR于2019年6月在美國加利福利亞州召開,在這篇由北京郵電大學網絡智能研究中心、東信北郵EB Lab合作完成的論文中,作者考慮了網絡中連續層之間的關聯關系,提出了OICSR方法,將結構正則化同時運用于連續網絡層中相互對應的out-channels和in-channels,從而可以在更小的精度損失下,移除更多的冗余通道。在對指標影響較小的情況下,極大地提升深度學習模型的運行效率。以下為論文詳細解讀。

基于Out-In-Channel結構稀疏正則化的神經網絡通道剪枝

李家仕,戚琦,王敬宇+,戈策,李鈺劍,岳章章,孫海峰

1,網絡與交換國家重點實驗室,北京郵電大學

2,東信北郵信息技術有限公司

一種新的結構正則化形式

人工智能在眾多計算機視覺領域都取得了很大的成功,然而深度學習高昂的計算和存儲需求嚴重阻礙了其被大規模地部署于移動設備和嵌入式裝置。通道剪枝(Channel Pruning)是一類很經典的網絡輕量化方法,通過移除神經網絡中冗余通道的全部可訓練參數和激活值,可以同時達到加速神經網絡推理過程和壓縮模型體積的效果。由于對神經網絡進行通道剪枝后獲得的是結構化稀疏的網絡,因此不需要特殊的硬件支持就可以獲得實際的加速效果。

目前很多網絡輕量化的工作[1,2,3]利用結構稀疏正則化(下文簡稱為結構正則化)來對神經網絡進行通道剪枝。如公式1所示,這類方法通過在訓練過程中加入結構正則化來對網絡權重進行結構化約束,使得訓練過程中神經網絡不同通道的重要性分離開來。在剪枝過程中,網絡中重要的通道得以繼續保存,而更多冗余的通道可以在不損失網絡精度的情況下被安全的移除。

然而當前基于結構正則化的通道剪枝方法將結構正則化分離地應用于神經網絡中的各個層的out-channels,忽略了神經網絡中連續層之間的關聯關系,本研究稱之為分離式的結構正則化。

本研究提出了一種新的結構正則化形式Out-In-Channel Sparsity Regularization (OICSR)來克服分離式結構正則化的缺陷。OICSR充分考慮了網絡中連續層之間的關聯關系,將結構正則化同時運用于連續網絡層中相互對應的out-channels和in-channels,從而可以在更小的精度損失下移除更多的冗余通道。

Out-In-Channel結構稀疏正則化

連續兩層網絡的關聯關系如圖1所示,本研究用相同的顏色來標識連續層之間相互對應的out-channel和in-channel。

連續兩層網絡中相互對應的輸入輸出通道在網絡運行過程中是相互合作相互依賴的,第l層的輸入與第l層中第i個out-channel的權重向量共同生成第l層的第i個輸出特征圖,緊接著第l層的第i個輸出特征圖和第l+1層中第i個in-channel的權重向量共同生成第l+1層的輸出。

除此之外,在網絡通道剪枝過程中連續層之間對應的out-channel和in-channel會被共同保留或者移除。所以,有理由認為在剪枝工作中,連續層之間對應的out-channels和in-channels應該被共同且平等地考慮。

圖1 連續層網絡的關聯關系及Out-In-Channel的定義

分離式結構正則化的缺陷在于僅僅使得第l層網絡的out-channels維度的重要程度分離開來,然而第l+1層中對應的in-channels卻被忽略了。存在這樣的情況,第l層網絡的第i個out-channel因為分離式結構正則化,在訓練過程變得冗余,因此在通道剪枝過程中被移除。然而被同時移除的l+1層網絡中對應的第i個in-channel可能還是相對重要的,這時網絡的能力和精度就被嚴重的破壞了。

本研究因此提出在應用結構正則化進行剪枝時,應將連續層之間對應的out-channel和in-channel當成一個正則化組out-in-channel來進行結構化約束。在網絡訓練過程中,帶有OICSR的優化目標如公式2和公式3所示:

其中的符號‘+’表示對第l層和第l+1層中對應輸入輸出通道的權重向量進行拼接,從而可以對同一個out-in-channel正則化組內的權重向量進行結構化約束。不同于分離式結構正則化,OICSR可以使得神經網絡中out-in-channels的重要性分離開來,也就是說,對于連續網絡層中共同作用相互對應的out-channels和in-channels,它們將會同時變得重要或者同時變得冗余。因此在對網絡進行剪枝時,可以在更小的精度損失下,移除更多冗余的out-in-channels.

OICSR是一種通用的結構正則化形式,很多結構正則化項GroupLasso [4], GrOWL regularization [5]等都可以拓展OICSR的形式。例如Group Lasso拓展成OICSR的形式如公式4所示:

通道剪枝框架

圖2 迭代剪枝流程

本研究的迭代剪枝流程如圖2所示。在通道剪枝過程中,涉及到冗余通道選取的問題。當前的很多工作僅僅使用第l層的統計信息來選擇第l層和第l+1層之間的冗余通道,然而第l+1層中的統計信息又被忽略了。沿用out-in-channel的思想,認為應當同時利用連續兩層網絡的統計信息來選取兩層網絡間冗余的out-in-channels。為了簡潔性表示,本研究使用了通道能量(當然也很有效果)作為通道重要性的評判標準,通道重要性準則如公式5所示:

實際上神經網絡中每一層的冗余程度都不同,當前的很多工作為每一層網絡設定均等的剪枝比例或者根據經驗人為地設定剪枝比例是不夠合理的。因此本研究提出一個全局貪婪剪枝算法(Algorithm 1),來全局地決定每一層網絡的剪枝比例。首先根據公式8計算出網絡中全部out-in-channels的通道能量,接著對這些通道能量進行全局排序,最后根據預先設定的全局目標剪枝比例,來貪婪地選取網絡中的冗余通道,最后每層的剪枝比例因此也被確定下來。

全局貪婪剪枝算法

實驗結果

在實驗階段將Group Lasso拓展為OICSR的形式(OICSR-GL),并使用AlexNet, ResNet, DenseNet 與 SeNet等網絡架構在CIFAR-10/100和ImageNet-1K數據集上驗證OICSR的有效性。OICSR-GL將和一下的baseline作對比:

(1)L2. 在網絡訓練過程中只使用L2正則項,而不適用結構正則項

(2)GL. Group Lasso的原始形式,分離地被應用于網絡各層的out-channels.

(3)L1-BN [3]. L1-BN使用L1 regularization對BN層的scale因子進行約束,是另一種形式的結構正則化。

圖3 使用不同正則化約束進行網絡訓練后的通道能量分布圖

首先可視化了使用不同正則化約束進行訓練后神經網絡內通道能量 (通道能量定義為公式5) 的分布圖。ResNet-56網絡 (on CIFAR-100 dataset) 內layer4.2.conv1和layer4.2.conv2之間的通道能量分布如圖3所示,縱軸表示通道能量的高低,橫軸表示通道的坐標。相比于非結構正則化L2和分離式結構正則化GL, OICSR-GL顯然能更大程度的分離通道間的重要程度,故更多的冗余通道能被安全的移除。

圖4 通道剪枝后,重訓練前的網絡精度對比

接著論文展示了使用OICSR-GL及其baselines對網絡進行通道剪枝后,進行重訓練之前的網絡精度。剪枝后剩余的網絡參數/精度可以看成網絡重訓練的初始點,好的網絡初始點可以使得網絡重訓練后的精度更高。如圖3所示,在相同的FLOPs剪枝比例下,OICSR-GL在不同的網絡架構上下均能保存更多的網絡精度。

最后和其他的state-of-the-art通道剪枝方法在ResNet-50 ImageNet-1K上做了對比,如表1所示,在不同的FLOPs剪枝比例下,本研究的方法均優于目前最好的工作。

表1 在ResNet-50(ImageNet-1K dataset)和當前state-of-the-art

通道剪枝方法的對比結果

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4762

    瀏覽量

    100539
  • 算法
    +關注

    關注

    23

    文章

    4599

    瀏覽量

    92643
  • AI
    AI
    +關注

    關注

    87

    文章

    30146

    瀏覽量

    268418

原文標題:CVPR 2019:北郵提出新AI模型壓縮算法,顯著降低計算復雜度

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    [原創]《快學易用 Protel 99》經典書籍--北京郵電大學出版社

    《快學易用 Protel 99》經典書籍--北京郵電大學出版社 Protel99SE精彩教程Protel教程——練習與例題(共14章) Protel 99 PCB設計經驗談電路工程設計
    發表于 11-18 17:24

    WiFi北京郵電大學課件

    本帖最后由 藍伽然 于 2012-3-3 14:54 編輯 WiFi北京郵電大學課件
    發表于 03-03 09:28

    2015年西安郵電大學電子設計競賽試題

    2015年西安郵電大學電子設計競賽試題,共四個
    發表于 04-21 11:40

    聚焦開源人才培養,“開放原子校源行”走進北京郵電大學活動順利

    開源社區的基本情況,以及如何參與飛槳開源項目。Alluxio社區形象大使&Community Manager王添鈺北京郵電大學DISCC Lab碩士研究生孫嘉森Alluxio社區的兩位
    發表于 12-08 12:08

    TD-SCDMA網絡規劃(北京郵電大學)

    TD-SCDMA網絡規劃(北京郵電大學):
    發表于 05-20 15:44 ?9次下載
    TD-SCDMA網絡規劃(<b class='flag-5'>北京郵電大學</b>)

    信號與系統電子教案 (北京郵電大學)

    信號與系統電子教案 (北京郵電大學):§1.1 信號與系統§1.2 信號的描述和分類§1.3 信號的運算§1.4 階躍信號和沖激信號§1.5 信號的分解§1.6 系統模型及其劃分類§1.
    發表于 09-03 11:48 ?0次下載
    信號與系統電子教案 (<b class='flag-5'>北京郵電大學</b>)

    北京郵電大學與NI合作建立聯合創新實驗基地

    2013年9月 - 美國國家儀器有限公司(National Instruments, 以下簡稱 NI)與北京郵電大學(以下簡稱“北郵”)信息與通信工程學院合作建立的“信息與通信工程聯合創新實驗基地
    發表于 09-27 17:31 ?988次閱讀

    嵌人式實時操作系統及其應用開發北京郵電大學出版社+2006)

    電子發燒友網站提供《嵌人式實時操作系統及其應用開發北京郵電大學出版社+2006).txt》資料免費下載
    發表于 02-14 11:11 ?0次下載

    嵌入式系統原理及應用(北京郵電大學出版社+2006)

    電子發燒友網站提供《嵌入式系統原理及應用(北京郵電大學出版社+2006).txt》資料免費下載
    發表于 02-14 11:22 ?0次下載

    計算機與通信專業英語(第四版) 徐秀蘭 北京郵電大學出版社

    電子發燒友網站提供《計算機與通信專業英語(第四版) 徐秀蘭 北京郵電大學出版社.txt》資料免費下載
    發表于 10-09 15:25 ?0次下載

    南京郵電大學數字信號處理大綱

    南京郵電大學802數字信號處理考試大綱!!!
    發表于 11-19 14:57 ?0次下載

    北京郵電大學5G+VR全景直播云畢業典禮在線上舉行

    正值畢業季,北京聯通在疫情期間自主為“中央音樂學院”、“北京郵電大學”、“北京經濟管理職業學院”等創新設計并實施了5G云畢業典禮。畢業典禮借助“5GVR直播”、“5G云合影”等多種創新場景,通過5G高速傳輸保障及云交互平臺,實現
    發表于 07-07 09:53 ?1119次閱讀

    第16屆“中國芯”之雁飛萬里,郵苑有“芯”——北京郵電大學校友論壇成功舉辦

    大會同期舉辦了以“雁飛萬里,郵苑有“芯””為主題的北京郵電大學校友論壇。校友論壇由中國電子信息產業發展研究院集成電路研究所、北京郵電大學電子工程學院、信息光子學與光通信國家重點實驗室主
    的頭像 發表于 12-23 14:17 ?2994次閱讀
    第16屆“中國芯”之雁飛萬里,郵苑有“芯”——<b class='flag-5'>北京郵電大學</b>校友論壇成功舉辦

    聚焦開源人才培養,“開放原子校源行”走進北京郵電大學活動順利舉行

    11月19日, “開放原子校源行”走進北京郵電大學活動成功召開 。本次活動由開放原子開源基金會聯合CCF開源發展委員會共同舉辦,并且得到北京郵電大學的大力支持。活動匯聚了來自開源社區和開源項目的專家
    的頭像 發表于 11-21 21:05 ?1167次閱讀

    資訊速遞 | 北京郵電大學 OpenHarmony 技術俱樂部正式揭牌成立

    4月13日上午,由OpenAtom OpenHarmony(以下簡稱“OpenHarmony”)技術指導委員會(以下簡稱“TSC”)和北京郵電大學共同舉辦的“北京郵電大學OpenHarmony技術
    的頭像 發表于 05-05 15:47 ?1020次閱讀
    資訊速遞 | <b class='flag-5'>北京郵電大學</b> OpenHarmony 技術俱樂部正式揭牌成立