精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

跨圖像關系型KD方法語義分割任務-CIRKD

科技綠洲 ? 來源:地平線HorizonRobotics ? 作者:地平線HorizonRobot ? 2022-05-10 11:30 ? 次閱讀

語義分割任務作為計算機視覺中的基礎任務之一,其目的是對圖像中的每一個像素進行分類。該任務也被廣泛應用于實踐,例如自動駕駛和醫學圖像分割?,F有流行的用于語義分割任務的模型,例如DeepLab和PSPNet系列,雖然獲得了很好的分割精度,但是所需的算力成本較高。本文考慮使用知識蒸餾(Knowledge Distillation,KD)算法來緩解這個問題。KD作為模型壓縮里的一項重要技術,其核心思想是將教師模型中學習的知識作為監督信號來訓練學生模型,使得學生模型得到更好的性能。雖然現有的語義分割知識蒸餾方法能夠對學生網絡的性能進行提升,但是這些方法通常是從單張圖像中提取知識,忽略了跨圖像之間的關系信息也是一種有價值的知識。

最近,地平線-中科院提出了一種新穎的跨圖像關系型KD方法用于語義分割任務-CIRKD。該方法嘗試在語義分割任務中建模pixel-to-pixel和pixel-to-region這兩種對比關系作為KD的監督信號。本文主要從方法介紹以及實驗結果對提出的CIRKD進行講解。

KD作為一種思想已被廣泛應用,尤其是圖像分類任務。但是先前的工作表明直接將圖像分類KD方法直接遷移到語義分割任務是不可行的,因為它們沒有考慮到語義分割的結構化信息。一些經典的語義分割KD工作于是去嘗試捕捉到一些上下文信息來建模結構化知識,比如pixel相似度,pixel與region向量的相似度關系,但是這些方法通常在單張圖像內部進行信息提取,難以捕捉到更加廣泛的上下文依賴。

于是,我們提出一種跨圖像的知識蒸餾方法來建模圖像間的依賴,從而使得網絡能夠捕捉到更加豐富的結構化信息。具體地,本工作建模數據集中的全部圖像之間建模pixel-to-pixel以及pixel-to-region的對比關系作為知識。動機在于一個好的教師模型可以產生更好的全局pixel依賴以及特征空間。CIRKD引導學生模型去模仿教師網絡產生的更好的結構化語義關系,因此提升了語義分割表現。

具體方法

本方法分別從mini-batch和memory的角度對結構化關系進行建模。

1. 基于mini-batch的pixel-to-pixel蒸餾

首先是在batch中建模關系,將圖像產生的特征圖在spatial維度上進行分離,產生pixel-wise的特征向量。針對某一個pixel點的特征向量作為錨樣本,其他pixel點特征向量(包括當前圖像和其他圖像)作為對比樣本,可以得到相似度矩陣?;诖朔椒ǎ诮處煻撕蛯W生端都可以產生對應的相似度矩陣,然后通過KL散度進行逼近,使得學生可以學到教師的相似度矩陣:

poYBAGJ525qAV7JAAAAy64ChKUc424.png

一個batch內的圖像進行兩兩之間的關系矩陣求取和遷移:

poYBAGJ527CAAyFHAAA1Stteods108.png

整個過程的示意圖如下所示:

pYYBAGJ528GAQjDoAAHaRgVd67I107.png

2. 基于memory的pixel-to-pixel蒸餾

相對于基于mini-batch的對比性關系求取,這里采用一個memory bank來存儲對比向量,使得每一個錨樣本都可以得到充足的對比樣本。針對某一個pixel點的特征向量作為錨樣本,每次訓練隨機從memory bank中采樣大量的pixel特征向量來構造對比樣本,通過相乘分別得到教師和學生的相似度矩陣:

poYBAGJ529OAE_USAAAgpjlUVbo449.png

使用KL散度的誤差形式將教師和學生的pixel-to-pixel相似度矩陣進行對齊:

poYBAGJ52-GADE-EAAAujL9aVrM879.png

3. 基于memory的pixel-to-region蒸餾

離散化的pixel特征向量不能充分在捕捉到圖像內容,因此本方法利用memory對region向量進行存儲。region向量產生自對來自相同類別的pixel向量做一個平均。針對某一個pixel點的特征向量作為錨樣本,每次訓練隨機從memory bank中采樣大量的region特征向量來構造對比樣本,通過相乘分別得到教師和學生的相似度矩陣:

poYBAGJ52_CAABezAAAizUQO_X0194.png

使用KL散度的誤差形式將教師和學生的pixel-to-region相似度矩陣進行對齊:

poYBAGJ53BOAQU98AAAvFu0ENzY799.png

基于memory進行KD的整體示意圖如下所示:

pYYBAGJ53COAEmR9AADeNdVcI4Q457.png

最終的訓練誤差則是將以上3部分誤差相加在一起:

pYYBAGJ53E2ACKp9AAA1ksZPZzw949.png

實驗結果

實驗在流行的Cityscapes場景分割數據集上進行,相比于其他流行的語義分割KD方法,CIRKD獲得了一致最佳的表現。

pYYBAGJ53FaAKb6LAAFvt4MBG6g082.png

在一些case study上進行可視化,本方法能夠得到最好的分割表現。
審核編輯:彭靜

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    6670

    瀏覽量

    88171
  • 存儲
    +關注

    關注

    13

    文章

    4067

    瀏覽量

    85153
  • 地平線
    +關注

    關注

    0

    文章

    317

    瀏覽量

    14784
收藏 人收藏

    評論

    相關推薦

    目標檢測和圖像語義分割領域性能評價指標

    目標檢測和圖像語義分割領域的性能評價指標
    發表于 05-13 09:57

    基于內容的圖像分割方法綜述

    方法、基于像素聚類的方法語義分割方法這3種類型并分別加以介紹對每類方法所包含的典型算法,尤其
    發表于 01-02 16:52 ?2次下載
    基于內容的<b class='flag-5'>圖像</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>綜述

    聚焦語義分割任務,如何用卷積神經網絡處理語義圖像分割

    CNN架構圖像語義分割 圖像分割是根據圖像內容對指定區域進行標記的計算機視覺
    發表于 09-17 15:21 ?500次閱讀

    語義分割算法系統介紹

    圖像語義分割圖像處理和是機器視覺技術中關于圖像理解的重要任務。
    的頭像 發表于 11-05 10:34 ?5966次閱讀

    分析總結基于深度神經網絡的圖像語義分割方法

    隨著深度學習技術的快速發展及其在語義分割領域的廣泛應用,語義分割效果得到顯著提升。對基于深度神經網絡的圖像
    發表于 03-19 14:14 ?21次下載
    分析總結基于深度神經網絡的<b class='flag-5'>圖像</b><b class='flag-5'>語義</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>

    結合雙目圖像的深度信息層次特征的語義分割模型

    為改善單目圖像語義分割網絡對圖像深度變化區域的分割效果,提出一種結合雙目圖像的深度信息和
    發表于 03-19 14:35 ?21次下載
    結合雙目<b class='flag-5'>圖像</b>的深度信息<b class='flag-5'>跨</b>層次特征的<b class='flag-5'>語義</b><b class='flag-5'>分割</b>模型

    基于深度神經網絡的圖像語義分割方法

    對應用于圖像語義分割的幾種深度神經網絡模型進行簡單介紹,接著詳細闡述了現有主流的基于深度神經網絡的圖像語義
    發表于 04-02 13:59 ?11次下載
    基于深度神經網絡的<b class='flag-5'>圖像</b><b class='flag-5'>語義</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>

    基于SEGNET模型的圖像語義分割方法

    使用原始 SEGNET模型對圖像進行語義分割時,未對圖像中相鄰像素點間的關系進行考慮,導致同一目標中像素點類別預測結果不一致。通過在 SEG
    發表于 05-27 14:54 ?15次下載

    圖像語義分割的概念與原理以及常用的方法

    (Graph partitioning segmentation methods),在深度學習(Deep learning, DL)“一統江湖”之前,圖像語義分割方面的工作可謂“百花齊放”。
    的頭像 發表于 04-20 10:01 ?3455次閱讀

    語義分割標注:從認知到實踐

    隨著人工智能技術的不斷發展,語義分割標注已經成為計算機視覺領域的一個熱門話題。語義分割是指將圖像中的每個像素分配給一個預定義的
    的頭像 發表于 04-30 21:20 ?918次閱讀

    AI算法說-圖像分割

    語義分割是區分同類物體的分割任務,實例分割是區分不同實例的分割
    的頭像 發表于 05-17 14:44 ?1104次閱讀
    AI算法說-<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>

    PyTorch教程-14.9. 語義分割和數據集

    SageMaker Studio Lab 中打開筆記本 在 第 14.3 節-第 14.8 節討論對象檢測任務時,矩形邊界框用于標記和預測圖像中的對象。本節將討論語義分割問題,重
    的頭像 發表于 06-05 15:44 ?518次閱讀
    PyTorch教程-14.9. <b class='flag-5'>語義</b><b class='flag-5'>分割</b>和數據集

    圖像分割語義分割中的CNN模型綜述

    圖像分割語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定
    的頭像 發表于 07-09 11:51 ?255次閱讀

    圖像分割語義分割的區別與聯系

    圖像分割語義分割是計算機視覺領域中兩個重要的概念,它們在圖像處理和分析中發揮著關鍵作用。 1. 圖像
    的頭像 發表于 07-17 09:55 ?224次閱讀

    圖像語義分割的實用性是什么

    圖像語義分割是一種重要的計算機視覺任務,它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術
    的頭像 發表于 07-17 09:56 ?177次閱讀