精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何使用DDPM提取特征并研究這些特征可能捕獲的語義信息

CVer ? 來源:咚咚學AI ? 作者:咚咚 ? 2022-11-29 15:40 ? 次閱讀

摘要

背景介紹:去噪擴散概率模型DDPM最近受到了很多研究關注,因為它們優于其他方法,如GAN,并且目前提供了最先進的生成性能。差分融合模型的優異性能使其在修復、超分辨率和語義編輯等應用中成為一個很有吸引力的工具。

研究方法:作者為了證明擴散模型也可以作為語義分割的工具,特別是在標記數據稀缺的情況下。對于幾個預先訓練的擴散模型,作者研究了網絡中執行逆擴散過程馬爾可夫步驟的中間激活。結果表明這些激活有效地從輸入圖像中捕獲語義信息,并且似乎是分割問題的出色像素級表示。基于這些觀察結果,作者描述了一種簡單的分割方法,即使只提供了少量的訓練圖像也可以使用。

實驗結果:提出的算法在多個數據集上顯著優于現有的替代方法。

算法

df2211b6-6cda-11ed-8abf-dac502259ad0.png

首先,簡要概述DDPM框架。然后,我們描述了如何使用DDPM提取特征,并研究這些特征可能捕獲的語義信息。

poYBAGOFt_KAGV57AAIYyJHxg-Y131.jpg

表征分析

作者分析了噪聲預測器θ(xt,t)對不同 t 產生的表示。考慮了在LSUN Horse和FFHQ-256數據集上訓練的最先進的DDPM checkpoints。

來自噪聲預測器的中間激活捕獲語義信息:對于這個實驗,從LSUN Horse和FFHQ數據集中獲取了一些圖像,并分別手動將每個像素分配給21和34個語義類中的一個。目標是了解DDPM生成的像素級表示是否有效地捕獲了有關語義的信息。為此,訓練多層感知器(MLP),以根據特定擴散步驟t上18個UNet解碼器塊中的一個生成的特征來預測像素語義標簽

請注意,只考慮解碼器激活圖,因為它們還通過跳躍連接聚合編碼器激活圖。MLP在20張圖片上接受訓練,并在20張圖片上進行評估。預測性能以平均IoU衡量。

dfb99d42-6cda-11ed-8abf-dac502259ad0.png

圖2顯示了不同解碼塊和擴散步驟t的預測性能演變。解碼塊從深到淺依次編號。圖2顯示了噪聲預測器θ(xt,t)產生特征的IoU隨不同的塊和擴散步驟而變化。

特別是,對應于反向擴散過程后續步驟的特征通常更有效地捕獲語義信息。相比之下,早期步驟相對應的特征通常沒有什么信息。在不同的解碼塊中,UNet解碼器中間層產生的特征似乎是所有擴散步驟中信息最豐富的。

dfe3315c-6cda-11ed-8abf-dac502259ad0.png

此外,根據標注數據集中的目標的平均面積分別考慮小型和大型語義類。然后,獨立評估不同UNet解碼塊和擴散步驟中這些類的平均IoU。LSUN Horse的結果如圖3所示。

正如預期的那樣,在相反的過程中,大型對象的預測性能開始提前增長。對于較小的對象,淺層解碼塊的信息量更大,而對于較大的對象,深層解碼塊的信息更大。在這兩種情況下,最有區別的特征仍然對應于中間塊

e0171e18-6cda-11ed-8abf-dac502259ad0.png

圖4顯示了由FFHQ checkpoint從擴散步驟{50,200,400,600,800}的解碼塊{6,8,10,12}中提取的特征形成的k-means聚類(k=5),并確認聚類可以跨越連貫的語義對象和對象部分。

在塊B=6中,特征對應于粗糙的語義掩碼。在另一個極端,B=12的特征可以區分細粒度的面部部位,但對于粗碎片來說,語義意義較小。在不同的擴散步驟中,最有意義的特征對應于后面的步驟。

將這種行為歸因于這樣一個事實,即在反向過程的早期步驟中,DDPM樣本的全局結構尚未出現,因此,在這個階段幾乎不可能預測分段掩碼。圖4中的掩碼定性地證實了這種直覺。對于t=800,掩碼很難反映實際圖像的內容,而對于較小的t值,掩碼和圖像在語義上是一致的。

基于DDPM的few-shot語義分割

上述觀察到的中間DDPM激活的潛在有效性表明,它們可以被用作密集預測任務的圖像表示。圖1展示了整體圖像分割方法,該方法利用了這些代表的可辨別性。更詳細地說,當存在大量未標記圖像{X1,…,XN}?時,考慮了few-shot半監督設置。

第一步,以無監督的方式對整個{X1,…,XN}訓練擴散模型。然后使用該擴散模型提取標記圖像的像素級表示。在本工作中,使用UNet解碼器中間塊B={5,6,7,8,12}的表示,以及反向擴散過程的步驟t={50,150,250}。

實驗

e056e0fc-6cda-11ed-8abf-dac502259ad0.pnge0799d2c-6cda-11ed-8abf-dac502259ad0.pnge0996634-6cda-11ed-8abf-dac502259ad0.png





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1131

    瀏覽量

    40676
  • 感知器
    +關注

    關注

    0

    文章

    34

    瀏覽量

    11830
  • MLP
    MLP
    +關注

    關注

    0

    文章

    57

    瀏覽量

    4229

原文標題:ICLR 2022 | 基于擴散模型(DDPM)的語義分割

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于OWL屬性特征語義檢索研究

    【來源】:《電子設計工程》2010年02期【摘要】:在文獻檢索中,概念的語義相似度計算直接影響查準率和查全率指標。將本體描述語言OWL(Web Ontology Language)的屬性特征有機結合
    發表于 04-24 09:48

    手指靜脈圖像的特征提取和識別前期研究

    圖像處理,手指靜脈圖像的特征提取和識別前期研究
    發表于 05-11 11:51

    語音特征參數提取的仿真研究

    語音特征參數提取的仿真研究
    發表于 08-20 12:38

    模擬電路故障診斷中的特征提取方法

    故障特征提取是模擬電路故障診斷的關鍵,而模擬電路由于故障模型復雜、元件參數的容差、非線性、噪聲以及大規模集成化等現象使電路故障信息表現為多特征、高噪聲、非線性的數據集,且受到特征信號觀
    發表于 12-09 18:15

    如何提取顏色特征

    計算機視覺的特征提取算法研究至關重要。在一些算法中,一個高復雜度特征提取可能能夠解決問題(進行目標檢測等目的),但這將以處理更多數據,需要
    發表于 10-12 06:55

    基于已知特征項和環境相關量的特征提取算法

    在現有基于已知特征特征提取算法的基礎上,提出一種基于已知特征項和環境相關量的特征提取算法。該算法通過已知特征項搜索頻繁項集,提高了
    發表于 04-18 09:37 ?17次下載

    基于OWL屬性特征語義檢索研究

    在文獻檢索中,概念的語義相似度計算直接影響查準率和查全率指標。將本體描述語言OWL(Web Ontology Language)的屬性特征有機結合到語義檢索模型中,設計本體內實體間匹配度算法
    發表于 02-11 14:01 ?4次下載

    故障特征提取的方法研究

    摘要:針對常規特征提取方法存在著問題不足,提出了基于BP神經網絡和基于互信息熵的特征提取方法,通過特征提取實例加以說明。結果表明這兩種方法
    發表于 03-11 13:14 ?1479次閱讀
    故障<b class='flag-5'>特征提取</b>的方法<b class='flag-5'>研究</b>

    特征量的選擇和提取

    特征量的選擇和提取為了有效地分類,希望同類樣本之間的距離越小越好,而不同類樣本之間的距離則越大越好,本文所使用的特征量盡可能滿足取樣的要求。
    發表于 03-01 17:49 ?911次閱讀
    <b class='flag-5'>特征</b>量的選擇和<b class='flag-5'>提取</b>

    顏色特征提取方法

    計算機視覺的特征提取算法研究至關重要。在一些算法中,一個高復雜度特征提取可能能夠解決問題(進行目標檢測等目的),但這將以處理更多數據,需要
    發表于 11-16 14:12 ?4356次閱讀

    基于小波脊線的特征提取算法

    捕獲問題,對其特征參數提取算法進行了研究。針對跳頻信號的特征提取
    發表于 01-04 14:04 ?0次下載
    基于小波脊線的<b class='flag-5'>特征提取</b>算法

    結合雙目圖像的深度信息跨層次特征語義分割模型

    圖像的二維信息基于 Paralleinet設計色彩深度融合模塊,計算雙目圖像特征點的不同視差等級相似度提取深度信息,同時將其與二維
    發表于 03-19 14:35 ?21次下載
    結合雙目圖像的深度<b class='flag-5'>信息</b>跨層次<b class='flag-5'>特征</b>的<b class='flag-5'>語義</b>分割模型

    基于自編碼特征的語音聲學綜合特征提取

    利用監督性學習算法進行語音増強時,特征提取是至關重要的步驟。現有的組合特征和多分辨率特征等聽覺特征是常用的聲學特征,基于
    發表于 05-19 16:33 ?27次下載

    結合詞特征語義特征的網絡評價對象識別

    網絡評論短文本的細粒度情感分析是文本挖掘的研究熱點,評價對象作為細粒度情感分析的基礎,在識別文本過程中具有重要作用,如何充分利用上下文信息對其進行有效表示是評價對象識別的難點所在。提出一種結合詞
    發表于 05-28 11:04 ?3次下載

    將高級語義信息隱式地嵌入到檢測和描述過程中來提取全局可靠的特征

    ? 介紹 以往的特征檢測和匹配算法側重于提取大量冗余的局部可靠特征,這樣會導致效率和準確性有限,特別是在大規模環境中挑戰性的場景,比如天氣變化、季節變化、光照變化等等。 本文將高級語義
    的頭像 發表于 06-30 10:49 ?680次閱讀
    將高級<b class='flag-5'>語義</b><b class='flag-5'>信息</b>隱式地嵌入到檢測和描述過程中來<b class='flag-5'>提取</b>全局可靠的<b class='flag-5'>特征</b>