精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用圖卷積網絡解決語義分割問題

智能感知與物聯網技術研究所 ? 來源:通信信號處理研究所 ? 2020-05-13 15:21 ? 次閱讀

使用 CNN 處理圖像問題已經是常規操作,但此類方法會造成局部位置信息的損失。如何解決這個問題呢?來自中科院自動化所和北京中醫藥大學的研究者另辟蹊徑,提出用圖卷積網絡解決語義分割問題。

論文鏈接:https://arxiv.org/pdf/2001.00335.pdf 使用深度學習執行語義分割在圖像像素分類方面取得了巨大進步。但是,深度學習提取高級特征時往往忽略了局部位置信息(local location information),而這對于圖像語義分割而言非常重要。 為了避免上述問題,來自中科院自動化所、北京中醫藥大學的研究者們提出一個執行圖像語義分割任務的圖模型 Graph-FCN,該模型由全卷積網絡(FCN)進行初始化。 首先,通過卷積網絡將圖像網格數據擴展至圖結構數據,這樣就把語義分割問題轉換成了圖節點分類問題;然后,使用圖卷積網絡解決圖節點分類問題。 研究者稱,這是首次將圖卷積網絡用于圖像語義分割的嘗試。該方法在 VOC 數據集上獲得了有競爭力的 mIOU 性能,相比原始 FCN 模型有 1.34% 的性能提升。

Graph-FCN 架構圖。

語義分割問題的難點 語義分割是計算機視覺領域中的重要課題,其復雜程度超過分類和檢測任務。這項密集預測任務需要預測每個像素的類別,也就是說它需要從高級語義信息和局部位置信息中學習目標輪廓、目標位置和目標類別。 基于深度學習的語義分割方法,具體而言即卷積神經網絡(CNN),為該領域帶來了一系列巨大進展。提取高級特征的強大泛化能力使得圖像分類和檢測任務取得了非常好的性能,但伴隨泛化而來的局部位置信息損失則為密集預測任務增加了難度。具備較大感受野的高級語義信息對應卷積神經網絡中的小型特征圖,這類圖會造成像素級局部位置信息的損失。 多種基于深度學習的方法對該問題帶來了改進,如全卷積網絡 [16]、Segent [1]、Deeplab 方法 [2,3,4]。這些工作使用全連接層、空洞卷積和金字塔結構,來減少提取高級特征過程中的位置信息損失。 中科院等提出語義分割難題新解法 首先,研究者為圖像語義分割問題構建圖節點模型。圖模型方法廣泛應用于分割問題,這類方法將像素視作節點,將節點之間的差異度(dissimilarity)視作邊(edge)。最優的分割即對圖執行最大割(maximum cut)。 結合了概率論和圖論的概率圖模型方法(如馬爾可夫隨機場和條件隨機場)被用于細化語義分割結果。這些方法將檢測到的目標建模為圖節點,通過提取目標之間的關系來改進檢測準確率。相比于深度卷積模型把輸入數據表示為網格結構,圖模型具備更靈活的跳躍連接(skip connection),因此它可以探索圖中節點之間的關系。 受限于計算量,研究者使用 FCN 初始化該圖模型。該圖模型基于小尺寸圖像構建,其節點標注由 FCN 進行初始化,邊的權重則由高斯核函數進行初始化。

圖 1:FCN 結構示意圖。本研究使用 FCN-16s 作為基礎模型對節點標注進行初始化。 然后使用圖卷積網絡(GCN)解決這個圖模型。GCN 是處理圖結構數據的當前最優模型之一。基于節點的 GCN 利用消息傳播(message propagation)來交換相鄰節點之間的信息。這一過程可以在圖的較大相鄰范圍內提取特征,其作用類似于卷積網絡中的卷積層和池化層。由于該過程中不會有節點消失,因此基于節點的 GCN 擴展了感受野,并避免了局部位置信息出現損失。 這篇論文提出了新型模型 Graph-FCN 來解決語義分割問題。研究者使用深度卷積網絡建模圖,并首次用 GCN 方法解決圖像語義分割任務。Graph-FCN 可以擴大感受野,同時避免局部位置信息出現損失。實驗表明,Graph-FCN 的性能優于 FCN。 Graph-FCN 方法詳解 GCN 旨在解決圖結構數據集上的學習問題。圖結構數據可看作是三元組 G(N, E, U),其中 N 表示圖的節點集合,即 |N| ? S 矩陣(|N| 表示圖節點數量,S 表示節點標注向量的維度)。E 是圖的邊集合。U 對應圖特征,由于本研究涉及任務與 U 無關,因此本研究不討論 U。 與歐幾里德空間中的數據表示不同,矩陣 N 和邊 E 并非獨特表示。矩陣 N 與 E 對應,它們都按照節點的順序排列。研究者使用監督學習方式訓練模型。節點 n_j 表示圖 j 中的節點集,t_j 表示節點集 n_j 的標注集。因此用于語義分割任務的圖模型可公式化為:

研究者將交叉熵函數作為該模型的損失函數。T_r 表示訓練集。 節點 在本研究提出的新模型中,節點標注由 FCN-16s 進行初始化。通過端到端訓練后,FCN-16s 得到步幅為 16 和 32 的特征圖,如下圖 2 所示。對步幅為 16 的特征圖執行因子為 2 的上采樣可以獲得與步幅為 32 的特征圖一樣的大小。(節點 j 的)標注 x_j 由這兩個特征向量以及特征圖中每個節點位置的級聯進行初始化。該標注包含在局部感受野上提取到的特征。在訓練過程中,研究者通過對原始標注圖像執行池化操作來得到節點標簽

圖 2:節點標注初始化過程。節點標注由 FCN-16s 中兩個層的級聯進行初始化。 邊 在圖模型中,邊和鄰接矩陣相關。假設每個節點和其最鄰近的 l 個節點相連,這意味著節點標注可以通過圖神經網絡中的邊進行遷移。下圖 3 中的示例描述了圖神經網絡中的感受野。假設 l 為 4,那么從相關距離的影響來看,我們需要用高斯核函數獲得權重鄰接矩陣 A。

圖 3:當 l 為 4 時,雙層 GCN 的感受野。這與卷積層不同。 使用 Graph-FCN 進行訓練 在 Graph-FCN 中,FCN-16s 實現節點分類和圖模型在小型特征圖中的初始化。同時,雙層 GCN 獲取圖中節點的分類結果。研究者分別計算這兩部分輸出的交叉熵損失。和 FCN-16s 模型一樣,Graph-FCN 也以端到端模式進行訓練。Graph-FCN 網絡結構如下圖 4 所示:

圖 4:Graph-FCN 的結構示意圖。該模型有兩個輸出和兩個損失 L1 和 L2。它們共享卷積層提取特征的權重。L1 通過 output1 計算得到,L2 通過 output2 計算得到。通過最小化 L1 和 L2,FCN-16s 的性能得到了提升。 實驗 研究者在 VOC2012 數據集上對模型進行測試,實驗結果表明 Graph-FCN 的性能優于原始 FCN 模型。

表 1:Graph-FCN 和 FCN-16s 的性能對比情況。

圖 5:圖像語義分割結果。第二列是 Graph-FCN 的結果,第三列是 FCN-16s 的結果,第四列是 ground truth。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據集
    +關注

    關注

    4

    文章

    1205

    瀏覽量

    24649
  • 深度學習
    +關注

    關注

    73

    文章

    5493

    瀏覽量

    120999
  • 圖卷積網絡
    +關注

    關注

    0

    文章

    8

    瀏覽量

    1501

原文標題:另辟蹊徑,中科院自動化所等首次用圖卷積網絡解決語義分割難題

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種基于因果路徑的層次圖卷積注意力網絡

    機電系統中的故障檢測對其可維護性和安全性至關重要。然而,系統監測變量往往具有復雜的聯系,很難表征它們的關系并提取有效的特征。本文開發了一種基于因果路徑的層次圖卷積注意力網絡(HGCAN),以提高復雜
    的頭像 發表于 11-12 09:52 ?196次閱讀
    一種基于因果路徑的層次<b class='flag-5'>圖卷積</b>注意力<b class='flag-5'>網絡</b>

    語義分割25種損失函數綜述和展望

    語義圖像分割,即將圖像中的每個像素分類到特定的類別中,是許多視覺理解系統中的重要組成部分。作為評估統計模型性能的主要標準,損失函數對于塑造基于深度學習的分割算法的發
    的頭像 發表于 10-22 08:04 ?140次閱讀
    <b class='flag-5'>語義</b><b class='flag-5'>分割</b>25種損失函數綜述和展望

    圖像語義分割的實用性是什么

    圖像語義分割是一種重要的計算機視覺任務,它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用,如自動駕駛、醫學圖像分析、機器人導航等。 一、圖像語義
    的頭像 發表于 07-17 09:56 ?361次閱讀

    圖像分割語義分割的區別與聯系

    圖像分割語義分割是計算機視覺領域中兩個重要的概念,它們在圖像處理和分析中發揮著關鍵作用。 1. 圖像分割簡介 圖像分割是將圖像劃分為多個區
    的頭像 發表于 07-17 09:55 ?723次閱讀

    卷積神經網絡的工作原理和應用

    卷積神經網絡(FCN)是深度學習領域中的一種特殊類型的神經網絡結構,尤其在計算機視覺領域表現出色。它通過全局平均池化或轉置卷積處理任意尺寸的輸入,特別適用于像素級別的任務,如圖像
    的頭像 發表于 07-11 11:50 ?984次閱讀

    經典卷積網絡模型介紹

    經典卷積網絡模型在深度學習領域,尤其是在計算機視覺任務中,扮演著舉足輕重的角色。這些模型通過不斷演進和創新,推動了圖像處理、目標檢測、圖像生成、語義分割等多個領域的發展。以下將詳細探討
    的頭像 發表于 07-11 11:45 ?470次閱讀

    圖像分割語義分割中的CNN模型綜述

    圖像分割語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經
    的頭像 發表于 07-09 11:51 ?697次閱讀

    卷積神經網絡的實現原理

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將詳細介紹卷積神經網絡
    的頭像 發表于 07-03 10:49 ?496次閱讀

    卷積神經網絡分類方法有哪些

    卷積神經網絡(Convolutional Neural Networks,CNN)是一種深度學習模型,廣泛應用于圖像分類、目標檢測、語義分割等計算機視覺任務。本文將詳細介紹
    的頭像 發表于 07-03 09:40 ?410次閱讀

    cnn卷積神經網絡分類有哪些

    卷積神經網絡(CNN)是一種深度學習模型,廣泛應用于圖像分類、目標檢測、語義分割等領域。本文將詳細介紹CNN在分類任務中的應用,包括基本結構、關鍵技術、常見
    的頭像 發表于 07-03 09:28 ?579次閱讀

    卷積神經網絡訓練的是什么

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將詳細介紹卷積神經網絡
    的頭像 發表于 07-03 09:15 ?353次閱讀

    卷積神經網絡的原理與實現

    1.卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。 卷積神經網絡是一種前饋
    的頭像 發表于 07-02 16:47 ?501次閱讀

    卷積神經網絡的基本原理和應用范圍

    卷積神經網絡(Convolutional Neural Network,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、語音識別、自然語言處理等領域。本文將詳細介紹卷積神經網絡的基
    的頭像 發表于 07-02 15:30 ?949次閱讀

    卷積神經網絡的基本結構及其功能

    。 引言 深度學習是機器學習的一個分支,它通過模擬人腦神經網絡的結構和功能,實現對數據的自動學習和特征提取。卷積神經網絡是深度學習中的一種重要模型,它通過卷積操作和池化操作,有效地提取
    的頭像 發表于 07-02 14:45 ?1215次閱讀

    卷積神經網絡的優點

    卷積神經網絡的優點? 卷積神經網絡(Convolutional Neural Network,CNN)是一種基于深度學習的神經網絡模型,在圖
    的頭像 發表于 12-07 15:37 ?4130次閱讀