精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于DetNet的單階段單視圖三維點云重建網絡

冬至子 ? 來源:蘇大軌道交通學院研究生 ? 作者:Bin Li , Shiao Zhu an ? 2023-12-06 15:34 ? 次閱讀

1. 文章摘要與主要貢獻

從一張圖片中推斷出具有合理形狀和外觀的物體是一個具有挑戰性的問題。現有的研究往往更多地關注點云生成網絡的結構,而忽略了二維圖像的特征提取,減少了網絡中特征傳播過程中的損失。本文提出了一種單級單視圖三維點云重建網絡3D SSRecNet。所提出的3D SSRecNet是一個簡單的單級網絡,由2D圖像特征提取網絡和點云預測網絡組成。單級網絡結構可以減少提取的2D圖像特征的丟失。二維圖像特征提取網絡以DetNet為骨干。DetNet可以從2D圖像中提取更多細節。

為了生成形狀和外觀更好的點云,在點云預測網絡中,使用ELU作為激活函數,并使用CD和EMD的聯合函數作為3D SSRecNet的損失函數。為了驗證3D SSRecNet的有效性,該文在ShapeNet和Pix3D數據集上進行了一系列實驗。CD和EMD測量的實驗結果表明,3D SSRecNet優于最先進的重建方法。

該文工作的主要貢獻如下:

  1. 該文提出了一種用于從單個圖像進行3D重建的單階段神經網絡,即3D SSRecNet。3D SSRecNet將圖像作為輸入,并直接輸出預測的點云,而無需進一步處理。
  2. 3D SSRecNet包括特征提取和三維點云生成。特征提取網絡更善于提取2D輸入的詳細特征。點云生成網絡具有簡單的結構,并在其多層感知器中使用適當的激活函數,這減少了轉發傳播過程中的特征損失,以獲得精細的輸出。
  3. 在ShapeNet和pix3D數據集上的實驗表明,3D SSRecNet在單視圖重建任務上優于現有技術的重建方法。同時,該文還通過實驗證明了點云生成網絡激活函數的有效性。

**2. **研究方法

2.1 3D-SSRecNet的結構

3D SSRecNet的體系結構如圖1所示。3D SSRecNet包括兩個主要部分:二維圖像特征提取網絡和點云預測網絡。這兩個部分構成了一個簡單的單階段點云重建網絡。單階段網絡結構僅在3D SSRecNet的網絡內傳輸2D圖片的特征。與需要跨網絡傳輸特征的兩階段重建網絡相比,這種網絡結構減少了特征的損失。

圖片

圖 1 3D-SSRecNet框架—architecture of 3D-SSRecNet.

給定一個2D圖像,首先,該文通過DetNet獲得一個潛在的表示V。然后,該文通過全連接(FC)層將V映射到低維特征V’。然后直接應用多層感知器(MLP)對點集進行預測。在訓練過程中,計算倒角距離和推土機的距離損失函數,并監督可訓練參數的更新。

2.2 二維圖像特征提取

許多圖像特征網絡應用下采樣,帶來了更高的感受野,但不可避免地造成了圖像細節的損失。然而,對于重建,圖像細節對于幾何形狀的恢復至關重要。這種網絡更適合圖像分類任務,但不適合需要更詳細特征的重建任務。

DetNet不僅保留了更多的細節,而且保留了很大的感受野。盡管DetNet是為物體檢測而設計的,但其新穎的擴張瓶頸結構提供了高分辨率的特征圖和大的感受野。該文使用DetNet作為圖像特征提取的主干。DetNet在階段4之前遵循與ResNet-50相同的結構,因此DetNet還具有易于訓練且不會陷入梯度消失的優點。表1顯示了DetNet最后兩個階段的參數,即DetNet和ResNet-50之間的差異。

在第4階段之后,DetNet將特征圖的大小保持在16×16,這使得能夠保留更多細節。DetNet的第五和第六階段由具有擴張卷積的瓶頸組成,一些瓶頸在其快捷連接上具有1×1卷積。擴大的卷積增加了感受野。然而,考慮到計算量和存儲量,階段5和階段6設置相同的通道數256。在基線結束時,將應用完全連接的圖層。

表 1 DetNet最后兩個階段的參數—the parameters of last two stages DetNet.

圖片

如圖1所示,在對輸入圖像進行特征提取后,該文獲得了輸入圖像的1000維潛在特征V。之后,全連接(FC)層將向量V的維度從1000壓縮到100,并獲得向量V’。

2.3 點云預測

該文使用三層MLP來直接預測點集。三個MLP層的輸出尺寸分別為512、1024和N×3。特征提取網絡的輸出:向量V'被饋送到點云預測網絡的MLP中。在前兩層上,引入ELU作為激活函數。

ELU激活函數及其導數的曲線分別如圖2a、b所示。對于常見的激活函數,如ReLU,對應于負軸的值為0。然而,標準化的點云坐標間隔為[-1,1],這表明點云坐標將具有負值。如圖2a所示,ELU激活函數的負軸對應的值為非零。因此,使用ELU作為激活函數,重建網絡中的負值信息在前向傳播過程中不會丟失。如圖3b所示,ELU的導數在負軸上也是非零的。在網絡的反向傳播過程中,負梯度不會丟失,它可以幫助更新網絡權重。

圖片

(a)激活函數ELU曲線 (b) ELU導數曲線

Curve of activation function ELU Curve of derivative of ELU

圖 2 ELU激活函數及其導數—ELU activation function and its derivative

圖片

圖 3 具有相同CD損失值的不同重建—different reconstructions with the same CD loss value

在實驗部分,該文證明了使用ELU作為激活函數的重建效果優于使用其他激活函數。該文在最后一個激活層之后直接輸出預測的點集。它由tanh函數實現,其輸出屬于[-1,1],與所需的點集數據相同。

2.4 損失函數

定義點云重建的損失函數。該文必須考慮兩個重要的性質。(1)點云是一個無序的點集,因此無論該文如何改變點的順序,該文都將獲得相同的數據。(2)無論任何旋轉變換,真實物體的幾何特征均不得發生顯著變化。然而,例如,當該文進行旋轉變換時,點坐標似乎不同。

CD定義如下:

圖片

EMD定義如下:

圖片

綜合CD和EMD的優缺點,該文的網絡的損失函數定義為:

圖片

3. 實驗過程 ****

該文分別在ShapeNet和Pix3D數據集上評估了所提出的3D SSRecNet。ShapeNet是一個紋理CAD模型的大集合,由13個類和43809個點云模型組成,用于訓練和測試。該文使用80–20%的訓練/測試分割來執行該文的實驗。該文在Pix3D數據庫上進行了同樣的實驗。Pix3D數據庫由三個類和7595個點云模型組成。該數據集是真實場景的CAD模型。在Pix3D上的實驗可以更好地評估點云重建算法的實用性。

該文使用梯度優化算法Adam來優化所提出的3DSSRecNet。在訓練中,該文將學習率設置為0.0005,將歷元設置為50。訓練環境如下:Ubuntu 18.04.6,CUDA 10.1,GPU型號為NVIDIA Tesla T4×4。該文使用在1024個采樣點上計算的CD和EMD值來評估重建點云的質量。

表 2 ShapeNet數據集上不同激活函數的重構結果—reconstruction results of different activation functions on ShapeNet dataset.

圖片

表 3 CD評估的ShapeNet重建結果—reconstruction results on ShapeNet evaluated by CD

圖片

表 4 EMD評估的ShapeNet重建結果—reconstruction results on ShapeNet evaluated by EMD

圖片

**4. **文章結論

本文提出了一種高效的三維點云重建方法3DSSRecNet。給定圖像,它學習潛在的表示,在降維后,該文應用MLP直接預測對應點云。該文在ShapeNet和Pix3D數據集上進行了幾個實驗。該文證明了在發電網絡中使用激活函數ELU的重建效果優于使用其他激活函數。也就是說,使用ELU生成的點云的CD和EMD值低于使用其他激活函數生成的點云中的CD和EMD值。

**5. **閱讀心得

這篇論文提出了一種名為3D-SSRecNet的單階段和單視圖3D點云重建網絡,該網絡由2D圖像特征提取網絡和點云預測網絡組成。單階段網絡結構可以減少提取的2D圖像特征的損失。2D圖像特征提取網絡采用DetNet作為骨干網絡,可以從2D圖像中提取更多細節。為了生成形狀和外觀更好的點云,在點云預測網絡中,使用ELU作為激活函數,并使用Chamfer距離(CD)和Earth mover’s distance(EMD)的聯合函數作為3D-SSRecNet的損失函數。在ShapeNet和Pix3D數據集上進行的實驗結果表明,通過CD和EMD測量,3D-SSRecNet優于現有的重建方法。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4765

    瀏覽量

    100565
  • CAD
    CAD
    +關注

    關注

    17

    文章

    1083

    瀏覽量

    72369
  • EMD
    EMD
    +關注

    關注

    1

    文章

    43

    瀏覽量

    20017
  • 感知器
    +關注

    關注

    0

    文章

    34

    瀏覽量

    11831
  • MLP
    MLP
    +關注

    關注

    0

    文章

    57

    瀏覽量

    4230
收藏 人收藏

    評論

    相關推薦

    怎樣去設計一種基于RGB-D相機的三維重建無序抓取系統?

    為什么要開發一種三維重建無序抓取系統?三維重建無序抓取系統是由哪些部分組成的?三維重建無序抓取系統有哪些關鍵技術和創新
    發表于 07-02 06:29

    人工神經網絡三維X線頭影測量系統中的應用

    給出一種iX線頭影測量中圖形圖像重建的方法; 南正側位兩張X線頭影片上72個標志。可以重建 顱頜骨三維
    發表于 07-07 14:24 ?19次下載

    AI+AR將用于智能三維重建領域

    AI與AR的關系日漸微妙,正在不斷融合、相互促進。在計算機視覺中, 三維重建是指根據視圖或者多視圖的二圖像
    發表于 09-21 10:33 ?4605次閱讀

    如何使用目視覺進行高精度三維場景重建技術研究

    近年來,隨著計算機硬件的不斷快速更新,計算機的處理能力也不斷變強。同時場景三維模型的獲取技術越來越成熟,我們獲得場景的三維模型數據的方式更多也更加方便了。而目前在基于目和雙目的三維重建
    發表于 12-24 15:55 ?7次下載
    如何使用<b class='flag-5'>單</b>目視覺進行高精度<b class='flag-5'>三維</b>場景<b class='flag-5'>重建</b>技術研究

    計算機視覺:三維數據處理學習內容總結

    三維匹配的目的就是把相鄰掃描的數據拼接在一起。三維匹配重點關注匹配算法,常用的算法有最近迭代算法 ICP和各種全局匹配算法。 2)多
    的頭像 發表于 11-27 10:32 ?4807次閱讀

    的概念以及與三維圖像的關系

    概念 三維圖像的關系:三維圖像是一種特殊的信息表達形式,其特征是表達的空間中
    的頭像 發表于 08-17 09:18 ?7159次閱讀
    <b class='flag-5'>點</b><b class='flag-5'>云</b>的概念以及與<b class='flag-5'>三維</b>圖像的關系

    NVIDIA Omniverse平臺助力三維重建服務協同發展

    計算機視覺的進步為元宇宙的數字孿生應用打下堅實基礎。在計算機視覺中,三維重建是指根據視圖或者多視圖的圖像重建
    的頭像 發表于 10-13 09:45 ?1149次閱讀

    深度學習背景下的圖像三維重建技術進展綜述

    根據三維模型的表示形式可以將圖像三維重建方法分類為基于體素的三維重建、基于三維重建和基于網
    的頭像 發表于 01-09 14:26 ?2386次閱讀

    如何使用純格雷碼進行三維重建

    對于新手來說,使用格雷碼做目結構光三維重建是一個入門級的訓練。但是在復現時往往會遇到一個問題,明明解碼都很不錯了,重建后的精度卻很低,
    的頭像 發表于 01-13 11:41 ?1120次閱讀

    三維重建:從入門到入土

    經典三維重建系統的整個pipeline從相機標定、基礎矩陣與本質矩陣估計、特征匹配到運動恢復結構(SFM),從SFM到稠密重建、表面重建
    的頭像 發表于 03-03 10:17 ?1146次閱讀

    為什么三維視圖中不顯示PCB三維模型?

    PCB三維視圖中的三維主體模型顯示通過View Configuration Panel中的設置控制。我們將簡單介紹如何確保該選項被啟用。
    的頭像 發表于 04-28 15:48 ?5525次閱讀
    為什么<b class='flag-5'>三維</b><b class='flag-5'>視圖</b>中不顯示PCB<b class='flag-5'>三維</b>模型?

    三維計算視覺研究分析

    掃描。三維匹配的目的就是把相鄰掃描的數據拼接在一起。三維匹配重點關注匹配算法,常用的算法有最近迭代算法 ICP和各種全局匹配算法。 2
    的頭像 發表于 06-19 11:06 ?631次閱讀

    三維場景點理解與重建技術

    三維場景理解與重建技術主要包含場景點特征提取、掃描配準與融合、場景理解與語義分割、掃描物體
    的頭像 發表于 08-08 16:58 ?1264次閱讀
    <b class='flag-5'>三維</b>場景點<b class='flag-5'>云</b>理解與<b class='flag-5'>重建</b>技術

    如何實現整個三維重建過程

    在計算機視覺中,三維重建是指根據視圖或者多視圖的圖像重建三維信息的過程。由于
    發表于 09-01 11:06 ?1616次閱讀
    如何實現整個<b class='flag-5'>三維重建</b>過程

    總結!三維基礎知識

    該方法具體通過六個步驟實現:圖像的采集、系統相機標定、特征模板匹配、圖像處理、三維仿真匹配以及三維重建。首先,通過兩個相機于不同位置對待測物體進行圖像信息感知獲取。然后根據角測量原理獲得待測表面的
    的頭像 發表于 09-01 16:12 ?2141次閱讀
    總結!<b class='flag-5'>三維</b><b class='flag-5'>點</b><b class='flag-5'>云</b>基礎知識